You are on page 1of 486

El movimiento absoluto

Empezamos nuestra disertación con un viajero que se acaba de subir a un tren de pasajeros en
una estación de ferrocarriles y se acaba de acomodar en su asiento el cual está justo a un lado de
una ventana que dá una vista hacia afuera. Una vez que el porter se ha asegurado de que todos
los pasajeros le han entregado sus boletos de viaje y que están ya en sus lugares asignados, el
tren se pone en movimiento enfilándose hacia su destino:

El viajero se dá cuenta de que el vagón de ferrocarril en el que viaja está en movimiento porque
la vista que recibe del exterior le muestra que todo lo que observa de afuera, casas, praderas,
edificios, llanos, granjas, etc., parece crear la ilusión de estarse desplazando todo junto en una
dirección contraria a la dirección hacia la cual se está moviendo el ferrocarril. Al caer la noche,
los pasajeros bajan las cortinas de las ventanas para poder dormir, y todo lo que se siente es el
vaivén del ferrocarril conforme avanza sobre las vías de acero.

Es aquí cuando el viajero se percata de que al estar cerradas las cortinas, al no tener una vista
directa desde el vagón hacia el exterior, ha perdido su punto de referencia visual con el cual
podía darse cuenta sin el menor asomo de duda que el vagón de pasajeros en el que viaja estaba
en movimiento sobre las vías del tren.

De cualquier manera, él sabe que el pesado tren está en movimiento porque se está meciendo de
un lado a otro produciendo vibraciones sensibles no sólo al oído sino al tacto, clara señal de que
el tren mantiene cierto tipo de movimiento.

Ahora llevaremos a cabo un experimento gedanken, un experimento realizado por completo


dentro de la tranquilidad de nuestro pensamiento pero que no por ello deja de tener
repercusiones completamente válidas para el mundo real en que vivimos como las podría tener
un experimento llevado a cabo con instrumentos y aparatos costosos. Vamos a suponer que
todas las ventanas del tren han sido selladas herméticamente de modo tal que será imposible
tener la menor pista de que el tren está en movimiento por alguna señal visual llegada del
exterior. El interior del tren se encuentra perfectamente iluminado por el sistema de energía
eléctrica autónomo del convoy de ferrocarriles, pero no es posible ver hacia afuera porque el
vagón es en efecto una caja herméticamente sellada.

¿Entonces cómo podremos saber que nos estamos moviendo junto con el vagón que nos
transporta?

Lo primero que se nos ocurre es la confirmación que nos dá el vaivén del vagón meciéndose de
un lado a otro. Esto nos confirma que estamos en movimiento. Pero esta confirmación se debe a
las imperfecciones de las vías del ferrocarril que no están situadas sobre una superficie
horizontal perfectamente plana. En nuestro experimento gedanken, imaginemos que las vías del
ferrocarril están colocadas sobre una superficie extensa perfectamente plana de modo tal que el
vagón no tiene por qué mecerse de un lado a otro, e imaginaremos tambié que el tren se mueve
siempre hacia adelante sin virar en lo más mínimo ni hacia la derecha ni hacia la izquierda. De
este modo el convoy de vagones se mueve sin mecerse de un lado a otro, y así hemos perdido
otra pista que nos indicaba que estamos en movimiento. Pero aún nos queda el ruido estridente
que producen las ruedas de acero del ferrocarril tallando sobre las vías de acero en las que se
mueve. Sin embargo esto se puede solucionar sellando acústicamente el vagón de ferrocarril de
modo tal que no sea posible percibir ruido alguno llegado del exterior, con lo cual estaremos
viajando en un tren perfectamente blindado en contra de ruidos (si el viajero es sordo, tal
blindaje acústico no será necesario).

Tal vez se nos ocurra hacer trampa con un amigo situado en el exterior que a través de un
teléfono celular nos llame del exterior y nos confirme que el tren está en movimiento. Pero
supondremos que no contamos con tal ayuda.

Supóngase que el tren es un tren bala de diseño ultramoderno que está viajando a una velocidad
extremadamente elevada con respecto al suelo, digamos a unos 500 kilómetros por hora. Se nos
podría ocurrir otra cosa; se nos podría ocurrir saltar hacia arriba dentro del vagón de ferrocarril
para no tener contacto alguno con el piso del mismo por algunos segundos, en la creencia de que
al estar separados del piso por ese breve lapso de tiempo suspendidos en el aire el vagón
continuará con su movimiento rápido de 500 kilómetros por segundo mientras que nosotros
iremos quedando atrás, y al caer tocando nuevamente el piso estaremos en una posición más
atrás de la posición desde la cual habíamos saltado. Sin embargo, al hacer esto, descubrimos que
ésto no funcionará tampoco, caeremos exactamente en el mismo sitio desde el cual saltamos
hacia arriba. Esto se debe a que si bien el tren se está moviendo a una rapidez elevada, a 500
kilómetros por hora, nosotros con los pies puestos firmemente sobre el piso del vagón también
nos estaremos moviendo a los mismos 500 kilómetros por hora, y al despegarnos del piso del
tren seguiremos moviéndonos a la misma velocidad de 500 kilómetros por hora, porque en un
vagón perfectamente blindado no hay nada que nos haga perder nuestra velocidad de 500
kilómetros por hora. Esto es algo que nos garantiza una de las leyes de Newton que nos dice que
todo cuerpo permanece en estado de reposo o en su movimiento rectilíneo mientras no
intervenga una fuerza externa que modifique dicho estado de reposo o de movimiento rectilíneo,
y en un vagón perfectamente sellado no hay fuerza horizontal alguna actuando en contra nuestra
que nos haga perder nuestra velocidad de 500 kilómetros por hora. Si el vagón estuviera al
descubierto, sin techo y sin paredes, entonces al saltar hacia arriba la fuerza del aire exterior
actuando como un viento en contra de nosotros nos haría caer más atrás, pero esto se debe a que
al saltar y despegarnos del piso del vagón por breves instantes el vagón ya no nos puede seguir
arrastrando con la misma velocidad al no tener nosotros ya el momentum para sobreponernos a
la resistencia del aire. En un vagón perfectamente sellado, no hay corrientes de aire que nos
puedan mover de un lado a otro cuando saltamos, así que un brinco hacia arriba nos hará caer
en el mismo punto del cual saltamos. Esta es una experiencia que tal vez muchos habrán
compartido cuando al estar viajando dentro de un camión de pasajeros circulando por la
carretera saltaron hacia arriba creyendo que iban a caer un poco más atrás y cayeron en el
mismo lugar del cual saltaron.

Al fallar lo anterior, nuevamente, volvemos a formularnos la pregunta de antes:

¿Entonces cómo podremos saber que nos estamos moviendo junto con el vagón que nos
transporta?

Si hemos sido raptados, anestesiados, y despertamos después en un vagón de ferrocarril


perfectamente sellado del exterior, lo primero que desearíamos saber es si el tren en el que
viajamos está en movimiento. Pero sin pista visual alguna y sin pista acústica alguna, tal cosa se
antoja problemática. Es entonces cuando tratamos de recurrir a la física, cuando tratamos de
recurrir a cierto experimento mecánico que nos permita darnos cuenta de que estamos en
movimiento. Aquí se vale de todo. Se vale sacar balanzas, agujas colgando de hilos delgados,
medidores de presión barométrica, en fin, todos los instrumentos y aparatos que se nos pueda
ocurrir.

Sin embargo, conforme hacemos experimento tras experimento, encontramos que no hay
absolutamente nada de índole mecánica que nos confirme que nos estamos moviendo, por la
sencilla razón de que todos nuestros instrumentos y aparatos mecánicos están en reposo frente a
nosotros moviéndose exactamente a la misma velocidad a la cual nos estamos desplazando en el
tren. Adentro del vagón perfectamente blindado, todo se encuentra en un reposo tan perfecto
como el reposo en el que nos encontraríamos afuera en un laboratorio escolar.

Aquí seguramente habrá críticos que dirán que esta es una situación altamente hipotética,
altamente idealizada, de un experimento imposible de llevarse a cabo. Sin embargo, esto no es
así, ya que para llegar a las mismas conclusiones todo lo que tenemos que hacer es subirnos a
una nave espacial y salir fuera de la órbita terrestre. Estamos en la nave espacial, y de repente al
asomarnos por una de las ventanas de la misma vemos pasar un asteroide a gran velocidad muy
cerca de nosotros el cual casi se estrella contra nuestra nave. Aquí decimos: “Qué rápido se está
moviendo el asteroide”. Pero un naúfrago espacial varado en el asteroide muy bien nos podría
decir “Qué rápido se está moviendo esa nave espacial”. Tanto nosotros como el naúfrago
espacial varado en el asteroide podríamos enfrascarnos en un debate diciendo que es el otro el
que se está moviendo a gran velocidad. ¿Pero cuál de los dos tiene la razón? En realidad,
ninguno, no a menos de que exista un experimento mecánico que permita determinar de modo
absoluto quién es el que se está moviendo. Y para que la respuesta sea válida, tendría que
existir algún punto de referencia absoluto, algo que por su misma naturaleza pudieramos
clasificar en un estado de reposo absoluto, con respecto al cual tanto nosotros como el
náufrago espacial podríamos dirimir el asunto sobre quién es el que realmente se está
moviendo, porque podría muy bien suceder que si bien nosotros y el náufrago espacial varado
en el asteroide nos estamos viendo el uno al otro moviéndonos en direcciones opuestas a gran
velocidad el uno con respecto al otro, ninguno de los dos realmente está en reposo con respecto
a otro punto de referencia absoluto si es que pudiera existir una cosa así.

En base a lo anterior, los siguientes tres puntos de vista para dos naves espaciales que se
encuentran en el espacio viajando en direcciones opuestas producirán los mismos resultados
numéricos para cualquier tipo de experimento mecánico que se pueda llevar a cabo:
En el primer caso, la nave inferior se considera a sí misma que está parada flotando en el
espacio, mientras que ve pasar por encima de ella a otra nave espacial viajando a una velocidad
de 500 metros por segundo, a la cual el tripulante de la nave inferior le dice “yo estoy parado
flotando en el espacio, eres tú el que se está moviendo”. En el segundo caso, el tripulante de la
nave que pasa por arriba, le contesta: “eso no es cierto, yo soy el que está detenido flotando en el
espacio, eres tú el que se está moviendo a una velocidad de 500 metros por segundo. Y en el
tercer caso, con respecto a un tercer observador externo a ambas naves, las dos se están
moviendo en sentidos opuestos cada una con una velocidad de 250 metros por segundo. ¿Quién
tiene la razón? Todos, y a la vez ninguno. Todos tienen la razón porque al no poder detectarse el
movimiento absoluto los tres anteriores supuestos son igualmente válidos. Y todos están
equivocados si insisten en afirmar cada uno que su punto de vista es el correcto y los demás
están en el error.

Por lo pronto, y regresando a nuestro vagón blindado de ferrocarril en la tierra, tenemos que
aceptar querámoslo o no que no existe experimento alguno de índole mecánica que nos permita
saber si nos estamos moviendo. Esto era algo que ya se sabía desde los tiempos de Galileo y que
fué formalizado tiempo después por Newton con sus leyes con las cuales dió inicio a la mecánica
clásica tal y como la conocemos hoy en día.

No existe ningún experimento de índole mecánica que nos pueda indicar que
estamos en moviento.

Lo que acabamos de enunciar tiene alcances y repercusiones mucho más profundas que lo
muchos pudieran suponer. Regresemos al viajero que está en un vagón del ferrocarril en
movimiento. Un observador estacionario situado a un lado de las vías del ferrocarril que tenga
sus pies plantados firmemente sobre la Tierra podría sentirse tentado a decirle en voz alta al
viajero: “Indudablemente que tú eres el que se está moviendo. No puedes argumentar que el
ferrocarril está parado y que son las vías del ferrocarril las que se están moviendo en sentido
contrario junto con todo lo que tú estás viendo moverse a través de tu ventana de observación,
incluyendo los árboles, las casas, los edificios, las montañas, las praderas, todo incluyéndome a
mí. Yo soy el que está parado, y tú indudablemente eres el que se está moviendo”.

El argumento anterior podría parecer razonable a primera vista. Sin embargo, es una falacia.

Supóngase que hemos construído un ferrocarril cuyas vías han sido colocadas siguiendo la ruta
del ecuador de la Tierra. Supóngase ahora que el ferrocarril se pone en movimiento en sentido
contrario al sentido de rotación de la Tierra.

La Tierra, en virtud de su movimiento de rotación alrededor de su eje, movimiento que dá


origen a los días y las noches, dá un giro completo en 24 horas. Usando radianes como medida
de desplazamiento angular, la velocidad angular ω de rotación de la Tierra será entonces:

ω = 2π radianes/24 horas

ω = 72.722 * 10-6 radianes/segundo

Por otro lado, la velocidad tangencial VT en la superficie de un cuerpo en rotación que está
girando a una velocidad angular ω a una distancia r del eje de rotación de dicho cuerpo está
dada por:

ω = VT / r

Suponiendo para la Tierra un radio medio en su ecuador de r = 6.37 * 106 metros, la velocidad
tangencial VT en la superficie del ecuador de la Tierra con respecto a su eje de rotación será
entonces:

VT = ωr

VT = (72.722 * 10-6 radianes/segundo)(6.37 * 106 metros)

VT = 463.24 metros / segundo

Si el ferrocarril se pone en marcha en sentido contrario al movimiento de rotación de la


Tierra a una velocidad de 463.24 metros por segundo, y si empieza el viaje al mediodía con el
Sol directamente encima, entonces el Sol parecerá estacionario sin moverse un solo milímetro.
Para alguien flotando en el espacio encima del ferrocarril, la bóveda celeste parecerá
estacionaria, y todo lo demás fuera del ferrocarril parecerá estarse moviendo, incluyendo las vías
sobre las cuales está montado el ferrocarril, los árboles, las casas, los edificios, las montañas, las
praderas, los lagos, incluyendo desde luego al observador estacionario en la Tierra que le decía
al viajero que era él quien estaba en reposo absoluto. Fuera del ferrocarril, para todos,
amanecerá y anochecerá, los días transcurrirán como siempre, mientras que para el viajero
dentro del ferrocarril el Sol seguirá puesto encima de él sin moverse para nada. De repente, el
viajero en el ferrocarril parece haberse convertido en el observador privilegiado que se siente
tentado a decir que él sí está en estado de reposo absoluto.

Siguiendo un impulso egocentrista, podríamos sentirnos tentados a afirmar que la Tierra es el


centro del cosmos, dándole a la Tierra una condición de reposo absoluto y negando el
movimiento de traslación de la Tierra alrededor del Sol. Esta fue precisamente la cuestión por la
cual el físico italiano Galileo Galilei fue acosado por la Santa Inquisición, en tiempos en los que
por motivos religiosos se consideraba al hombre como el centro de la Creación, el centro del
cosmos, con la bóveda celeste girando en torno suyo certificando su posición privilegiada como
criatura predilecta de Dios. Lo único que pudo hacer Galileo después de ser obligado a negar el
movimiento de rotación de la Tierra fue exclamar en voz baja: “Y sin embargo se mueve”.

Sin embargo, ni aún compensando por el movimiento de rotación de la Tierra con un ferrocarril
construído siguiendo la ruta del ecuador le sería posible a un el viajero dentro del ferrocarril
considerarse a sí mismo como un observador privilegiado en reposo absoluto, en virtud de que
la Tierra no sólo tiene un movimiento de rotación en torno a su eje sino que además tiene un
movimiento de traslación alrededor del Sol, precisamente el movimiento que dá origen a las
estaciones del año.

Fracasando en nuestros intentos por encontrar en la Tierra un punto de referencia absoluto con
respecto al cual el movimiento absoluto se pueda medir, podríamos sentirnos tentados a
asignarle al Sol un papel privilegiado, considerándolo como el centro del Universo. De esto es de
lo que trata la creencia en la teoría heliocéntrica (el Sol es el centro del cosmos) sostenida
inclusive por los astrónomos Copérnico y Kepler que se encargaron de darle la puntilla a la
teoría geocéntrica (la Tierra es el centro del cosmos). Pero esto a la postre resulta ser también
una ilusión, por el hecho de que el Sol no es más que una estrella más dentro de nuestra galaxia,
la Vía Láctea, habiendo muchas otras estrellas albergando otros sistemas solares, todos los
cuales resultan estar también en movimiento dentro de la Vía Láctea.

El anterior fracaso podría llevar a algunos a intentar proclamar a la Vía Láctea, nuestra propia
galaxia, como el centro del cosmos, el centro del Universo. Pero nuestra galaxia no es la única
galaxia del Universo. En nuestra mira de observación con la ayuda de nuestros instrumentos
actuales hay billones y billones de otras galaxias, a ninguna de las cuales puede asignársele una
posición privilegiada por el hecho de que todas las galaxias se están separando la una de la
otra debido a la expansión continua del cosmos. Y esta es una expansión que tampoco tiene un
“centro de origen”, un centro de la explosión inicial que hoy conocemos como el “Big Bang”.
Parece que hemos agotado todas las posibilidades de poder detectar el movimiento absoluto
recurriendo a referencias astronómicas además de tratar de recurrir a experimentos de índole
mecánica. Sin embargo, a principios del siglo XX, había una esperanza basada en un
descubrimiento sobre otro tipo de fenómenos físicos, un descubrimiento que llevó a físicos de
primera línea a postular la existencia de una substancia universal conocida como el éter, con
respecto al cual debería ser posible en principio determinar el movimiento absoluto no por
medios mecánicos, sino por medios ópticos, usando rayos de luz.

Un descubrimiento sorprendente
Descartada totalmente la posibilidad de poder determinar por medio de algún experimento
propio de la mecánica si algo está en estado de movimiento con respecto a algún punto de
referencia que pudiera considerarse absoluto, en cierto momento renació la esperanza de que tal
cosa pudiera lograrse no por medios mecánicos sino por medios ópticos llevados a cabo
dentro de un vagón de ferrocarril perfectamente blindado. Es aquí cuando entra en el panorama
el físico matemático James Clerk Maxwell, el cual asentó firmemente sobre bases matemáticas
los principios básicos del electromagnetismo enunciados desde los tiempos de Faraday,
enunciando las cuatro ecuaciones básicas del electromagnetismo con las cuales ganó para sí
mismo la inmortalidad en la comunidad científica:

Estas cuatro fórmulas están elaboradas en notación vectorial (las


cantidades D, B, E, H y Json vectores, o mejor dicho campos vectoriales en analogía con las
líneas de fuerza que representan un campo gravitacional, y como tales son cantidades que tienen
dirección y sentido como el viento que sopla en las praderas), lo cual simplifica enormemente el
pronunciamiento de las mismas debido a que el enunciamiento es independiente del tipo de
coordenadas (Cartesianas, polares, cilíndricas, esféricas, etc.) que se utilicen en el estudio de
algún fenómeno electromagnético particular. La primera ecuación nos dice esencialmente que el
flujo neto (divergencia) de las líneas de fuerza eléctrica que salen (o entran) de cualquier
recipiente cerrado depende de la densidad de la carga eléctrica ρ que encierra dicho recipiente
(para un recipiente dentro del cual no hay carga eléctrica alguna almacenada en su interior, el
flujo neto de las líneas de fuerza eléctrica sobre toda la superficie del recipiente es cero); la
segunda ecuación nos dice que todas las líneas de fuerza de un campo magnético (como las de
un imán) forman siempre un bucle cerrado (no existen monopolos magnéticos, esto es, una
partícula de la cual salgan líneas de fuerza de un campo magnético correspondientes al polo
Norte de un imán, y otra partícula de la cual salgan líneas de fuerza de un campo magnético
correspondientes al polo Sur del imán) y por lo tanto la divergencia de las líneas del campo
magnético es siempre cero (el flujo neto de las líneas de fuerza del campo magnético que entren
a cualquier recipiente cerrado restado del flujo de las líneas de fuerza del campo magnético que
salgan del mismo recipiente será exactamente igual a cero en todos los casos); mientras que la
tercera y la cuarta ecuación nos dicen que todo campo eléctrico que varíe con el tiempo
producirá campos magnéticos rotacionales del mismo modo que todo campo magnético que
varíe con el tiempo producirá a su vez campos eléctricos rotacionales.

Se puede demostrar a partir de las ecuaciones del campo electromagnético de Maxwell, como el
mismo Maxwell lo descubrió por vez primera, que la velocidad de una onda electromagnética en
el vacío que consta de un campo eléctrico E y un campo magnético Bperpendiculares el uno al
otro y alternantes sinusoidalmente en el tiempo:

depende única y exclusivamente de la permitividad eléctrica del vacío ε0 y de la permeabilidad


magnética del vacío μ0, y la velocidad para dicha onda electromagnética debe ser:
Los valores experimentales para estos parámetros ya eran conocidos en los tiempos de Maxwell,
de modo tal que no fué para él ningún problema llevar a cabo una substitución de dichos valores
para poder saber cuál era la velocidad de una onda electromagnética propagándose en el vacío.

PROBLEMA: En el sistema de unidades SI (MKS) se aceptan generalmente como válidos los


siguientes valores experimentales para la permitividad eléctrica y para la permeabilidad
magnética del vacío:

ε0 = 8.854 × 10-12 farad/metro

μ0 = 12.5664× 10-7 henry/metro

Determínese, a partir de estos valores experimentales, la velocidad de una onda


electromagnética propagándose en el vacío.

Puesto que las unidades SI del farad y el henry son algo crípticas para quienes no están
familiarizados con estas unidades, las pondremos en una forma más convencional acorde con
las unidades que se utilizan en la Mecánica.

Empezaremos con la unidad del farad. De la teoría básica del campo eléctrico, la capacitancia C
de un condensador es igual a la carga eléctrica Q almacenada por el condensador dividida entre
el voltaje V que hay entre las terminales del condensador, según la fórmula C = Q/V. Esto
significa que, dimensionalmente, un farad es igual a un coulomb de carga eléctrica dividido
entre un volt:

1 farad = 1 couloumb/volt

Entonces la unidad de la permitividad eléctrica es:

1 farad/metro = 1/(1 coulomb/volt) = 1 coulomb/volt·metro

Pero el voltaje V se define como el trabajo W hecho sobre una unidad de carga Q para moverla
de un punto con un potencial V1 a otro punto con un potencial V2, dividido entre el valor de la
carga, o sea V = W/Q. Y el trabajo mecánico se define como el producto de la fuerza aplicada
(medida en newtons) por la distancia recorrida (medida en metros). Entonces,
dimensionalmente hablando, una unidad de voltaje es igual a:

1 volt = 1 newton·metro/coulomb

Entonces podemos escribir la unidad dimensional de la permitividad eléctrica del modo


siguiente:

1 coulomb/(1 newton·metro/coulomb)·metro

O sea:

1 farad/metro = 1 coulomb²/newton·metro²

De este modo:

ε0 = 8.854 × 10-12 coulomb²/newton·metro²

Ahora trabajaremos con la unidad del henry. El henry es la unidad utilizada para medir
la inductancia eléctrica L de una bobina, de acuerdo con la fórmula:

ε = - L di/dt

De modo que, dimensionalmente hablando:

1 volt = 1 henry · (1 ampere/segundo)

Pero un ampere de corriente eléctrica es por definición igual a un coulomb por segundo de carga
eléctrica Q atravesando una superficie imaginaria:

1 ampere = 1 coulomb/segundo

Entonces:

1 volt = 1 henry · (1 coulomb/segundo)/segundo)

Despejando para la unidad del henry:

1 henry = 1 volt · segundo²/coulomb


Entonces la unidad dimensional SI para la permeabilidad magnética μ0 puede escribirse en la
siguiente forma igualmente válida:

1 henry/metro = 1 volt · segundo²/coulomb · metro

De este modo, utilizando el equivalente “mecánico” del volt obtenido en el caso de la


permitividad eléctrica, podemos escribir la permeabilidad magnética del modo siguiente:

μ0 = 12.5664× 10-7 newton · segundo²/coulomb²

Podemos proceder a la aplicación de la fórmula de Maxwell para la velocidad de una onda


electromagnética verificando al mismo tiempo la correcta cancelación y simplificación de
unidades:

μ0 ε0 =
(12.5664·10-7 newton·seg²/coulomb²)(8.854·10-12 coulomb²/newton·metro²)

μ0 ε0 = 1.1126·10-17 segundo²/metro²

Finalmente:

v² = 1/μ0 ε0 = 1/1.1126·10-17 segundo²/metro²

v = 1/(3.356·10-9 segundo/metro)

v = 299,795,638 metros/segundo

Este resultado seguramente habrá llamado de inmediato la atención de Maxwell, porque esta es
precisamente la velocidad de la luz en el vacío. Y puesto que la luz viaja en el vacío a esta
velocidad, Maxwell concluyó de inmediato que la luz puede ser considerada como una
onda electromagnética que consta de campos eléctrico y magnético alternantes. A
la velocidad de la luz se le identifica comúnmente en la actualidad con la letra c, de modo tal que
la conclusión de Maxwell puede ser enunciada de la siguiente manera con el significado
filosófico que ello conlleva:
Este descubrimiento sorprendente presentó casi de inmediato un problema fundamental.
Siempre que hablamos de la velocidad de algo lo hacemos tomando otra cosa
como referencia para medir dicha velocidad. Si decimos que algo, por ejemplo un avión, tiene
una velocidad de 10 metros por segundo, entonces debe de estarse moviendo a 10 metros por
segundo con respecto a otra cosa, en el caso del avión, con respecto al suelo. No tiene sentido ni
lógica alguna hablar acerca de la velocidad de algo utilizando ese algo como su propia
referencia del mismo modo que no tiene sentido alguno hablar acerca de una línea paralela
cuando no existe otra línea recta con respecto a la cual se pueda compararla para decir que es
paralela, del mismo modo que no podemos decir que algo se encuentra “arriba” cuando no hay
nada “abajo” de ese algo. Y el resultado obtenido no es algo que podamos reinterpretar a nuestro
antojo, ya que la permitividad eléctrica y la permeabilidad magnética del vacío son atributos
propios universales del mismo vacío que darán los mismos valores en cualquier parte del
Universo en donde nos encontremos.

Lo interesante de la fórmula de Maxwell es que la velocidad de la luz aparecía como un


valor único, constante, invariable. ¿Pero con respecto a qué? Los físicos clásicos
entrenados en la filosofía del universo mecanístico de Newton, presionados a proponer alguna
salida al dilema sobre qué exactamente significaba esa velocidad de la luz considerada como una
onda electromagnética no tardaron en inventar el medio en el cual se transmitía dicha onda, y la
respuesta natural dada en aquél entonces fue que esa era la velocidad de la luz con respecto
al éter (la palabra aquí no tiene ninguna relación con el compuesto químico óxido de etilo del
mismo nombre con fórmula química (C2H2)2O que es utilizado como anestésico por los doctores,
sino con la idea de lo que es etéreo, celestial, algo llenando a la bóveda celeste de confín a
confín). Para formular tal proposición se tomó en cuenta que, si de acuerdo con el resultado
obtenido por Maxwell, la luz es una onda electromagnética, entonces para poder propagarse de
un lado a otro tenía que hacerlo sobre el medio en el cual supuestamente estaba vibrando, del
mismo modo en que los sonidos que escuchamos todos los días no son más que ondas acústicas
formadas por compresiones y enrarecimientos del aire sumamente rápidas (en el vacío del
espacio exterior en donde no hay aire, tampoco hay sonido alguno), del mismo modo en que
ocurre en una “ola” de gente en cuya producción participan espontáneamente miles de
aficionados presentes en un partido de futbol levántandose de sus asientos por breves instantes
cuando les toca ser parte de la “ola”. Sin la presencia de los aficionados en las gradas, esas “olas”
no se dán, del mismo modo que sin la presencia del aire no es posible que se produzca sonido
alguno. Siendo la luz una onda electromagnética, el concepto del éter parecía una suposición
lógica y natural. La postulación de la existencia del éter no sólo era deseable para suponer al éter
como el medio a través del cual se propagan las ondas magnéticas luminosas, también era
deseable desde el punto de vista filosófico e inclusive religioso, ya que permite evadir el tema
del vacío total, ese vasto espacio entre los planetas, entre los sistemas solares y entre las
galaxias en el cual a nuestra vista no parece haber absolutamente nada. Desde tiempos de la
antigüedad, el vacío total ha sido una idea cuya sola mención a causado angustia e inclusive
espanto entre filósofos y religiosos de renombre, porque el vacío total representa la nada, la
ausencia de todo. El omnipresente éter, invisible a nuestros ojos, era la solución científica ideal
con la cual la ciencia podía reconfortar a los preocupados por tal cuestión haciéndoles saber que
el vacío total, el vacío absoluto, era algo que no existía, porque las vastas regiones del cosmos en
donde no parecía haber nada de materia estaban repletas de éter, así que siempre había algo que
llenaba “los espacios vacíos”.

El éter, aunque debía ser capaz de poder “vibrar” (para poder transmitir las ondas
electromagnéticas luminosas), debía permanecer completamente inmóvil con respecto a todos
los objetos materiales, más bien los objetos materiales eran los que se movían a través de él,
como el movimiento de una coladera a través del agua. Aunque el éter fuese una substancia
invisible, incorpórea, una substancia que no puede ser vista directamente, escuchada, tocada,
olida o paladeada, el movimiento absoluto de los planetas con respecto al éter debía ser
detectable recurriendo a experimentos hechos con rayos de luz.

Al éter se le suponía como algo completamente rígido, indeformable de confín a confín del
Universo. Sus propiedades no podían ser menos que fantásticas. Tenía que poseer una rigidez
extraordinaria para poder dar apoyo a ondas electromagnéticas de una frecuencia tan elevada
como la poseída por los colores de la luz del espectro visible (en las guitarras y en todos los
instrumentos de cuerda, para producir los sonidos más agudos, los de mayor frecuencia, la
tensión de la cuerda que los produce tiene que ser mayor que la tensión de la cuerda requerida
para producirlos sonidos graves, en virtud de que la velocidad de las ondas en una cuerda tensa
es directamente proporcional a la raíz cuadrada de la tensión de la cuerda), pero pese a esta
extraordinaria rigidez el éter no parecía tener efecto alguno sobre el movimiento de los planetas
alrededor del Sol cuyas órbitas se podían predecir clásicamente con un buen nivel de precisión
usando las fórmulas de Newton para la atracción gravitacional entre el Sol y los planetas,
ignorando en dichas fórmulas cualquier efecto de retardo que el éter pudiese producir en los
movimientos de los planetas. A diferencia del agua en los océanos de la Tierra, en los cuales se
forman corrientes internas, en el éter cósmico no había tales “corrientes de éter”. El éter era uno
solo, inamovible, como si fuese un bloque infinitamente grande de hielo, de modo que si algún
observador privilegiado pudiera situarse en estado de reposo absoluto con respecto al éter en
cualquier ciudad de la Tierra, podía tener la seguridad de que también estaba en reposo absoluto
con respecto al éter en cualquier parte del Universo. El éter era el marco de referencia ideal con
respecto al cual se podía medir el movimiento absoluto. Y aparentemente también era inmune a
los cambios de temperatura así como químicamente inerte, ya que no parecía haber substancia
alguna conocida con la cual el éter pudiera reaccionar químicamente. Pero no sólo era el éter
algo completamente rígido a través del universo entero e inmune a los cambios de temperatura
así como químicamente inerte. También era completamente poroso y permeable, estaba metido
dentro de todo, inclusive dentro de las cajas fuertes de los bancos suizos o en vagones sellados
de ferrocarriles en movimiento. El éter podía estar en cualquier parte en donde pudiera
producirse un rayo de luz. El mismo Maxwell determinó para el éter una densidad específica de
9.36·10-19, un coeficiente de rigidez de 842.8, y una estimación de que la densidad del aire a una
distancia infinita de la Tierra era 1.8·10327 veces menor que la densidad por él estimada del éter.
Pero no había científico alguno que se atreviera a aventurar una hipótesis sobre cuál era la
substancia de la cual pudiera estar constituído el éter, ya que en la química de aquellos tiempos
no se conocía elemento alguno que pudiera tener tan fantásticas propiedades. En realidad, la
única razón de ser del éter era servir como medio universal de conducción para las ondas
electromagnéticas del mismo modo que el aire sirve como medio de conducción para las ondas
acústicas.

La universalidad y absoluta rigidez del éter permitió suponer que la velocidad de la luz con
respecto al éter tal vez pudiera utilizarse como el punto de referencia absoluto para la
determinación del movimiento absoluto que no se había podido encontrar por medios
puramente mecánicos hasta entonces. Aquél cuya velocidad fuera igual que la velocidad cde 300
mil kilómetros por segundo podría considerarse a sí mismo en estado de reposo absoluto con
respecto al éter, mientras que todo aquél cuya velocidad fuese mayor o menor que la velocidad
de la luz podría considerarse a sí mismo en estado de movimiento con respecto al nuevo
estándard de referencia, el éter. Y de este modo habría también una manera de determinar
quién o quiénes están en estado de reposo o en estado de movimiento con respecto a este nuevo
parámetro.

Volviendo nuevamente a una nave espacial con forma de vagón de ferrocarril perfectamente
blindado, sin necesidad de ver hacia el exterior bastaría con que alguien echara mano de una
linterna encendiéndola para enviar un rayo de luz de un extremo a otro de la nave, y si la
velocidad de ese rayo de luz medida de alguna manera resultara ser igual a la velocidad de la luz
obtenida mediante las ecuaciones de Maxwell, entonces el ocupante de la nave espacial podría
dar por hecho el encontrarse por alguna maravillosa casualidad en un estado de reposo
absoluto. Por otro lado, si para una persona exterior a la nave espacial tal como un viajero
varado en un asteroide dicha nave espacial pasara a gran velocidad junto a ella, la velocidad de
la luz disparada desde la linterna dentro de la nave espacial tendría que ser necesariamente
diferente según el náufrago viajando en el asteroide se moviese rápidamente con respecto a la
nave espacial en la misma dirección o en dirección contraria al haz saliendo de la linterna dentro
de la nave espacial. En caso de moverse con una velocidad V en dirección contraria a la
dirección del haz que sale de la linterna dentro de la nave espacial con una velocidad c, el
náufrago espacial en el asteroide debería ver al rayo de luz moverse con una rapidez todavía
mayor igual a c+V, mientras que en caso de moverse con una velocidad V en la misma
dirección del haz que sale de la linterna con una velocidad c debería ver al rayo de luz moverse
con una rapidez menor igual a c-v. (moviéndose a una velocidad V igual a c, el náufrago espacial
estaría avanzando a la par con el rayo de luz que le parecería estático). Y en principio podría
estarse moviendo tan rápido que inclusive hasta podría dejar atrás al rayo de luz después de
alcanzarlo. Por fin había una forma de poder determinar experimentalmente quién se estaba
moviendo y con respecto a qué se estaba moviendo, todo en base a un simple rayo de luz, todo
en base a cualquier experimento óptico que pudiese utilizar rayos de luz para la determinación
del movimiento absoluto con respecto a la nueva vara de medición. Todo gracias al éter. El
problema de la determinación del movimiento absoluto parecía resuelto. Al menos en
apariencia.

La física es parada de cabeza


Clásicamente, antes del advenimiento de la Teoría Especial de la Relatividad, el mundo basado
en los conceptos del tiempo absoluto que marcha por igual en todo el Universo, invariable, y el
espacio absoluto, también invariable, siendo ambos conceptos completamente independientes el
uno del otro, era un mundo mucho más sencillo. En este mundo, para ubicar a un objeto
puntual en el espacio tri-dimensional, utilizando coordenadas Cartesianas para ello, bastaba con
especificar tres números para que la posición del objeto puntual quedara identificada de modo
unívoco, como el siguiente punto P especificado por las coordenadas (x, y, z) = (2, 3, 5), medidas
a partir de un origen de referencia con coordenadas (x, y, z) = (0, 0, 0):
Con esta convención, si el objeto ubicado en el punto P empezaba a desplazarse a lo largo de uno
de los ejes, digamos el eje y, a una velocidad constante V, digamos de unos 4 metros por
segundo, su posición nueva medida a partir de un tiempo t = 0 se podía obtener fácilmente
simplemente sumando la cantidad Vt al valor original en dicha coordenada. De este modo, al
haber transcurrido un tiempo de t = 3 segundos, el objeto se habría desplazado una distancia de
Vt = 12 metros, y sus nuevas coordenadas serían:

x’ = 2 metros (permanece igual)

y’ = y + Vt = 3 metros + (4 metros/segundo) (3 segundos) = 15 metros

z’ = 5 metros (permanece igual)

(Obsérvese cómo se cancelan las dimensiones de las unidades, puestas en color verde, para
siempre dar en la respuesta final las unidades correctas. Añadir todas las unidades desde un
principio en la solución de cualquier problema matemático, cancelándolas según se requiera, es
una buena forma de darse cuenta de que no se están cometiendo errores; llevando
la contabilidad correcta de las dimensiones. Si en la respuesta final de un problema un
estudiante obtiene metros/segundo cuando esperaba obtener kilogramos por metro cúbico ello
le indicará que hubo un error, el cual puede ser corregido de inmediato con sólo ver en dónde
fue en donde las unidades se salieron fuera de control.)

De este modo, considerando a dos observadores distintos moviéndose uno con respecto al otro a
una velocidad constante V, con un observador O en reposo en su propio sistema de coordenadas
rectangulares (x,y,z) al que indistintamente llamaremos también marco de referencia S y
otro observador O’ en movimiento junto con su propio sistema de coordenadas rectangulares
(x’,y’,z’) al que llamaremos S’, para pasar de un sistema de coordenadas al otro simplemente
echábamos mano de las transformaciones de Galileodeducidas como se hizo en el ejemplo
de arriba recurriendo a la lógica elemental. Si el movimiento relativo se lleva a cabo a lo largo de
un eje común entre ambos, digamos el eje-x, y si suponemos que el marco de referencia S’ es el
que se está moviendo de izquierda a derecha:

entonces es fácil ver que las transformaciones de Galileo para pasar las coordenadas de un
punto fijo situado en el marco de referencia S’ a las coordenadas que le corresponden en el
marco de referencia S deben ser:

x = x’ + Vt’

y = y’

z = z’

Aunque nos parezca superfluo, por completitud introduciremos el tiempo universal t como un
cuarto componente en el conjunto ordenado de componentes de cada sistema de coordenadas.
Así, para el observador O un punto cualquiera en su sistema de coordenadas estará especificado
como (x,y,z,t), y para el observador O’ otro punto cualquiera en su sistema de coordenadas
estará especificado como (x’,y’,z’,t’), y el conjunto completo de transformaciones de Galileo para
llevar a cabo la conversión de un punto cualquiera en S’ a las coordenadas que le corresponden
en S serán:

x = x’ + Vt’

y = y’

z = z’

t = t’

Hemos supuesto que ambos observadores están provistos de metros y relojes de forma tal que
pueden medir las coordenadas de los eventos o acontecimientos que les toque presenciar.
Hemos supuesto también que ambos ajustan sus relojes de modo tal que cuando pasen el uno
frente al otro en x = x’ = 0 la lectura en sus relojes será t = t’ = 0. El uso de las transformaciones
de Galileo quedará más claro con la resolución de los siguientes problemas.

PROBLEMA: Las coordenadas de un punto fijo en el marco de referencia móvil S’ son


(x’,y’,z’,t’) = (4,7,2,0). ¿Cuáles serán las coordenadas del mismo punto evaluadas en el marco
de referencia estacionario S para un tiempo t = 3 segundos y para un tiempo t = 5 segundos si
la velocidad relativa entre ambos marcos de referencia es igual a V = 4 metros/segundo?
Para un tiempo de t’ = 3 segundos, las coordenadas en S se obtienen como:

x = x’ + Vt’ = 4 metros + (4 metros/segundo)(3 segundos) = 16 metros

y = y’ = 7 metros

z= z’ = 2 metros

t = t’ = 3 segundos

Las coordenadas en S serán entonces (x,y,z,t) = (16,7,2,3).

Para un tiempo de t’ = 5 segundos, las coordenadas en S se obtienen como:


x = x’ + Vt’ = 4 metros + (4 metros/segundo)(5 segundos) = 24 metros

y = y’ = 7 metros

z = z’ = 2 metros

t = t’ = 5 segundos

Las coordenadas en S serán entonces (x,y,z,t) = (16,7,2,3).

Obviamente, conforme avanza el tiempo, la posición del punto fijo en S’ se va desplazando más y
más hacia la derecha. Las coordenadas en el eje-y y en el eje-z se mantienen iguales puesto que
no hay movimiento alguno fuera del que se lleva a cabo a lo largo del eje de las equis.

Hemos considerado en la resolución del problema anterior que el marco de referencia S’ es el


que se está moviendo de izquierda a derecha (en el sentido positivo del eje-x) a velocidad V,
pero la resolución del problema hubiera sido exactamente la misma si hubiéramos
considerado al observador O’ fijo y al marco de referencia S moviéndose de derecha a
izquierda en el sentido del eje-y:

Para pasar del marco de referencia S al marco de referencia S’, las transformaciones de Galileo
serán:

x’ = x - Vt
y’ = y

z’ = z

t’ = t

Obsérvese el cambio de signo que se tuvo que hacer, ya que esta es una transformación inversa a
la anterior.

PROBLEMA: Las coordenadas de un punto fijo en el marco de referencia móvil S son (x,y,z,t)
= (3,1,8,0). ¿Cuáles serán las coordenadas del mismo punto evaluadas en el marco de
referencia estacionario S’ para un tiempo t = 5 segundos y para un tiempo t = 10 segundos si la
velocidad relativa entre ambos marcos de referencia es igual a V = 2 metros/segundo?

El punto fijo se encuentra ahora en el marco de referencia S. Para un tiempo de t = 5 segundos,


las coordenadas en S se obtienen como:

x’ = x - Vt = 3 metros - (2 metros/segundo)(5 segundos) = -7 metros

y’ = y = 1 metro

z’ = z = 8 metros

t’ = t’ = 5 segundos

Las coordenadas en S serán entonces (x,y,z,t) = (-7,1,8,5).

Para un tiempo de t = 10 segundos, las coordenadas en S se obtienen como:

x’ = x - Vt = 3 metros - (2 metros/segundo)(10 segundos) = -17 metros

y’ = y = 1 metro

z’ = z = 8 metros

t’ = t = 10 segundos
Las coordenadas en S serán entonces (x,y,z,t) = (-17,1,8,10).

Obviamente, conforme avanza el tiempo, la posición del punto fijo en S se va desplazando más y
más hacia la izquierda, en el sentido negativo del eje-x.

PROBLEMA: Un pasajero de un tren que se mueve a 20 metros/segundo para frente a un


hombre que se encuentra en la plataforma de la estación en un tiempo que para ambos es t = t’
= 0. Diez segundos después de que el tren lo pasa, el hombre de la plataforma encuentra que
un pájaro que vuela a lo largo de la vía y en la misma dirección del tren está a 500 metros de
distancia. ¿Cuáles son las coordenadas del pájaro determinadas por el pasajero?

Las coordenadas asignadas al pájaro por el hombre en la plataforma de la estación son

(x, y, z , t) = (500 metros, 0, 0, 10 segundos)

Pasando del sistema de referencia S al sistema de referencia S’ y de acuerdo con las


transformaciones de Galileo, la distancia x del pájaro al pasajero, medida por éste es:

x’ = x - Vt = 500 metros - (20 metros/segundo) (10 segundos)

x’ = 300 metros

Entonces las coordenadas del pájaro determinadas por el pasajero son:

(x’, y’, z’ , t’ ) = (300 metros, 0, 0, 10 segundos)

Al pasar del marco de referencia S al marco de referencia S’, las transformaciones de


velocidad, según Galileo, basadas en incrementos Δ de las coordenadas, serán:

Δx’ = Δx - Δ(Vt) = Δx - VΔt

Δx’/Δt = Δx/Δt - VΔt/Δt___(dividiendo entre Δt)

Δx’/Δt’ = Δx/Δt - V___(Δt = Δt’)

u’x = ux - V
Y del mismo modo:

Δy’/Δt = Δy/Δt

Δy’/Δt’ = Δy/Δt

u’y = uy

Δz’/Δt = Δz/Δt

Δz’/Δt’ = Δz/Δt

u’z = uz

Por otra parte, al pasar del marco de referencia S al marco de referencia S’,
las transformaciones de aceleración, según Galileo, basadas en incrementos Δ de las
velocidades con respecto a incrementos iguales de tiempo, serán (la velocidad relativa V entre
ambos marcos de referencia permanece constante y no cambia con respecto al tiempo
transcurrido):

Δu’x/Δt = Δux/Δt - ΔV/Δt

Δu’x/Δt’ = Δux/Δt

a’x = ax

a’y = ay

a’z = az

El hecho de que la aceleración de un cuerpo medida clásicamente tanto por un observador


estacionario como por un observador móvil sea la misma implica que las leyes de Newton
basadas en la fórmula fuerza igual a masa por aceleración (F = ma) permanecerán las mismas
en todos los marcos de referencia al pasar de un marco de referencia a otro, y por lo tanto los
experimentos basados en las leyes de la mecánica clásica basadas a su vez en los conceptos del
espacio absoluto y el tiempo absoluto no nos sirven para detectar el movimiento absoluto,
confirmando lo que ya habíamos visto al principio de esta obra. El movimiento absoluto no se
puede detectar a través de experimentos mecánicos. Pero se suponía que se podía detectar a
través de experimentos ópticos usando rayos de luz. Para eso estaba el éter, para darnos un
marco de referencia universal e inmóvil con respecto al cual era posible concebir el movimiento
absoluto. De este modo, la velocidad de la luz, predicha teóricamente mediante las fórmulas del
electromagnetismo de James Clerk Maxwell, parecía zanjar de una vez por todas la cuestión
sobre el asunto del movimiento absoluto.

PROBLEMA: Considérese una masa M atada a un resorte que se mueve sobre una superficie
horizontal sin rozamiento, y la cual cuando el resorte no está estirado ni comprimido se
encuentra a una distancia x0 de la pared a la que está anclado el otro extremo del resorte.
Clásicamente, la fuerza de tensión F ejercida por el resorte sobre la masa M cuando es estirado
a una distancia x de la pared está dada por la relación que nos dice que dicha fuerza es
directamente proporcional a la distancia x-x0:

F = -k(x-x0)

Esta fuerza cuando está desbalanceada produce una aceleración sobre la masa M que está
dada por la ley de Newton F = Ma (fuerza igual a masa por aceleración). Demostrar que esta
fórmula es invariante bajo las transformaciones de Galileo.
Considerando el movimiento de la masa M a lo largo del eje-x, la ecuación del movimiento de la
masa determinada por un observador en reposo con respecto a la superficie es:

F = Ma

-k(x - x0) = Max

Usando las transformaciones de Galileo para determinar la ecuación del movimiento encontrada
por un segundo observador moviéndose a una velocidad V con respecto al primero:

x = x’ + Vt’

x0 = x’0 + Vt’

ax = a’x

obtenemos la siguiente ecuación del movimiento para el segundo observador:

-k(x’- x’0) = Ma’x

Puesto que la ecuación del movimiento para el segundo observador tiene la misma forma que la
ecuación del movimiento para el primer observador, la ecuación del movimiento
es invariante bajo las transformaciones de Galileo. Esto confirma que no se puede detectar el
movimiento absoluto haciendo experimentos mecánicos con resortes.

En general, se dice que hay invariancia en una ecuación cuando esta presenta la misma
forma al ser determinada por dos observadores distintos moviéndose el uno con respecto al
otro. En la teoría clásica se supone que las medidas de espacio y tiempo obtenidas por dos
observadores están relacionadas por las transformaciones de Galileo.

PROBLEMA: Suponiendo que los sistemas de referencia S y S’ además de estarse moviendo a


una velocidad relativa Vx el uno con respecto al otro en el sentido de los ejes x-x’ se están
moviendo también a una velocidad relativa Vy el uno con respecto al otro en el sentido de los
ejes y-y’ y a una velocidad relativa Vz el uno con respecto al otro en el sentido de los ejes z-z’,
¿cuáles serán las transformaciones de las coordenadas? ¿Cuáles serán las transformaciones
de velocidad? ¿Cuáles serán las transformaciones de aceleración?
Puesto que el movimiento relativo Vx es independiente de los movimientos relativos Vy y Vz del
mismo modo que el movimiento relativo Vy es independiente del movimiento relativo Vz, la
extensión natural de las transformaciones de Galileo hacia un espacio de tres
dimensiones serán:

x = x’ + Vx t’

y = y’ + Vy t’

z = z’ + Vz t’

t = t’

Diferenciando con respecto al tiempo las transformaciones anteriores obtenemos las


transformaciones de velocidad:

ux = u’x + Vx

uy = u’y + Vy

uz = u’z + Vz

Diferenciando con respecto al tiempo las transformaciones de velocidad obtenemos las


transformaciones de aceleración:

ax = a’x

ay = a’y

az = a’z

PROBLEMA: Suponiendo que las coordenadas de un punto P’ en S’ son (x’, y’, z’) = (7, 4, 9) en
un tiempo t = t’ = 0, y que (V’x, V’y, V’z) = (3, 5, -2), ¿cuáles serán las coordenadas de dicho punto
en un tiempo t’ = 6?

Las coordenadas en el sistema de referencia S de tres dimensiones serán de acuerdo con los
resultados anteriores:
x = x’ + Vx t’ = 7 + (3) (6) = 25

y = y’ + Vy t’ = 4 + (5) (6) = 34

z = z’ + Vz t’ = 9 + (-2) (6) = -3

Las coordenadas del punto P en el sistema de referencia S serán entonces:

(x, y, z, t) = (25, 34, -3, 6)

La mecánica clásica, construída sobre las columnas del espacio absoluto y el movimiento
absoluto, invariante bajo las transformaciones de Galileo, daba lugar a que las ecuaciones de
Newton permanecieran iguales al pasar de un sistema de referencia a otro. Era un entorno
cómodo, consistente, con el que todos estaban contentos. El único “pero” que se le podía poner a
este esquema era que al intentar extender los conceptos de la mecánica clásica al estudio de los
fenómenos propios del electromagnetismo (del cual no se sabía casi nada en los tiempos de
Galileo y Newton) empezaban a surgir inconsistencias y asimetrías que no se habían visto en el
estudio de la mecánica Newtoniana. Si se suponía que era posible medir el movimiento absoluto
de todos los objetos del universo con respecto a un simple rayo de luz, el asunto matemático de
repente se había vuelto extraordinariamente complejo. Uno de los primeros en darse cuenta de
las complejidades matemáticas que se habían venido encima con la suposición del movimiento
absoluto basado en el concepto del éter fue un físico alemán de nombre Albert Einstein.
Suponiendo el movimiento absoluto como válido, las mismas fórmulas del electromagnetismo
de Maxwell tenían que ser revisadas y modificadas para tomar en cuenta los diferentes
resultados experimentales que podrían esperar obtener diferentes observadores en movimiento
relativo el uno con respecto al otro y por lo tanto en movimientos diferentes con respecto a un
rayo de luz. La revisión requería introducir asimetrías en las fórmulas de Maxwell para dar
cabida en ellas a observadores privilegiados cuyo estado de reposo absoluto se encontrase en
concordancia exacta con la dirección y la velocidad teórica de un rayo de luz. Estas asimetrías no
existían en las fórmulas de Maxwell, puesto que dichas fórmulas no situaban a ningún
observador en un plano preferencial con respecto al otro, las fórmulas tal y como estaban dadas
por Maxwell eran igualmente válidas para todos los observadores sin cambio alguno. Pero con la
velocidad de la luz fijada como una vara de medición absoluta con respecto al éter, las fórmulas
de Maxwell habían dejado de ser universales, habían dejado de ser simétricas. Uno de los
ejemplos más claros de ello lo es la ecuación de onda electromagnética, obtenida de las
ecuaciones de Maxwell de la teoría electromagnética y representada en su forma más compacta
por la siguiente fórmula:

Esta fórmula en la que el operador Laplaciano (∇) actuando sobre la onda electromagnética φ
representa de manera concisa lo siguiente:

se puede expresar en forma más explícita como:

No es difícil demostrar que al aplicar las transformaciones de Galileo a la fórmula anterior, la


ecuación toma el siguiente aspecto (se ha utilizado la sobre-línea encima de cada variable en
lugar de la comilla para simplificar la notación):

Claramente, esta fórmula es más compleja que la fórmula original. La única manera en la cual
ésta fórmula puede simplificarse es haciendo la velocidad V = 0, lo cual significa regresar a la
fórmula original válida para un observador que está en reposo con respecto al éter. El
observador que está en reposo con respecto al éter siempre tendrá la fórmula más
sencilla de todas; es un observador privilegiado. Todos los demás obtendrán fórmulas
diferentes. Y esto cubre apenas las asimetrías con las que nos topamos al manipular la ecuación
de onda electromagnética. Cualquier otra situación en la que estén involucradas fórmulas en las
que basamos experimentos llevados a cabo con rayos de luz (o con ondas electromagnéticas de
teléfonos celulares, radio y televisión) adquirirán asimetrías al pasar de un marco de referencia
a otro.

Por más que intentó restaurar con parches las ecuaciones de Maxwell que anteriormente
mostraban una simetría perfecta, Albert Einstein lo único que encontró en cada nuevo intento
fueron más asimetrías y más asimetrías. Simple y sencillamente no había forma alguna de
restaurar las ecuaciones de Maxwell a su condición original como ecuaciones independientes del
movimiento del observador. Esto llevó a Einstein a cuestionar las mismas bases de lo que
entendemos por movimiento absoluto. En su esencia básica, todo movimiento, medido
experimentalmente como una velocidad, definida como la distancia recorrida entre el tiempo
empleado en recorrer dicha distancia:

presupone necesariamente que tanto la distancia como el tiempo son parámetros físicos
absolutos, invariables.

Pero, ¿realmente podemos considerar la distancia entre dos objetos como algo invariable,
absoluto? La lógica nos dice que sí, que dos personas que estén paradas la una frente a la otra
medirán la misma longitud de un metro. ¿Y dos personas que se están moviendo la una con
respecto a la otra, también medirán la misma longitud de un metro para la vara? El fundador
mismo de la mecánica clásica, Isaac Newton, nos había afirmado que sí, y esto se había tomado
casi como un dogma indiscutible por muchas décadas en reconocimiento al enorme calibre
intelectual de Newton, algo que no era fácil de poner en entredicho en base a lo que nos sugiere
nuestra propia intuición. Pero Newton fue más allá al afirmar que eso que nosotros llamamos
tiempo también es algo absoluto, universal, en el sentido de que dos personas con relojes
diferentes en sus manos y en reposo la una frente a la otra medirán el mismo lapso del tiempo
que les marcan los relojes que si se ponen en movimiento la una frente a la otra inclusive hasta
alcanzar velocidades extraordinariamente altas. Para Newton, la marcha del tiempo era algo
universal, invariable, y si la marcha del tiempo era medida con relojes iguales sincronizados con
elevada precisión el uno con respecto al otro, ambos deberían obtener los mismos lapsos de
tiempo. Esto, el concepto del tiempo absoluto, aunque un poco menos obvio que el concepto
de la longitud absoluta, también era tan obvio a nuestra intuición que simple y sencillamente
no había razones para cuestionarlo. Pero el problema de aferrarnos a los conceptos de
la longitud absoluta y del tiempo absoluto con su consecuencia directa que es el movimiento
absoluto se traducía directamente en la destrucción de la simetría universal mostrada por las
ecuaciones básicas del electromagnetismo de Maxwell. Podemos, si así lo deseamos, aferrarnos
a los conceptos de la longitud absoluta y del tiempo absoluto, y toparnos con las mismas
ecuaciones asimétricas para la teoría del electromagnetismo que Einstein trató de remendar
inútilmente.

O podemos, aunque nos cueste mucho trabajo hacerlo, y aunque vaya en contra de nuestro
más elemental sentido común, prescindir por completo de los conceptos de la longitud absoluta
y del espacio absoluto, y con ello del movimiento absoluto.

Esto, desde luego, nos lleva nuevamente a la misma situación en la cual nos encontrábamos
desde la perspectiva de la mecánica Newtoniana, de que no es posible determinar quién es el
que se está moviendo, definido el movimiento como algo contra lo que se pudiera decir que nos
estamos moviendo. Pero tiene una consecuencia matemática extraordinariamente apetecible:
todas las asimetrías que habían surgido en las ecuaciones de Maxwell desaparecen casi como
por arte de magia, las ecuaciones básicas de la teoría del electromagnetismo retoman su caráter
sencillo y universal. Pero para que esto ocurra, es necesario también que uno de los
descubrimientos más sorprendentes de Maxwell, la constancia de la velocidad de la luz
considerada como una onda electromagnética, permanezca invariable para distintos
observadores aunque estén en movimiento relativo el uno con respecto al otro. En pocas
palabras, dos o más observadores que se estén moviendo en direcciones diferentes
ambos medirán para un mismo rayo de luz la misma velocidad, siendo esta
precisamente la velocidad predicha por las ecuaciones de Maxwell. Convencido de que esta era
la única salida posible para el enredo, Albert Einstein formuló los dos principios básicos sobre
los cuales descansa la Teoría Especial de la Relatividad, conocida también como Teoría
Restringida de la Relatividad o simplemente Teoría Restringida por estar limitada a
fenómenos físicos en los cuales no hay aceleraciones entre dos observadores distintos sino
únicamente movimientos relativos entre el uno y el otro llevándose a cabo a velocidad
constante:

(I) El movimiento absoluto no puede ser detectado, porque tal cosa no existe.

(II) La velocidad de la luz es la misma para distintos observadores.


El primer postulado nos confirma que el movimiento absoluto no sólo no puede ser detectado
por medios mecánicos, lo cual ya se sabía desde los tiempos de Newton y Galileo, tampoco
puede ser detectado por medios ópticos que involucren a la misma luz así como experimentos
de índole eléctrica y magnética, y de hecho no puede ser detectado por medio alguno, no puede
ser determinado por ningún tipo de experimento de índole alguna que a alguien se le pueda
ocurrir ahora o en el futuro.

Y el segundo postulado es irónico porque a la vez que descarta la existencia de la longitud


absoluta y del tiempo absoluto, sube a un pedestal privilegiado a un nuevo absoluto de la física,
la velocidad de la luz, la cual será la misma e invariable en cualquier parte del universo para
cualquier observador.

Estos dos postulados sobre los cuales descansa la Teoría Especial de la Relatividad, tan sencillos
como parecen, tienen repercusiones amplias y profundas, siendo causantes de una de las
revoluciones intelectuales más profundas e importantes del siglo XX.

Uno de los primeros triunfos inmediatos de la nueva teoría fue que la ecuación de onda
electromagnética permanecía invariante al pasar de un sistema de referencia S a otro sistema de
referencia S’ o viceversa; o sea que si la ecuación original en el sistema S era:

entonces en el sistema S’ la fórmula obtenida era:

¡Simetría total, por fin!

Obviamente, las transformaciones requeridas para llevar a cabo la conversión de un marco de


referencia a otro no podían estar basadas en las transformaciones de Galileo. Se requería un
nuevo tipo de transformaciones incorporando los principios de los dos postulados de la Teoría
Especial de la Relatividad. Esto se verá posteriormente con mayor detalle.
De este modo, al llevar a cabo experimentos de óptica con rayos de luz, desaparecía la
posibilidad de poder detectar el movimiento absoluto con respecto al éter, y con ello desaparecía
la necesidad de creer en la existencia del éter, al mismo tiempo que desaparecía el concepto del
observador privilegiado. Pero había que pagar un costo por todo esto. De pronto las
transformaciones de Galileo perdieron su carácter universal y sólo eran aproximadamente
válidas a bajas velocidades (en comparación con la velocidad de la luz). La cinemática clásica
tuvo que ser revisada a fondo y puesta al día. Y la dinámica basada en las leyes de Newton era
insostenible en caso de no ser modificada adaptándola a los nuevos conceptos.

En su trabajo original, publicado en 1905 en el tomo 17 de la publicación científica Annalen der


Physik, cuya página frontal tenemos a continuación:

y en cuyo interior tenemos el trabajo “Zur Elektrodynamik bewegter Korper” (Sobre la


electrodinámica de los cuerpos en movimiento) cuya introducción es:
podemos leer lo siguiente:
“Es conocido que la electrodinámica de (James Clerk) Maxwell -como usualmente se entiende
en el tiempo presente- cuando se aplica a los cuerpos en movimiento, conduce a asimetrías que
no parecen ser inherentes en los fenómenos. Tómese, por ejemplo, la acción electrodinámica
recíproca de un imán y un conductor. El fenómeno observable aquí depende únicamente del
movimiento relativo del conductor y el imán, mientras que el punto de vista acostumbrado hace
una distinción aguda entre los dos casos en los cuales el uno o el otro de estos cuerpos está en
movimiento...

“Ejemplos de este tipo, junto con los intentos infructuosos para descubrir cualquier movimiento
de la tierra relativo al “medio de luz” (aquí Einstein está haciendo una clara referencia al éter
que supuestamente servía como medio de transporte para la luz) sugieren que los fenómenos
de la electrodinámica, así como los de la mecánica, no poseen propiedades que correspondan a
la idea del reposo absoluto (si el reposo absoluto no puede ser detectado, tampoco el
movimiento absoluto). Estos sugieren que, como ya se ha demostrado al primer orden para
cantidades pequeñas, las mismas leyes de electrodinámica y óptica serán válidas para todos los
marcos de referencia para los cuales las ecuaciones de la mecánica son sostenidos como válidos.
Elevaremos esta conjetura (que será llamada de aquí en delante el “Principio de Relatividad”) a
la categoría de un postulado, introduciendo también otro postulado, que es irreconciliable sólo
en apariencia con el anterior, que la luz es propagada siempre en el espacio vacío con una
velocidad definida c que es independiente del estado de movimiento del cuerpo emisor. Estos
dos postulados son suficientes para la realización de una teoría simple y consistente de la
electrodinámica de cuerpos en movimiento basada en la teoría de Maxwell para cuerpos
estacionarios.”
Para beneficio e interés de los lectores, se ha reproducido íntegramente al final de
esta obra la traducción inglesa del trabajo original con el cual Einstein dió a
conocer al mundo desde Alemania la Teoría Especial de la Relatividad, puesto en
el Apéndice I bajo el título “El papel original de Einstein de 1905”.

Bastan pues tan solo dos postulados sencillos, enunciados en unos cuantos renglones, para
construír todo nuestro castillo de conocimientos sobre el tema de la Teoría Especial de la
Relatividad (Einstein no utilizó el adjetivo “Especial” en su primer trabajo sobre el tema, esto lo
incluiría posteriormente). Aquí tal vez podría preguntarse alguien, ¿y por qué razón Einstein
hizo referencia posterior a esta teoría como la Teoría Especial de la Relatividad? ¿Acaso estaba
concebida para formar parte de un esquema más amplio? ¿Acaso la Teoría Especial de la
Relatividad iba a formar parte de una teoría de mayor cobertura, una Teoría General de la
Relatividad? ¿Qué es entonces lo que está ausente de la Teoría Especial de la Relatividad?

En efecto, cuando Einstein concibió la Teoría de la Relatividad en su primer formato, supo


desde un principio que esta teoría tendría que formar parte necesariamente de un esquema más
amplio, sabía que la Teoría de la Relatividad que había formulado no abarcaba algo que había
quedado pendiente y que por lo tanto tendría que ser considerada como una Teoría Especial de
la Relatividad.

Para saber qué es lo que había quedado ausente, trasladémonos de nuevo al vagón de ferrocarril
herméticamente sellado en el que nuestro viajero se encontraba viajando y en el cual trataba de
concebir infructuosamente alguna forma experimental con la cual pudiera saber si se estaba
moviendo o no. En base a la Teoría Especial de la Relatividad, no existe experimento alguno que
le pueda decir al viajero si se está moviendo o no, porque el movimiento absoluto no existe,
siempre fue una quimera a la cual fuimos llevados por la forma tan simplificada en la cual opera
nuestro sentido común:
Sin embargo, si el tren se acelera o decelera, por muy blindado que esté el tren por dentro el
viajero sabe de inmediato que el tren ha cambiado de velocidad por las fuerzas que experimenta
de súbito en el interior. Si lleva un reloj de bolsillo consigo colgando de una cadena y el reloj está
suelto, la ligera elevación del reloj le indicará claramente que el vagón está experimentando un
cambio de velocidad, un cambio susceptible de ser medido experimentalmente con
instrumentos de medición:

Esto parecería darle al ocupante del vagón de ferrocarril la condición de ser un observador
privilegiado con respecto a todos los demás observadores externos al tren que lo ven pasar
rápidamente sobre las vías del ferrocarril, porque mientras los observadores externos se pueden
considerar en estado de reposo el viajero en el vagón blindado se puede dar cuenta de cuándo el
vagón está cambiando de velocidad. De lo que no puede darse cuenta es si el vagón se está
moviendo a una velocidad constante cuando se está moviendo a una velocidad constante, pero
indudablemente que sí se puede dar cuenta de cuándo el vagón ha variado la velocidad de su
marcha. Esto parece restaurar cierto status de observador privilegiado al viajero que va
dentro del vagón. Pero este es un asunto que involucra aceleraciones, cambios de velocidad, no
velocidades constantes. Einstein dejó este asunto pendiente por algún tiempo mientras
formulaba esa teoría más general que tomara en cuenta el caso de los cambios de velocidad, esa
teoría que llegaría a ser conocida como la Teoría General de la Relatividad de la cual la Teoría
Especial de la Relatividad es, perdonando la redundancia, un caso especial.

Las consecuencias directas de la teoría


Si tomamos como ciertos los dos postulados básicos de la Teoría Especial de la Relatividad y nos
aferramos a ellos sin cuestionarlos, las consecuencias suelen tomar un carácter dramático para
la forma de pensar a la cual estábamos acostumbrados. En realidad, para muchos pueden
resultar un verdadero shock.
Empezaremos con el siguiente ejemplo que es tal vez uno de los ejemplos más simples que
podamos concebir, en el cual tenemos a un experimentador viajando en un tren sin paredes y
sin techo, con la plataforma descubierta, a una velocidad extremadamente alta de 100 mil
kilómetros por segundo con respecto a las vías del tren, el cual con una linterna acciona un rayo
de luz que en el dibujo podemos ver que viaja de izquierda a derecha:

En la tierra tenemos un observador que ve pasar rápidamente al vagón a la velocidad de 100 mil
kilómetros por segundo.

El viajero que va en el tren con la plataforma al descubierto y el cual tiene una linterna
reposando en sus manos, ve salir al rayo de luz de la linterna con una velocidad de 300 mil
kilómetros por segundo. Si tiene instrumentos a bordo esto es lo que él medirá.

¿Y qué velocidad medirá para el mismo rayo de luz el observador que ve pasar el vagón a una
velocidad de 100 mil kilómetros por segundo? Nuestro sentido común nos dice que la velocidad
del rayo de luz de 300 mil kilómetros por segundo se sumará a la velocidad del vagón de 100 mil
kilómetros por segundo resultándole en una velocidad de 400 mil kilómetros por segundo. Pero
la Teoría de la Relatividad nos dice que él también medirá una velocidad de 300 mil kilómetros
por segundo para el rayo de luz. Ambos miden para el mismo rayo de luz una
velocidad de 300 mil kilómetros por segundo. ¿Entonces qué es lo que está sucediendo?
Lo que está sucediendo es que la distancia que recorre el rayo de luz para el experimentador que
viaja en el vagón y el tiempo que tarda en recorrer dicha distancia son diferentes del tiempo y de
la distancia que el observador en tierra mide experimentalmente. En efecto, las distancias y los
tiempos han dejado de ser unidades de medición absolutas. Lo único que no ha cambiado y que
permanece invariable como una constante universal es ese rayo de luz.
Consideremos ahora otro experimento hipotético, en el cual tenemos un ferrocarril que se
mueve a una velocidad extremadamente rápida, dentro del cual hay un pasajero A que tiene una
linterna en su mano y que en un momento dado enciende y apaga su linterna con el objeto de
enviar un pulso luminoso hacia un espejo que puede estar situado ya sea en el techo del vagón
en el que viaja o en la pared contraria, siempre y cuando el pulso luminoso no sea enviado en la
misma dirección en la cual se está moviendo el tren o en dirección contraria, sino en una
dirección perpendicular al sentido del movimiento del tren.

Supondremos también que hay un observador externo B situado a un lado de las vías del
ferrocarril que se ha puesto de acuerdo previamente con el viajero A en el tren en que el
observador externo B es el que está en reposo y que el tren se está moviendo a una
velocidad V de 0.6 metros por segundo. Puesto que la velocidad de la luz es extremadamente
alta, para fines didácticos consideraremos una velocidad de la luz c igual a un metro por
segundo, lo cual no altera las conclusiones básicas que estamos buscando.

Es ya costumbre “encajonar” al viajero que se traslada en la plataforma móvil dentro de lo que


llamamos un marco de referencia (la palabra inglesa es reference frame) como si estuviese
contenido dentro del marco de un cuadro en el cual está todo lo que se mueve junto con el
viajero incluyendo al tren, su linterna, el aire que respira, el espacio tridimensional en el que
está situado, en fin, todo incluyéndolo a él; como también es ya costumbre denotar dicho marco
de referencia con la letra S'. Por otro lado, es ya costumbre “encajonar” el observador situado a
un lado de las vías del ferrocarril y al cual consideramos en reposo dentro de su propio marco de
referencia como también es ya costumbre denotar dicho marco de referencia con la letra S:

El viajero A lleva consigo dentro de su marco de referencia (que llamaremos S' siguiendo la
costumbre usual) un reloj electrónico de alta precisión con el cual mide el tiempo total de ida y
vuelta que el pulso luminoso tarda en recorrer la distancia D de la linterna hasta el espejo junto
con el tiempo que tarda en regresar a su punto de origen. El tiempo que transcurre entre dos
eventos que ocurren dentro de un mismo marco de referencia en el cual el observador está en
reposo es conocido como tiempo propio (y también como tiempo local).

Para fines ilustrativos usando números, supondremos que la distancia D del viajero hasta el
espejo que tiene frente a él es de 4 metros. Entonces el pulso luminoso recorrerá un total de 8
metros en su trayecto de ida y vuelta:
Entonces el tiempo propio Δt' que mide el viajero con su reloj entre la salida del pulso de luz de
la linterna y el retorno del pulso después de haber sido reflejado por el espejo será igual a:

c = 2D / Δt'

Δt' = 2D / c

Δt' = 8 metros / 1 metro por segundo

Δt' = 8 segundos

Sin embargo, lo que observa el viajero dentro de su marco de referencia S' no es lo mismo que lo
que observa la persona que está fuera del ferrocarril a un lado de las vías del tren en un marco
de referencia que llamaremos S, la cual verá al pulso de luz recorrer una longitud mayor que la
que ve el viajero dentro del vagón:
Si el ferrocarril se está trasladando a una velocidad V igual a 0.6 metros por segundo, entonces
la distancia L recorrida por el pulso luminoso será indudablemente mayor para el observador
estacionario en el marco de referencia S que la distancia 2D que el viajero ve que el pulso
luminoso recorre en su marco de referencia S'. Sin embargo, por el segundo postulado de la
Teoría Especial de la Relatividad, ambos deben medir la misma velocidad cpara ese pulso
luminoso. Entonces, ¿cómo puede el observador estacionario obtener la misma velocidad c para
el pulso luminoso siendo que la longitud de recorrido que él mide es mayor que la longitud de
recorrido para el viajero dentro del vagón? Pues midiendo un tiempo mayor de
recorrido Δt para el pulso luminoso que el tiempo Δt' medido por el viajero A. Este es un
fenómeno relativista conocido como la dilatación del tiempo.

Usando el Teorema de Pitágoras, el recorrido del rayo de luz se puede descomponer en una
componente vertical y una componente horizontal:
Veamos ahora las cosas desde la perspectiva del observador externo B, en el marco de referencia
S, medidas en el tiempo propio del observador externo B.

Para el observador B, el rayo de luz hace un recorrido triangular que, dentro de su marco de
referencia, transcurre en un tiempo total Δt que necesariamente debe ser mayor que el tiempo
propio Δt' del viajero A para que así ambos puedan medir para el rayo de luz la misma
velocidad c. En algo en lo que ambos viajero y observador externo están completamente de
acuerdo, además del hecho de que los dos miden para el pulso luminoso la misma velocidad c,
es que el tren se está desplazando a la misma velocidad V de 0.6 metros por segundo.

En su tiempo Δt, entre ambos eventos del disparo y retorno del rayo de luz a su punto de origen,
para el observador B el tren habrá avanzado una distancia total VΔt. Entonces la distancia que
habrá avanzado el tren desde que el rayo de luz es disparado por el viajero Ahasta que llega al
espejo situado en el lado contrario al viajero será la mitad, o sea (VΔt)/2. También, en su marco
de referencia S, el observador B medirá para la distancia total recorrida por el rayo de luz desde
que es disparado por el viajero A hasta que regresa a su punto de origen una longitud total
de cΔt. Entonces la distancia que habrá recorrido el rayo de luz desde que es disparado por el
viajero A hasta que llega al espejo situado en el lado contrario al viajero será la mitad de la
trayectoria total, o sea (cΔt)/2). Podemos ver que la relación de longitudes, de acuerdo con el
teorema de Pitágoras, estará dada en base al siguiente triángulo:
y será:

(cΔt/2)² = D² + (VΔt/2)²

Entonces, despejando para Δt:

Δt = 2D/√ c² - V²

Δt = (8 metros)/√(1 metro/seg)² - (0.6 metro/seg)²

Δt = 8/0.8 segundos

Δt = 10 segundos

Así pues, para el observador B, el rayo de luz tarda 10 segundos en recorrer el trayecto total de
ida y vuelta. El tiempo que mide el viajero A se ha dilatado (expandido) en B, ya que el
viajero B mide 8 segundos entre ambos eventos. Al usar la palabra “dilatación”, no la estamos
utilizando en el sentido de “retraso”, “dilación”, sino en el sentido de “aumento”, “expansión”.

Usando exactamente el mismo procedimiento que el que utilizamos para resolver este problema
numérico, podemos obtener una fórmula general para la dilatación del tiempo(en la
derivación de la fórmula se prescindirá del símbolo Δ al sobreentenderse que el tiempo t es una
diferencia de tiempo transcurrido entre dos eventos):
Pero ya vimos que 2D/c es el tiempo t' que mide el viajero A entre ambos eventos. Entonces:

Usando los valores del numéricos del ejemplo, con V=0.6 metros/segundo y Δt' = 8 segundos,
encontramos que el tiempo del viajero A se dilata a un tiempo Δt de 10 segundos, lo cual nos
verifica la fórmula.

Supongamos ahora que tenemos en tierra espaciados a distancias iguales una serie de
relojes sincronizados que están en reposo cada uno de ellos con respecto a todos los demás:

Al referirnos a estos relojes como relojes sincronizados estamos hablando de relojes que no sólo
marcan todos ellos la misma hora para el observador en reposo situado en tierra sino que
también avanzan a la par cada uno de ellos con respecto a los demás sin adelantarse ni
retrasarse.

Si repetimos los cálculos que hemos hecho arriba manteniendo constante (igual) la
velocidad V usando trayectorias de recorrido más largas, comprobaremos que el tiempo
dilatado Δt aumentará en forma directamente proporcional al tiempo propio Δt' medido
dentro del vagón. O sea que si el reloj Δt' marca 8 segundos justo cuando un reloj del
observador enfrente de él marca un tiempo Δt de 10 segundos, entonces si el reloj Δt'marca 16
segundos (el doble) entonces otro reloj en tierra que se encuentre directamente enfrente de él al
tomarse la lectura estará marcando un tiempo Δt de 20 segundos, y si el reloj Δt' marca 24
segundos (el triple) entonces otro reloj en tierra que se encuentre directamente enfrente de él al
tomarse la lectura estará marcando un tiempo Δt de 30 segundos, en una forma sugerida por las
siguientes figuras (los relojes sincronizados puestos a lo largo del sistema de referencia del
observador en reposo se mantienen sincronizados en todo momento para el observador en
reposo; sin embargo y como lo veremos posteriormente, todos esos relojes aparecerán
desincronizados para el observador en movimiento al ocurrir una pérdida relativista de
la simultaneidad absoluta con la cual lo que es simultáneo en un marco de referencia deja de
serlo al ser visto desde otro marco de referencia):

Todo esto nos indica que el factor de corrección (que en este caso es igual a Δt/Δt' = 10/8 =
1.25) que debemos aplicar para obtener el tiempo en el marco de referencia en tierra Δtcuando
conocemos el tiempo Δt' dentro del vagón es una cantidad constante, y por lo tantola
transformación matemática requerida para pasar del marco de referencia del vagón al marco
de referencia en tierra (o viceversa) debe ser una transformación linear. Haremos uso de
esta observación cuando posteriormente llevemos a cabo la derivación de fórmulas de carácter
general para poder movernos de un marco de referencia a otro.

Analicemos ahora el ejemplo desde la perspectiva del viajero A estando ambos todavía de
acuerdo en que el viajero A es el que se está desplazando a una velocidad V y el
observador B está en reposo.

El viajero A mide para el rayo de luz en su plataforma móvil con su reloj en mano una velocidad
de c = 1 metro por segundo al recorrer dentro de su marco de referencia una distancia total (ida
y vuelta) de 8 metros en 8 segundos. Pero al ser reflejado el rayo de luz y llegar a su punto de
origen, encuentra que en ese mismo punto en el que ambos coinciden por un instante mientras
el tren prosigue con su movimiento el reloj del observador Bmarca 10 segundos. Ambos siguen
en completo acuerdo en que el tren se está moviendo a la misma velocidad V con respecto a
ambos. La única forma posible en la que el viajero Apueda seguirle asignando al
observador B una velocidad V de 0.6 metros por segundo (en dirección opuesta) es que el
viajero A determine desde su punto de vista una longitud menor para el observador B entre
ambos eventos, ya que de no ser así le estaría midiendo una velocidad errónea igual a:

6 metros / 8 segundos = 0.75 metros / segundo

Entonces el viajero A también necesita un factor de corrección para compensar por


la contracción de longitud que está detectando. ¿Y de cuánto tiene que ser ese factor de
corrección? Para poder seguirle midiendo al observador B una velocidad de 0.6 metros por
segundo en ocho segundos, la distancia entre ambos eventos en la plataforma de B según el
viajero A, debe ser:

espacio = tiempo x velocidad

espacio = (8 segundos) x (0.6 metros/segundo)

espacio = 4.8 metros

¡Para el viajero A, una longitud de 6 metros del observador B parece haberse contraído a 4.8
metros! El factor de corrección para la contracción de longitud debe ser entonces:
4.8 metros / 6 metros = 0.8

El factor de corrección utilizado por el viajero móvil A para medir la contracción de la


longitud en B resulta ser exactamente el inverso del factor de corrección utilizado por el
observador B para poder determinar la dilatación del tiempo de A, lo cual era de esperarse y no
debe causarnos ningún asombro. Lo que para un observador es un fenómeno físico de dilatación
del tiempo para el otro observador refiriéndose a los mismos eventos es un fenómeno físico de
contracción de longitud.

En la cinemática relativista, la contracción de la longitud es un corolario de la


dilatación del tiempo, y viceversa. Ambas cosas siempre van de la mano.

El factor de corrección:

aparece con tanta frecuencia en problemas propios de la Teoría Especial de la Relatividad, que
con fines de simplificación notacional es representado con el símbolo γ (letra griega gamma):

Con esto tenemos la siguiente relación simplificada para obtener la dilatación del tiempo al
pasar del marco de referencia a otro:

Si simbolizamos al tiempo propio (tiempo local) del observador en reposo con la letra griega τ
(tau), entonces la fórmula toma el siguiente aspecto que resulta más familiar para quienes
estudian ciertos aspectos más avanzados de la Teoría de la Relatividad:
Del mismo modo, con el factor de corrección γ podemos escribir la siguiente relación
simplificada para obtener la contracción de longitud al pasar de un marco de referencia a otro:

Por otra parte, la cantidad V/c aparece también en el análisis de problemas de relatividad con
tanta frecuencia que es común que sea abreviada con el símbolo β (letra griega beta):

β = V/c

Hagamos el cálculo de la velocidad del rayo de luz tal y como es medida tanto por el
viajero A como por el observador B. Desde la perspectiva del viajero A, el rayo de luz recorre
dentro de su marco de referencia S' ocho metros (2D) en ocho segundos (Δt'). Entonces él mide
una velocidad de:

c = 2D / 2Δt'

c = (8 metros) / (8 segundos)

c = 1 metro/segundo

Desde su perspectiva, el observador B ve que el rayo de luz recorre una distancia dentro del
marco de referencia del viajero A tanto en su trayectoria de ida como en su trayectoria de
regreso una distancia que podemos obtener del triángulo de las distancias básicas:
Podemos ver que para el observador B el rayo en su trayectoria de ida recorre 5 metros, o sea
que en su trayectoria total de ida y vuelta recorre 10 metros. Entonces para el observador B el
rayo de luz tiene una velocidad de:

c = 10 metros / Δt

c = 10 metros / 10 segundos

c = 1 metro/segundo

Ambos viajero A y observador B miden para el rayo de luz la misma velocidad, como era de
esperarse.

Como lo hemos visto, la parte matemática del problema no es tan difícil de resolver. Lo duro
viene al considerar la parte filosófica. Cuando hablamos de contracción de longitud, ¿de qué
estamos hablando realmente? ¿Se comprime una vara de medir conforme pasa volando a gran
velocidad frente a nosotros? ¿Qué la comprime?

En realidad, la vara de medir en sí no se comprime. Es todo el espacio que viaja en ella y en


torno a ella el que se achica. Se achica el espacio entre los átomos de la vara de medir, se achica
longitudinalmente el cuerpo del observador B, absolutamente todo se achica, y es precisamente
por ello que el observador B no percibe cambio alguno en su marco de referencia dentro del cual
para él todo sigue igual sin contracción alguna.

De las fórmulas obtenidas, podemos ver que entre mayor sea la velocidad V del viajero Atanto
mayor será la contracción de longitud que el viajero a detecta en todo lo que corresponde al
espacio del observador estacionario B. Si le fuera posible al viajero moverse a la velocidad de la
luz, entonces de acuerdo con la fórmula todo el espacio del observador B desaparecería
longitudinalmente, desaparecería del Universo, lo cual ciertamente no va a ocurrir. Ningún
objeto material sólido puede moverse a una velocidad igual o mayor que la
velocidad de la luz. Sólo la luz puede moverse a la velocidad de la luz, y la luz no es ningún
objeto material sólido, es energía electromagnética pura.

Es importante enfatizar que lo que hemos visto no es una cuestión de ilusiones ópticas. Se trata
de fenómenos reales que están ocurriendo en el mundo real. No nos damos cuenta de ello
porque siendo la velocidad de la luz extremadamente alta, el factor V²/c² y con ello el factor de
corrección sólo se vuelve importante para situaciones que se acercan a la velocidad de la luz.
Pero los efectos son medibles. Un caso que ocurre cotidianamente tiene que ver con
las partículas cósmicas que constantemente están bombardeando la Tierra. Al chocar contra la
atmósfera de la Tierra, cada una de las partículas cósmicas produce una estela de otras
partículas subatómicas:
En el siguiente dibujo podemos ver una representación de las partículas subatómicas que una
partícula cósmica produce tras su choque con la atmósfera terrestre:

Entre todas estas partículas subatómicas hay una que nos interesa, el muón μ+, producido por el
decaimiento del mesón π+ a su vez producido por el choque de la partícula cósmica con la
atmósfera terrestre. Por experimentos llevados a cabo en laboratorios en la Tierra, se sabe que
los muones cuando están reposo tienen un tiempo de vida medio de tan sólo 2 microsegundos,
un tiempo extremadamente corto. Puesto que los muones son producidos a gran altura, muy
pocos de ellos deberían llegar al nivel del mar. Sin embargo, los muones que se observan son
muchos (esto se puede confirmar utilizando una cámara de niebla de Wilson). Un muón
viajando a una velocidad de 0.99 veces la velocidad de la luz (0.99c) alcanzaría a recorrer
únicamente unos 600 metros en sus 2.2 microsegundos de vida. Sin embargo, en virtud de que
el muón viaja a una velocidad muy cercana a la velocidad de la luz, en el marco de referencia del
muón el tiempo avanza mucho más lentamente. Su vida media de 2.2 microsegundos se ve
incrementada en el marco de referencia de la Tierra por un factor de corrección de 16 (para una
velocidad de 0.998c), aumentando hasta 16 microsegundos, y un muón viajando a la velocidad
de 0.99c alcanza a recorrer 4,800 metros en este lapso de tiempo:
Sin embargo, desde la perspectiva del muón, viajando a un lado suyo, su vida media sigue
siendo de 2.2 microsegundos. Lo que pasa es que la distancia que recorre el muón es menor por
los efectos de la contracción relativista de la longitud. El muón no recorre los 4,800 metros,
recorre únicamente 600 metros:

Nuevamente, lo que para un observador se trata de una dilatación del tiempo, para el otro
observador se trata de una contracción de longitud.

PROBLEMA: En su primer papel en el cual dió a conocer al mundo su Teoría Especial de la


Relatividad, Einstein escribió lo siguiente:
“Si en los puntos A y B de K hay relojes estacionarios que, vistos desde un sistema estacionario,
están sincronizados, y si el reloj en A es movido con velocidad V a lo largo de la línea AB hacia B,
entonces a su llegada a B los dos relojes no sincronizarán, el reloj movido de A hacia B estará
detrás del otro que permaneció estacionario por ½ tV²/c² (hasta magnitudes de orden cuatro y
mayor), siendo t el tiempo ocupado en la jornada de A hacia B.”

Demostrar el enunciado anterior.

Al estar en la posición A, ambos relojes que llamaremos el reloj 1 y el reloj 2 coinciden en un


mismo tiempo t1 = t2. Al llegar el reloj viajero 1 de A a B, ambos relojes habrán acumulado
tiempos diferentes t1 ≠ t2, y la diferencia Δt acumulada entre ambos estará dada por la fórmula
para la dilatación del tiempo:

Δt = Δt’ / √ 1 - V²/c²

Δt = Δt’ { 1 - (V/c)² }-½

Podemos llevar a cabo la expansión por series de la expresión anterior recurriendo al teorema
del binomio que en su forma más general es enunciado de la siguiente manera:

(a + x) n =

an + nan-1x + {n(n-1)/2!} an-2x² + {n(n-1)(n-2)/3!} an-3x3 + ...

Haciendo a=1 y tomando el exponente n como el exponente fraccionario negativo -½, tenemos
la serie infinita:

(1 - x) -½ = 1 + (½) x + ... __para x ≤ 1

con la cual:

Δt = Δt’ { 1 + (½) (V/c)² + O(V/c)4 }

en donde O(V/c)4 significa “los Otros términos residuales de la serie infinita sobre V/c de orden
4 o mayor”. Entonces, despreciando esos otros términos residuales de la serie:

Δt = Δt’ { 1 + (½) (V/c)² }

Δt = Δt’ + Δt’ (½) (V/c)²

Δt - Δt’ = (½) Δt’ (V²/c²)


Pero Δt - Δt’ es precisamente la diferencia entre los lapsos de tiempos Δt y Δt’ transcurridos
entre los dos relojes, y como el lapso de tiempo Δt’ corresponde al reloj que se movió, vemos que
esto será igual a la expresión dada por Einstein en su papel original.

PROBLEMA: En el mismo papel elaborado por Einstein en donde aparece lo anterior,


Einstein agregó lo siguiente:
“Entonces concluímos que un reloj de balanza puesto en el Ecuador deberá correr más
lentamente, por una cantidad muy pequeña, que un reloj precisamente similar situado en uno
de los polos bajo condiciones de otra manera idénticas.”

Calcúlese la diferencia de tiempos entre los dos relojes después de un siglo.

En medidas angulares, la Tierra gira sobre su propio eje 2π radianes en 24 horas. Su velocidad
angular ω será entonces:

ω = 2π radianes / 24 horas

ω = 72.722 · 10-6 radianes/seg

Tomando el radio medio de la Tierra como R = 6.37 · 106 metros, podemos estimar una
velocidad tangencial en su ecuador igual a:

V = ωR

V = (72.722 · 10-6 radianes/seg)(6.37 · 106 metros)

V = 463.24 metros/seg

El retardo de tiempo acumulado después de un siglo por el reloj que avanza a la anterior
velocidad V será:

t = (½) t’ (V²/c²) = (½) t’ (V/c)²

t = (½) (100 años) {(463.24 metros/seg) / (3 · 108 metros/seg)}²

t = 3.8 · 10-3 segundos


Esta es una diferencia de tiempos muy pequeña que en los tiempos de Einstein era indetectable.
Sin embargo, en los tiempos de hoy en los que contamos con relojes de precisión atómica, el
experimento se puede llevar a cabo en cualquier momento subiendo a una persona a un avión
llevando consigo un reloj de alta precisión. El experimento ya se ha efectuado, y los resultados
son precisamente los que predice la Teoría de la Relatividad. Fue llevado a cabo por vez primera
en 1971 por Joseph C. Hafele y R. Keating, los cuales se subieron con cuatro relojes atómicos de
cesio a bordo de aviones comerciales dándole la vuelta a la Tierra primero en dirección Este y
después haciendo otro viaje redondo en dirección Oeste, comparándose las lecturas de los
mismos con la lectura de otro reloj idéntico en Tierra en la ciudad de Washington sincronizado
inicialmente con los relojes viajeros. Al comparar las lecturas de los relojes atómicos después del
viaje, los del avión y el de la Tierra, ya no estaban sincronizados. Los relojes atómicos que
habían volado estaban ligeramente retrasados (muy ligeramente pero medible con dichos
relojes, la diferencia de tiempos era de unas pocas centésimas de milésima de millonésima de
segundo). Tras descontar ciertos efectos gravitatorios secundarios, y asumiendo que no hubo
ningún error de medida, lo cual se comprobó controlando las condiciones y repitiendo el
experimento varias veces, se concluyó que la única explicación posible venía por la Teoría de la
Relatividad.
A un costo de 8 mil dólares por el experimento, de los cuales 7 mil 600 dólares fueron
empleados para pagar los pasajes, la edición de septiembre de 1972 de la revista Scientific
American
lo llamó la prueba más económica que se haya hecho sobre la relatividad. De hecho, son tantas
las pruebas experimentales que se han llevado a cabo ya de diversas maneras confirmando las
predicciones teóricas de la Teoría de la Relatividad, que un resultado negativo causaría en estos
momentos una verdadera conmoción entre la comunidad científica.

En tiempos recientes, los efectos relativistas de la dilatación del tiempo ocasionados por una
rotación alrededor de la Tierra tienen que ser tomados en cuenta para hacer las correcciones
numéricas necesarias para poder mantener sincronizados con la Tierra a los 24 satélites
utilizados por el Sistema de Posicionamiento Global ó Global Positioning System (GPS), cada
uno de los cuales le dá una vuelta completa a la Tierra cada 12 horas:
en virtud de que dichos satélites, al estarse moviendo en el espacio en relación con los relojes
atómicos que están en reposo en la Tierra, registran un tiempo que camina con mayor lentitud.
El sistema de localización GPS requiere para su buen funcionamiento que los satélites estén
sincronizados a un elevado nivel de precisión, lo cual es absolutamente necesario para
permitirle a las personas en la Tierra que tengan receptores GPS (cada vez incorporados con
mayor frecuencia como una función en teléfonos celulares de alto costo):
el poder ubicar sus coordenadas geográficas con la exactitud requerida en base a las distancias
de cada uno de los satélites cuyas señals alcanzan a llegar a un receptor de señales GPS. Aunque
el efecto relativista es relativamente pequeño, los relojes atómicos son lo suficientemente
precisos como para ser afectados por el efecto de la dilatación del tiempo, y las correcciones
numéricas que se tienen que hacer son precisamente las que predice la Teoría de la Relatividad.

PROBLEMA: Una vara en movimiento de longitud L forma un ángulo θ con respecto a la


horizontal. Si la vara se mueve a una velocidad V a lo largo de la dirección con respecto a la
cual forma dicho ángulo, ¿cuál será la longitud de la vara y cuál será el ángulo que forma la
vara con respecto a la horizontal para un observador en reposo que los ve pasar?

Puesto que las dimensiones de un objeto experimentan una contracción relativista por un factor
√ 1 - V²/c² en la dirección del movimiento, para un observador en reposo la componente
horizontal de la vara habrá quedado reducida a una longitud de:

L cos(θ) √ 1 - V²/c²

mientras que la componente de la vara perpendicular a la dirección del movimiento, que


es Lsen(θ), permanecerá inalterada en ambos marcos de referencia. Por lo tanto, para el
observador en reposo en el marco de referencia S, por el teorema de Pitágoras la longitud de la
vara L en su marco de referencia será igual a la raíz cuadrática de la suma de los cuadrados de la
componente vertical y de la componente horizontal contraída :

L² = L² sen²(θ) + (1 - V²/c²)(L² cos²(θ))

L = L √ sen²(θ) + cos²(θ)/γ²

Y en lo que al ángulo respecta, el ángulo θ medido por el observador en S estará dado de:

Tan(θ) = [L sen(θ)]/[(L cos(θ))(√ 1 - V²/c²)]

Tan(θ) = γ Tan(θ)

θ = Tan-1[γ Tan(θ)]

PROBLEMA: Dos observadores en los sistemas de referencia S y S’ sincronizan sus relojes


para que den las mismas lecturas de t = 0 en sus orígenes cuando coinciden el uno frente al
otro. El observador en S lee la lectura del reloj en S’ a través de un telescopio. ¿Cuál es el
tiempo que lee del reloj en S’ cuando su reloj marca 20 minutos si V² = (8/9) c²?

Este problema ilustra una complicación adicional que tenemos que tomar en cuenta en la
resolución de ciertos problemas que tiene que ser agregada a los efectos propios de la
relatividad: el tiempo finito empleado por la luz en llegar de un lugar a otro. Si nosotros desde la
Tierra vemos con un telescopio un reloj en el planeta Marte sincronizado con el nuestro cuando
los planetas están más cercanos, podemos tener la seguridad de que la lectura que veremos en el
reloj de Marte con la ayuda de nuestro telescopio no será igual a la de nuestro reloj ya que la
distancia que tiene que recorrer viajando a la velocidad de la luz la imagen del reloj es de unos
100 millones de kilómetros, y puesto que esa imagen no nos llega instantáneamente sino que es
una imagen que tarda (100,000,000 Km)/(300,000 Km/seg) = 333 segundos = 6 minutos, la
lectura que veremos es una imagen del pasado, de algo que nos fue enviado 6 minutos antes y
que tardó 6 minutos en llegarnos. De hecho, todo, pero absolutamente todo lo que
vemos, son imágenes del pasado. No hay imagen alguna de nada que vemos con nuestros ojos
que nos llegue instantáneamente, inclusive de objetos cercanos a nosotros al alcance de nuestras
manos, en virtud de la velocidad finita de la principal portadora de información, la luz. Vivimos
en la ilusión de que todo lo que tenemos ante nosotros cerca de nosotros lo vemos justo cuando
está ocurriendo, pero ello es una ilusión encubierta por el hecho de que las diferencias en los
tiempos involucrados son tan pequeñas que para fines prácticos pueden ser consideradas
despreciables, pero no son despreciables. Afortunadamente, aunque la velocidad de la luz es
finita, también es bastante elevada, de modo tal que no nos damos cuenta de que las imágenes
que vemos en torno nuestro son imágenes de un pasado tanto mayor cuanto mayor sea la
distancia que nos separa de lo que estamos viendo. En estos momentos vemos con nuestros
telescopios, incluído el telescopio espacia Hubble, las imágenes de estrellas que ya no existen,
que se apagaron hace millones de años. En el tiempo en que tardaron las imágenes de esas
estrellas en llegarnos tales estrellas desaparecieron y ya no existen “hoy”.

Regresando al problema que nos ocupa, podemos ver que ocurren tres eventos:

1) Los dos observadores S y S’ están el uno frente al otro sincronizando sus relojes a un tiempo t
= t = 0.

2) El observador viajero S’ llega a cierto punto en su recorrido desde donde le envía una imagen
de su reloj al observador en S.

3) La imagen del reloj de S’ le llega al telescopio al observador en S a la vez que S’ continúa su


recorrido.

Nótese que el tiempo de S’ que lee el observador en S no es la lectura que está marcando el reloj
de S’ cuando le llega la imagen del reloj a S a los 20 minutos.

Desde la perspectiva del observador en reposo, el tiempo de 20 minutos en el cual el


observador en S recibe la imagen del reloj de S’ debe ser igual al tiempo t 1 (= L/V) que tarda el
viajero en S’ en llegar hasta el punto desde el cual le envía a S la imagen de su reloj, más el
tiempo t2 (= L/c) que tarda en llegarle dicha imagen a S, siendo L la distancia propia medida
por S:

20 minutos = t1 + t2

20 minutos = L/V + L/c = (1/V + 1/c) L’ = (√9/8 + 1) L/c = (2.06) L/c

L = (1,200 seg) (3·108 metros/seg) / 2.06 = 1.747·1011 metros

Esta es la distancia que ha recorrido S’ medida por S cuando el primero le envía la imagen de su
reloj a S.

Sin embargo, para S’ esta distancia de está contraída por un factor

√ 1 - V²/c² = √ 1 - (8/9) = 1/3

O sea que, desde su perspectiva, S’ ha recorrido una distancia de L’ = 0.582·10 11 metros.


Entonces el tiempo t’ que S tiene acumulado en su reloj al recorrer dicha distancia viajando a
una velocidad de V = √(8/9) c es:

t’ = L’/V = (0.582·1011 metros) / (0 2.8284·108 metros/seg)

t = 205.8 segundos = 3.43 minutos

El experimento que antecedió a la teoría

“¿Qué es el tiempo?” - en alguna ocasión


se le llegó a preguntar a Einstein, quizá
para meterlo en un aprieto filosófico.
“Es lo que medimos con el reloj” - contestó
Es interesante el hecho de que la primera confirmación experimental de la Teoría Especial de la
Relatividad se dió en 1881 cuando aún no existía dicha teoría e inclusive cuando Einstein apenas
tenía dos años de edad (nació en 1879). La Teoría Especial de la Relatividad sería publicada 24
años después, en 1905, y cuando Einstein desde Europa dió a conocer al mundo su teoría ni
siquiera parecía haber estado bien enterado de los resultados obtenidos en aquél famoso
experimento llevado a cabo por vez primera en los Estados Unidos por el físico Albert Michelson
24 años atrás. Cuando Einstein elaboró su teoría no la concibió con la finalidad de explicar los
resultados obtenidos por Michelson, la elaboró con el fin de liberar de asimetrías las ecuaciones
básicas del electromagnetismo descubiertas por Maxwell.

Cuando Michelson llevó a cabo su ahora ya famoso experimento, la intención de Michelson era
determinar la rapidez con la cual se estaba moviendo la Tierra en el espacio en relación con ese
medio estático, invisible y universal que se suponía que servía como medio de conducción para
la transmisión de las señales luminosas, el éter, el cual había sido postulado por varios físicos de
prestigio como la gran referencia cósmica con respecto a la cual el movimiento absoluto podía
ser detectado. Michelson esperaba poder detectar desde su laboratorio no sólo la velocidad a la
cual se estaba moviendo la Tierra con respecto al éter, sino inclusive la dirección hacia la cual o
de la cual se estaba acercando o alejando del éter en un momento dado al girar la Tierra en torno
al Sol.

El aparato original de Michelson cuando fue utilizado por vez primera tenía el siguiente aspecto:

Este aparato trabajaba sobre el siguiente esquema simplificado:


Todo el aparato estaba montado sobre una enorme piedra caliza montada sobre madera suave
flotando a su vez en una piscina de mercurio líquido con el fin de disminuír las vibraciones del
instrumento. Sobre la plataforma había una fuente de luz de la cual emanaba un haz que con la
ayuda de un espejo semireflejante era dividido en dos caminos diferentes, dirigiéndose parte del
haz por transmisión directa a través del espejo semireflejante hacia un espejo opuesto hacia la
fuente de luz (situado a la derecha del dibujo), y dirigiéndose la otra parte del haz por reflexión
directa hacia otro espejo (situado en la parte superior del dibujo). Ambos haces eran reflejados
por los espejos, y al combinarse los haces separados nuevamente lograban pasar por el espejo
semireflejante hacia un detector que consistía básicamente en un telescopio graduado. Puesto
que uno de los haces de la combinació seguía una ruta había seguido una trayectoria más larga
que el otro, al juntarse nuevamente ambos haces se producía un patrón de interferencia propio
de las ondas que llegan fuera de fase. A continuación tenemos un bosquejo del efecto que se
obtenía del aparato:
El objetivo de la rueda que flotaba sobre la piscina de mercurio líquido era girar todo el
instrumental (fuente de luz, espejos, telescopio) situado sobre la plataforma para dejar que el
movimiento con respecto al éter alterara las franjas de interferencia observadas en el telescopio
y a través de la alteración determinar la velocidad del aparato (y por lo tanto de la Tierra sobre la
cual estaba puesto el aparato) con respecto al éter. Obviamente, para poder obtener un patrón
de interferencia entre dos haces de luz originados de una misma fuente pero arribando con una
diferencia de longitud en sus trayectorias, era necesario utilizar un haz luminoso
monocromático, de un solo color (y por lo tanto de una sola frecuencia):

El experimento estaba diseñado sobre una premisa muy fácil de entender: si existe el éter
absoluto, inamovible, que permea todo el espacio, medio usado por las ondas electromagnéticas
incluída la luz misma para propagarse, entonces si un rayo luminoso es lanzado directamente
hacia un espejo el tiempo total de ida y vuelta del rayo luminoso será diferente si dicho rayo de
luz es lanzado en una dirección que coincide con la dirección en la cual está “soplando” el viento
del éter que el tiempo total de ida y vuelta si dicho rayo de luz es lanzado en una
dirección perpendicular a la dirección en la cual está “soplando” el viento del éter, suponiéndose
que este “viento del éter” se debe al movimiento combinado de rotación y traslación de la Tierra
en el cosmos. En el aparato de Michelson, aunque no sepamos ni podamos ver en qué dirección
está “soplando” el viento del éter, nos basta con ir girando la rueda sobra la cual está montada
todo el instrumental para poder obtener una diferencia de tiempos la cual, aunque minúscula,
debe poder ser detectada de los patrones de interferencia formados en el telescopio detector.

Cuando un rayo de luz es lanzado hacia un espejo a lo largo de una misma dirección con
respecto a la cual se está efectuando el movimiento del laboratorio con respecto al éter, entonces
si la velocidad del laboratorio moviéndose en contra del estático éter es V la velocidad del rayo
luminoso se verá disminuída de c a c-V en su viaje de ida, y se verá aumentada a c+V en su
viaje de retorno (obsérvese que bajo la hipótesis del éter, al no ser la velocidad de la luz la
misma para todos los marcos de referencia en movimiento absoluto con respecto al éter no
existe impedimento alguno para que los objetos materiales puedan moverse a velocidades
mayores que la velocidad de la luz):

Llamando L a la distancia entre la fuente de luz y el espejo reflector, el tiempo total de ida y
vuelta del haz luminoso será la suma del tiempo de ida:

Tida = L / (c - V)

a la del tiempo de vuelta:

Tvuelta = L / (c + V)

o sea:

Ttotal = Tida + Tvuelta

Ttotal = L{ 1/(c - V) + 1/(c + V) }

Ttotal = L{ (c + V)/(c² - V²) + (c - V)/(c² - V²) }


Ttotal = 2Lc/(c² - V²)

Ttotal = (2L/c)/(1 - V²/c²)

El caso en el cual el rayo de luz es lanzado en una dirección perpendicular a la dirección en la


cual está “soplando” el viento del éter se puede comparar mediante una analogía con un avión
en el aire. Un avión que vuela de Sur a Norte a una velocidad de 20 metros por segundo tardará
diez segundos en recorrer una distancia de 200 metros volando de Sur a Norte cuando no está
soplando viento alguno, pero si el avión es arrastrado al mismo tiempo de Este a Oeste por el
viento a una velocidad de 12 metros por segundo, tardará más tiempo en recorrer los mismos
200 metros de Sur a Norte ya que su velocidad efectiva en dicha dirección habrá disminuído a 16
metros por segundo. Tardará 12.5 segundos en lugar de diez en recorrer esos 200 metros de Sur
a Norte:

Esto lo podemos deducir con una simple substracción vectorial de velocidades llamando va la
velocidad del avión en un día tranquilo sin viento alguno, V la velocidad con la cual empieza a
soplar el viento, y u la velocidad efectiva del avión de de Sur a Norte:

u=v-V
Vectorialmente, la velocidad v del avión es disminuída en su sentido de Norte a Sur de 20
metros por segundo a una velocidad efectiva u de 16 metros por segundo por el “soplo del
viento” (el avión sigue manteniendo su misma velocidad de acuerdo a lo que le marcan al piloto
los instrumentos). La magnitud de la velocidad efectiva la obtenemos con la simple aplicación
de teorema de Pitágoras:

v² = V² + u²

(20 m/seg)² = (12 m/seg)² + u²

u² = (20 m/seg)² - (12 m/seg)²

u² = 256 m²/seg²

u = 16 m/seg

Esto mismo lo podemos generalizar para obtener una expresión para el tiempo total de ida y
vuelta del rayo luminoso cuando es lanzado en una dirección perpendicular a la dirección del
“viento del éter”.

PROBLEMA: Suponiendo la existencia del éter, obtener una expresión general para calcular
el tiempo total de ida y vuelta de un haz luminoso cuando el rayo de luz es lanzado hacia un
espejo en una dirección perpendicular con respecto a la cual se está efectuando el movimiento
del haz en relación al éter, siendo L la distancia entre la fuente luminosa y el espejo reflector.

La resolución de este problema consiste simplemente en generalizar con símbolos lo que


acabamos de ver en el ejemplo de arriba. El tiempo de ida Tida del haz en una dirección
perpendicular con respecto a la cual se está efectuando el movimiento del haz en relación al éter
será igual al tiempo de regreso Tvuelta del haz al punto de donde fue lanzado, siendo este tiempo
igual a:

Tida = L / √c² - V²

y por lo tanto el tiempo total será:


Ttotal = 2L/ √c² - V²

Ttotal = (2L/c) / √ 1 - V²/c²

Obsérvese que este tiempo es diferente del tiempo total de recorrido que se obtiene cuando el
haz luminoso es lanzado en una dirección paralela (en la misma dirección) a la dirección del
“viento del éter” en vez de ser lanzado en una dirección perpendicular a dicho viento.

PROBLEMA: Suponiendo la existencia del éter, obtener una expresión general aproximada
para calcular la diferencia de tiempos en un aparato en el cual se lanza un rayo de luz
recorriendo una distancia L hacia el espejo reflector en su trayecto de ida y vuelta cuando el
rayo de luz viaja en una dirección paralela a la dirección en la cual está soplando el “viento del
éter”, y el tiempo total de ida y vuelta medido en el mismo aparato cuando el rayo de luz es
lanzado viajando en una dirección perpendicular a la dirección en la cual está soplando el
“viento del éter”. ¿Cómo se comparan estos dos tiempos con el tiempo medido por un
observador privilegiado que esté en reposo absoluto con respecto al éter?

Para el caso en el cual el haz luminoso es lanzado a lo largo de la misma dirección en la cual está
soplando el “viento del éter”, la expresión del tiempo total Ttotal de ida y vuelta es:

Ttotal = (2L/c) /(1 - V²/c²)

Ttotal = (2L/c) {1 - V²/c²} -1

Podemos llevar a cabo la expansión de esta expresión mediante una serie infinita recurriendo
al teorema del binomio que en su forma más general es enunciado de la siguiente manera:

(a + x) n =

an + nan-1x + {n(n-1)/2!} an-2x² + {n(n-1)(n-2)/3!} an-3x3 + ...

Cuando a=1 y cuando el exponente n es -1 por tratarse de un inverso, el teorema del binomio se
reduce a:

(1 - x) -1 = 1 + x + x² + x3 + x4 + x5 + ... __para x ≤ 1

(La condición x ≤ 1 se cumple aquí porque suponemos que el aparato está viajando a una
velocidad V menor que la velocidad de la luz c sin suponer efecto relativístico alguno.)

Con esta expansión tenemos:

(1 - V²/c²) -1 = 1 + V²/c² + O(V/c)2

en donde O(V/c)2 significa “los Otros términos residuales de la serie obtenidos con exponentes
de orden 2 y mayor”.

Por lo tanto el tiempo de ida y vuelta será aproximadamente igual a:

Ttotal ≈ (2L/c) (1 + V²/c²)

Para el caso en el cual el haz luminoso es lanzado en una dirección perpendicular a la dirección
en la cual está soplando el “viento del éter”, la expresión del tiempo total Ttotalde ida y vuelta es

Ttotal = (2L/c) / √ 1 - V²/c²

Ttotal = (2L/c) {1 - V²/c²} -½

Usamos nuevamente el teorema del binomio haciendo a=1 cuando el exponente es el exponente
fraccionario negativo -½, con lo cual tenemos:

(1 - x) -½ = 1 + (½) x + O(x)2 __para x ≤ 1

Por lo tanto el tiempo total de ida y vuelta para el caso perpendicular será:

Ttotal ≈ (2L/c) {1 + (½) (V²/c²)}

La diferencia entre Ttotal y Ttotal es entonces (obsérvese que Ttotal es mayor que Ttotal):

ΔT ≈ Ttotal - Ttotal

ΔT ≈ (2L/c) (1 + V²/c²) - (2L/c) {1 + (½) (V²/c²)}

Simplificando:

ΔT ≈ LV² / c3
Un observador privilegiado que se encuentre en absoluto reposo con respecto al éter tendrá una
velocidad V igual a cero, y el tiempo total de ida y vuelta será Tprivilegiado = 2L/c. Puesto que esta
relación es diferente de las relaciones obtenidas por otro experimentador que está en
movimiento con respecto al éter, hay una asimetría entre el observador privilegiado y todos los
demás observadores. reflejada en diferencias medibles entre experimentos llevados a cabo con el
mismo aparato por distintos observadores.

Comparando los tres tiempos a un primer orden de aproximación:

Ttotal ≈ (2L/c) (1 + V²/c²)

Ttotal ≈ (2L/c) {1 + (½) (V²/c²)}

Tprivilegiado = 2L/c

comprobamos que, en todos los casos, el menor tiempo posible de recorrido será precisamente
el que mida un observador privilegiado que esté en absoluto reposo con respecto al éter en cuyo
caso por tener V = 0 tanto Ttotal como Ttotal se reducen a 2L/c. Esto, en principio, nos dá una
forma teórica y experimental de poder saber si estamos en reposo absoluto con respecto al
hipotético éter.

Michelson supuso, al igual que otros científicos de su tiempo, que la Tierra por sus movimientos
de rotación y traslación alrededor del Sol no estaba permanentemente en reposo con respecto al
éter, y si acaso lo estaba ello sería por un instante brevísimo. Debía ser posible detectar el
desplazamiento de la Tierra a través del éter. El aparato que diseño se basó precisamente en la
diferencia de tiempos ΔT que esperaba obtener entre dos rayos de luz, uno arrojado en la posible
dirección paralela al “soplo del viento del éter” y el otro arrojado en una dirección
perpendicular, juntando dichos haces de luz para detectar la variación producida en un patrón
de interferencia luminosa. Dada la enorme dificultad en hacer las dos trayectorias (la paralela y
la perpendicular) de la misma longitud L a la precisión requerida, el patrón de interferencia
producida por los dos haces luminosos al llegar desfasados al detector era observada y entonces
el aparato completo era girado 90 grados. Esta rotación debería de producir para cada haz
luminoso la diferencia de tiempo dada por:

ΔT ≈ LV² / c3
Esta diferencia de tiempo ΔT es equivalente a una diferencia de trayectoria de 2cΔT. De acuerdo
con los principios de la óptica ondulatoria, las franjas de interferencia observadas en la primera
orientación de la mesa giratoria deberían recorrerse en el detector por una cantidad ΔN de
franja igual a:

ΔN = 2cΔT/λ

ΔN = (2L/λ) (V²/c²)

en donde λ es la longitud de onda de la fuente luminosa monocromática.

Cuando llegó el día de llevar a cabo la primera realización del experimento en 1881, la distancia
L en la mesa giratoria era de unos 1.2 metros y la longitud de onda de la señal luminosa utilizada
era de λ = 5.9·10-7 de metro. Tomando la velocidad orbital de la Tierra alrededor del Sol para
una primera aproximación de la velocidad V con respecto al éter, obtenemos una velocidad de
unos 30 kilómetros por segundo que viene siendo igual a 10-4c, con lo cual V²/c² es un factor de
10-8, y se esperaba que ΔN fuese igual a un 0.04 de franja. Desafortunadamente, se estimaba que
las incertidumbres experimentales eran de un orden de magnitud similar.

De cualquier manera, al efectuar el experimento y en un resultado que lo sorprendió, Michelson


no encontró cambio alguno en los patrones de interferencia por más que girase la mesa rotatoria
hacia uno y otro lado, con lo cual concluyó que esto era una evidencia de que la Tierra no se
estaba moviendo con respecto al éter, aunque el resultado negativo del experimento llevado a
cabo por Michelson inicialmente fue tomado por muchos como un fracaso debido a la falta de
precisión de los instrumentos utilizados en aquella época en la que no existía ni siquiera la radio
comercial. Tiempo después, en 1887, Michelson repitió el mismo experimento con Edward W.
Morley, usando un sistema mejorado para girar la mesa circular del aparato sin introducir un
desplazamiento en las franjas de interferencia luminosas causadas por tensiones mecánicas en
el aparato, y la longitud efectiva de la trayectoria fue elevada de los 1.2 metros originales a unos
11 metros recurriendo a una serie de reflexiones múltiples. Este es el aparato que tenemos
descrito arriba. Para este intento, se había calculado que N debería tener un valor de 0.4 de
franja, unas 20 ó 40 veces más que el mímino que era posible observar. Y de nueva cuenta, no se
encontró corrimiento alguno en las franjas de interferencia al girar la mesa rotatoria hacia uno y
otro lado, y en esta ocasión había la certeza de que no se debían a error experimental alguno..
Desde entonces, el mismo experimento ha sido repetido innumerables ocasiones alrededor del
mundo, y jamás se ha encontrado corrimiento alguno en las franjas de interferencia.

En un esfuerzo por explicar los resultados negativos obtenidos por Michelson y Morley, el físico
holandés Hendrik Antoon Lorentz formuló conjuntamente con el físico irlandés George Francis
Fitzgerald una explicación teórica hecha “justo a la medida”, argumentando que al igual que una
masa suave que se mueve en el aire o bajo el agua sufre una ligera deformación por la resistencia
que le ofrece el medio en el cual se está desplazando, también la vara de medición que se
estuviera moviendo en contra del éter estático sufriría una contracción que por una maravillosa
y casi milagrosa coincidencia era justo lo que se necesitaba para compensar con una longitud
menor la diferencia de tiempos de traslado que se hubiera esperado detectar a través de los
patrones de interferencia observados en el telescopio, explicando con ello los resultados
negativos obtenidos en los experimentos. Matemáticamente expresado, la contracción debida al
“empuje del viento del éter” reduciría la longitud original L0 de la vara de medición a una
longitud menor L dada por:

L = L0 √ 1 - V²/c²

en donde V vendría siendo la velocidad de la regla al estarse moviendo en contra del éter. De
acuerdo con ésta fórmula, poniendo números, una vara de medición moviéndose en contra del
éter a una velocidad igual a las tres cuartas partes de la velocidad de la luz sería “comprimida” a
un 66 por ciento de su longitud original. Esta contracción fue llamada desde que fue propuesta
como la contracción Lorentz-Fitzgerald.

La principal objeción que podemos ponerle a esta teoría es que predice una compresión igual en
todas las varas de medición independientemente del material del que estén hechas, ya sea de
acero inoxidable rígido o de caucho, lo cual por sí solo presiona demasiado los límites de nuestra
credibilidad. Pero otra objeción más dura aún a la fórmula de contracción de longitud de una
vara de medición dada por Lorentz y Fitzgerald era que carecía de una teoría que justificase la
fórmula, se trataba de una fórmula semi-empírica, era simplemente un artificio concebido para
explicar los resultados negativos del experimento Michelson-Morley.

Fué solo hasta 1905 cuando Einstein dió a conocer su Teoría Especial de la Relatividad que los
resultados negativos del experimento Michelson-Morley tuvieron una explicación teórica
rigurosa y satisfactoria: al no existir el éter y por lo tanto al no existir forma alguna de poder
detectar el movimiento absoluto de la Tierra con respecto a algo que no fuese su rotación
alrededor del Sol y ni siquiera así, la Tierra podía tomarse como un cuerpo en estado de reposo,
y al ser tomada como un cuerpo en estado de reposo la velocidad del éter en las fórmulas
utilizadas por Michelson y Morley era V=0, con lo cual los resultados negativos del experimento
se vuelven inevitables.

En el problema anterior, tenemos tres expresiones diferentes para los tiempos de viaje que
obtendríamos para un rayo de luz usando el mismo aparato
experimental, Ttotal , Ttotal y Tprivilegiado, tiempos de viaje predichos teóricamente sobre la base
de la existencia del éter, capaces de ser confirmados experimentalmente. Y de las tres
expresiones anteriores, la más sencilla de todas, la que nos dá T=2L/c, es la que obtendría un
observador privilegiado que estuvierse en reposo absoluto con respecto al éter. Esto es algo de
naturaleza general. Las leyes de la física adquieren su forma más sencilla posible para un
observador privilegiado que esté en reposo absoluto con respecto al éter, un observador para
el cual V=0. Para todos los demás observadores, las leyes tendrán fórmulas más complejas como
lo acabamos de ver. A este tipo de asimetrías era a las que se refería Einstein en su
papel original. La única forma de deshacerse de estas asimetrías es rechazar la hipótesis de la
existencia del éter y del movimiento absoluto, que fue precisamente lo que hizo Einstein.

Los diagramas espacio-tiempo de Minkowski


La Teoría Especial de la Relatividad, tal y como fue enunciada por vez primera por Einstein, era
una teoría puramente algebraica, sin referencia alguna a ningún tipo de geometría. Se debe a
Hermann Minkowski la proeza de haberla convertido en una teoría geométricallevando a cabo
de paso la unificación de dos conceptos que en la mecánica clásica habían sido considerados
completamente independientes y separados el uno del otro: el espacio y el tiempo. Gracias a
Minkowski, el espacio y el tiempo fueron unificados en un solo concepto básico e indivisible bajo
una sola palabra, el espaciotiempo (aquí lo llamaremos espacio-tiempo en el entendido de
que ambos conceptos han sido fusionados en uno solo), de modo tal que no era posible hablar ya
del espacio como entidad individual y del tiempo como entidad individual también, separados el
uno del otro. Pero aquí nos estamos adelantando a nuestra historia.

Considerando para fines ilustrativos una velocidad de la luz de c = 1 metro por segundo,
el diagrama espacio-tiempo para un rayo de luz es el siguiente:
Sobre el mismo diagrama, la especificación de la coordenada x de una partícula material que nos
indica la posición en la cual se encuentra la partícula y del tiempo t al que corresponde esta
coordenada, se dice que determina un evento o un suceso. Si representamos la posición x en el
eje de las abcisas (eje horizontal) y el tiempo t en las ordenadas (eje vertical), cada punto del
plano x-t corresponde a un posible evento. En un diagrama así podemos representar dos eventos
distintos vistos por un mismo observador, trátese de dos eventos distintos que ocurren en el
mismo lugar en tiempos diferentes, dos eventos distintos que ocurren al mismo tiempo en
distintos lugares, o dos eventos distintos que ocurren en tiempos diferentes en lugares
diferentes, como es el siguiente caso:
El lugar en un plano x-t de los eventos que representan las coordenadas apareadas de una
partícula en varios instantes se conoce en los estudios de la relatividad como línea del
mundo (world line) y también como línea del universo. En la Teoría Especial de la
Relatividad, la línea del mundo es siempre una línea recta como la línea azul que tenemos en el
diagrama de arriba porque la partícula material viaja siempre en movimiento rectilíneo en una
misma dirección, recorriendo distancias iguales en tiempos iguales. Si en el instante t1 la
coordenada de una partícula móvil es x1, entonces las magnitudes x1 y t1 determinan el
evento E1. Análogamente, x2 y t2 determinan el evento E2. Los eventos para un mismo y único
observador están separados en el espacio por una distancia Δx = x2 - x1 y en el tiempo por una
distancia Δt = t2 - t1.

En los estudios sobre la relatividad, no se acostumbra revolver peras con manzanas, no se


acostumbra revolver metros con segundos al medir sobre coordenadas rectangulares. Para que
en un diagrama espacio-tiempo tanto el eje horizontal como el eje vertical usen el mismo tipo de
unidades, se acostumbra multiplicar el tiempo en el eje vertical que corresponde al tiempo por la
constante universal absoluta que es la velocidad de la luz c, ya que con ello ct se convierte en
una distancia que está medida en metros, no en segundos. De este modo, no mezclamos peras
con manzanas, al medir tanto en el eje vertical como en el eje horizontal lo estamos haciendo en
metros. En todos los diagramas espacio-tiempo que serán utilizados aquí, la ordenada vertical
estará en dimensiones de metros, o sea multiplicada por c, representado en la ordenada vertical
como ct. Aunque aparezca t en lugar de ct, se sobreentenderá que siempre nos estamos
refiriendo a ct. Además, para fines de simplificación, le seguiremos dando a c el valor de 1 metro
por segundo. Sin embargo, para fines de cálculo numérico, estamos en libertad de regresar a las
mediciones en segundos sobre el eje vertical.

En la última gráfica de arriba, tenemos representados dos eventos distintos, uno ocurriendo en
la posición x1 en un tiempo representado en la posición ct1, y el otro evento ocurriendo en la
posición x2 en un tiempo representado en la posición ct2. Poniendo números y usando una
velocidad de la luz igual a c = 1 metro/segundo, las coordenadas respectivas de cada evento y la
distancia entre ambos eventos es:

x1 = 1 metro

x2 = 2 metros

ct1 = 1 metro

ct2 = 3 metros

Δx = x2 - x1 = 2 metros - 1 metro = 1 metro

cΔt = ct2 - ct1 = 3 metros - 1 metro = 2 metros

PROBLEMA: Una vara de medir de tres metros de largo se encuentra en reposo en el marco
de referencia del observador O, y sus extremos coinciden con las coordenadas x1 = 2 metros
y x2 = 5 metros. Trazar las líneas del mundo de los extremos de la vara de medir en un
diagrama espacio-tiempo del observador O.

El diagrama espacio-tiempo pedido es el siguiente:


No es un requisito indispensable que en la construcción de un diagrama del espacio-tiempo se
utilicen ejes ortogonales (perpendiculares, puestos en ángulos rectos el uno con respecto al
otro). Es factible e inclusive deseable por razones que pronto serán obvias construír el diagrama
espacio-tiempo utilizando ejes que no son perpendiculares. A continuación tenemos un
diagrama en el cual los ejes principales no son perpendiculares:

Obsérvese la manera de leer las coordenadas de un punto cualesquiera en este tipo de diagrama,
trazando desde el punto líneas paralelas a uno de los ejes principales hasta topar con el eje
principal de la otra coordenada.

Y a continuación tenemos otro diagrama espacio-tiempo en el cual los ejes principales tampoco
son perpendiculares:

Para un mismo observador, el anterior diagrama espacio-tiempo nos dá la distancia Δx que


separa dos eventos E1 y E2, y nos dá también la distancia cΔt que separa a dichos eventos. Pero
este diagrama espacio-tiempo describe la situación de un solo observador. El diagrama espacio-
tiempo para un observador solitario no nos es de mucha utilidad en la resolución de problemas
propios de la relatividad. Es necesario juntar de alguna manera los diagramas espacio-tiempo de
dos observadores que están en movimiento relativo el uno con respecto al otro en uno solo. Lo
que estamos buscando es algo que geométricamente nos permita visualizar en un mismo
diagrama la situación de dos observadores. Esto se logra con un procedimiento que nos fue
dado por el matemático Hermann Minkowski que será dado a continuación.

Procedimiento para construír un diagrama espacio-tiempo

(1) Supondremos que la velocidad de la luz tiene un valor de c = 1 metro/segundo. Empezamos


trazando dos coordenadas perpendiculares que representan el diagrama espacio-tiempo de un
observador al cual llamaremos O y que se considera a sí mismo en estado de reposo en su marco
de referencia S, con la coordenada horizontal asignada a la representación de la posición de un
objeto en el eje-x y con la coordenada vertical asignada a la representación del tiempo en el cual
el objeto está en cierta posición:

(2) El diagrama espacio-tiempo más elemental que combina a dos observadores es el diagrama
trivial en el cual ambos observadores está reposo el uno frente al otro en el mismo lugar (x = x’)
y tienen sus relojes sincronizados al mismo tiempo (t = t’), lo que permite que los orígenes de
ambos sistemas de referencia S y S’ coincidan en un mismo punto:
En forma similar a como sucede para el observador O, el eje ct’ es el lugar de los puntos tales
que los eventos que ocurren a lo largo de dicho eje ocurren en el mismo lugar x’ = 0 pero en
tiempos distintos para un observador O.

(3) Para trazar un diagrama espacio-tiempo combinado juntando a dos observadores diferentes
que están en movimiento relativo el uno con respecto al otro a una velocidad V, trazamos
primero el eje-t’ del marco de referencia S’ sobre el diagrama espacio-tiempo del observador en
reposo usando para ello la velocidad relativa entre ambos observadores. No es necesario que los
orígenes de los diagramas espacio-tiempo del observador O y del observador O’ coincidan,
esto es mera cuestión de conveniencia. Construiremos un diagrama en el que ambos orígenes
coinciden.
Suponiendo que la velocidad relativa entre ambos marcos de referencia es de V = 0.4c (o.4
metros/segundo) entonces para moverse una distancia x = 1 metro el observador O’ debe de
haberse movido en un tiempo t = x/V = 2.5 segundos con respecto al origen, y para moverse una
distancia x = 2 metros el observador O’ debe de haberse movido en un tiempo t = x/V = 5
segundos. Todos estos puntos están conectados con una línea recta, la cual trazamos sobre el
diagrama como se muestra arriba. Esta recta corresponde al tiempo t’ del marco de referencia S’.
Obsérvese que entre menor sea la velocidad relativa V más y más cercana estará la línea que
hemos trazado a la vertical que corresponde a t, hasta que ambas llegan a coincidir cuando la
velocidad relativa entre los dos observadores es cero. Para mayor simplicidad, prescindiremos
de las graduaciones que hemos puesto en las coordenadas de ambos ejes del observador O:
(4) A continuación trazamos sobre el diagrama espacio-tiempo la ruta que corresponde a la
trayectoria de un rayo de luz con una velocidad c = 1 metro/segundo:
(5) Ahora vamos a trazar la coordenada de x’ superimponiéndola en el mismo diagrama. Para
poder localizarla en dicho diagrama, considérese primero un rayo de luz lanzado en el marco de
referencia del observador O’ en un tiempo (medido en metros) ct’ = -a desde la coordenada x’ =
0, un evento al que llamaremos E, el cual es reflejado en sentido opuesto en un tiempo ct = 0
por un espejo en un evento al que llamaremos P, para regresar nuevamente a la coordenada x’ =
0 en un evento al que llamaremos R ocurriendo en el tiempo ct’ = +a (podemos imaginar lo que
ocurre como una descripción geométrica en el espacio-tiempo del experimento llevado a cabo
por el viajero en el ferrocarril al que vimos en la entrada titulada “La física es parada de cabeza”
cuando nos encontramos por vez primera el efecto relativista de la dilatación del tiempo):
Desde la perpectiva del observador estacionario O, la situación del rayo de luz que fue reflejado
en el marco de referencia de O’ es la siguiente:
Tanto en el marco de referencia del observador O’ como en el marco de referencia del
observador O la luz sigue teniendo la misma velocidad, como lo enuncia el segundo postulado de
la Teoría Especial de la Relatividad. Por lo tanto, el rayo de luz que es lanzado en el marco de
referencia de O’ también tendrá la misma pendiente de 45 grados en el marco de referencia de
O. En el diagrama de arriba ubicamos arbitrariamente sobre el eje ct’ el evento E en el punto ct’
= -a, y trazamos desde dicho punto una trayectoria de 45 grados que corresponde al rayo de luz
que es lanzado por el observador O’. Por otro lado, ubicamos sobre el eje t’ el evento R en el
punto ct’ = +a, y trazamos desde allí la trayectoria que representa el rayo de luz reflejado por el
espejo desde el punto que debe representar al evento P, una línea recta también de 45 grados
(en concordancia con el segundo postulado de la Teoría Especial de la Relatividad) pero yendo
de derecha a izquierda, extendiendo dicha línea hasta que se cruce con la otra línea que
habíamos trazado. Esto nos dá unívocamente en el diagrama la localización del evento P. Por
último, trazamos una línea punteada que conecta el origen común de ambos observadores hasta
el punto que representa al evento P. Esta es la línea que corresponde a la coordenada de x’. No
tardamos en descubrir que el ángulo que forma la coordenada x con la coordenada x’ es el
mismo ángulo que el que forma la coordenada ct con la coordenada ct’. Con esto, hemos
terminado esencialmente con la construcción del diagrama.
Una cosa que resalta del diagrama espacio-tiempo final es el hecho de que los dos eventos
identificados con cuadritos rojos y con los números 1 y 2 que son simultáneos para el
observador O’ (ambos ocurren en su tiempo t’ = 0) no ocurren al mismo tiempo en el marco de
referencia del observador O. Esta es nuestra perspectiva geométrica del verdadero origen de los
fenómenos relativistas de dilatación del tiempo y contracción de longitud: la simultaneidad
deja de ser absoluta. En el universo de los absolutos, en la física pre-relativista, si dos
eventos ocurrían al mismo tiempo para un observador estacionario, también ocurrían al mismo
tiempo para otro observador en movimiento, lo cual deja de ser válido en la Teoría Especial de la
Relatividad.

Una cosa que no hemos hecho y la cual dejaremos pendiente por el momento
es graduar(marcar con divisiones igualmente espaciadas) las coordenadas (x,t) del observador
O y las coordenadas (x’,t’) del observador O’ de modo tal que podamos resolver gráficamente un
problema relativista obteniendo aproximaciones numéricas al igual que como lo hacen los
ingenieros que utilizan papel gráfico para la resolución aproximada de problemas de otra índole
(el Smith Chart utilizado para la resolución de problemas eléctricos de líneas de transmisión, y
el diagrama de humedad o carta psicométrica usada para la resolución de problemas de
humedad relativa y punto de rocío). Esta graduación es conocida también como la calibración
de los ejes, y se puede llevar a cabo mediante cálculos numéricos con las ecuaciones de
transformación de Lorentz que veremos posteriormente o con el procedimiento geométrico de
la hipérbola invariante.

Así pues, nuestro principal medio de trabajo para el análisis geométrico de los problemas de la
Teoría Especial de la Relatividad es el diagrama espacio-tiempo de Minkowski:
Este es el diagrama espacio-tiempo desde la perspectiva del observador O en reposo. Si
queremos, podemos dibujar también el diagrama espacio-tiempo desde la perspectiva del
observador O’ cuando este se considera en reposo y cuando ve al observador O en
movimiento hacia la izquierda:
En esencia, lo que hemos hecho a sido tomar el diagrama básico para un observador O en reposo
en un marco de referencia S, trazando sobre el mismo la línea que marca la trayectoria de un
rayo de luz con una pendiente de 45 grados que corresponde a una velocidad c de 1 metro por
segundo:
y sobre este diagrama, usando como referencia común la bisectriz que ambos diagramas deben
tener identificando en el mismo la línea del mundo de un rayo de luz común a ambos
observadores O y O’ en los marcos de referencia S y S’, hemos agregado al diagrama del
observador estacionario O el siguiente diagrama espacio-tiempo de O’ (nos queda pendiente el
asunto de cómo se lleva a cabo la graduación o calibración de los ejes x’-t’):

para así tener el siguiente diagrama espacio-tiempo combinando a ambos observadores desde la
perspectiva del observador estacionario O:
PROBLEMA: Representar en un diagrama espacio-tiempo cuatro eventos distintos cuyas
coordenadas son las siguientes:

E1(x1, c t1) = (1, 2)

E2(x2, c t2) = (2, 5)

E3(x’1, c t’1) = (4, 1)

E4(x’2, c t’2) = (2, 2)

Los eventos E1 y E2 están especificados sobre las coordenadas del observador en reposo O en su
marco de referencia S, y en el diagrama espacio-tiempo combinado estarán ubicados en las
siguientes posiciones (se han representado los dos eventos en el diagrama con unos cuadritos de
color púrpura):
Los eventos E3 y E4 están especificados sobre las coordenadas del observador en movimiento O’
en su marco de referencia S’, y en el diagrama espacio-tiempo combinado estarán ubicados en
las siguientes posiciones (se han representado los dos eventos en el diagrama con unos cuadritos
de color verde):
Cuanto más alta sea la velocidad relativa V entre dos marcos de referencia acercándose o
alejándose a una velocidad cada vez más cercana a la velocidad de la luz, tanto más se irán
cerrando los ejes que corresponden al marco de referencia en movimiento S’ como podemos
apreciarlo en el siguiente diagrama espacio-tiempo:

En el diagrama espacio-tiempo de arriba, tenemos sobrepuestos a tres observadores, el


observador que consideramos estacionario, el observador O’ que se está moviendo a una
velocidad relativa V con respecto al observador O, y un tercer observador O’’ que se está
moviendo a una velocidad todavía mayor con respecto al observador O. Nótese cómo se van
cerrando cada vez más y más los ejes coordenados x-t de un observador móvil conforme va
aumentando su velocidad V con respecto al observador estacionario.

Cuando se prescinde de un diagrama espacio-tiempo como el caso en el que se vaya a efectuar


un cálculo numérico, para la especificación completa de un mismo evento Ecualquiera se deben
especificar cuatro coordenadas, las coordenadas (x,t) del evento en el marco de referencia S, y
las coordenadas (x’,t’) del evento en el marco de referencia S’, de modo tal que un evento
quedará registrado como E(x,t,x’,t’) en forma completa. Esto es válido para cualquier evento. El
único evento que tendrá las mismas coordenadas tanto para S como para S será el que ocurra en
el punto común de origen, o sea E(x,t,x’,t’) = (0,0,0,0). En todos los demás casos las
coordenadas diferirán. Sin embargo, al hablar de un evento se está hablando de un mismo y
único evento visible para todos los observadores. Cuando un carro choca contra otro, ya sea
visto por un observador estacionario o por un observador móvil, no existen dos marcos de
referencia distintos en los cuales uno de los carros choque y el otro no. Distintos observadores
siempre se podrán poner de acuerdo en un evento específico, cada uno asignándole sus propias
coordenadas. En lo que no se podrán poner de acuerdo es en la duración del lapso de tiempo
entre dos eventos distintosE1 y E2 y en la distancia espacial que separe a dos eventos distintos.
Un observador dirá que el lapso de tiempo entre dos eventos E1 y E2 fue Δt mientras que el otro
dirá que fue Δt’. Un observador dirá que la distancia espacial entre dos eventos fue Δx mientras
que el otro dirá que fue Δx’, y en los diagramas de arriba podemos ver por qué no podrán
ponerse de acuerdo jamás, a menos de que tomen en cuenta las correciones relativistas.

Dado un evento E cualquiera puesto en un diagrama espacio-tiempo que involucre a dos


observadores en movimiento relativo el uno con respecto al otro, las coordenadas del mismo se
pueden obtener tanto en un marco de referencia como en el otro trazando desde el evento líneas
paralelas a cada uno de los ejes coordenados respectivos de cada observador, como lo muestra
el siguiente diagrama:
En el diagrama espacio-tiempo de arriba tenemos un evento A. Trazando una línea horizontal
hacia la izquierda hasta llegar al eje vertical ct podemos obtener el valor de ctcon lo cual
podemos obtener el tiempo, y trazando una línea vertical hacia abajo podemos obtener la
coordenada de la distancia x. Del mismo evento A podemos hacia la línea ct’ una línea paralela
a la coordenada x’ con lo cual obtenemos el valor de ct’, y podemos trazar hacia abajo otra línea
paralela a ct con lo cual obtenemos el valor de x’.

PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista


de la dilatación del tiempo.

El análisis se llevará a cabo considerando a nuestro proverbial viajero el cual dentro de un vagón
de ferrocarril arroja un rayo de luz hacia arriba desde una linterna, el cual es reflejado por un
espejo regresando al punto de partida, mientras que un observador sentado a un lado de las vías
del ferrocarril observa al rayo de luz recorrer una trayectoria mayor. En la construcción de
cualquier diagrama espacio-tiempo se vuelve necesario identificar claramente los eventos que
ocurren. En este caso, nos basta con identificar sobre el diagrama espacio-tiempo dos eventos: el
primer evento que llamaremos E1 ocurre cuando el rayo de luz sale de la linterna, y el segundo
evento que llamaremos E2 ocurre cuando el rayo de luz regresa reflejado por el espejo al punto
desde donde fue lanzado. Ambos eventos ocurren en el mismo lugar para el observador viajero
O’, al cual le asignaremos la coordenada x’ = 0, pero en tiempos diferentes t’1 y t’2. Una vez
localizados ambos eventos en el sistema de referencia S’ de O’, nos basta con trazar dos líneas
horizontales desde las coordenadas (x’, t’1) y (x’, t’2) hacia el eje de tiempos del observador O
para obtener las coordenadas correspondientes en el marco de referencia de O de los dos
eventos:
Darse cuenta de que efectivamente hay una dilatación del tiempo requiere que pongamos sobre
los ejes del diagrama espacio-tiempo divisiones graduadas en los ejes de los tiempos, o sea que
llevemos a cabo la calibración de los ejes, lo cual se verá en una entrada posterior. Obsérvese
que a diferencia de como sucede con el observador O’, los eventos E1 y E2 no sólo ocurren en
tiempos diferentes t1 y t2; también ocurren en lugares diferentes x1 y x2.

PROBLEMA: Ilustrar mediante un diagrama espacio-tiempo el fenómeno de la contracción


de longitud sobre una vara de medición, suponiendo que:

a) El observador en reposo O es el que tiene la vara de medir y el observador O’ es el que la ve


pasar frente a él.

b) El observador en movimiento O’ es el que lleva consigo la vara de medir y el observador en


reposo O es el que la ve pasar frente a él.

a) En el primer caso, si el observador en reposo es el que tiene una vara de medir de longitud L0,
las líneas del mundo de los dos extremos de la vara de medir se mantendrán como dos líneas
verticales paralelas proyectadas hacia arriba como lo muestra el siguiente diagrama espacio-
tiempo:

En este caso, el observador estacionario O mide para la vara al mismo tiempo t = 0 en su tiempo
propio una longitud L0. Pero el observador móvil O’ mide la coordenada de cada extremo de la
vara en tiempos diferentes y concluye que hubo una contracción en la longitud de la vara.

b) En el segundo caso, si el observador en movimiento O’ es el que lleva consigo la vara de medir


de longitud L0, las líneas del mundo de los dos extremos de su vara de medir se mantendrán
como dos líneas paralelas las cuales a su vez serán paralelas a su eje vertical ct’como lo muestra
el siguiente diagrama espacio-tiempo:
En este caso, el observador O’ mide para su vara al mismo tiempo t’ = 0 en su tiempo propio una
longitud L0. Pero el observador O mide la coordenada de cada extremo de la vara en tiempos
diferentes y concluye por su parte que hubo una contracción en la longitud de la vara.

Hemos visto una forma convencional del diagrama espacio-tiempo de Minkowski, pero no es la
única manera de construír un diagrama espacio-tiempo. Otra forma de lograrlo es recurriendo a
un truco. El truco consiste en que sobre un mismo diagrama, usando el mismo origen para dos
observadores distintos que se están moviendo a una velocidad relativa V el uno con respecto al
otro, se tracen dos ejes de espacios correspondiendo a los espacios propios medidos por cada
observador, y además se tracen dos ejes de tiempos correspondiendo a los tiempos propios
medidos por cada observador, de modo tal que el eje de tiempos de un observador sea
perpendicular al eje de espacios del otro observador y que el eje de espacios de dicho
observador sea perpendicular al eje de espacios del otro observador. Esto es lo que nos
produce esencialmente lo que se llama un diagrama espacio-tiempo de Loedel, así llamado
en referencia a su creador, el físico latinoamericano Enrique Loedel Palumbo:
El diagrama de Loedel es una modificación con fines didácticos del diagrama espacio-tiempo
que fue concebido por Hermann Minkowski.

Ahora veremos con mayor detalle el asunto de la simultaneidad, visto desde la óptica de la
Teoría Especial de la Relatividad.

El primer contacto que tienen muchos estudiantes con la explicación de la pérdida de la


simultaneidad absoluta se basa en un ejemplo como el siguiente en el cual tenemos a nuestro
proverbial pasajero de ferrocarril colocado justo a la mitad de los dos extremos del convoy de
vagones. En el marco de referencia S del observador situado a un lado de las vías del ferrocarril
justo a la mitad de dos torres de luz se activan en forma sincronizada (al mismo tiempo) dos
pulsos luminosos emanados de las dos torres de luz usando relojes sincronizados en el marco
de referencia de S para lanzar los pulsos luminosos, en forma tal que el estallido de uno de los
pulsos luminosos coincidirá justo con el extremo delantero del ferrocarril y el estallido del otro
pulso luminoso coincidirá justo con el extremo trasero del ferrocarril:
El observador estático situado a un lado de las vías del ferrocarril en el marco de referencia S
recibe los dos pulsos luminosos al mismo tiempo, y por lo tanto concluye que ambos eventos
fueron simultáneos dentro de su marco de referencia. Por su parte, en virtud de que la luz tiene
una velocidad finita y en virtud de que el pasajero del ferrocarril está en movimiento rápido, uno
de los pulsos luminosos le llega primero que el otro, y el pasajero concluye que los destellos no
ocurrieron al mismo tiempo, que no fueron simultáneos, dada la diferencia de tiempos en que
tardan en llegarle los dos rayos de luz a su plataforma móvil, y por lo tanto para él los eventos no
son simultáneos en su marco de referencia S’.

La anterior es una explicación simplista y en cierta forma errónea porque no toma en cuenta
para nada los efectos relativistas de la dilatación del tiempo y la contracción de longitud. La
pérdida en la simultaneidad se debe, según la explicación anterior, a la velocidad finita de la luz.
Si no hubiese dilatación del tiempo ni contracción de longitud, si no hubiese relatividad, si
existiesen el tiempo absoluto y el espacio absoluto, la pérdida en la simultaneidad sería
meramente una ilusión, una pérdida de simultaneidad aparente. La situación actual es más
complicada que la descrita en el ejemplo anterior precisamente porque hay efectos relativistas
de dilatación del tiempo y contracción de longitud. Efectivamente, hay una diferencia de
tiempos en la llegada de los dos pulsos luminosos al viajero en el ferrocarril, pero también hay
una pérdida de simultaneidad real que no es ocasionada por la velocidad finita de la luz sino por
efectos de índole relativista, y es en este caso en donde los diagramas espacio-tiempo de
Minkowski resultan de una ayuda invaluable para entender lo que está sucediendo,
permitiéndonos ir más allá de la anterior explicación simplista. Para entender lo que está
sucediendo, es necesario identificar a los dos eventos que ocurren simultáneamente en el marco
de referencia S como E1 y E2 y ver las coordenadas (x’,t’) de cada uno de dichos eventos en el
marco de referencia S’.
Si dos eventos ocurren al mismo tiempo en el mismo lugar se puede afirmar sin lugar a dudas
que ambos eventos son simultáneos. Cuando dos aviones chocan en el aire, no existe marco de
referencia alguno en el cual la colisión de ambos aviones no sea simultánea. Pero entre mayor
sea la distancia entre dos eventos que ocurren en distintos lugares tanto mayor será la dificultad
para los observadores en decidir por cuenta propia el asunto de la simultaneidad.

Considérese el siguiente diagrama espacio-tiempo de Minkowski que ilustra la situación de


eventos que son simultáneos en un marco de referencia S del observador O y que NO son
simultáneos en un marco de referencia S’ del observador O’, así como eventos que son
simultáneos en un marco de referencia S’ pero que NO son simultáneos en el marco de
referencia S:

En este diagrama, los eventos A y B ocurren simultáneamente a un mismo tiempo en el marco


de referencia S en dos lugares distintos que podemos identificar como x1 y x2. Pero resulta claro
que, relativísticamente hablando, los mismos eventos A y B ocurren en tiempos diferentes en el
marco de referencia de S’, los cuales podemos ubicar en los tiempos t’1 y t’2. Los dos
eventos A y B ocurren en tiempos diferentes en lugares diferentes para un observador situado
en S’. Aquí lo que es simultáneo para S no es simultáneo para S’. Por otro lado, los
eventos C y D ocurren simultáneamente a un mismo tiempo en el marco de referencia S’ en dos
lugares distintos que podemos identificar como x’3 y x’4. Pero resulta claro que,
relativísticamente hablando, los mismos eventos C y D ocurren en tiempos diferentes en el
marco de referencia de S, los cuales podemos ubicar en los tiempos t3 y t4. Los dos
eventos C y D ocurren en tiempos diferentes en lugares diferentes para un observador situado
en S. Aquí lo que es simultáneo para S’ no es simultáneo para S. Y en cuanto a los eventos E y F,
tales eventos no son simultáneos ni para S ni para S’. Todo esto lo podemos ver claramente tal
como es en los diagramas espacio-tiempo de Minkowski. Desafortunadamente, aunque estos
gráficos son de gran ayuda, no se prestan para cálculos numéricos de precisión, para lo cual
tendremos que recurrir a una herramienta algebraica conocida como las ecuaciones de
transformación de Lorentz.

A continuación tenemos otro diagrama espacio-tiempo que nos ilustrara la falla de la


simultaneidad dentro de la Teoría Especial de la Relatividad:

En este diagrama espacio-tiempo, para el observador en el marco de referencia S cuyas


coordenadas son (x, ct), dos eventos son simultáneos cuando de acuerdo con su reloj ocurren al
mismo tiempo t = t0 en dos lugares diferentes que podemos identificar simplemente como x 1 y
x2, marcados por los puntos obscuros que están puestos sobre la línea horizontal que
corresponde a un tiempo t = t0.

Sin embargo, para el otro observador cuyas coordenadas son (x’, ct’), los dos eventos no ocurren
simultáneamente, ocurre primero uno y después ocurre el otro. En su reloj un evento
ocurre primero en el tiempo t’1 y el otro evento ocurre después en el tiempo t’2. Esta anomalía
relativista en la simultaneidad es precisamente la que ocasiona los efectos físicos de la
dilatación del tiempo y la contracción de longitud. Todas las dificultades para comprender las
aparentes paradojas que están detrás de la Teoría Especial de la Relatividad surgen de nuestra
renuencia a rechazar de manera definitiva el falso concepto de la simultaneidad absoluta. Si
hubiera simultaneidad absoluta, no habría dilatación relativista del tiempo ni contracción de
longitud, aunque ello requeriría neceariamente la aceptación del movimiento absoluto, lo cual a
estas alturas ya hemos descartado por completo.

PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista


de la contracción de longitud.

Si en lugar de un diagrama espacio-tiempo trazado sobre una hoja hacemos un esfuerzo extra
por representar dos coordenadas de la posición (x,y) y la coordenada del tiempo (ct) apuntando
esta última hacia arriba, podemos dibujar algo que se conoce como superficies de
simultaneidad tanto para el observador O en reposo en el marco de referencia S como el
observador en movimiento O’ en el marco de referencia S’:

En el diagrama de la izquierda, tenemos dos eventos representados con puntitos rojos que
ocurren al mismo tiempo, simultáneamente, en el marco de referencia S del observador O, y
tenemos otros dos eventos representados con puntitos amarillos que ocurren en tiempos
diferentes en el marco de referencia S’ del observador O’. Pero en el diagrama de la izquierda,
los dos eventos representados con puntitos amarillos sí ocurren al mismo tiempo,
simultáneamente, en el marco de referencia S’ del observador O’, aunque los eventos
representados con puntitos rojos y que eran simultáneos en el marco de referencia S del
observador O han dejado de ser simultáneos para el observador O’.

La limitante de que ningún objeto puede viajar a una velocidad mayor que la velocidad de la luz
se refleja no tan sólo en un cuadrante del diagrama espacio-tiempo, se refleja en los cuatro
cuadrantes, y el “origen” del observador puede no necesariamente coincidir con el origen del
diagrama espacio-tiempo que está situado en x = 0 y ct = 0, en virtud de que la fijación de las
coordenadas es una mera cuestión de conveniencia:

En el diagrama de arriba, tenemos a un cuerpo que al moverse del punto A al punto B se ha


movido en línea recta de x1 = 0.5 metros y x2 = 0.75 metros a partir de un tiempo t1 = 0.5
segundos a un tiempo t1 = 1.75 segundos, siendo por lo tanto su velocidad igual a v = 0.2 c.
Puesto que el avance natural del tiempo es siempre hacia arriba, el cuerpo sólo puede
desplazarse también junto con el tiempo de abajo hacia arriba, en cualquier trayectoria
rectilínea cuya pendiente no exceda la velocidad de la luz, lo cual está marcado por el área
punteada. Del punto B hay un conjunto de puntos que marcan el futuro de la posición del
cuerpo en el diagrama espacio-tiempo, y hay también un conjunto de puntos que marcan el
pasado de la posición del cuerpo en el diagrama espacio-tiempo.
No es necesario limitarnos a un diagrama espacio-tiempo de tan sólo dos dimensiones. Podemos
agregar una dimensión adicional, como correspondería a la coordenada y en un plano
Cartesiano x-y, para tener lo que parece ser un cono dentro del cual están circunscritas las
trayectorias posibles de un objeto, llamado cono de luz:

De este modo, podemos tener las siguientes dos trayectorias rectilíneas posibles en el siguiente
diagrama espacio-tiempo tridimensional:
Antes del advenimiento de la Teoría Especial de la Relatividad, podíamos hablar acerca de un
“ahora” universal, podíamos hablar acerca de un “pasado” común universal y acerca de un
“futuro” común universal, comunes a todos los que habitamos en este Universo, puesto que el
tiempo absoluto marchaba al unísono por igual en todo el Universo, sin retrasarse ni
adelantarse en ninguno de sus confines:

Pero a partir del advenimiento de la Teoría Especial de la Relatividad, para cada observador hay
un “pasado”, un presente y un “futuro”, delimitados por el cono de luz:

En este último diagrama, la línea del mundo (de color verde) corresponde a un observador que
está en reposo. El punto en el que se tocan los dos conos de luz que corresponden al “pasado” y
al “futuro” del observador viene siendo el “ahora” del observador. Puesto que ningún objeto
puede moverse a una velocidad mayor que la velocidad de la luz, la única forma de poder llegar
al “ahora” desde el pasado (suponiendo una línea del mundo con un movimiento rectilíneo) es
haciéndolo dentro del cono de luz inferior. Y la única forma de poder llegar a cierto punto del
diagrama espacio-tiempo en el “futuro” es estando dentro del cono de luz superior. Las
regiones de espacio-tiempo de color gris en el diagrama de arriba son, por lo tanto,
regiones de espacio-tiempo a las que el observador no tiene acceso. Esto fija de
manera unívoca todas las relaciones que pueda haber de causa-efecto entre dos observadores.
Los únicos eventos que pueden cambiar el estado de un observador o de un objeto en su
posición actual en el espacio-tiempo deben estar situados en ó dentro del cono de luz que
corresponde a su “pasado”. Y los únicos eventos que pueden ser influenciados por eventos en los
que participe un observador o un objeto deben estar situados en ó dentro del cono de luz que
corresponde a su “futuro”. De este modo, en el siguiente diagrama espacio-tiempo:
el evento que tuvo lugar en el punto C pudo muy bien haber cambiado lo que está sucediendo en
el “ahora” del observador que se encuentra en el punto A, y el observador Apuede hacer algo
para intervenir sobre lo que sucede en el evento que tiene lugar en el punto B. Pero no puede
hacer nada para modificar lo que ocurra en los eventos E y Dporque están fuera de su alcance al
no poder establecer una comunicación con ellos debido a la limitante absoluta de la velodidad
de la luz. Los puntos E y D están en regiones prohibidas. Cabe aclarar que la línea en el
diagrama que corresponde a la coordenada X no está inclinada como parece estarlo; es una
línea perfectamente horizontal como puede comprobarlo el lector en el monitor de su
computadora con la ayuda de una hoja de papel. Se trata de una ilusión óptica, como lo es la
ilusión del concepto de la simultaneidad absoluta que tanto trabajo le cuesta a muchos
estudiantes sepultar.

¿Entonces ya no podemos hablar de un pasado común y un futuro común a todos los habitantes
del Universo como se acostumbraba hacerlo antes? Sí, pero desde la perspectiva relativista. En
el siguiente diagrama espacio-tiempo tenemos los conos de luz que corresponden no a uno sino
a dos eventos A y B:
En este diagrama, el “ahora” del evento A no puede tener efecto alguno sobre el “ahora” del
evento B porque ello requeriría atravesar la zona gris que le está vedada a ambos eventos. Para
poder tener efecto alguno sobre el “ahora” de B, el “ahora” del evento A debería ser capaz de
poder transmitir información al “ahora” del evento B a una velocidad mayor que la velocidad de
la luz, lo cual es imposible. Sin embargo, ambos conos de luz tienen dos zonas en común, las
zonas en las cuales se traslapan los dos conos de luz. La zona común en la cual se traslapan los
pasados de ambos, de color rosa, es la zona en la cual ambos eventos pueden intercambiar
información que sea capaz de cambiar el “ahora” de cada uno de ellos, es la zona
denominada pasado común. Y la zona común en la cual se traslapan los futuros de ambos, de
color azul cielo, es la zona en la cual ambos eventos podrán intercambiar información en su
futuro (a menos de que ocurra un cambio en la línea del mundo de uno de ellos o de ambos), es
la zona denominada futuro común. De cualquier manera, y hablando del Universo como un
todo, sí podemos hablar de un “ahora” universal que sin embargo no es un “ahora” absoluto,
porque en la infinitud de las regiones locales de las que está hecho el Universo habrá variaciones
en la marcha del tiempo como las que predice la Teoría de la Relatividad.

En los diagramas espacio-tiempo que hemos visto, sólo hemos considerado objetos que
mantienen una trayectoria rectilínea a velocidad constante sobre la cual se pueden aplicar los
principios propios de la Teoría Especial de la Relatividad. Pero también podemos trazar en un
diagrama espacio-tiempo la trayectoria de un objeto que no mantiene una trayectoria rectilínea,
que está cambiando constantemente de dirección. Un diagrama tal tendría un aspecto como el
siguiente:

En esta trayectoria tenemos a un viajero que se ha trasladado del punto P al punto Q en un lapso
de tiempo Δτ medido en el reloj con el que va viajando el viajero. Este es precisamente el tipo
de movimientos que deben caer bajo el ámbito de una teoría expandida para analizar
movimientos no-rectilíneos o acelerados, una Teoría General de la Relatividad. La trayectoria
de un cuerpo que no avanza en línea recta dentro del cono de luz debe ser tal que la velocidad de
la luz nunca debe ser excedida, o sea que la tangente de la curva nunca debe apartarse más de 45
grados del eje vertical que representa a la coordenada del tiempo. A continuación tenemos un
ejemplo de un recorrido válido y un recorrido inválido:
Obsérvese del diagrama anterior izquierdo cómo el cono de luz es algo que viaja junto con el
observador móvil, el cual puede definir en cualquier momento cuál será el instante en que su
reloj sea ajustado para marcar el “pasado”, el “futuro” y el “presente” (el instante a partir del
cual se empieza a tomar el tiempo para llevar las cuentas de una sucesión de eventos).

Partiendo de sus dos postulados, Einstein dedujo correctamente las nuevas leyes para las
transformaciones llevadas a cabo entre dos marcos de referencia distintos, formalizadas
algebraicamente con las ecuaciones de transformación de Lorentz, pero fue Hermann
Minkowski el que demostró que si dejábamos de ver a las tres dimensiones del espacio y a la
dimensión del tiempo como entidades separadas y las uníamos geométricamente en un espacio-
tiempo de cuatro dimensiones, entonces las transformaciones relativistas podían ser vistas
como correspondiendo a rotaciones llevadas a cabo en este espacio-tiempo cuatri-dimensional,
lo cual fue una enorme simplificación creando una nueva perspectiva acerca del espacio y del
tiempo. Al principio Einstein no dió mucha importancia a la interpretación geométrica de
Minkowski, tomándola meramente como una formalidad matemática sin significado físico real,
pero eventualmente cambió su actitud adoptando el punto de vista cuatri-dimensional
geométrico que después emplearía para la postulación de la Teoría General de la Relatividad.

Las transformaciones de Lorentz


Conforme nos vamos familiarizando más y más con las consecuencias de los postulados de
Einstein, se vuelve deseable obtener fórmulas de carácter general que nos permitan obtener toda
la información que describa los eventos analizados por dos observadores en movimiento relativo
el uno con respecto al otro, dos observadores situados en dos marcos de referencia distintos S y
S' (se acostumbra denotar al observador en reposo como un observador colocado en el marco de
referencia S mientras que el observador móvil desplazandose a una velocidad V está puesto en el
marco de referencia designado como S’):
Tales ecuaciones de transformación de carácter general de un marco de referencia a otro fueron
enunciadas por vez primera no por Einstein sino por el físico Lorentz, razón por la cual reciben
el nombre de ecuaciones de transformación de Lorentz.

Para la derivación de las ecuaciones de transformación, en ambos marcos de referencia se


centrará la atención sobre un evento común descrito por ambas personas, el cual tendrá
coordenadas (x,y,z,t) en el marco de referencia S y coordenadas (x’,y’,z’,t’) en el marco de
referencia S’:

Por simplicidad en la derivación de las ecuaciones de transformación, ambos marcos de


referencia son seleccionados de modo tal que sus orígenes (el punto O en el marco de referencia
de S y el punto O’ en el marco de referencia de S’) coincidan en los tiempos t=0 y t’=0.
Supóngase que cuando los orígenes de ambos marcos de referencia coinciden se dispara un
pulso de luz en el origen común de ambos. Por el segundo postulado de la Teoría Especial de la
Relatividad, este pulso de luz se propagará con la misma velocidad tanto dentro del marco de
referencia S como dentro del marco de referencia S’. Este es precisamente el punto clave para
poder obtener la transformación de un marco de referencia a otro, el hecho de que la velocidad
de la luz c que debe ser la misma en ambos marcos de referencia, tanto para el marco de
referencia S:

c=x/t

x = ct

como para el marco de referencia S’:

c = x’ / t’

x’ = ct’

¿Cuál es el tipo de transformación que estamos buscando? Si recordamos la derivación de los


resultados preliminares sobre los fenómenos de la dilatación del tiempo y la contracción de
longitud, resulta claro que las transformaciones que estamos buscando deben ser
transformaciones lineares. Estando fija la velocidad V a la cual se desplaza el marco de
referencia S’, si por la dilatación del tiempo medido en S’ cuando se mide en S requiere de la
aplicación de un factor de corrección constante (esto es, si la velocidad V es tal que cuando un
lapso de tiempo medido en S’ es de 10 segundos entonces el lapso de tiempo medido en S es de
15 segundos, con lo cual al mantenerse constante el factor de corrección entonces un lapso de
tiempo de 20 segundos medido en S’ equivaldrá a un lapso de tiempo de 30 segundos medido en
S del mismo modo que un lapso de tiempo de 30 segundos medido en S’ equivaldrá a un lapso
de tiempo de 45 segundos medido en S) el factor de corrección debe ser una simple constante
multiplicativa cuyo valor depende únicamente de la velocidad relativa V entre ambos marcos de
referencia, la cual suponemos constante. Si el factor de corrección no fuera constante, si la
dilatación del tiempo de un marco de referencia a otro no aumentara en forma directamente
proporcional entre ellos, entonces la transformación que requeriríamos sería una
transformación de carácter no-linear. Esto en lo que concierne a la dilatación del tiempo. Y en lo
que concierne a la contracción de longitud, también allí al descubrir el fenómeno de la
contracción de longitud encontramos que el factor de corrección requerido era una constante
multiplicativa. En ambos casos, necesitamos de transformaciones lineares. Si las
transformaciones no fuesen lineares, una longitud x2-x1 medida en el marco de referencia S
dependería de la selección del origen del marco de referencia, y un intervalo de tiempo t 2-
t1 dependería de cuándo el tiempo fue seleccionado para tener un valor de cero; en cierta forma
la no-linearidad nos llevaría de regreso hacia los conceptos del tiempo absoluto y la distancia
absoluta. Por otro lado, puesto que el movimiento relativo entre ambos marcos de referencia S y
S’ ocurre únicamente en la dirección de los ejes de las equis (x), las coordenadas y y z deben
permanecer iguales, o sea y = y’ y z = z’.

Cuando ocurre el evento en el cual el pulso luminoso (disparado cuando los orígenes O y O’ de
ambos marcos de referencia coincidían) llega al punto P, de acuerdo con la perspectiva del
observador en S el marco de referencia móvil S’ se ha desplazado hacia la derecha una distancia
de Vt en un tiempo t medido por el observador en S. Pero también desde la perspectiva del
observador en S, una vara de medir llevada consigo por S’ a lo largo del eje de las equis (x) se ha
contraído por un factor de corrección constante que llamaremos a. Para el observador fijo, por lo
tanto, la relación entre su marco de referencia y el marco de referencia móvil debe ser:

x = ax’ + bt’

x = a{x’ + (b/a} t’

en donde a y b son simples constantes multiplicativas (factores lineares que son independientes
de x’ y t’).

Así como los fenómenos de la relatividad se vuelven cada vez más evidentes a velocidades
cercanas a la velocidad de la luz, algo que también debe ser cierto es que a bajas velocidades las
ecuaciones de transformación que hemos escrito arriba se deben reducir a los resultados
clásicos que ya conocemos, las transformaciones de Galileo basadas en la noción del tiempo
absoluto y el espacio absoluto:

x = x - Vt

En otras palabras, para valores bajos de V/c, a debe acercarse a 1 y b/a debe acercarse a V, la
transformación relativista se debe reducir a la transformación clásica para bajas velocidades de
V. Esto nos permite escribir la transformación relativista como:

x = a{x’ + Vt’}
La transformación inversa debe tener la misma forma, excepto por el cambio de signo
involucrado por el hecho de que el marco de referencia S se está desplazando hacia la izquierda
mientras que el marco de referencia S’ permanece estático.

x’ = a{x - Vt}

Pero ya se había señalado que, por el segundo postulado de la Teoría de la Relatividad:

x = ct

x’ = ct’

Sustituyendo estas dos relaciones tanto en la transformación de S’ a S como en la


transformación inversa de S a S’, obtenemos lo siguiente:

ct = a ( ct’ + Vt’ )

ct = a ( c + V ) t’

y:

ct’ = a ( ct - Vt )

ct’ = a ( c - V ) t

Eliminando t de ambas ecuaciones obtenemos lo siguiente:

ct’ = a (c - V ) (1/c) a (c + V) t’

c² t’ = a² (c² - V² ) t’

De lo cual obtenemos para a lo siguiente:

a² = c² / (c² - V²)

a² = 1 / (1 - V²/c² )
a = 1 / √(1 - V²/c²)

Este resultado nos debería de ser ya familiar. a es el mismo factor de corrección γ que habíamos
obtenido anteriormente. En pocas palabras, a = γ.Con esto:

x = γ{x’ + Vt’}

Podemos obtener la ecuación de transformación para el tiempo de la ecuación

x’ = a{x - Vt}

usando

x = a{x’ + Vt’}

para t:

x’ = a [ a (x’ + Vt’) - Vt]

de lo cual:

t = at’ + ( a - 1/a) (x’/V)

t = a (t’ + Vx’ /c²)

Resumiendo, y empleando el símbolo γ en lugar de a, para cambiar del marco de referencia S’


que se está moviendo de izquierda a derecha a una velocidad V al marco de referencia S del
observador estacionario, las ecuaciones de transformación de Lorentz son:

____x = γ(x’ + Vt’)

____y = y’

____z = z’

____t = γ(t’ + Vx’/c²)


Podemos obtener la transformación inversa para cambiar del marco de referencia S al
marco de referencia S’ directamente de las anteriores ecuaciones. De la primera ecuación y de la
cuarta ecuación, podemos reescribirlas en forma tal que tanto la variable x’ como la variable t’
puedan ser despejadas por medio de ecuaciones simultáneas (por medio de determinantes
aplicando la regla de Cramer o cualquier otra técnica matemática del gusto del estudiante):

x' + Vt' = x/γ

(V/c²) x' + t' = t/γ

Es así como obtenemos el siguiente conjunto de ecuaciones:

____x’ = γ(x - Vt)

____y’ = y

____z’ = z

____t’ = γ(t - Vx/c²)

Obsérvese que, exceptuando por la diferencia entre los signos “+” y “-” entre la primera y la
cuarta ecuación de ambas transformaciones, ambas transformaciones son completamente
simétricas. La diferencia en el signo simplemente indica que mientras que para el observador en
S la persona en S’ se está moviendo en una dirección positiva (hacia la derecha), para la persona
en S’ el observador en S se está moviendo en sentido contrario, en una dirección negativa (hacia
la izquierda).

En virtud de que se requiere algo de práctica para poder adquirir cierta destreza en el empleo de
las transformaciones de Lorentz para la resolución de problemas, a continuación veremos
algunos ejercicios que nos darán una familiaridad en la transformación de coordenadas de un
sistema de referencia a otro. Se observará que estas transformaciones de coordenadas no son
muy diferentes a las transformaciones (clásicas) de coordenadas de Galileo, excepto que las
fórmulas que empleamos aquí se basan en la validez de los dos postulados de la Teoría Especial
de la Relatividad.

PROBLEMA: Para un observador O un destello de luz sale del punto x = 100 kilómetros, y =
20 kilómetros, z = 30 kilómetros en un tiempo t = 0.0005 segundo. ¿Cuáles son las
coordenadas del evento para un segundo observador O que se mueve con respecto al primero
a lo largo del eje común x-x’ a una velocidad de V = -0.8c?

El factor de corrección en este caso es:

γ = 1 / √(1 - V²/c²) = 1 / √(1 - (-0.8)² = 1 / 0.6 = 1.667

De las transformaciones de Lorentz para pasar del sistema de referencia S al sistema de


referencia S tenemos entonces lo siguiente:

____x’ = γ(x - Vt) = (1.667)[100 Km - (-0.8) (3·108 m/seg) (5·10-4 seg)] = 367 Km

____y’ = y = 20 Km

____z’ = z = 30 Km

____t’ = γ(t - Vx/c²) = (1.667)[5·10-4 seg - (-0.8c) (100 Km ) /c² ] = 12.8·10-4 seg

De esta manera, el evento tiene las siguientes coordenadas:

__En S: (x, y, z, t) = (100 Km, 20 Km, 30 Km, 5·10-4 seg)

__En S’: (x’, y’, z’, t’) = (367 Km, 20 Km, 30 Km, 12.8·10-4 seg)

En la mayoría de los problemas relativistas, más que obtener las coordenadas de un mismo
evento visto en dos marcos de referencia distintos, en lo que realmente estamos interesados es
en obtener la diferencia entre las coordenadas de dos eventos distintos y comparar dicha
diferencia de un marco a otro.

PROBLEMA: Derivar, empleando las transformaciones de Lorentz, la fórmula para la


dilatación del tiempo, especificando las coordenadas de cada evento involucrado en el análisis.

Es suficiente considerar únicamente dos eventos para la resolución de este problema. El primer
evento es aquél en el cual los relojes de S y S’ están el uno frente al otro, sincronizados:
El segundo evento es aquél en el cual, de acuerdo con el observador en el sistema S, el reloj en S’
se ha movido de una posición x1 a una posición x2 en su eje de coordenadas:

Obsérvese que que para el reloj viajero la coordenada posición x’ dentro de su marco de
referencia S’ no cambia en lo absoluto, ya que viaja a una velocidad V (con respecto al sistema de
referencia S) llevando consigo su sistema de referencia.

Sea Δt’ = t’2 - t’1 el intervalo de tiempo propio medido dentro del marco de referencia S’ en un
mismo punto fijo x’0 dentro del marco de referencia S’. El intervalo de tiempo Δt entre los dos
eventos que corresponde al marco de referencia S puede ser obtenido de las ecuaciones de
transformación de Lorentz:

t2 = γ( t’2 + V x’2/c²) = γ( t’2 + V x’0/c²)

t1 = γ( t’1 + V x’1/c²) = γ( t’1 + V x’0/c²)

Δt = t2 - t1

Δt = γ( t’2 + V x’0/c²) - γ( t’1 + V x’0/c²)

Δt = γ(t’2 - t’1)

Δt = γΔt’

Este es el fenómeno relativista de la dilatación del tiempo. Hemos obtenido


directamente a partir de las transformaciones de Lorentz la relación para la dilatación del
tiempo de un reloj. La resolución del problema requirió determinar los eventos sobre los cuales
se llevaría a cabo la transformación de las coordenadas. Una vez que se han logrado determinar
los eventos, el problema está prácticamente resuelto.

PROBLEMA: Derivar, empleando las transformaciones de Lorentz, la fórmula para la


contracción de longitud.

Considérese una vara de medición cuyos extremos en el marco de referencia S’ están


identificados como x’2 y x’1. La longitud propia L0 de la vara de medición dentro del marco de
referencia S’ será:

L0 = x’2 - x’1

La longitud de esta vara de medición, medida en el marco de referencia S con ambos extremos
medidos en el mismo tiempo t0, en S será:

L = x2 - x1

Usando las relaciones de transformación de Lorentz, tenemos lo siguiente:

x’2 = γ(x2 - Vt2) = γ(x2 - Vt0)

x’1 = γ(x1 - Vt1) = γ(x1 - Vt0)

Por lo tanto:

x’2 - x’1 = γ(x2 - Vt0) - γ(x1 - Vt0)

x’2 - x’1 = γ(x2 - x1)

x2 - x1 = (x’2 - x’1) /γ

L = L0/γ

Este es el fenómeno relativista de la contracción de longitud.


Las transformaciones de Lorentz nos preparan para un nuevo efecto relativista que no habíamos
encontrado previamente: la desincronización relativista de los relojes.

PROBLEMA: Considérense dos relojes sincronizados que están puestos en lugares


diferentes x’1 y x’2 dentro del marco de referencia S’ al cual consideramos el marco de referencia
móvil. ¿Cuáles serán los tiempos dados por dichos relojes en el tiempo t 0 dentro del marco de
referencia S?

En los problemas anteriores, teníamos puestos dos o más relojes sincronizados en el marco de
referencia fijo S, pero teníamos puesto un solo reloj en el marco de referencia móvil S. Ahora
vamos a complicar un poco más esa situación, con dos relojes colocados en el marco de
referencia móvil en lugares diferentes. Supongamos que hay un reloj A puesto en la coordenada
x’1 del marco de referencia móvil y otro reloj B puesto en la coordenada x’ 2 del mismo marco de
referencia.

De las ecuaciones de transformación de Lorentz tenemos lo siguiente para dos relojes diferentes
puestos en el marco de referencia móvil S’:

t’A = γ( t0 + V x1/c²)

t’B = γ( t0 + V x2/c²)

Entonces los tiempos de los relojes desincronizados dentro el marco de referencia S, relojes de S
que están sincronizados en S, estarán relacionados de la manera siguiente:

t’A - t’B = γ(x2 - x1)(V/c²)

t’A - t’B = L0V/c²

en donde L0 = γ(x2 - x1) = x’2 - x’1 es la distancia propia entre los dos relojes situados dentro del
marco de referencia S’.

Este resultado que acabamos de obtener tiene implicaciones mucho más profundas de lo que
aparentan a primera vista. Dos relojes separados por una distancia L0 y sincronizados
dentro del marco de referencia en el que se encuentran se verán desincronizados
en un marco de referencia S’ en el que se estén moviendo a una velocidad V, con el
reloj perseguidor retrasado por un tiempo L0V/c². Esto significa que dos eventos
diferentes que ocurran a un mismo tiempo en un marco de referencia S’ ocurrirán en tiempos
diferentes para en un marco de referencia S. En efecto, dos eventos diferentes que sean
simultáneos dentro de un marco de referencia S no serán simultáneos para un observador que
viaje en un marco de referencia S’ del mismo modo que dos eventos diferentes que sean
simultáneos dentro de un marco de referencia S’ no serán simultáneos para un observador que
viaje en un marco de referencia S. Esto nos confirma algebraicamente lo que ya habíamos visto
geométricamente en nuestra introducción a los diagramas espacio-tiempo de Minkowski, el
hecho de que, relativísticamente hablando, no existe la simultaneidad absoluta. La falta
plena de entendimiento de este hecho es lo que dá pie a falsos razonamientos que conducen a
paradojas y confusiones entre quienes empiezan sus estudios de relatividad por vez primera.

Los problemas relativistas de contracción de longitud en los que todo se resuelve con la simple
aplicación de la fórmula L = L0√(1 - V²/c²) son problemas sencillos que involucran meramente
una separación espacial de las coordenadas, mientras que los problemas relativistas en los que
simplemente se busca una dilatación del tiempo son problemas sencillos que involucran
meramente una separación temporal de las coordenadas. Es importante establecer claramente
la diferencia profunda entre el concepto de la “separación espacial de las coordenadas” y
“longitud”. Un error común en la solución de problemas consiste en simplemente multiplicar o
dividir un determinado intervalo espacial por el término √(1 - V²/c²). Esta aproximación es
válida si se trata de hallar relaciones entre longitudes, entendiéndose por longitud algo como
x2 - x1. Sin embargo, si se trata de un intervalo espacial entre dos acontecimientos que no tienen
lugar simultáneamente, la respuesta se obtiene utilizando la técnica de substracción en
coordenadas de Lorentz y no multiplicando o dividiendo la expresión espacial original por √(1 -
V²/c²). Del mismo modo, si los observadores O y O’ miden la separación temporal entre dos
acontecimientos que para ambos observadores tienen lugar en diferentes sitios, estas
separaciones temporales no se relacionan simplemente multiplicando o dividiendo por √(1 -
V²/c²). La resolución de los siguientes problemas hará más claro lo que se acaba de afirmar, y
será obvio que no basta con simplemente multiplicar o dividir por el término √(1 - V²/c²) para
resolver problemas relativistas. Es necesario aplicar las transformaciones de Lorentz.

PROBLEMA: Para un observador O, dos acontecimientos están separados en el espacio y en


el tiempo por 600 metros y por 8·10-7 segundo. ¿Con qué velocidad debe moverse un
observador O’ con respecto a O para que los acontecimientos aparezcan simultáneos a O’?

Establecemos la diferencia de tiempos de acuerdo con la transformación de Lorentz:


t’ = γ(t - Vx/c²)

La diferencia de tiempos será:

t’2 - t’1 = γ(t2 - Vx2/c²) - γ(t1 - Vx1/c²)

Para que los dos acontecimientos aparezcan simultáneos a , se requiere que t’ 2 = t’1. Entonces:

0 = γ(t2 - Vx2/c²) - γ(t1 - Vx1/c²)

t2 - t1 = V/c² (x2 - x1)

8·10-7 segundo = (V/c) (600 metros/3·108 m/seg)

V/c = 0.4

V = 0.4 c

PROBLEMA: Un tren de media milla de longitud (medida por un observador que viaja
dentro del tren) se mueve a 100 millas/hora. Dos destellos de luz inciden simultáneamente en
los extremos del tren para un observador en tierra. ¿Cuál es la diferencia de tiempo entre estos
eventos para un observador O’ que viaja en el tren?

Supongamos que para el observador O en tierra se asignan las coordenadas (x1, t1) y (x2, t2) a
los dos eventos, mientras que para el viajero O’ que va en el tren las coordenadas
correspondientes de los dos eventos son (x’1, t’1) y (x’2, t’2). Entonces la situación es la siguiente
Convertimos primero las millas por hora a millas por segundo tanto para la velocidad del tren
como para la velocidad de la luz tomando en cuenta que una milla equivale a 1.609 kilómetros:

V = (100 millas/hora) (1 hora / 3600 segundos) = 2.78·10-2 millas/segundo

c = 3·108 m/seg/(1 milla/1609 metros) = 1.86·105 millas/segundo

Para este problema:

V/c = (2.78·10-2 millas/segundo) /(1.86·105 millas/segundo) = 1.495·10-7

y el factor γ = 1 / √(1 - V²/c²) para fines prácticos lo podemos tomar como igual a la unidad.

Establecemos ahora la diferencia de tiempos de acuerdo con la transformación de Lorentz para


pasar del sistema de referencia S’ al sistema de referencia S:

t = γ(t’ + Vx’ /c²)

La diferencia de tiempos entre los dos acontecimientos (los dos destellos de luz) de acuerdo con
el observador S será:
t2 - t1 = γ ( t’2 + V x’2/c²) - γ ( t’1 + V x’1/c²)

t2 - t1 = (t’2 - t’1) + (V/c²) (x’2 - x’1)

Si los dos destellos inciden simultáneamente en los extremos del tren para un observador en
tierra (ocurriendo al mismo tiempo) entonces t1 = t2 y:

0 = (t’2 - t’1) + {(2.78·10-2 milla/seg) / (1.86·105 millas/seg)² } (0.5 milla)

t’2 - t’1 = - 4.02·10-3 segundo___(¡Obsérvese el signo menos!)

El signo menos obtenido en la respuesta nos indica que para el observador viajero que va en el
tren el acontecimiento 1 (en el punto A en la figura) ocurre después que el acontecimiento 2 (en
el punto B en la figura).

Anteriormente al estudiar los diagramas espacio-tiempo de Minkowski ya habíamos hablado


acerca de la introducción típica con la que varios textos presentan la ausencia de simultaneidad
entre dos eventos, con un marco de referencia S de un observador situado a un lado de las vías
del ferrocarril justo a la mitad de dos torres de luz que se activan en forma sincronizada (al
mismo tiempo) emitiendo dos pulsos luminosos de las dos torres de luz usando relojes
sincronizados en el marco de referencia de S para lanzar los pulsos luminosos en forma tal que
el estallido de uno de los pulsos luminosos coincide justo con el extremo delantero del
ferrocarril y el estallido del otro pulso luminoso coincidirá justo con el extremo trasero del
ferrocarril:

De acuerdo con la explicación que dan en dichos libros, el observador en tierra situado a un lado
de las vías del ferrocarril en el marco de referencia S recibe los dos pulsos luminosos al mismo
tiempo, y por lo tanto concluye que ambos eventos fueron simultáneos dentro de su marco de
referencia, pero a causa de la velocidad finita de la luz y en virtud de que el pasajero del
ferrocarril está en movimiento, uno de los pulsos luminosos le llega primero que el otro, y el
pasajero concluye que los destellos no ocurrieron al mismo tiempo, que no fueron simultáneos,
dada la diferencia de tiempos en que tardan en llegarle los dos rayos de luz a su plataforma
móvil, y por lo tanto para él los eventos no son simultáneos en su marco de referencia S’. Sin
embargo, ya se había señalado que esta explicación es una explicación simplista y en cierta
forma errónea porque no toma en cuenta para nada los verdaderos efectos relativistas de
pérdida de simultaneidad que hemos visto arriba, y como acabamos de ver en los problemas que
se han resuelto la pérdida en la simultaneidad no se debe simplemente a la velocidad finita de la
luz. Efectivamente, hay una diferencia de tiempos en la llegada de los dos pulsos luminosos al
observador viajero que está en el ferrocarril, pero también hay una pérdida de
simultaneidad real que no es ocasionada por la velocidad finita de la luz sino por efectos de
índole relativista, y para poder calcular numéricamente ésta pérdida relativista de
simultaneidad es necesario identificar a los dos eventos que ocurren simultáneamente en el
marco de referencia S y calcular las coordenadas (x’,t’) de cada uno de dichos eventos (o mejor
dicho, las diferencias entre las coordenadas) para S’ de acuerdo con las transformaciones de
Lorentz. Si queremos agregarle a todo esto lo que el viajero situado a la mitad de los vagones del
ferrocarril veentonces tenemos que llevar a cabo cálculos adicionales en base a la velocidad
finita de la luz, lo cual viene a complicar el problema. Si el viajero pudiese estar mágicamente al
mismo tiempo en ambos extremos del tren por algún milagro de ubicuidad (como el que se le
atribuye a algunos santos) de modo tal que la luz de ambos destellos no tenga que recorrer ni
siquiera un milímetro para que el viajero los vea justo cuando ocurren frente a él, de cualquier
manera vería a un destello ocurrir antes que el otro, y la diferencia de tiempos entre ambos
acontecimientos sería la misma predicha por las transformaciones de Lorentz. Esto ya no tiene
nada que ver con el tiempo finito de la velocidad de la luz sino con el hecho de que relojes que
están sincronizados en un marco de referencia se salen fuera de sincronía en otro
marco de referencia porque el tiempo no es absoluto. Hay una distinción bastante clara
entre ver un acontecimiento y medir las coordenadas del mismo, del mismo modo que hay una
distinción bastante clara entre ver dos acontecimientos que nos parecen o no nos parecen ser
simultáneos y medir la pérdida de simultaneidad a causa de los efectos relativistas.

PROBLEMA: (a) Un observador O’ se mueve con una velocidad V = 0.8c respecto a otro
observador O. Los relojes se ajustan de tal manera que t = t’ = 0 en x = x’ = 0. Si para O un
destello de luz sale en x = 50 metros y t = 2·10 -7 segundo, ¿cuál es el tiempo de este
acontecimiento medido por O’ ? (b) Si un segundo destello aparece en x’ = 10 metros y t’ = 2·10 -
7 segundo para el observador O’, ¿cuál será el intervalo de tiempo entre los dos
acontecimientos medido por O? (c) ¿Cuál es la separación espacial entre los dos
acontecimientos medida por O’? (d) ¿Cuál es la separación espacial entre los dos
acontecimientos medida por O?

(a) Este parte del problema involucra una transformación a una coordenada de tiempo t’ que se
lleva a cabo en forma directa con una de las ecuaciones de transformación de Lorentz:

t’ = γ(t - Vx/c²)

La evaluación de γ nos dá:

γ = 1 / √(1 - V²/c²) = 1 / √(1 - (0.8) = 1 / √0.36 = 1/0.6 = 1.667

Entonces:

t’ = (1.667) [2·10-7 segundo - (0.8c) (50 metros)/c² ]

t’ = (1.667) [[2·10-7 segundo - 1.333·10-7 segundo] = 1.11·10-7 segundo

(b) Para un segundo destello de luz, identificamos sus coordenadas en S’ como (x’ 2, t’2) = (10 m,
2·10-7 segundo). El intervalo de tiempo t2 - t1 entre los dos acontecimientos medido por O estará
dado por:

t2 - t1 = γ( t’2 + V x’2/c²) - γ( t’1 + V x’1/c²)

t2 - t1 = γ(t’2 - t’1) + γ (V/c²) (x’2 - x’1)

t2 - t1 = γ [(t’2 - t’1) + γ (V/c²) (x’2 - x’1)]

Tenemos el tiempo t’1 del primer acontecimiento (destello) medido por O’ que es el que
acabamos de obtener arriba, 1.11·10-7 segundo, y tenemos la coordenada espacial x’ 2 del segundo
acontecimiento. Pero no tenemos aún la coordenada espacial x’ 1 del primer acontecimiento, la
cual tenemos que calcular antes de poder seguir adelante:

x’1 = γ (x1 - Vt1)


x’1 = (1.667) [50 metros - (0.8c) (2·10-7 segundo)]

x’1 = (1.667) [50 metros - 48 metros]

x’1 = 3.33 metros

Tenemos ya todos los datos que requerimos para seguir adelante:

t2 - t1 = (1.667) [(2·10-7 segundo - 1.11·10-7 segundo)


+ (1.667) (0.8/c) (10 metros - 3.33 metros)]

t2 - t1 = 1.48·10-7 segundo + 0.296·10-7 segundo

t2 - t1 = 1.78·10-7 segundo

(c) Teniendo x’1 y x’2, la evaluación de x’2 - x’1 es directa:

x’2 - x’1 = 10 metros - 3.33 metros = 6.67 metros

(d) Recurrimos nuevamente a las transformaciones de Lorentz para encontrar la diferencia


entre las coordenadas espaciales de los dos acontecimientos en S cuando se conoce la diferencia
entre las coordenadas espaciales de los dos acontecimientos en S’:

x2 - x1 = γ (x’2 + Vt’2) - γ (x’1 + Vt’1)

x2 - x1 = γ (x’2 - x’1) + γV (t’2 - t’1)

x2 - x1 = (1.667) [6.67 metros + (0.8) (3·108 m/seg) (2·10-7 seg - 1.11·10-7 seg)]

x2 - x1 = 11.11 metros + 35.60 metros = 46.7 metros

Repasando la relación:

t2 - t1 = γ(t’2 - t’1) + γ (V/c²) (x’2 - x’1)

se concluye que si dos acontecimientos son simultáneos para O (lo cual requiere t1 = t2) no
pueden ser simultáneos para O’ ; esto es imposible. Y si dos acontecimientos son simultáneos
para O’ (lo cual requiere t’1 = t’2) no pueden ser simultáneos para O. Esto ya lo habíamos
visto geométricamente al estudiar los diagramas espacio-tiempo de Minkowski, y lo
comprobamos ahora algebraicamente con las ecuaciones de transformación de Lorentz.

Las ecuaciones de transformación de Lorentz, aplicadas bajo el contexto de la Teoría Especial de


la Relatividad, aparecen publicadas en el primer trabajo de Einstein en el que expuso los
conceptos de dicha teoría (el cual es reproducido en su versión inglesa en un apéndice puesto al
final de esta obra):

Posiblemente haya quien se pregunte aquí por qué son llamadas ecuaciones de transformación
de Lorentz y no ecuaciones de transformación de Einstein. Esto se debe a que, si bien fue
Einstein quien generalizó estas ecuaciones de transformación derivándolas de los dos
postulados sobre los cuales está fundada la Teoría Especial de la Relatividad, el holandés
Hendrik Antoon Lorentz se le adelantó publicándolas primero, pero no aplicadas a los
fenómenos propios de la mecánica sino de la electrodinámica, y ello sin suponer efectos
relativistas, sino meramente como un esquema ingenioso de simplificación matemática para
hacer valer las ecuaciones de Maxwell dándoles cierta cualidad de invariancia. El mérito de
Einstein fue el haberles dado a estas ecuaciones de transformación un carácter universal,
general, aplicable no sólo a la electrodinámica sino a toda la mecánica, derivándolas no de
consideraciones hechas sobre fenómenos propios de la teoría del electromagnetismo, sino de los
dos postulados básicos.

En la resolución de muchos problemas propios de la Teoría Especial de la Relatividad, conviene


resolverlos tanto algebraicamente con las ecuaciones de transformación de Lorentz como
representarlos geométricamente con los diagramas espacio-tiempo de Minkowski, conviene
recurrir a ambos métodos que se complementan formidablemente el uno al otro y nos dan una
mejor idea de lo que está sucediendo.

Representaciones matriciales
Las transformaciones de Lorentz, siendo transformaciones lineares, se prestan admirablemente
para ser manejadas a través de las herramientas más fundamentales del álgebra lineal,
las matrices, esos arreglos rectangulares de números:

que resumen la transformación que será llevada a cabo de un sistema de coordenadas a otro.

Primero que nada, empecemos por visualizar a las cuatro variables (x,y,z,t) como un vector en
cuatro dimensiones. Este vector tendría una representación en la forma de un vector
renglón como la siguiente:

[x_y_z_t]

En realidad, este vector es una matriz que consta de un renglón y cuatro columnas, o sea es una
matriz 1x4.

La representación matricial anterior dada a las cuatro variables de las ecuaciones de


transformación de Lorentz adolece de un defecto: revuelve peras con manzanas. En efecto, las
coordenadas x, y y z son longitudes medidas en metros, mientras que la cuarta coordenada es
una dimensión medida en segundos. Pero esto tiene un remedio fácil, ya que todo lo que
tenemos que hacer es multiplicar la cuarta coordenada por la constante universal absoluta que
es la velocidad de la luz, por c, con lo cual obtenemos la coordenada ct que también está
expresada en metros. De este modo, tenemos un vector renglón en el que todos sus
componentes son peras (o manzanas):

[x_y_z_ct]

Repasemos ahora las ecuaciones de transformación de Lorentz:

____x = γ(x’ + Vt’)

____y = y’

____z = z’

____t = γ(t’ + Vx’/c²)

A continuación reescribiremos estas ecuaciones de transformación para preparar el sistema para


su representación matricial, multiplicando la cuarta coordenada (la del tiempo) por la constante
absoluta universal que es la velocidad de la luz c con la finalidad de que el vector de cuatro
componentes a ser transformado de un sistema de referencia a otro contenga las cuatro
coordenadas en dimensiones de metros:

____x = γx’ + 0y’ + 0z’ + γ(V/c) ct’

____y = 0γx’ + 1y’ + 0z’ + 0(V/c) ct’

____z = 0γx’ + 0y’ + 1z’ + 0(V/c) ct’

____ct = γ(V/c) x’ + 0cy’ + 0cz’ + γct’

Para aquellos con alguna experiencia previa en matrices el arreglo rectangular de la


representación matricial requerida casi salta a la vista, ya que lo que queremos es convertir el
vector [x’, y’, z’, ct’] al vector [x, y, z, ct], o sea:

[x’, y’, z’, ct’] → [x, y, z, ct]

Si hacemos las siguientes designaciones:


A = [x, y, z, ct]

A’ = [x’, y’, z’, ct’]

entonces lo que estamos buscando es un operador Λ que aplicado sobre el vector A lo


transforme al vector A’. En notación matricial (el operador usualmente se escribe a la izquierda
del operando sobre el cual actúa, aunque hay algunos textos en los que por la falta de una
convención universal se escribe primero el operando que va a ser transformado e
inmediatamente después el operador que llevará a cabo la transformación) esto se representa
con la siguiente ecuación:

A = ΛA’

Obsérvese que para representar al operador matricial propio de las transformaciones de Lorentz
estamos utilizando la letra griega lambda (Λ) cuyo equivalente latino es la letra L.

Tomando en cuenta la forma en la cual se lleva a cabo la multiplicación de dos


matrices A y B (cada elemento en el renglón i y en la columna j de la matriz resultante C se
puede obtener de la suma de los productos apareados respectivos de los elementos de la
matriz A del lado izquierdo a los cuales apunta horizontalmente el dedo índice de la mano
izquierda en el renglón i por los elementos de la matriz B del lado derecho a los cuales apunta
verticalmente el dedo índice de la mano derecha en la columna j):

determinamos de inmediato que las operaciones matriciales de transformación, representando a


los vectores A y A’ como vectores columna, están indicadas por la siguiente ecuación
matricial:

Con un simple intercambio en el orden de los renglones y en la posición de unas variables en las
ecuaciones de transformación de Lorentz:

____x = γx’ + + γ(V/c) ct’ + 0y’ + 0z’

____ct = γ(V/c) x’ + γct’ + 0cy’ + 0cz’

____y = 0γx’ + 0(V/c) ct’ + 1y’ + 0z’

____z = 0γx’ + 0(V/c) ct’ + 0y’ + 1z’

podemos obtener la siguiente ecuación matricial que es un poco más reveladora:

Tenemos, en efecto, una submatriz, resaltada con fondo color amarillo, la cual transforma las
coordenadas (x’, ct’) a las coordenadas (x, ct) dejando intactas a las coordenadas del eje-y y
del eje-z en virtud de que entre los sistemas de referencia S’ y S no hay un movimiento relativo
en los ejes-y y en los ejes-z, el único movimiento es en el eje-x. Entresacando dicha submatriz de
la matriz general, obtenemos la matriz que verdaderamente proporciona la transformación en el
eje-x, una transformación conocida como un boost (empuje) en la dirección del eje-x:
No se requiere de mucha imaginación para darse cuenta de que en caso de que el marco de
referencia móvil S se esté moviendo a lo largo del eje-y en lugar de moverse a lo largo del eje-x,
las ecuaciones de transformación serán:

____x = 1x’ + 0y’ + 0z’ + 0ct’

____y = 0x’ + γy’ + + 0z’ + γ(V/c) ct’

____z = 0x’ + 0y’ + 1z’ + 0ct’

____ct = 0x’ +γ(V/c) y’ + 0z’ + γct’

La representación matricial de este sistema de ecuaciones lineares es la siguiente:

Y cuando el movimiento relativo entre ambos marcos de referencia se esté dando en el eje-z, las
ecuaciones de transformación serán:

____x = 1x’ + 0y’ + 0z’ + 0ct’

____y = 0x’ + 1y’ + 0z’ + 0ct’

____z = 0x’ + 0y’ + γz’ + γ(V/c) ct’

____ct = 0x’ + 0y’+ γ(V/c) z’ + γct’

La representación matricial de este sistema de ecuaciones lineares es la siguiente:


Obsérvese que, en cada caso, podemos entresacar una submatriz, la cual será siempre la misma
cuando el movimiento ocurre a velocidad V a lo largo de solo uno de los ejes coordenados. Esta
matriz es conocida como la matriz simple de Lorentz.

Utilizando el símbolo β definido como β = V/c, obtenemos una representación más compacta de
la matriz simple de Lorentz:

Por razones de conveniencia que pronto serán obvias, haremos el cambio notacional a = γ y b =
βγ, con lo cual nuestra matriz de Lorentz adquiere el siguiente aspecto:

Consideremos ahora las ecuaciones de la transformación inversa de Lorentz, utilizadas para


efectuar el cambio de las coordenadas (x, y, z, ct) del marco de referencia S a las coordenadas (x’,
y’, z’, ct’) del marco de referencia S’:

____x’ = γ(x - Vt)

____y’ = y

____z’ = z

____t’ = γ(t - Vx/c²)

Para poder obtener la submatriz que nos interesa, podemos ignorar las dos transformaciones
intermedias que en realidad son transformaciones triviales, concentrándonos únicamente sobre
las transformaciones que realmente nos interesan:

____x’ = γx - γ(V/c) ct

____ct’ = - γ(V/c) x + γct

No cuesta trabajo darse cuenta de que para la transformación inversa la submatriz será:

En notación matricial compacta, si A = [x, ct] entonces para obtener A’ = [x’, ct’] la operación
matricial estará representada por la siguiente ecuación;

A’ = ΛA

Puesto que Λ es la transformación matricial que usamos para convertir las coordenadas del
sistema de referencia S al sistema de referencia S’, y Λ es la transformación matricial que
usamos para convertir las coordenadas del sistema de referencia S’ al sistema de referencia S, si
aplicamos a un vector A primero la operación Λ y después la operación Λ debemos obtener el
mismo vector A con el que habíamos comenzado originalmente:

ΛΛA’ = Λ (ΛA’) = Λ A = A’

(ΛΛ) A’ = A’

Esto solo puede ser cierto si el producto matricial ΛΛ es igual a la matriz identidad I:

Se recuerda, por si se ha olvidado, o se informa, por si no se sabe, que por lo general la


multiplicación de dos matrices no es una operación conmutativa, el orden de los factores sí
altera el producto. El producto de dos matrices Q1 y Q2, tomado en el orden Q1Q2, producirá
una matriz diferente a la que producen las mismas matrices tomadas en el orden Q2Q1:

Cuando son conmutativas, el producto de ambas resulta ser la matriz identidad I, ya que una de
las matrices es la inversa de la otra.)

Todo lo anterior nos conduce a concluír que Λ tiene que ser la matriz inversa de la matriz Λ, lo
cual representamos notacionalmente como Λ = Λ-1. Siendo así, entonces se debe cumplir la
condición ΛΛ = I:

Llevando a cabo la multiplicación matricial del lado izquierdo de la igualdad e igualando


componente a componente con la matriz del lado derecho, además de obtener la obvia condición
trivial ab = ba obtenemos otra condición que no es trivial:

a² - b² = 1

Esto nos permite definir, formalmente y de modo riguroso, a una matriz simple de Lorentz
como toda aquella matriz que tenga el aspecto

o el aspecto
para la cual se cumpla la condición

a² - b² = 1

El interés que podamos tener en las propiedades de las representaciones matriciales de las
transformaciones de Lorentz va más allá de la afición que pueda haber en nosotros hacia las
curiosidades de las matemáticas. Las transformaciones de Lorentz tienen un aspecto casi único,
distintivo, característico de lo que llamamos un espacio-tiempo plano propio de la Teoría
Especial de la Relatividad. Eventualmente llegará el momento de dar el salto hacia marcos de
referencia no-inerciales, acelerados, en los cuales el espacio-tiempo no es plano sino que
adquiere una curvatura. Y las matrices de transformación volverán a aparecer nuevamente pero
bajo un aspecto más elaborado, propio de la Teoría General de la Relatividad. Pero tales
matrices características de un espacio-tiempo curvo se reducen a las matrices características de
las transformaciones de Lorentz cuando el marco de referencia acelerado que corresponde a los
campos gravitacionales se puede considerar en una región pequeña del espacio
como Lorentziano.

Existe otra forma de representar lo mismo que lo que representan las matrices cuadradas
(rectangulares, de orden 2) en cuatro dimensiones, renombrando a las cuatro coordenadas bajo
un esquema conocido como coordenadas generalizadas (x1, x2, x3, x4) y prescindiendo de
matrices usando en lugar de ello sumatorias y dobles sumatorias, pero esto quedará postpuesto
para cuando se lleve a cabo una discusión sobre el cálculo tensorial. De antemano se señala
aquí que ambas formas de representación son completamente equivalentes, están
representando lo mismo, y cada una de ellas tiene sus propias ventajas.

PROBLEMA: Determinar si la siguiente matriz


es una matriz de Lorentz.

Extraemos primero la submatriz que nos interesa tachando los renglones y las columnas que
contienen únicamente unos y ceros:

La matriz de interés es la siguiente:

Haciendo a = 1.25 y b = .75, la matriz dada ciertamente tiene la configuración de una matriz
Lorentziana. Sin embargo, falta ver si se cumple la condición principal:

a² - b² = (1.25)² - (.75)² = 1.5625 - 0.5625

a² - b² = 1

Se concluye que la matriz es Lorentziana, y en los lugares en donde esta matriz aplica se
cumplirán los postulados de la Teoría Especial de la Relatividad.

Al tratar el tema de las transformaciones de Lorentz, para derivar dichas ecuaciones de


transformación se supuso, como se ha hecho desde un principio, que el movimiento relativo
entre los dos marcos de referencia usuales S y S’ se lleva a cabo con uno de los marcos
moviéndose a una velocidad constante V a lo largo del eje-x. Esto se hace con fines de
simplificación. Los marcos de referencia pueden estarse moviendo el uno con respecto al otro en
tal forma que no sólo haya un movimiento relativo entre ambos marcos a lo largo del eje-x, sino
también que haya un movimiento relativo entre ambos a lo largo del eje-y e inclusive a lo largo
del eje-z. De este modo, podríamos hablar de tres componentes de velocidad, Vx, Vy y Vz en lugar
de una sola. En la situación clásica en donde utilizamos las transformaciones de Galileo, esto no
presenta problema alguno porque allí las componentes de velocidad a lo largo de cada eje son
independientes la una de la otra por completo. De este modo, si las transformaciones clásicas de
un marco de referencia a otro cuando el movimiento relativo entre ambos marcos ocurre sólo a
lo largo del eje-x son:

x = x’ + Vt’

y = y’

z = z’

entonces cuando el movimiento relativo entre ambos marcos ocurre a lo largo de los tres ejes las
transformaciones de Galileo serán simplemente:

x = x’ + Vx t’

y = y’ + Vy t’

z = z’ + Vz t’

Desafortunadamente, en el caso de la Teoría Especial de la Relatividad, el asunto de ampliar la


cobertura cuando el movimiento relativo entre ambos marcos ocurre a lo largo de los tres ejes en
lugar de uno solo no es un asunto tan sencillo en virtud del requerimiento estricto del segundo
postulado de la Teoría Especial de la Relatividad que nos dice que la velocidad de la luz medida
por observadores situados en ambos marcos debe seguir siendo exactamente la misma. De este
modo un rayo de luz, que tendrá tres componentes de velocidad proyectados sobre cada uno de
los ejes en ambos marcos de referencia, debe tener el mismo valor constante por dondequiera
que se le mire. La transformación general de Lorentz para esta situación, recurriendo a la
ayuda de matrices con el fin de simplificar la notación, es la siguiente (se recomienda ampliar la
imagen para poder leer mejor la ecuación matricial):
Como es de esperarse, la obtención de la transformación general de Lorentz es un asunto
laborioso al que sólo se recurre cuando algún maestro que disfruta de su fama de “cruel” lo deja
como tarea a sus alumnos (algo así como el draconiano Profesor Charles W. Kingsfield que
aparece en la película The Paper Chase, protagonizado por John Houseman). El lector no
deberá tener dificultad alguna en verificar la transformación general de Lorentz que se ha dado
arriba tomando en cuenta que la designación de las coordenadas es un asunto arbitrario,
haciendo por ejemplo βy = βz = 0 con lo cual se debe obtener como caso especial la
transformación de Lorentz cuando el movimiento relativo ocurre únicamente a lo largo del eje-
x, tras lo cual se puede hacer βx = βz = 0 para comprobar el segundo caso (movimiento relativo a
lo largo del eje-y), y finalmente βx = βy = 0 (movimiento relativo a lo largo del eje-z).

En realidad, si estamos realmente interesados en derivar las relaciones que corresponden a la


transformación general de Lorentz cuando los marcos de referencia están en movimiento
relativo el uno con respecto al otro a través de tres ejes coordenados en lugar de uno solo, la
demostración se puede simplificar enormemente si recurrimos a notación
vectorial clásica denotando como el vector posición x a la ubicación de un punto en el sistema
coordenado S:

x = (x, y, z)

y denotando la ubicación del mismo punto en el sistema coordenado S’ como:

x’ = (x’, y’, z’)

simbolizando asimismo a la velocidad relativa V que hay entre los dos marcos de referencia
como un vector V (con letra negrita) con componentes relativos en cada uno de los tres ejes
Cartesianos:

V = (Vx, Vy, Vz)


Lo anterior lo hacemos en conjunción con la notación vectorial del producto punto ó producto
escalar entre dos vectores:

x · V = (x, y, z) · (Vx, Vy, Vz) = xVx + yVy + zVz

Con esta notación, la transformación general de Lorentz que estamos buscando tanto para las
componentes espaciales como para la componente temporal se puede
resumir vectorialmente en las siguientes dos fórmulas:

Resta decir que para la derivación de estas dos fórmulas debemos aferrarnos estrictamente de
principio a fin al manejo matemático vectorial que se acostumbra darle a los problemas típicos
de la mecánica clásica en los que se manejan cantidades vectoriales.

Habiendo visto una representación matricial para la transformación generalizada de Lorentz, no


debe causarnos ningún asombro el hecho de que la siguiente matriz también sea una matriz de
Lorentz:

Esto nos debe dejar en claro cuál es la diferencia entre una matriz simple de Lorentz como las
que vimos arriba, y una matriz de Lorentz ordinaria.

Determinar si una matriz 4x4 como la de arriba es una matriz de Lorentz no es un asunto
complicado. Ello requiere derivar primero tres relaciones generales a partir de lo que vendría
siendo la invariancia de la ecuación del cono de luz (en referencia a los diagramas de
Minkowski). Pero para ello tenemos que tener en claro cuál es esa invariancia a la que nos
estamos refiriendo, razón por la cual este asunto debe quedar postpuesto hasta que no haya sido
desarrollado dicho tema.

La multiplicación de dos matrices A y B tiene desde luego una definición más formal que la
definición intuitiva que se ha dado arriba, y es la siguiente:

Este enunciado nos dice que para dos matrices A = (apq) y B = (brs), siendo A una matriz
de p renglones y q columnas, y siendo B una matriz de r renglones y s columnas, el producto de
las mismas definido en el orden AB es tal que cada elemento cij de la matriz resultante deberá
ser obtenido de acuerdo a la relación anterior, para lo cual es requisito indispensable que el
número de columnas de la matriz A sea igual al número de renglones de la matriz B, o sea q = r.

En la definición formal que se acaba de dar para el producto de dos matrices, obsérvese un
detalle interesante: la sumación se lleva a cabo sobre el sub-índice que está repetido, en este
caso k. Si alguien borrara el símbolo Σ de la sumatoria en la expresión de arriba, no tendríamos
dificultad alguna para reestablecerlo junto con el índice que fue borrado. Tan sólo tendríamos
que fijarnos en el sub-índice que aparece repetido.

PROBLEMA: Escribir la expresión para evaluar el elemento c47 resultante del


producto AB de dos matrices A y B si la matriz A es una matriz de cinco renglones y nueve
columnas (representado como 5x9), y la matriz B es una matriz de nueve renglones y ocho
columnas (representado como 9x8).

En este caso, el producto matricial está definido, puesto que el número de columnas de la
matriz A es igual al número de renglones de la matriz B, o sea:

[5x9] [9x8]
Podemos ver también aquí que la sumatoria deberá correr desde n =1 hasta n = 9 y que la matriz
resultante será una matriz 5x8.

Utilizando la definición formal dada arriba, el elemento c47 estará dado por la siguiente
sumatoria:

c47 = ______________________________________
a41b17 + a42b27 + a43b37 + a44b47 + a45b57 + a46b67 + a47b77

PROBLEMA: Si postmultiplicamos una matriz A cuyo tamaño es 5x4 por una matriz B cuyo
tamaño es 4x7, y el producto resultante los postmultiplicamos por otra matriz C cuyo tamaño
es 7x3, ¿cuál será el tamaño de la matriz resultante?

[5x4][4x7][7x3]

Podemos ver que la matriz resultante será una matriz 5x3.

PROBLEMA: La siguiente cantidad

cΔt² - x² - y² - z²

resulta ser de gran utilidad en el análisis de problemas propios de la Teoría Especial de la


Relatividad. Representar dicha cantidad en forma matricial.

Formando un vector renglón [ cΔt, x, y, z ] y tomando la transpuesta del mismo para formar el
vector columna correspondiente, la cantidad

cΔt² + x² + y² + z²

quedaría representada matricialmente por el siguiente producto matricial entre una matriz que
consta de un renglón y cuatro columnas (1x4) y una matriz que consta de una columna y cuatro
renglones (4x1):
Pero queremos además la selección de signos que se nos han indicado. Esto se logra injertando
entre las dos matrices de arriba una matriz intermedia:

En notación matricial más compacta y haciendo X = [ cΔt, x, y, z ], lo anterior se puede escribir


como XAXT en donde A es la matriz intermedia y XT es la transpuesta de la matriz X. Llevando
a cabo el producto matricial ya sea en el orden (XA)XT multiplicando primero las dos matrices
de la izquierda y multiplicando la matriz resultante por la matriz a la derecha, o en el
orden X(AXT) multiplicando primero las dos matrices de la derecha y multiplicando la matriz
resultante por la matriz de la izquierda, podemos ver que esta representación matricial nos
produce la expresión deseada.

La matriz intermedia A del problema representa los 16 componentes de un objeto que se conoce
como el tensor métrico de un espacio-tiempo plano (Lorentziano), el cual se representa en
forma abreviada ya sea como g = (gij) usando sub-índices o como g = (gij) usando super-índices.
El concepto del tensor métrico es generalizado hacia un espacio-tiempo curvo en la Teoría
General de la Relatividad.

Llevaremos ahora a cabo la post-multiplicación de un vector renglón U de tres elementos:

por una matriz cuadrada g de tamaño 3x3:


post-multiplicado todo por un vector columna V de tres elementos:

Procedemos a formar el producto matricial UgV de la manera siguiente:

Llevaremos a cabo la multiplicación de estas tres cantidades multiplicando primero la segunda


por la tercera siguiendo la regla para la multiplicación de matrices dada arriba:

El resultado final de la operación UgV resulta ser una sola cantidad, la cual viene siendo
evaluada a fin de cuentas de la siguiente manera:

UgV =_______________
a1 g11 b1 + a1 g12 b2 + a1 g13 b3
+ a2 g21 b1 + a2 g22 b2 + a2 g23 b3
+ a3 g31 b1 + a3 g32 b2 + a3 g33 b3

La evaluación de esta cantidad la podemos obtener sin ayuda de representaciones gráficas con la
ayuda de dos sumatorias:

No cuesta mucho trabajo convencerse de que, si llevamos a cabo las dos sumaciones,
obtendremos el resultado final del producto triple UgV. No importa que se lleve a cabo primero
la sumación sobre p y después la sumación sobre q, o bien primero la sumación sobre q y luego
la sumación sobre p, porque es cosa fácil de comprobar el hecho de que en una sumatoria
múltiple el orden en que se llevan a cabo las sumaciones no altera el resultado
final.

Al llevar a cabo el producto UgV, empezamos con dos vectores y una matriz, y terminamos al
final con un solo número. ¿Significa esto que hubo una metamorfosis en la cual terminaron
perdiéndose los paréntesis cuadrados? Bueno, no precisamente. Podemos ver simbólicamente
que el resultado de estos productos será una matriz 1x1:

En pocas palabras, para la matriz UgV el resultado final será:

[1x3][3x3][3x1] = [1x1]

De este modo, el número solitario que llamamos escalar en realidad sigue siendo una matriz,
una matriz que consta de un solo renglón y una sola columna, una matriz de tamaño 1x1 que
consta de un solo elemento, pero al fin y al cabo una matriz. Naturalmente, si este elemento
representa una temperatura o una frecuencia, prescindimos de la formalidad simbólica y
utilizamos a dicho elemento en cálculos posteriores como si fuese un número cualesquiera. Pero
no hay que olvidar que, formalmente, todas las operaciones llevadas a cabo con vectores y
matrices siempre terminan produciendo otros vectores y matrices.

Ahora bien, vamos a considerar al vector renglón U como lo que verdaderamente es, una matriz
que consta de un renglón y tres columnas, o sea, una matriz 1x3. En tal caso, podemos
formalizar la representación de cada elemento agregando un 1 a cada sub-índice, de modo tal
que el elemento a11 es el elemento que corresponde al primer (y único) renglón en la primera
columna de la matriz, el elemento a12 es el elemento que corresponde al primer renglón en la
segunda columna de la matriz, y el elemento a13 es el elemento que corresponde al primer
renglón en la tercera columna de la matriz:

Haremos también algo similar con el vector columna V, lo vamos a considerar como lo que
verdaderamente es, una matriz que consta de tres renglones y una columna, o sea, una matriz
3x1. En tal caso, podemos formalizar la representación de cada elemento poniendo un 1 después
de cada cada sub-índice, de modo tal que el elemento b11 es el elemento que corresponde al
primer renglón en la primera (y única) columna de la matriz, el elemento b 21 es el elemento que
corresponde al segundo renglón en la primera columna de la matriz, y el elemento b31 es el
elemento que corresponde al tercer renglón en la primera columna de la matriz:

Con este ligero cambio notacional, el producto UgV se escribe en notación matricial de la
siguiente manera:
La representación del producto matricial triple mediante una doble sumatoria será entonces:

Un momento de reflexión nos revela que si en lugar del vector U de tamaño 1x3 tenemos
una matriz de tamaño ix3, y que si en lugar del vector V de tamaño 3x1 tenemos una matrizde
tamaño 3xj, entonces el resultado final del producto de las tres matrices será una matriz M =
(mij) de tamaño ixj, y para calcular el valor de cada elemento mij de dicha matriz todo lo que
tenemos que hacer en la doble sumatoria de arriba es reemplazar el primer sub-índice 1 en la
variable a por i, y reemplazar el segundo sub-índice 1 en la variable b por j, obteniendo la
siguiente relación:

Lo que se acaba de hacer aquí es la obtención de la definición formal del producto de tres
matrices. Obsérvese que en los límites superiores de las sumatorias para esta definición que
acabamos de obtener el tamaño intermedio ya no está limitado hasta p = q = 3, podemos utilizar
matrices del tamaño que queramos siempre y cuando dichos tamaños estén en concordancia con
la definición de compatibilidad que se ha dado para productos matriciales (no podemos
multiplicar una matriz 4x3 por una matriz 2x5 en ningún orden).

Obsérvese también otro detalle interesante. Si alguien borrara los símbolos Σ de las sumatorias
en la expresión de arriba, no tendríamos dificultad alguna en reestablecerlos. Tan sólo
tendríamos que fijarnos en los sub-índices que están repetidos. De este modo, si lo que vemos
escrito es lo siguiente:

aip gpq bqj

entonces con tan sólo mirar los sub-índices que están repetidos (en este caso los sub-
índices p y q) podemos volver a poner las sumatorias en el orden que queramos (que al fin y al
cabo el orden en el cual se lleven a cabo las sumaciones no altera el resultado final de la
sumación). Esto será de utilidad posteriormente cuando entremos en el estudio del análisis
tensorial que a su vez es requerido para formular los principios y resolver los problemas que
corresponden a la Teoría General de la Relatividad. Mientras tanto, en base a lo que acabamos
de ver, podemos hacer unívocamente la siguiente afirmación sin temor a equivocarnos:

El resultado final de todo producto matricial múltiple (involucrando dos o más


matrices) puede ser representado no sólo gráficamente mediante matrices sino
también con la definición formal basada en el uso de las sumatorias.

De este modo, contamos ya con dos representaciones distintas para la misma cosa.

Tomando en cuenta que el producto de dos matrices no es una operación conmutativa salvo en
casos especiales, esta es una buena ocasión para señalar que para que una sumatoria múltiple
pueda ser representada en forma alterna como el producto de varias matrices cuando tal cosa
sea posible, ayuda mucho el acomodar los factores de la sumatoria de modo tal que la
conversión a la representación matricial se pueda llevar a cabo directamente. A modo de
ejemplo, en la siguiente sumatoria múltiple:

no resulta nada claro cuál podría ser la representación matricial correspondiente. Pero si
reacomodamos los factores de la sumatoria de la siguiente manera usando como guía el
requerimiento de que los sub-índices tienen que estar apareados conforme son leídos de
izquierda a derecha en la sumatoria ya transformada:

la representación matricial salta a la vista casi de inmediato, la cual en notación


matricial compacta resulta ser:

XTΛT G Λ X
Obsérvese cuidadosamente que para poder lograr esta representación matricial, tomando en
cuenta que la sumatoria múltiple debe producir al final un número (que matricialmente viene
siendo una matriz que consta de un solo renglón y de una sola columna, algo que tenemos que
saber de antemano para evitarnos mucho trabajo), la necesidad de aparear los sub-índices nos
obligó a tomar la transpuesta de la matriz Λ, la cual representamos de color rojo como ΛT; y
también nos obligó a usar la representación del vector columna X como el
vector renglón tomando la transpuesta de X y representándolo como XT. Esto significa que en la
sumatoria múltiple preparada para su representación matricial en donde aparecen XTy ΛT de
color rojo como corresponde a las transpuestas, si bien en lo que respecta al
componente xi dentro de la sumatoria el cambio no tiene efecto alguno, el componente λiren caso
de llevarse a cabo la sumación sobre esa expresión tiene que ser interpretado no como el
elemento dentro de la matriz Λ que está en el renglón i y la columna r sino como el elemento
dentro de la matriz que está dentro del renglón r y la columna i.

Suma relativista de velocidades


Supóngase, para fines de discusión, que tenemos un tren que se está moviendo a una velocidad
extraordinariamente alta, a una velocidad de Vtren igual a 200 mil kilómetros por segundo.
Supóngase también que en uno de los vagones del tren hay un viajero que lanza en la misma
dirección en la cual se está moviendo el tren una pelota a una velocidad Vpelota de 200 mil
kilómetros por segundo:

La pregunta que nos hacemos ahora es: ¿a qué velocidad verá moverse la pelota un observador
situado fuera del tren a un lado de las vías de ferrocarril?

Si pensáramos de acuerdo a la cinemática clásica, diríamos: A la velocidad Vpelota a la que es


lanzada la pelota dentro del vagón del tren hay que sumarle la velocidad Vtren a la cual se está
desplazando el ferrocarril en el mismo sentido para obtener la velocidad total Vtotalcon la cual
verá moverse la pelota un observador externo situado a un lado de las vías del ferrocarril, o sea:

Vtotal = Vtren + Vpelota

Pero en la mecánica relativista, este modo de pensar es incorrecto, porque en el ejemplo que se
ha puesto arriba una velocidad de la pelota de 200 mil kilómetros por segundo sumada a una
velocidad del tren de 200 mil kilómetros por segundo nos daría una velocidad de la pelota de
400 mil kilómetros por segundo para un observador externo, lo cual excede a la velocidad de la
luz por 100 mil kilómetros por segundo, violando el principio de que no hay nada que pueda
moverse a una velocidad mayor que la velocidad de la luz.

Obviamente, la suma clásica de velocidades tiene que ser modificada. El viajero dentro del tren
verá la pelota lanzada por él moviéndose a una velocidad de 200 mil kilómetros por segundo,
pero el observador externo no la verá moverse a 400 mil kilómetros por segundo sino a una
velocidad menor, ciertamente menor que la velocidad de la luz.

Se puede demostrar que, dentro de la Teoría de la Relatividad, si la velocidad de la pelota dentro


del vagón de ferrocarril (en el marco de referencia S') es designada como u' y la velocidad del
ferrocarril es designada como v, entonces la velocidad u de la pelota tal y como la verá un
observador situado a un lado de las vías será:

Esta relación es conocida también como ley de adición (composición) de velocidades.


Pongamos algunos valores numéricos en ésta fórmula. Puesto que la pelota es arrojada dentro
del vagón a una velocidad de 200 mil kilómetros por segundo, siendo las dos terceras partes de
la velocidad de la luz, podemos escribir u' = 2c/3. Del mismo modo, puesto que el ferrocarril se
está desplazando también a una velocidad v de 200 mil kilómetros por segundo, podemos
escribir v = 2c/3. Entonces la velocidad de la pelota, vista por un observador externo, será:

u = (2c/3 + 2c/3)/{1 + (2c/3)(2c/3)/c²}

u = (4c/3)/{1 + 4/9}
u = (4c/3)/(13/9)

u = (36/39) c

u = 0.923 c

u = 2,769 kilómetros por segundo

Ahora que tenemos una fórmula para obtener la suma de velocidades en un esquema relativista,
podemos recurrir directamente a dicha fórmula para resolver algunos problemas.

PROBLEMA: ¿Cuál será la velocidad de un rayo luminoso lanzado desde una linterna dentro
de una nave espacial en la misma dirección en la cual se mueve la nave, para un observador
externo que ve a la nave trasladarse a una velocidad u', de acuerdo con la formula relativista
para la suma de velocidades?

Poniendo u' = c en la fórmula de arriba, obtenemos:

u' = (u + v)/(1 + vu'/c²)

u' = (c + v)/(1 + vc/c²)

u' = (c + v)/{(c + v)/c)

u' = c

El observador externo mide para el rayo de luz la misma velocidad c que la que mide el
observador que va dentro de la nave, en concordancia con el segundo postulado de la Teoría
Espacial de la Relatividad.

Aunque no es una convención universalmente aceptada, en una buena cantidad de textos se


acostumbra simbolizar como u a la velocidad de un cuerpo que se está moviendo dentro de
cierto marco de referencia S frente a un observador en reposo situado dentro del mismo marco
de referencia:
mientras que la otra forma de simbolizar al movimiento de dicho cuerpo consiste en
considerarlo en estado de reposo dentro de un marco de referencia S’ que a su vez está en
movimiento relativo frente a otro observador situado en el marco de referencia S, en cuyo caso
la velocidad del cuerpo entre ambos marcos es simbolizada como V:

De este modo, en una convención se utiliza un solo marco de referencia S, mientras que en la
otra convención se utilizan dos marcos de referencia S y S’. Algunas veces, las
velocidades uy V serán iguales, o sea u = V, lo cual describe exactamente la misma situación en
ambos casos. En la convención en la cual utilizamos el símbolo V para representar a un cuerpo
en reposo dentro de un marco de referencia que se está moviendo con respecto a otro a una
velocidad V, ésta convención equivale a anclar el sistema de referencia S’ al cuerpo mismo. En el
caso en el que tengamos a un cuerpo moviéndose dentro de un marco de referencia S’ a una
velocidad u, el cual a su vez está moviéndose a una velocidad V con respecto a otro marco de
referencia S de un observador en reposo, la velocidad del cuerpo medida por el observador en
reposo será igual a la suma relativista de velocidades u y V. Cuando no hay confusión al
respecto, podemos designar a la velocidad u como V1 y a la velocidad V del marco de referencia
como V2 para simplificar así a la suma relativista de velocidades de una manera más general.

PROBLEMA: Un observador en Tierra ve a dos naves espaciales aproximarse en sentido


contrario la una a la otra. ¿A qué velocidad debe ir viajando cada nave, suponiendo que
ambas tienen velocidades iguales pero en sentido contrario, para que produzcan una suma
relativista de velocidades resultante en una velocidad igual a 0.9c?

Llamando V a la velocidad de cada nave con respecto al observador en Tierra, de acuerdo con la
fórmula relativista para adición de velocidades tendríamos lo siguiente para lograr una suma
relativista de velocidades igual a 0.9 c:

(0.9 c)(1 + V²/c²) = 2V

(0.9)V²/c² - 2V + (0.9/c) = 0

0.9V² - 2Vc² + 0.9 c = 0

Resolviendo la ecuación cuadrática, encontramos que la velocidad de cada nave espacial debe
ser igual a:

V = 0.627 c

PROBLEMA: Tomando la siguiente representación de la fórmula para la adición relativista


de velocidades:
demostrar la simetría e integridad de la fórmula despejando a V1 poniéndola en función
deV2 y V3 , comprobando que se mantiene el formato correcto para la composición de
velocidades.

c²V3 + V1V2V3 = c²V1 + c²V2

c²V1 - V1V2V3 = c²V3 - c²V2

c²V1(1 - V2V3 /c²) = c²(V3 - V2)

V1 = (- V2 + V3)/(1 - V2V3 /c²)

Este es el mismo formato de la fórmula original, con la substitución:

( V1, V2, V3) → ( V3, - V2, V1)

La fórmula dada para la suma relativista de velocidades es útil para el caso en el cual la persona
que viaja en el vagón del tren lanza la pelota en la misma dirección en la cual se está moviendo
el tren (el eje de las equis, x). ¿Pero qué relaciones deberán ser aplicadas para el caso en el cual
la pelota no es lanzada en la misma dirección en la cual se está moviendo el tren sino en una
dirección diferente que involucra las otras dos coordenadas (el eje de las y y el eje de las z)? En
tal caso, resulta conveniente derivar unas expresiones de uso general, y para ello podemos
recurrir a las ecuaciones de transformación de Lorentz:

____x = γ(x’ + Vt’)

____y = y’

____z = z’

____t = γ(t’ + Vx’/c²)

Por definición, la velocidad instantánea u de un objeto está definida como el cambio


infinitesimal en el espacio recorrido ds entre el intervalo infinitesimal de tiempo dtrequerido
para recorrerlo:
u = ds/dt

En tres coordenadas (x,y,z), las componentes respectivas de la velocidad serán:

ux = dx/dt

uy = dy/dt

uz = dz/dt

Tomando infinitesimales (diferenciales) en cada una de las relaciones de transformación de


Lorentz, obtenemos lo siguiente:

dx = γ(dx’ + Vdt’)

dy = dy’

dz =dz’

dt = γ(dt’ + Vdx’/c²)

Esto nos lleva directamente a las siguientes relaciones:

ux = dx/dt = {γ(dx’ + Vdt’)} / {γ(dt’ + Vdx’/c²)}

ux = {dx’/dt’ + V} / {1 + (V/c²)(dx’/dt’)}

uy = dy/dt = dy’/{γ(dt’ + Vdx’/c²)}

uy = {dy’/dt’} / {γ(1 + V(dx’/dt’) c²)


uz = dz/dt = dz/dt = dz’/{γ(dt’ + Vdz’/c²)}

uz = {dz’/dt’} / {γ(1 + V(dz’/dt’) c²)

PROBLEMA: ¿Cuál es la velocidad de un pulso de luz arrojado en la dirección del eje de las
equis de acuerdo con las transformaciones relativistas de velocidad?

En este caso se tiene

u’x = c , u’y = 0 , u’z = 0

Entonces:

ux = {c + V} / {1 + (V/c²)(c)} = c

así como uy = 0 y uz = 0. La luz que se mueve con una velocidad c en el marco de referencia S’
también se mueve con una velocidad c en el marco de referencia S, como lo requiere el segundo
postulado de la Teoría Especial de la Relatividad.

PROBLEMA: ¿Cuál es la velocidad de un pulso de luz arrojado dentro del marco de


referencia S’ en la dirección del eje-y’ cuando el marco de referencia se está moviendo en
dirección del eje-x’ ante un observador externo situado en el marco de referencia S?

En este caso se tiene

u’x = 0 , u’y = c , u’z = 0

Entonces:

ux = {0 + V} / {1 + (V/c²)(0)} = V

uy = {c} / {γ(1 + V(c)/c²) = c/γ

uz = 0
En este caso, el pulso de luz se desplaza formando un ángulo con respecto al eje de las yes. Este
es precisamente el caso que vimos desde un principio cuando un pasajero viajando dentro de
un vagón de ferrocarril en su marco de referencia S’ lanzaba un rayo de luz hacia el techo del
ferrocarril mientras que un observador externo en su marco de referencia S veía al rayo de luz
moverse no verticalmente sino siguiendo una línea recta a lo largo de una pendiente.

Al tenerse ux = V y uy = c/γ, se concluye que en el marco de referencia S la luz viaja a un ángulo α


con respecto al eje-y, o sea:

tan α = ux / uy

tan α = γV/c

α = tan -1 (γV/c)

Este es justo el ángulo al cual se tendría que inclinar un telescopio para poder mirar una estrella
que como resultado de su movimiento orbital alrededor del Sol se está moviendo a una
velocidad aparente V encima de nosotros, de lo contrario la estrella no podrá verse. Este
fenómeno es conocido como la aberración de la luz de las estrellas distantes:
El fenómeno de la aberración de la luz puede considerarse mejor con el siguiente diagrama que
muestra a la Tierra en su movimiento de traslación alrededor del Sol a una velocidad
aproximada de 30 mil millas por segundo:

en donde VSE es la velocidad de la estrella con respecto a la Tierra (acercándose), VLS es la


velocidad de la luz con respecto a la estrella que suponemos es igual a c, y VLE es la velocidad de
la luz con respecto a la Tierra que nos llega de la estrella. Nuestro sentido común nos lleva a
creer que la velocidad de la luz con respecto a la Tierra VLE debe ser mayor que la velocidad de
la luz con respecto a la misma estrella VLS; esperamos que la velocidad de la luz con respecto a
la Tierra deba ser igual a la hipotenusa del triángulo y por lo tanto mayor que c. Pero las
observaciones experimentales indican que la velocidad de la luz con respecto a la Tierra también
es c, en concordancia con el segundo postulado de la Teoría Especial de la Relatividad.

PROBLEMA: ¿Cuáles son las transformaciones inversas de velocidad para pasar del marco
de referencia S al marco de referencia S’ ?

La resolución de este problema requiere simplemente despejar u’ x, u’y y u’z de las relaciones para
la transformación relativista de velocidades que ya obtuvimos previamente. Esto nos conduce a
las siguientes relaciones:
Existen otras maneras de derivar la ley de adición de velocidades, como lo veremos a
continuación:

PROBLEMA: Demostrar que dos transformaciones sucesivas de Lorentz en la misma


dirección son equivalentes a una transformación sencilla de Lorentz que se lleva a cabo con
una velocidad:

Para un marco de referencia desplazándose en la dirección del eje-x a una velocidad V1, las
transformaciones de Lorentz para pasar de un sistema S a un sistema S’ se pueden escribir de la
manera siguiente:

____x’ = γ1(x + V1t)

____y’ = y

____z’ = z

____t’ = γ1(t + V1x/c²)

Por otro lado, para un marco de referencia desplazándose en la misma dirección a una velocidad
V2, las transformaciones de Lorentz para pasar de un sistema S’ a un sistema S’’ se pueden
escribir de la manera siguiente:

____x’’ = γ2(x’ + V2t’)


____y’’ = y’

____z’’ = z’

____t’’ = γ2(t’ + V2x’/c²)

Enfocaremos nuestra atención sobre la parte espacial en la coordenada-x de la transformación


repetida. Introduciendo los valores de x’ y t’ en la expresión para x’’, tenemos:

x’’ = γ2(x’ + V2t’) = γ2 [γ1(x + V1t) + V2 γ1(t + V1x/c²)]

x’’ = γ1γ2 [x + V1t + V2 (t + V1x/c²)]

x’’ = γ1γ2 [x + V1V2x/c² + V1t + V2t]

x’’ = γ1γ2 [(1 + V1V2/c²) x + (V1 + V2) t]

Sacando fuera de los paréntesis cuadrados el término (1 + V1V2/c²) tenemos:

Llevaremos a cabo una simplificación del factor que tenemos fuera de los paréntesis cuadrados
sin olvidar que:

definiéndolo todo dentro de un factor gamma compuesto:


Este factor gamma compuesto siempre será mayor que la unidad, puesto que el numerador 1 +
V1V2/c² es mayor que 1 y puesto que para β1 y β2 diferentes de cero el numerador del gamma
compuesto será menor que la unidad, garantizando un gamma compuesto mayor que la unidad
en todos los casos.

Con esto, la componente espacial a lo largo del eje-x de la transformación repetida de Lorentz
resulta ser:

Obsérvese que esta expresión, haciendo V1 = 0 ó V2 = 0, se reduce a la transformación de


Lorentz sencilla para la componente espacial.

Definiendo:

entonces la transformación repetida de Lorentz se reduce a:

x’’ = γ(x + Vt)

Vemos que dos transformaciones sucesivas de Lorentz en la misma dirección son equivalentes a
una transformación sencilla de Lorentz que se lleva a cabo con una velocidad que es la
resultante de la adición relativista de las velocidades V1 y V2 correspondientes a cada
transformación original.

Puesto que no hay movimiento relativo alguno aquí entre los ejes-y y eje-z de los sistemas de
coordenadas, dichas coordenadas permanecen inalteradas al pasar de un sistema de referencia a
otro.
Falta comprobar si la conclusión que obtuvimos sigue siendo válida para la parte temporal de
las transformaciones repetidas. Introduciendo los valores de x’ y t’ en la expresión para t’’,
tenemos:

t’’ = γ2(t’ + V2x’/c²) = γ2[γ1(t + V1x/c²) + V2γ1(x + V1t)/c²]

t’’ = γ1γ2[t + V1x/c² + V2(x + V1t)/c²]

t’’ = γ1γ2[t + V1x/c² + V2x/c² + V1V2 t/c²]

t’’ = γ1γ2[(1 + V1V2 /c²) t + (V1 + V2) x/c²]

t’’ = γ1γ2 (1 + V1V2 /c²) [t + {(V1 + V2)/(1 + V1V2 /c²)} x/c²]

t’’ = γ1γ2 (1 + V1V2 /c²) [t + {(V1 + V2)/(1 + V1V2 /c²)} x/c²]

Recurriendo nuevamente a las definiciones dadas arriba:

t’’ = γ [t + Vx/c²]

Vemos que también para la parte temporal dos transformaciones sucesivas de Lorentz en la
misma dirección son equivalentes a una transformación sencilla de Lorentz que se lleva a cabo
con una velocidad que es la resultante de la adición relativista de las velocidades V1 y
V2 correspondientes a cada transformación original. Esto concluye lo que queríamos demostrar
dándonos de paso otra manera para obtener la ley de adición de velocidades.

Por simplicidad, hasta aquí hemos considerado en las transformaciones de velocidad marcos de
referencia que se están moviendo el uno con respecto al otro a una velocidad V al otro a lo largo
del eje común de abcisas, el eje-x, sin movimiento relativo alguno con respecto a los ejes eje-y y
eje-z. Entendiblemente, la derivación de las transformaciones de velocidad cuando la velocidad
entre ambos marcos de referencia ocurre con una velocidad relativa entre ambos marcos con
componentes en los tres ejes coordenados Cartesianos será algo más elaborado. Sin embargo, la
derivación de la ley generalizada de composición de velocidades se puede simplificar
como lo veremos en el siguiente problema si recurrimos a notación vectorial con la velocidad V
simbolizada como un vector V (con letra negrita) con componentes relativos en cada uno de los
tres ejes Cartesianos:
V = (Vx, Vy, Vz)

Usaremos además la notación vectorial del producto punto ó producto escalar entre dos
vectores:

u · V = (ux, uy, uz) · (Vx, Vy, Vz) = uxVx + uyVy + uzVz

Manejando cantidades vectoriales, estamos mejor preparados para llevar a cabo en forma
compacta la derivación del resultado general que estamos buscando.

PROBLEMA: Partiendo de la base de que la transformación generalizada de Lorentz entre


dos sistemas de coordenadas S y S’ está dada vectorialmente por las siguientes dos relaciones
para los componentes espaciales y para el componente temporal:

demostrar que la ley generalizada para la composición de velocidades está dada por la
siguiente fórmula vectorial:

En este problema, debe quedar claro que el vector x en la transformación generalizada de


Lorentz se refiere a las tres componentes espaciales de dicha transformación antes de llevarse a
cabo la transformación:

x = (x, y, z)

del mismo modo que el vector x’ se refiere a las tres componentes espaciales después de haberse
llevado a cabo la transformación:

x’ = (x’, y’, z’)


Al igual que como lo hicimos arriba, tomamos infinitesimales en cada una de las relaciones de la
transformación generalizada de Lorentz, obteniendo lo siguiente:

Vectorialmente, la velocidad generalizada u’ en el marco de referencia S’ está dada por la


siguiente definición:

Entonces, vectorialmente, dividiendo los diferenciales para ambas expresiones tenemos lo


siguiente:

Teniendo en cuenta que en el marco de referencia S:

entonces tras unas cuantas manipulaciones algebraicas todo lo anterior se nos reduce a:

Expandiendo γ = √1 - V²/c² = √1 - β², obtenemos la expresión final dada arriba para la ley
generalizada de composición de velocidades.

Además de haber obtenido las transformaciones relativistas de velocidad para un objeto lanzado
a una velocidad constante u’ dentro de un marco de referencia S’, podemos obtener también las
transformaciones relativistas de las aceleraciones en el marco de referencia S de un objeto que
se está acelerando dentro del marco de referencia S’. Todo lo que tenemos que hacer es tomar la
derivada con respecto al tiempo de la velocidad, que es la definición matemática de la
aceleración:

a = ds/dt

En un sistema Cartesiano de tres coordenadas rectangulares, tenemos tres componentes de la


aceleración (a’x , a’y , a’z) para un cuerpo dentro del marco de referencia S’ que corresponden a
unas aceleraciones (ax , ay , az) en el marco de referencia S. Por lo tanto:

ax = dux/dt

ay = duy/dt

az = duz/dt

Es importante tener presente que el marco de referencia S se sigue moviendo siempre a una
velocidad constante V. Dicho marco de referencia en ningún momento se está acelerando,
porque si empezara a acelerarse entonces la Teoría Especial de la Relatividad ya no sería
aplicable. Para el estudio de marcos de referencia acelerados es necesario recurrir a la Teoría
General de la Relatividad.

Una teoría libre de asimetrías y de paradojas


Cuando un novicio en la Teoría de la Relatividad es confrontado por vez primera con algo que va
tan decididamente en contra de su sentido común, en contra de su intuición, lo primero que
puede ocurrírsele es que posiblemente en la teoría hay fallos que permiten suponer que la teoría
está equivocada, que es una teoría errónea. Esta fue precisamente la actitud en la que
incurrieron no sólo aprendices de ciencias sino físicos eminentes en los tiempos de Einstein
cuando el famoso físico presentó al mundo su teoría por vez primera. Los críticos de Einstein,
que fueron bastantes en su época, aminoraron conforme nuevos experimentos empezaron a
confirmar la teoría (la predicción teórica de la existencia del positrón y con ello de la antimateria
hecha por el físico inglés P.A.M. Dirac al unificar la mecánica cuántica con la Teoría Especial de
la Relatividad es uno de esos triunfos), pero de cualquier modo aún en nuestros tiempos hay
quienes dudan sobre la integridad de la Teoría de la Relatividad, y una de las cosas que los hace
entrar en dudas es la presencia de paradojas tales como la famosa paradoja de los gemelos.
Estas paradojas parecen hacer resaltar las asimetrías que se obtendrían en los resultados
logrados con ciertos experimentos.

En realidad, la Teoría Especial de la Relatividad es una teoría consistente completamente libre


de asimetrías y de paradojas. Las supuestas paradojas a la larga terminan siendo problemas
matemáticos mal planteados o razonamientos mal formulados, llevando a conclusiones
erróneas.

Una de las “paradojas” más frecuentemente citada es la “paradoja del corredor y el granero”, la
cual veremos aquí en detalle. Esta paradoja involucra a un super-atleta ficticio que puede correr
a velocidades cercanas a la velocidad de la luz y el cual lleva consigo una pértiga o garrocha
(como las usadas en las competencias para dar el salto que tiene por objetivo superar una barra
transversal situada a gran altura), aunque en otros textos lo que lleva consigo es una escalera. El
objetivo es meter dentro de un granero pequeño que mide 5 metros de largo una escalera que
mide 10 metros de largo, lo cual parece físicamente imposible, pero que se antoja posible si el
corredor va desplazándose a una velocidad cercana a la velocidad de la luz con lo cual la escalera
que lleva consigo experimenta una contracción relativista de longitud.

En el siguiente dibujo tenemos al corredor sosteniendo en su brazo una escalera de 10 metros de


largo:
En el siguiente dibujo tenemos al corredor en reposo frente al granjero ambos viendo un
granero con una puerta frontal de entrada y una puerta trasera de salida (abierta) el cual mide 5
metros de longitud y dentro del cual el corredor planea meter la escalera de 10 metros:

El corredor se sitúa ahora a gran distancia del granero y empieza a correr a gran velocidad hacia
la puerta de entrada del mismo hasta adquirir una velocidad igual a 13/15 de la velocidad de la
luz (v = 0.866c) antes de llegar con la escalera a la puerta frontal del granero.

Desde la perspectiva del granjero, el cual se considera a sí mismo en reposo, la longitud de la


escalera se ha contraído a la mitad, se ha contraído de 10 metros a 5 metros de acuerdo con la
fórmula:

L = L’ √1 - (V/c)²

L = (10 metros) √1 - (0.866c/c)²

L = 5 metros

El corredor entra con la escalera y en el momento en que está adentro con la escalera un viento
cierra la puerta frontal del granero. En ese instante, una escalera de 10 metros está metida
dentro de un granero de 5 metros, por puros efectos de contracción relativista de longitud:

Todo parece en orden desde el punto de vista del granjero. La escalera cupo perfectamente
dentro del granero. Sin embargo, desde la perspectiva del corredor, la situación resulta ser
completamente diferente si el corredor se considera a sí mismo en reposo y considera al granero
moviéndose hacia él a una gran velocidad de 0.866c. Al aplicar la fórmula de contracción
relativista de longitud al granero, el corredor decide que es el granero el que se ha contraído a la
mitad, o sea que el granero en vez de medir 5 metros mide 2.5 metros:
De acuerdo con el corredor, no existe forma alguna en la cual pueda caber dentro del granero,
metiendo una escalera que mide cuatro veces más que la longitud de 2.5 metros del granero.
Según él, cuando apenas han entrado los primeros 2.5 metros de la escalera llenando
completamente los 2.5 metros que mide el granero, al soplar el viento cerrando la puerta frontal
ésta se cierra y los resultados son poco menos que agradables para el corredor:

Obviamente, aquí tenemos algo que parece anómalo, algo que parece una asimetría total de la
situación, ya que mientras que para el granjero la escalera cabe perfectamente dentro del
granero para el corredor es imposible que pueda caber. ¿Quién de los dos tiene la razón? ¿O
estará incorrecta la Teoría Especial de la Relatividad?

La paradoja anterior resulta de la aplicación ciega de una fórmula, la fórmula relativista para la
contracción de longitud, sin tomar en cuenta las condiciones bajo las cuales fue derivada dicha
fórmula. La solución correcta de los problemas que involucran efectos relativísticos jamás ha
dependido de la aplicación ciega de fórmulas, sino de una inspección de las condiciones de cada
problema en particular. Esta paradoja debe servir de advertencia sobre las pifias en las que se
puede caer si se opta ir por lo sencillo aplicando fórmulas fijas a todo tipo de casos sin
considerar las diferencias que pudiera haber habido en la obtención de las fórmulas y la
naturaleza del problema sobre el cual se está aplicando cierta fórmula (lo mismo es válido para
todas las matemáticas, la física, la química, y las ciencias en general).

La ruta de salida fuera de las paradojas radica en aquellos eventos en los cuales observadores
situados en marcos de referencia distintos puedan estar en total y común acuerdo. En la
paradoja del corredor y el granero, el primer evento en el que tanto un acompañante corriendo
adelante del super-atleta situado justo a un lado de la punta de la escalera (la parte de la escalera
que va a entrar primero al granero) y el granjero estático situado justo a la entrada del
granero se pueden poner de acuerdo es cuando la punta de la escalera está entrando por la
puerta frontal del granero. No existen dos marcos de referencia distintos en los cuales la punta
de la escalera esté entrando y no esté entrando por la puerta frontal al mismo tiempo en que el
acompañante del corredor y el granjero están justo uno enfrente del otro. En realidad el
problema que tenemos a la mano consiste de tres eventos diferentes. Y para el análisis de
dichos eventos podemos recurrir a las ecuaciones de transformación de Lorentz. Es
precisamente aquí en donde nos pueden dar una perspectiva algebraica del problema (podemos
obtener además una perspectiva geométrica ilustrativa recurriendo a los diagramas espacio-
tiempo de Minkowski, pero llevaremos a cabo primero el análisis de la situación mediante las
transformaciones de Lorentz en virtud de que con ellas podemos hacer cálculos numéricos que
no son tan fáciles de hacer sobre papel de gráfica). El análisis requiere también dar por perdido
definitivamente y para siempre el concepto erróneo de la simultaneidad absoluta, ya que en el
contexto relativista dos eventos que son simultáneos dentro de un marco de referencia no son
simultáneos en otro a menos de que ambos marcos de referencia estén en completo reposo el
uno frente al otro.

Veamos nuevamente la situación desde la perspectiva del corredor, empezando por el primer
evento. Tanto el corredor como el granjero se han rodeado de acompañantes rodeando al
corredor (uno a un lado de la punta de la escalera y otro a un lado del pie de la escalera) y
rodeando al granero (uno situado en la puerta de entrada y otro situado en la puerta de salida)
para cerciorarse de lo que está sucediendo. En el primer evento, la puerta frontal del granero
está abierta y el corredor está entrando con su escalera de 10 metros dentro del granero:
Se ha puesto al pie de los dibujos una regla de medir azul de 10 metros de longitud extendida a
lo largo de la escalera que va rastreando lo que está sucediendo desde la perspectiva del
corredor. Como la regla de medir viaja a la misma velocidad y en la misma dirección que el
corredor, el corredor no debe detectar ninguna contracción de dicha regla. Ahora veamos
el segundo evento también desde la perspectiva del corredor, cuando la escalera después de
haber entrado al granero por la puerta de entrada frontal está llegando hacia la salida trasera
casi tocando los bordes de la misma:

Obsérvese que el granjero está parado a la salida del granero, no a la entrada, ya que no le es
posible estar en dos lugares diferentes al mismo tiempo. Él lo único que ve es la punta de la
escalera que ha llegado a la salida trasera del granero, y está completamente ignorante de lo que
está sucediendo a la entrada. Y lo que está sucediendo a la entrada no es simultáneo con lo que
el granjero está viendo en la puerta trasera de salida del granero. Obsérvese la barra de color
café (incompleta) que le indica al acompañante frontal del corredor la llegada de la escalera a la
salida del granero cuya longitud parece haberse contraído.

En el tercer evento, la parte trasera de la escalera (detrás del corredor) ya está adentro del
granero, pero la parte frontal de la escalera (delante del corredor) también ha salido fuera del
granero. Es importante notar que tampoco el corredor puede estar al mismo tiempo en la parte
frontal y en la parte trasera de la escalera al mismo tiempo. El acompañante que va detrás del
corredor es el que alcanza a ver el soplo del viento que cierra la puerta frontal del granero, con lo
cual la longitud total de la escalera ha pasado por el granero sin problema alguno, de modo tal
que también para el corredor la escalera ha cabido perfectamente dentro del granero, y no hay
discrepancia alguna tomando en cuenta que los eventos que son simultáneos para un
observador en un marco de referencia no son simultáneos para el observador en el otro marco
de referencia, lo cual tiene que ver directamente con el hecho de que si la escalera llevara un
reloj en su parte frontal y un reloj en su parte trasera aunque los relojes estén perfectamente
sincronizados para el corredordichos relojes estarán fuera de sincronía para el granjero, fuera
de sincronía por un tiempo LV/c²:

Obsérvese la barra de color café en el marco de referencia del granjero que indica la llegada de la
parte trasera de la escalera a la entrada del granero confirmándole al amigo del granjero situado
a la entrada del granero una contracción relativista de longitud de la escalera.
¿Y qué sucedería si el corredor frenase bruscamente su velocidad al ir entrando al granero?
¿Seguiría cabiendo la escalera? Claro que no. Al bajar abruptamente el corredor su velocidad los
tiempos diferentes en el frente y en la parte trasera de la escalera (de acuerdo con el granjero) se
reducirían a cero, y al igualarse los marcos de referencia la escalera experimentaría una
expansión de longitud recuperando sus 10 metros originales en ambos marcos de referencia. La
única manera en la cual la escalera puede mantener su longitud contraída a 5 metros es con el
corredor manteniendo una velocidad constante de 0.866c.

Habiendo visto la explicación cualitativa de la situación, veamos cómo se puede llegar a tales
conclusiones a partir de las ecuaciones de transformación de Lorentz. Identifiquemos las
coordenadas dentro del marco de referencia S del granjero como (x, y, z, t) y las coordenadas
dentro del marco de referencia S’ del corredor como (x’, y’, z’, t’). En virtud de que no hay
movimiento alguno a lo largo de los otros dos ejes Cartesianos (y,z), podemos trabajar
simplemente con las coordenadas (x,t) de S y (x’,t’) de S’.

Ahora analizaremos en detalle la famosa paradoja de los gemelos, la cual fue propuesta
originalmente por el mismo Einstein y la cual fue utilizada por sus detractores para negarle
validez y credibilidad a la Teoría de la Relatividad.

Vayamos al caso de un viajero A en una nave espacial que se está moviendo a gran velocidad con
respecto a otro observador B que se considera a sí mismo en reposo y que llevando en una mano
un reloj C' apunta dentro de su nave espacial un rayo de luz hacia arriba siendo devuelto por un
espejo desde el techo hacia el piso de la nave espacial. Un observador B que vea pasar a la nave
espacial a gran velocidad y el cual tenga en su plataforma de reposo relojes C1 y C2 que estén
perfectamente sincronizados medirá en Auna dilatación del tiempo en la nave espacial:
Pero ahora llevemos a cabo una inversión de la situación, lo cual siempre podemos hacer puesto
que la Teoría de la Relatividad nos afirma precisamente que no hay observadores privilegiados.
Veamos las cosas como las vería el viajero A de la nave espacial al considerarse a sí mismo en
reposo, viendo pasar al observador B ante él a gran velocidad. Entonces A, desde su perspectiva,
debería ser él quien detecta una dilatación del tiempo y no B. Con esto, los escépticos podría
argumentar: ¿No es esto una asimetría? ¿No es esto una paradoja manifiesta? ¿No es esto una
inconsistencia que nos debe llevar a desechar la teoría?

En realidad, no hay paradoja alguna. El problema es que distintos observadores obtendrán


distintos resultados con respecto el uno del otro dependiendo de la naturaleza del
experimento que estén llevando a cabo. En los diagramas de arriba, el observador B tiene
dos relojes diferentes C1 y C2 perfectamente sincronizados en su plataforma de
observación, mientras que el viajero en la nave espacial tiene un solo reloj. Suponiendo que los
relojes C1 del observador B y C' del viajero A en la nave espacial coincidan con una misma
lectura de cero cuando el reloj C1 y el reloj C' están justo uno arriba del otro, y en esta
coincidencia ambos A y B estarán de acuerdo, entonces al pasar el único reloj C' del viajero A de
la nave espacial justo por encima del reloj C2 del observador B, ambos tendrán lecturas
diferentes, y en esto ambos también estarán perfectamente de acuerdo. No se trata de ilusiones
ópticas. Se trata de efectos físicos reales, detectables y medibles con instrumentos científicos de
alta precisión.

Para que el viajero en la nave espacial A pueda tener una perspectiva similar a la que tiene el
observador B que se considera a sí mismo estacionario, sería necesario que el viajero Aen la
nave espacial también tuvierse dos relojes diferentes en el piso de su nave espacial
perfectamente sincronizados entre sí a la misma hora, a los cuales podemos llamar C'1 y C'2.
Pero al ocurrir esto, y al no existir la simultaneidad absoluta (lo cual para ser posible
requiere necesariamente de la existencia del movimiento absoluto que no existe de acuerdo a la
Teoría de la Relatividad), por los mismos efectos relativistas el observador B verá los dos
relojes C'1 y C'2 del viajero A en la nave espacial fuera de sincronía. En otras palabras, mientras
que para el viajero A de la nave espacial sus relojes C'1 y C'2 están perfectamente sincronizados,
para el observador B esos relojes están todo el tiempo fuera de sincronía entre sí. Y del mismo
modo, desde la perspectiva del viajero A en la nave espacial, los dos relojes C1 y C2 del
observador B que para el observador B estarán en perfecta sincronía para el viajero A de la
nave espacial también estarán fuera de sincronía. En esto existe una simetría total. Y si
llevamos a cabo los cálculos tanto para uno como para otro considerando primero al
viajero A de la nave espacial en movimiento y al observador B en reposo, y después al
viajero A de la nave espacial en reposo y al observador B en movimiento, los resultados
obtenidos serán consistentes con lo que predicen las fórmulas de la Teoría de la Relatividad. No
hay paradoja alguna.

Pero queda otra interrogante. Si el tiempo marcha más lentamente en un marco de referencia
que en otro, ¿entonces quién es el que estará envejeciendo más rápidamente si después de una
larga separación ambos vuelven a coincidir en el mismo punto? ¿El viajero A de la nave espacial
o el observador B? Esta es precisamente la “paradoja de los gemelos”. La respuesta a esta
interrogante tiene que ver directamente con la respuesta a la pregunta sobre cuál de los dos fue
el que se puso en movimiento con respecto al otro suponiendo que ambos estaban en reposo
dentro del mismo marco de referencia. Esta es la parte crucial que resuelve la “paradoja
de los gemelos”. Supongamos que al principio ambos el viajero A en la nave espacial y el
observador B estaban en reposo el uno frente al otro, con sus relojes perfectamente
sincronizados. En un momento dado, la nave espacial despega de la plataforma y empieza su
viaje. Pero para poder adquirir cierta velocidad, por pequeña o grande que ésta sea, la nave
espacial tiene que cambiar de un estado de reposo hasta adquirir dicha velocidad. En pocas
palabras, tiene que acelerar. Pero al acelerar, la nave espacial en la que viaja A deja de estar
en el ámbito cubierto por la Teoría Especial de la Relatividad. Su situación tiene que ser
estudiada y analizada por la Teoría General de la Relatividad. Al acelerar, el viajero A de la
nave espacial experimenta fuerzas de aceleración sobre su cuerpo que el observador B en reposo
en la plataforma de lanzamiento no experimenta. Y si después de enfilar hacia un planeta
distante el viajero A de la nave espacial decide regresar para encontrarse de nuevo con el
observador B, entonces no sólo tendrá que aminorar la velocidad de su nave reduciéndola a
cero y con ello cayendo dentro de un marco de referencia acelerado que tiene que ser
analizado bajo la Teoría Generalde la Relatividad, sino que tendrá que acelerar en sentido
contrario para enfilarse hacia su encuentro con el observador B. Y si quiere detenerse a platicar
con el observador B, tendrá que desacelerar nuevamente experimentando las fuerzas de
desaceleración que sentirá en el proceso. La Teoría General de la Relatividad predice
que en un marco de referencia acelerado o en presencia de un campo gravitacional
intenso, los relojes marcharán más lentamente. De este modo, después de encontrarse
de nuevo, el viajero A de la nave espacial y el observador B, aunque hayan sido gemelos
idénticos al despedirse y separarse el uno del otro al emprender A su largo viaje, tendrán edades
distintas.

Para adentrarnos en la resolución de esta aparente paradoja, llevaremos a cabo primero la


resolución de unos problemas poniéndole números al asunto.

PROBLEMA: Un observador O’ que se mueve con una velocidad 0.8c respecto a una
plataforma espacial en la Tierra en la cual está su hermano gemelo viaja a la estrella Alfa
Centauro, la cual se encuentra a una distancia de 4 años-luz de la Tierra. Tan pronto llega a la
estrella, da un giro de 180 grados dándole vuelta a la nave y emprende su viaje de regreso a la
misma velocidad. ¿Cómo se compara la edad del observador O’ a su regreso a la Tierra con la
de su hermano gemelo que permaneció en la Tierra?

La distancia medida en años-luz es la distancia que recorre un rayo de luz en cierta cantidad de
años. Llamémosla L. Entonces, re-escribiéndola de una manera ligeramente distinta:

c = L/4 años

L = (4 años)·c

Para el observador estacionario O en la Tierra, la duración del viaje de ida de su hermano viajero
desde la Tierra hasta Alfa Centauro será:

Δtida = distancia /velocidad

Δtida = L /(o.8c)

Δtida = (4 años)·c /(o.8c)

Δtida = 5 años

Puesto que el viaje de regreso se efectúa a la misma velocidad, el tiempo total para el observador
O en la plataforma espacial en la Tierra será:
Δtida y vuelta = 10 años

Para el viajero O’ el intervalo de tiempo propio (medido por el viajero con su reloj) entre la
salida de la plataforma y su llegada a la estrella, utilizando la expresión para la dilatación del
tiempo, es:

Δt’ida = Δtida√1 - V²/c²

Δt’ida = (5 años) √1 - (0.8)²

Δt’ida = 3 años

De este modo, el tiempo total de duración del viaje (ida y vuelta) medido por el gemelo viajero
O’ es:

Δt’ida y vuelta = 6 años

Por lo tanto, al volver a la Tierra, el gemelo viajero O’ será 4 años más joven que O. Obsérvese
con detenimiento que si el viajero en su trayecto de ida está viajando con respecto a su hermano
gemelo O en la Tierra en el sentido positivo (+) del eje-x, al darle la vuelta a la estrella estará
viajando con respecto al mismo observador en el sentido negativo(-) del eje-x. Este giro, al
ser representado geométricamente en un diagrama espacio-tiempo, equivale a una
rotación del marco de referencia de O’. Entonces el viaje de O’ es equivalente al de dos
observadores inerciales diferentes aunque se trate de la misma persona, uno que se mueve con
velocidad V = +0.8c y el otro que se mueve con una velocidad V = -0.8c. Existe una asimetría
manifiesta entre los dos observadores, ya que el giro del gemelo viajero es un giro real,
experimenta aceleraciones medibles, en contraste con el aparente giro que el gemelo viajero
observa de O en la Tierra y el cual no experimenta aceleración alguna durante todo el viaje
llevado a cabo por O’.

En la siguiente figura se ha bosquejado un diagrama espacio-tiempo superimpuesto sobre la


descripción pictórica del viaje. La línea trazada desde la Tierra llegando hasta la estrella Alfa
Centauri en la parte media de la figura a un ángulo de 45 grados (con respecto a la vertical) así
como la línea trazada desde la estrella Alfa Centauri llegando hasta la Tierra también a un
ángulo de 45 grados (con respecto a la vertical) pero en sentido inverso representan las
trayectorias seguidas por un rayo de luz. Las otras dos líneas del universo que representan a la
nave viajera forman un ángulo menor a 45 grados con respecto a la vertical, como corresponde a
un objeto que viaja a una velocidad menor que la velocidad de la luz.

En realidad, toda la acción del envejecimiento del hermano gemelo en la Tierra, visto desde la
perspectiva del gemelo viajero, ocurre justo cuando O’ le dá la vuelta a la estrella para regresar a
la Tierra. En ese lapso de tiempo, en esa rotación de los marcos de referencia de O’, el gemelo
viajero ve a su hermano en la Tierra envejecer rápidamente.

Antes de despegar la nave, cuando los dos gemelos están juntos en la plataforma de lanzamiento
en la Tierra, en estado de reposo el uno frente al otro, sus líneas del universo coinciden y
marchan verticalmente hacia arriba en un diagrama espacio-tiempo. Pero al despegar la nave y
emprender su trayectoria hacia Alfa Centauro, O’ toma su propio camino en el diagrama
espacio-tiempo alejándose de su hermano gemelo, y al dar la vuelta de regreso para enfilarse
hacia la Tierra su trayectoria en el mismo diagrama espacio-tiempo se invierte, hasta que llega a
la Tierra para encontrarse con su hermano volviendo a coincidir sus líneas del universo:
Podemos identificar tres eventos distintos en el anterior diagrama espacio-tiempo trazado desde
la perspectiva de O: (1) el gemelo viajero acelera súbitamente la nave hacia la estrella Alfa
Centauro adquiriendo una velocidad V, (2) el gemelo desacelera y detiene la nave para
encaminarla de regreso hacia la Tierra con una velocidad V igual a la velocidad con la cual llegó
a Alfa Centauro, (3) el gemelo viajero llega a la Tierra y desacelera la nave deteniéndola para
encontrarse con su hermano. Pero estos no son eventos como los que habíamos visto
anteriormente al estudiar los fenómenos relativistas de dilatación del tiempo y contracción de
longitud en los cuales la velocidad relativa V entre ambos marcos de referencia permanece igual
todo el tiempo, con el diagrama espacio-tiempo de O’ superimpuesto sobre el diagrama espacio-
tiempo de O haciéndolos coincidir en sus orígenes para t = t’ = 0. Se trata de otro tipo de eventos
en los cuales el viajero gemelo O’ cambia de marcos de referencia, lo que no hace su hermano
gemelo en la Tierra. La situación del gemelo viajero O’ es única porque a diferencia de su
hermano gemelo O en la Tierra que permanece todo el tiempo en el mismo marco de referencia
S, el gemelo viajero pasa por tres marcos de referencia distintos: el marco de referencia S que
comparte con su hermano en la plataforma de lanzamiento antes de despegar, el marco de
referencia S’ en el que viaja a una velocidad constante alejándose de la Tierra, y el marco de
referencia S’’ en el que emprende su viaje de regreso a la Tierra en donde nuevamente vuelve al
mismo marco de referencia S en el que se encuentra su hermano.

PROBLEMA: Con relación al problema anterior, supóngase que cada año (medido por el
observador O en la plataforma espacial en la Tierra), éste le envía una señal luminosa a su
gemelo viajero O’. ¿Cuántas señales recibe el gemelo viajero O’ en cada etapa de su recorrido?
(En otras palabras, ¿qué vería realmente el gemelo viajero O si él mirara a su hermano O a
través de un telescopio?)

Medido por O, el gemelo viajero llega a la estrella Alfa Centauro en 5 años. Para que la señal
luminosa llegue a Alfa Centauro simultáneamente con O’, ésta debe ser enviada en un
tiempo anterior deteminado por:

tiempo = distancia / velocidad

tiempo = (4 años)·c / c

tiempo = 4 años

Entonces una señal enviada por O en un tiempo suyo igual a un año llega a la estrella Alfa
Centauro simultáneamente con el gemelo viajero O’. Puesto que el gemelo en la plataforma
espacial en la Tierra le envía un total de 10 señales, a razón de una señal por año, las señales
restantes le llegan todas al gemelo viajero O’ en su viaje de regreso.

PROBLEMA: En relación con los problemas anteriores, supóngase que cada año, además de
las señales luminosas que el hermano gemelo desde la plataforma espacial en la Tierra le
envía anualmente a su gemelo viajero O’, también el gemelo viajero le envía cada año una
señal luminosa (en el tiempo propio de O, medido con su propio reloj) a O. Si la señal es
enviada por O’ tan pronto como llega a la estrella, ¿cuál es el tiempo medido por el gemelo en
la Tierra O, para que la señal sea recibida (es decir, qué vería el gemelo O si él mira a su
hermano a través de un telescopio?

Medido por el gemelo en la Tierra O, su hermano O’ llega a la estrella en 5 años. Una señal
luminosa enviada por O’ desde una estrella que está a una distancia de 4 años-luz de la Tierra
llegará a la Tierra en 4 años (esto debe ser obvio). Entonces la señal luminosa enviada a O al
llegar O’ a la estrella le llega en un tiempo igual a 5 años (el tiempo que tarda en llegar O’ a la
estrella) más 4 años (el tiempo que tarda en llegar la señal luminosa a la Tierra). Por lo tanto, de
las seis señales enviadas por O’, tres de ellas son recibidas por O durante los primeros nueve
años (una cada tres años) y las tres restantes las recibe O en la Tierra durante el último año. Es
importante tomar nota de lo que está sucediendo. Según el gemelo viajero, él le está enviando
cada año una señal luminosa a su hermano en la Tierra, y sin embargo su hermano recibe tres
de dichas señales no en el transcurso de tres años sino durante el último año. De nueva cuenta,
nos topamos con la pérdida de la simultaneidad. Eventos que están igualmente
espaciados en el tiempo en un marco de referencia en reposo no aparecen
igualmente espaciados en el tiempo en un marco de referencia móvil.

Podemos obtener una mejor idea de lo que se ha tratado de enseñar en los dos problemas
anteriores representando en diagramas de espacio-tiempo de Minkowski lo que sucede. En el
caso de las señales luminosas igualmente espaciadas (en el tiempo propio de O) que son
enviadas desde la Tierra al hermano viajero, la panorámica vista desde O es la siguiente (por
simplicidad se han dibujado como líneas negras únicamente las líneas correspondientes a los
ejes ct y ct’ omitiéndose las líneas que corresponderían al eje-x y al eje-x’):

Obsérvese que en el trayecto del viaje desde la Tierra hasta la estrella Alfa Centauro, y en virtud
de que el intervalo de tiempo entre cada pulso luminoso enviado al gemelo viajero O’ se
incrementa por el efecto relativista, la frecuencia de los pulsos recibidos por el hermano gemelo
viajero disminuye considerablemente. Unicamente en el breve instante de tiempo en el que el
gemelo viajero desacelera y detiene su marcha estando en reposo con respecto a su hermano
gemelo la frecuencia de los pulsos luminosos enviados por el hermano gemelo desde la Tierra es
igual a la frecuencia de los pulsos recibidos por el gemelo viajero. Pero al acelerar hacia la Tierra
y en el trayecto del viaje desde la estrella Alfa Centauro hasta la Tiera, la frecuencia con la que el
gemelo viajero O’ recibe los pulsos enviados por su hermano gemelo O desde la Tierra aumenta.

Por otro lado, en el caso de las señales luminosas igualmente espaciadas (en el tiempo propio
del gemelo viajero O’) que son enviadas a la Tierra hacia el hermano viajero, la situación es la
siguiente:

Puesto que en el viaje de ida el gemelo viajero recibe anualmente (según su reloj) una cantidad
menor de pulsos luminosos que la que le está enviando su hermano desde la Tierra,
disminuyendo la frecuencia de los pulsos, si se tratase de una señal monocromática continua
(por ejemplo, de color verde) ésta experimentaría un corrimiento de frecuencia hacia el
infrarrojo, o sea que tendría un desplazamiento Doppler. Y en su viaje de regreso el gemelo
vería la señal monocromática con otro desplazamiento Doppler, pero esta vez hacia una mayor
frecuencia, hacia el ultravioleta. Para ver el haz monocromático luminoso del mismo color con el
que se lo está enviando su hermano desde la Tierra, tendría que detenerse manteniéndose en
reposo con respecto a su hermano.

Podemos obtener otra perspectiva diferente de la paradoja de los gemelos llevando a cabo el
análisis usando para ello el efecto relativista de la desincronización de los relojes.
PROBLEMA: Analizar los problemas antes expuestos sobre la paradoja de los gemelos
llevando a cabo el análisis usando el efecto relativista de la desincronización de los relojes.

La distancia entre la Tierra y la estrella Alfa Centauro, vista por el gemelo al viajar, es objeto de
una contracción relativista con respecto a la distancia de 4 años-luz que ve su hermano gemelo
en la Tierra, siendo dicha distancia en S’:

L = (4 años-luz) √1 - V²/c²

L = (4 años-luz) √1 - (0.8c)²/c²

L = 2.4 años-luz

Supóngase que hay un reloj en la estrella Alfa Centauro sincronizado con un reloj en el sistema
de referencia S en la Tierra, de modo tal que ambos relojes marcan la misma hora. En el sistema
de referencia S’ en el que viaja el gemelo viajero, el reloj en la estrella Alfa Centauro estará
adelante del reloj en la Tierra por una cantidad LV/c², que en este caso es igual a:

LV/c² =

LV/c² =

Considérese al gemelo viajero en S’ llegando a la estrella Alfa Centauro. El reloj en dicha estrella
está adelantado con respecto al reloj en la Tierra por

años. Al detenerse momentáneamente el gemelo viajero en la estrella Alfa Centauro y


encontrarse en el sistema de referencia S, él debe observar que los dos relojes (el que está en la
Tierra y el que está en la estrella Alfa Centauro) se encuentran sincronizados, porque todos los
observadores en S están de acuerdo en la sincronización de los relojes que tienen en su sistema
de referencia. Entonces, de alguna manera, en el tiempo insignificante (de acuerdo al gemelo
viajero) que le llevó detenerse, su gemelo en la Tierra envejeció

años. Este tiempo, sumado al tiempo que transcurrió en la Tierra durante la travesía del gemelo
viajero desde la Tierra hasta Alfa Centauro (5 años) hace al gemelo
años más viejo al momento de detenerse su gemelo en la estrella. Cuando el gemelo viajero
emprende su viaje de regreso a la Tierra en el marco de referencia S’’, el reloj en la Tierra está
adelante del reloj en Alfa Centauro por

años, y avanzará otros 5 años hasta que el gemelo viajero regresa a la Tierra. Al regresar a la
Tierra y detenerse, el gemelo viajero estará en el sistema de referencia S en donde él debe
observar que los dos relojes (el que está en la Tierra y el que está en la estrella Alfa Centauro) se
encuentran sincronizados, porque todos los observadores en S están de acuerdo en la
sincronización de los relojes que tienen en su sistema de referencia. Entonces, de alguna
manera, en el tiempo insignificante (de acuerdo al gemelo viajero) que le llevó detenerse, su
gemelo en la Tierra envejeció otros

años. Este tiempo, sumado al tiempo que transcurrió en la Tierra durante la travesía del gemelo
viajero desde la Tierra hasta Alfa Centauro hace al gemelo en la Tierra años más viejo al
momento de detenerse su gemelo en la estrella.

No es necesario conocer el comportamiento detallado de los relojes durante la aceleración para


saber el efecto acumulativo. Sólo necesitamos la Teoría Especial de la Relatividad para saber que
si los relojes en la Tierra y en la estrella Alfa Centauro están sincronizados con respecto al marco
de referencia S, para el gemelo viajero en su viaje de ida el reloj en la Tierra estará retrasado con
respecto al reloj en Alfa Centauro en una magnitud de LV/c², y en el viaje de regreso el reloj en
la Tierra estará adelantado con respecto al reloj en Alfa Centauro también en una magnitud de
LV/c².

Un cálculo más detallado y menos cualitativo acerca de la paradoja de los gemelos está
disponible en el siguiente enlace:

http://es.wikipedia.org/wiki/Paradoja_de_los_gemelos

En realidad, desde antes de que Einstein expusiera formalmente por escrito sus dos postulados
básicos acerca de la Teoría Especial de la Relatividad, ya había quienes sospechaban que los
conceptos del tiempo absoluto, el espacio absoluto y el movimiento absoluto eran una ilusión
que nos imponía nuestro propio “sentido común” tan propenso a fallar en muchas ocasiones.
Sin embargo, al analizar tal posibilidad, eventualmente se topaban con estas aparentes
paradojas resultado de la pérdida de la simultaneidad absoluta, y terminaban convencidos de
que las paradojas indicaban claramente que una teoría así tenía que ser incorrecta. Uno de los
grandes méritos de Einstein fue no haberse dejado desanimar por estas paradojas aparentes,
sino buscar la resolución de las mismas sin dejarse vencer por resultados aparentemente
contradictorios

El efecto Doppler relativista


De acuerdo con el segundo postulado de la Teoría Espacial de la Relatividad, dos observadores
que están en movimiento relativo el uno con respecto al otro miden para un rayo de luz la
misma velocidad, independientemente de quien haya disparado el rayo de luz hacia el otro, e
independientemente de que se estén acercando o alejando.

¿Significa ésto que, una vez que alguien nos ha enviado un rayo de luz, no es posible saber de
dicho rayo de luz si tal persona se está alejando de nosotros o se está acercando a nosotros, o
inclusive que está estacionaria con respecto a nosotros sin alejarse ni acercarse?

Bueno, no exactamente. La Teoría Especial de la Relatividad nos dice que dos personas medirán
para un rayo de luz exactamente la misma velocidad. Pero no nos dice que la frecuencia
relativa de las ondas electromagnéticas que forman a dicho rayo de luz se mantendrá igual
independientemente de que el rayo de luz sea enviado por alguien que se esté alejando o
acercando de nosotros. Gracias a un fenómeno conocido como el efecto Doppler, podemos
saber si la persona que nos envió un rayo de luz se está acercando o alejando de nosotros
siempre y cuando conozcamos el color de la luz (que depende directamente de la frecuencia de
la onda electromagnética del haz que nos está llegando). Si esperamos que alguien situado en
una parte remota de la galaxia nos envíe un rayo de luz de cierto color, y el rayo de luz que
recibimos es exactamente del mismo color que esperábamos, entonces aquella persona está
estacionaria con respecto a nosotros (o por lo menos se encontraba estacionaria con respecto a
nosotros cuando nos envió el rayo de luz). Pero si el color que nos llega es diferente, si el color
aparece corrido hacia un extremo de la gama de colores como la que obtendríamos de un prisma
de vidrio, entonces podemos concluír que tal persona se está moviendo o alejando de nosotros
dependiendo de la magnitud del desplazamiento del color.

Primero que nada, hagamos un repaso del efecto Doppler desde su perspectiva clásica.

Casi todos nosotros estamos familiarizados de alguna manera con el efecto Doppler por las
experiencias de nuestra vida cotidiana. Cuando una ambulancia o un tren o un avión se acerca a
nosotros a gran velocidad produciendo un ruido con una frecuencia audible ya sea con su sirena
o con el ruido de sus motores, escuchamos el sonido con cierto tono distintivo. Pero en cuanto la
ambulancia o el tren o el avión se empieza a alejar de nosotros, el tono del sonido se vuelve
distintiblemente más grave. Esta situación la podemos imaginar en el siguiente diagrama en el
cual viaja un conductor que tiene puesto su radio en una estación que está produciendo cierto
sonido distintivo:

El sonido que escucha el conductor del vehículo en realidad no son más que una serie de
compresiones y rarefacciones del aire. El aire es el medio que sirve para “ondular”
transportando esas compresiones y rarefacciones de un lado a otro; sin el aire no es posible el
sonido. La distancia entre entre una compresión y la siguiente es la que determina la frecuencia
(el tono) del sonido que escucha el conductor del vehículo.

En el diagrama el carro está desplazándose hacia la derecha. Al ocurrir tal cosa, la velocidad del
carro se suma (clásicamente) a la velocidad con la cual se trasladan las ondas sonoras en el aire,
dando como resultado que para la persona que está caminando en la banqueta y a la cual se le
está acercando el carro a gran velocidad llegará una cantidad mayor de ondas sonoras que las
que escucha el conductor del vehículo en un mismo intervalo de tiempo. Esa persona en la
banqueta escuchará el sonido algo más “chillante”, con una frecuencia mayor en tanto mayor sea
la velocidad con la cual se le acerca el vehículo. Este es precisamente el efecto Doppler. En
cambio, para la persona que está en la banqueta del lado del cual se está alejando el carro,
llegará una cantidad mayor de ondas sonoras que las que escucha el conductor del vehículo en
un mismo intervalo de tiempo. Esa otra persona en la banqueta escuchará el sonido algo más
grave, más bajo, con una frecuencia menor en tanto menor sea la velocidad a la cual se le está
alejando el vehículo.

Si pudiéramos “ver” en un instante de tiempo las ondas sonoras que se van produciendo desde
el carro, posiblemente veríamos algo como lo siguiente:

A continuación tenemos otra ilustración de cómo se apilan las ondas sonoras del lado derecho al
moverse la fuente hacia la derecha a una velocidad moderadamente baja (representada por el
vector flecha de color rojo), y cómo se apilan aún más del lado derecho al aumentar la velocidad
de la fuente la fuente hacia la derecha, aumentando con ello la frecuencia (y el tono) de la señal:

En los mismos diagramas de arriba, al lado izquierdo de la fuente, podemos ver cómo se separan
las ondas sonoras al moverse la fuente hacia la derecha a una velocidad moderadamente baja y
cómo se separan aún más del lado izquierdo al aumentar la velocidad de la fuente la fuente hacia
la derecha, disminuyendo con ello la frecuencia.

Las fórmulas clásicas para el efecto Doppler acústico establecen una clara distinción entre una
fuente estacionaria y un observador móvil que se está alejando o acercando a la fuente, no son
las mismas. Esto se debe a que existe un medio en el cual son transportadas las ondas sonoras,
el aire, que sirve para este fenómeno como un marco de referencia absoluto. En un día
tranquilo, es posible saber en qué dirección está soplando el aire con sólo dejar caer al suelo un
objeto ligero. Pero si está soplando el viento, si el aire se está moviendo, el aire arrastrará al
objeto a cierta distancia al caer el objeto al suelo, y no caerá en la misma posición en la cual
habría caído si no hubiera viento alguno. Por lo tanto, las fórmulas para el efecto Doppler serán
distintas ya sea que la fuente esté estacionaria y el observador externo se esté moviendo o que la
fuente se esté moviendo también. Esta es precisamente una muestra de las asimetrías a
las que Einstein hacía referencia cuando se suponía que las ondas luminosas eran
transportadas a través de un medio de referencia estacionario conocido como el
éter.

Dentro del esquema de la Teoría Especial de la Relatividad, aunque una onda luminosa siempre
tendrá la misma velocidad en marcos distintos de referencia, la frecuencia de la señal luminosa
cuando salió disparada de su fuente tendrá también un desplazamiento Doppler como podemos
verlo en la siguiente analogía con las ondas acústicas:

De este modo, aunque un rayo luminoso siempre tenga la misma velocidad c con respecto a
cualquier marco de referencia, el hecho de que la frecuencia de la señal luminosa que nos llega
de la fuente dependa directamente del que la fuente luminosa se esté acercando o alejando de
nosotros nos proporciona una ayuda útil para tratar de determinar el movimiento relativo de
dicha fuente con respecto a nosotros. Para que la información nos pueda ser de utilidad,
necesitaríamos además una referencia universal con respecto a la cual pudiéramos medir la
magnitud del corrimiento. Afortunadamente, tal referencia universal existe, y son las líneas de
los espectros de emisión y absorción característicos de los elementos de la tabla periódica.
Cada elemento tiene sus propias líneas de emisión y absorción, y cada línea representa una
frecuencia específica, invariable. Siendo el hidrógeno el elemento más abundante del Universo,
no es de extrañar que sean precisamente las líneas características del hidrógeno las que son
utilizadas como fuente de referencia, las cuales dicho sea de paso son predichas en
espaciamiento e intensidad por la mecánica cuántica. Utilizando como punto de partida la
posición de las líneas que obtenemos en un espectógrafo de una fuente de hidrógeno situada en
la Tierra, comparando dichas líneas con las que obtenemos del hidrógeno emanado de los astros
podemos determinar individualmente para cada astro si dicho cuerpo celeste se está acercando
o se está alejando de nosotros. Si las líneas características del hidrógeno se corren hacia el azul,
el cuerpo celeste se está acercando hacia nosotros, y si las líneas características del hidrógeno se
corren hacia el rojo, el cuerpo celeste luminoso se está alejando de nosotros, y como lo podemos
ver en la siguiente representación:

A continuación tenemos una representación más ilustrativa de lo que podríamos ver en un


espectógrafo de alta precisión:
Clásicamente, para una fuente de la cual está emanando un sonido con una frecuencia
característica f0 en un medio como el aire en el que dicho sonido se propaga con una
velocidad V, cuando la fuente se está moviendo con una velocidad v con respecto a un
observador estacionario, el cambio por el efecto Doppler de dicha frecuencia f0 a una
frecuencia f está dado por la siguiente relación:

En ésta fórmula, el signo “+” o el signo “-” es utilizado dependiendo de que la fuente en
movimiento se esté alejando o se esté acercando al observador estacionario. Poniendo números,
considerando para la velocidad del sonido en el aire un valor V de 344 metros por segundo, para
una fuente sonora acercándose a un observador estacionario a una velocidad v de 172 metros
por segundo, usando el signo “-” en la fórmula podemos ver que la frecuencia del sonido
aumentará al doble:

f = f0/(1 - (172)/(344)) = f0/(1 - 0.5)) = f0/(0.5)

f = 2f0

Pero para una fuente móvil con la misma velocidad alejándose del observador estacionario a la
misma velocidad v de 172 metros por segundo, usando el signo “+” en la fórmula podemos ver
que la frecuencia del sonido disminuirá en un factor de dos tercios (0.666):
f = f0/(1 + (172)/(344)) = f0/(1 + 0.5)) = f0/(1.5)

f = (2/3)f0

Por otro lado, clásicamente para una fuente de la cual está emanando un sonido con una
frecuencia característica f0 en un medio como el aire en el que dicho sonido se propaga con una
velocidad V, cuando la fuente está estacionaria y es el observador el que se está moviendo con
una velocidad v con respecto a la fuente, el cambio por el efecto Doppler de dicha frecuencia f0 a
una frecuencia f está dado por la siguiente relación:

Obsérvese que esta fórmula es diferente de la fórmula anterior. El resultado clásico hace una
distinción entre el caso en el cual la fuente es la que está moviéndose con respecto a un
observador estacionario y el caso en el que el observador es el que está moviéndose con respecto
a una fuente estacionaria. Este es precisamente el tipo de asimetrías a las cuales
Einstein estaba haciendo referencia en su trabajo original cuando se suponía que
también la luz requería de un medio de conducción para poder propagarse de un
punto a otro. La razón por la cual el resultado clásico pre-relativista distingue entre una
fuente en movimiento y un observador en movimiento es que la derivación de las fórmulas
presupone la existencia de un medio (el aire) que proporciona una vía de conducción a las ondas
sonoras y por lo tanto proporciona una manera de detectar el reposo absoluto con respecto a
dicha referencia. En este caso, el observador privilegiado será aquél que esté en reposo absoluto
con respecto al aire en un día en el que no haya viento alguno o que se esté moviendo en la
misma dirección y con la misma velocidad (con respecto a la Tierra) a la cual está soplando el
viento.

Las fórmulas anteriores trabajan muy bien en situaciones cotidianas para velocidades bajas
mucho menores que la velocidad de la luz. Pero en situaciones que involucran a la luz misma,
viajando a la velocidad de la luz, las fórmulas tienen que ser corregidas tomando en cuenta los
efectos relativistas. En ambos casos habrá un efecto Doppler, pero el efecto Doppler calculado
relativísticamente debe ser el mismo ya sea que el análisis se lleve a cabo considerando una
fuente en movimiento y un observador estático o una fuente estática y un observador en
movimiento.
La inclusión de efectos relativistas al efecto Doppler necesariamente introducirá un grado
adicional de complejidad al asunto debido al fenómeno relativista de contracción de longitud. Si
generamos una onda sonora de frecuencia fija (constante) y suponemos que estamos
estacionarios frente a ella, entonces la distancia de cresta-a-cresta (máximo a máximo) definida
como la longitud de onda λ (medida en metros):

experimentará una contracción de longitud como la que ocurre de (a) a (b) en el diagrama de
arriba sin importar el sentido en el que nos estemos moviendo, ya sea hacia la fuente o
alejándonos de ella. La longitud de onda máxima será la que mida un observador estacionario
que se encuentre situado justo en el centro de la fuente que genera la onda o bien otro
observador que también se encuentre en reposo con respecto al observador situado en el punto
en donde se está generando la señal. Cualquier otro observador que se ponga en movimiento
con respecto a la fuente detectará una contracción de longitud relativista, y esa contracción de
longitud es la misma que la que hemos obtenido previamente desde un principio, dada por la
relación:

λ = λ0√1 - V²/c²

Se repite, y esto es importante, que esta variación en la longitud de onda λ de la señal (y por lo
tanto en la frecuencia f de la misma, ya que la frecuencia es la recíproca de la longitud de
onda, o sea f = 1/λ) con respecto a la longitud de onda λ0 medida por un observador que está en
reposo con respecto a la fuente es adicional al efecto Doppler que en sí es causada por el
abultamiento o el adelgazamiento de las ondas ya sea que nos estemos moviendo rápidamente
hacia la fuente o alejándonos de ella. El efecto final es el resultado compuesto de ambos efectos.
También podemos llevar a cabo un análisis relativista del efecto Doppler usando ladilatación del
tiempo en lugar de la contracción de longitud. Para ello, consideramos el período T de la onda
luminosa, que es el intervalo de tiempo propio (medido en segundos) entre cresta y cresta de la
onda luminosa:

Es importante tener presente siempre que la velocidad de una onda senoidal (que en este caso
suponemos que se trata de una onda electromagnética, o sea una señal luminosa moviéndose a
la velocidad de la luz) está relacionada a la longitud de onda y al período de la onda senoidal de
la siguiente manera:

c = λ/T

De un modo o de otro, tomando en cuenta los efectos relativistas, la fórmula para el efecto
Doppler relativista en el caso de un haz luminoso que resulta ser la siguiente:

no establece diferencia alguna entre una fuente en movimiento y un observador estático y una
fuente estática y un observador en movimiento, como era de esperarse. En esta fórmula,
utilizamos el signo “-” cuando la fuente y el observador están acercándose el uno con respecto al
otro, y utilizamos el signo “+” cuando la fuente y el observador están alejándose el uno con
respecto al otro.
La fórmula anterior es válida cuando la fuente se está acercando hacia el observador o cuando la
fuente se está alejando del observador directamente a lo largo de la línea imaginaria que conecta
a ambos. Cuando el acercamiento (o el alejamiento) no ocurre a lo largo de esta línea:

entonces la fórmula Doppler relativista debe ser modificada para acomodar la siguiente
situación que corresponde a un efecto Doppler transversal:

Esta es la fórmula general para el efecto Doppler relativista.

PROBLEMA: Suponiendo una fuente estacionaria emitiendo una señal luminosa f0, derivar
la expresión

para un observador que se está moviendo directamente hacia la fuente a una velocidad V.
Demuéstrese que esta expresión es idéntica a
La derivación de la primera relación se lleva a cabo en forma directa simplemente considerando
la contracción relativista de la longitud. Tomando dicha relación y trabajando sobre ella:

f = { f0 (1 + V/c) } / { √1 - V²/c² }

f = { f0 (1 + V/c) } / { √(1 + V/c)(1 - V/c) }

f = { f0 √(1 + V/c) √(1 + V/c) } / { √(1 + V/c) √(1 - V/c) }

f = { f0 √(1 + V/c) } / { √(1 - V/c) }

f = { f0 √(1 + V/c) √(1 - V/c) } / { √(1 - V/c) √(1 - V/c) }

f = { f0 √(1 - (V/c)²) } / { 1 - V/c }

PROBLEMA: Demuéstrese que las expresiones clásicas para el efecto Doppler tanto para
fuentes en movimiento como para observadores en movimiento aplicadas a haces luminosos
son iguales la una a la otra y a las expresiones relativistas a un primer orden en V/c.

La expresión clásica del efecto Doppler para una fuente en movimiento (observador en reposo)
suponiéndola válida para una fuente luminosa con la señal moviéndose a la velocidad de la luz
es (haciendo las modificaciones notacionales necesarias):

Podemos desarrollar el denominador de esta expresión mediante una expansión por series
(teorema del binomio) que en este caso resulta ser:
Esta expansión puede ser utilizada para valores de x inferiores a la unidad, lo cual es aplicable al
caso que nos ocupa ya que V/c ciertamente será inferior a la unidad. La inversa de (1+x) se
obtiene con un exponente de n = -1. Suponiendo valores pequeños de x (lo cual nos permite
ignorar los términos mayores a los de primer orden) y para valores positivos de x, la serie
resultante es:

Entonces:

f = f0 (1 ± V/c)

Este es el resultado clásico para una fuente en movimiento. Podemos comparar este resultado
con el resultado clásico para una fuente en reposo y un observador en movimiento dado arriba
(haciendo las modificaciones notacionales necesarias):

f =(1 ± V/c) f0

comprobando que las expresiones clásicas para el efecto Doppler tanto para fuentes en
movimiento como para observadores en movimiento aplicadas a haces luminosos son iguales la
una a la otra.

Ahora tomamos la expresión relativista


y trabajamos algebraicamente sobre la misma recurriendo en este caso tanto al desarrollo del
término de la raíz cuadrática del denominador como al término del denominador de la
expresión mediante una expansión por series (teorema del binomio):

f = { f0 √1 - V²/c² } / { 1 ± V/c }

f = f0 { (1 - V²/c²) -½ } { (1 ± V/c) -1 }

f = f0 { (1 + (½) (V/c)² + ...) -½ } { 1 ± V/c ± ... }

f = f0 (1 ± V/c)

Entonces tanto las expresiones clásicas para el efecto Doppler para fuentes en movimiento como
para observadores en movimiento aplicadas a haces luminosos son iguales la una a la otra y a las
expresiones relativistas a un primer orden en V/c.

En la resolución de problemas astronómicos en los cuales se determina el corrimiento de las


líneas espectrales propias de cada elemento, es común utilizar como medida de la longitud de
onda el angstrom, simbolizado como Å, el cual es igual a 10-8 centímetros.

PROBLEMA: La cuásar 3C-9 se está alejando de la Tierra a una velocidad V. La línea


espectral Lyman-α en el ultravioleta del hidrógeno situada normalmente en λ0 = 1216 Å es
desplazada hacia una longitud de onda mayor (conocido como corrimiento hacia el rojo). La
línea espectral observada tiene una longitud de onda λ = 3663 Å. Suponiendo que este
desplazamiento se debe al efecto Doppler, calcular la velocidad a la cual se está alejando la
cuásar 3C-9 de la Tierra.

Puesto que la velocidad de la luz es la misma en cualquier marco de referencia, podemos afirmar
que:

c = f0 λ0 _____ c = f λ

con lo cual:

f0 = c / λ0_____ f = c / λ
La fórmula para el efecto Doppler relativista en el caso de una fuente que se está alejando a una
velocidad V es:

f = { f0 √1 - V²/c² } / { 1 ± V/c }

usando lo anterior y el hecho de que la fuente se está alejando del observador con lo cual
seleccionamos el signo “+”:

c / λ = { (c / λ0) (√1 - V²/c² ) } / { 1 + V/c }

λ0 / λ = { √(1 + V/c)(1 - V/c) } / { (√1 + V/c) (√1 + V/c) }

(√1 + V/c) /(√1 - V/c) = λ / λ0 = 3663 Å /1216 Å = 3.0123

(1 + V/c) /(1 - V/c) = 9.0742

V = 0.801c

Del problema anterior, podemos ver que para la resolución de problemas numéricos podemos
utilizar fórmulas Dopper relativistas un poco más fáciles de recordar, las cuales obtendremos a
continuación

PROBLEMA: (a) A partir de la fórmula general para el efecto Doppler relativista,


demuéstrese que cuando el observador y la fuente se mueven directamente el uno hacia el otro
la frecuencia de la señal detectada por el observador se puede escribir de la siguiente manera:

(b) Del mismo modo, a partir de la fórmula general para el efecto Doppler relativista,
demuéstrese que cuando el observador y la fuente se están alejando el uno del otro la
frecuencia de la señal detectada por el observador se puede escribir de la siguiente manera:
(a) En la fórmula general para el efecto Doppler relativista:

cuando la fuente y el observador se mueven el uno hacia el otro tenemos un ángulo θ = 0° con lo
cual cos(θ) = 1 y:

f = { f0 √1 - V²/c² } / { 1 - V/c }

f = { f0 √(1 + V/c)(1 - V/c) } / { √(1 - V/c) √(1 - V/c) }

f = f0 { √(1 + V/c) / √(1 - V/c)}

f = f0 √(1 + V/c)/(1 - V/c)

(b) En la misma fórmula, cuando la fuente y el observador se están alejando el uno del otro,
tenemos un ángulo θ = 180° con lo cual cos(θ) = -1 y:

f = { f0 √1 - V²/c² } / { 1 + V/c }

f = { f0 √(1 + V/c)(1 - V/c) } / { √(1 + V/c) √(1 + V/c) }

f = f0 { √(1 - V/c) / √(1 + V/c)}

f = f0 √(1 - V/c)/(1 + V/c)

PROBLEMA: Para una estrella que se aleja de la Tierra a una velocidad de 5·10-3 c, ¿cuál es
el corrimiento en la longitud de onda para la línea D del sodio (5890 Å)

La ecuación Doppler relativista para fuente y observador alejándose el uno con respecto al otro
nos dá:
f = f0 √(c - V)/(c + V)

c/λ = (c/λ0) (√(c - V)/(c + V)

λ = λ0 √(c + V)/(c - V)

λ = λ0 √(1 + V/c)/(1 - V/c)

λ = (5890 Å) √(1 + .005)/(1 - .005)

λ = 5920 Å

El corrimiento Doppler en la longitud de onda es entonces Δλ = 5920 Å - 5890 Å = 30 Å. Este


corrimiento consiste en un aumento en la longitud de onda, y por lo tanto es un desplazamiento
hacia el infrarrojo (hacia el rojo).

PROBLEMA: ¿Cuál es la variación de Doppler para una fuente de longitud de onda 5500 Å
que se aproxima a un observador con una velocidad de 0.8c?

Procediendo en una forma parecida al problema anterior, la relación a ser utilizada en el caso de
que la fuente se está acercando al observador debe ser la siguiente:

λ = λ0 √(c - V)/(c + V)

λ = λ0 √(1 - V/c)/(1 + V/c)

λ = (5500 Å) √(1 - 0.8)/(1 + 0.8)

λ = (5500 Å) √(0.2)/(1.8) = (5500 Å) /9

λ = 1833 Å

Entonces Δλ = 5500 Å - 1833 Å = 3667 Å.


PROBLEMA: Supóngase que la mayor longitud de onda visible para el ojo humano es de
6500 Å, en el límite hacia el infrarrojo. ¿Con qué velocidad deberá viajar un cohete para que la
luz verde (λ = 5000 Å) emitida por él, sea invisible para un observador en Tierra?

En este caso, el cohete debe estar alejándose del observador en Tierra para que la longitud de
onda pueda aumentar por efecto Doppler:

λ = λ0 √(c + V)/(c - V)

√(1 + V/c)/(1 - V/c) = λ / λ0 = 6500 Å/ 5000 Å = 1.3

(1 + V/c) / (1 - V/c) = 1.69

2.69 V/c = 0.69

V = 0.257 c

PROBLEMA: ¿Con qué velocidad se debe alejar una estrella de la Tierra para que la
variación de la longitud de onda sea del 0.5%?

Esta situación es similar a la del problema anterior:

λ = λ0 √(c + V)/(c - V)

√(1 + V/c)/(1 - V/c) = λ / λ0 = 1.005

1 + V/c = 1.01 (1 - V/c)

2 V/c = .01

V = 5·10-3 c

PROBLEMA: Una fuente de luz de frecuencia f0 se mueve alternadamente hacia un


observador con velocidad V y rápidamente se aleja del observador a la misma velocidad.
Demuéstrese que el promedio de las frecuencias observadas es mayor que f0.
Relativísticamente, cuando la fuente se está acercando al observador, la frecuencia con
corrimiento Doppler es (usando el signo “-” en la fórmula):

f = { f0 √1 - V²/c² } / { 1 - V/c }

Y cuando la fuente se está alejando del observador, la frecuencia con corrimiento Doppler es
(usando el signo “+” en la fórmula):

f = { f0 √1 - V²/c² } / { 1 + V/c }

El promedio aritmético de ambas frecuencias es:

f = ( f + f ) /2

Entonces, substituyendo:

f = ½ [ { f0 √1 - V²/c² } / { 1 - V/c } + { f0 √1 - V²/c² } / { 1 + V/c } ]

f = [ ½ { f0 √1 - V²/c² }] {1/( 1 - V/c) + 1 /(1 + V/c) }

f = [ ½ { f0 √1 - V²/c² }] {(1 + V/c + 1 - V/c)/( 1 - V/c) (1 + V/c) }

f = [ ½ { f0 √1 - V²/c² }] { 2/( 1 - V²/c²) }

f = [ ½ { f0 √1 - V²/c² }] { 2/( 1 - V²/c²) }

f = f0 / √1 - V²/c²

Puesto que V es menor que c, entonces V²/c² es menor que 1 y el denominador (1-V²/c²) será
mayor que cero pero menor que la unidad. Esto significa que (1/√1 - V²/c²) siempre será mayor
que la unidad. Entonces el promedio de las frecuencias observadas debe ser mayor que la
frecuencia f0.

Se repite aquí que las fórmulas relativistas utilizadas arriba para el efecto Doppler que no
establecen diferencia alguna entre un observador estacionario situado en la fuente misma
(fuente en movimiento) y un observador en movimiento con respecto a la fuente (fuente
estacionaria) son válidas única y exclusivamente para haces de luz, no son válidas para ondas
sonoras o u ondas mecánicas transmitidas en un medio sólido, líquido o gaseoso, porque en
tales casos la información transmitida (las ondas viajeras) dependen de un medio físico
estacionario (el aire, el agua, el metal, etc.), mientras que la luz no depende de medio alguno de
transmisión al haber sido descartada la hipótesis del éter. En el caso de las ondas sonoras y
mecánicas las relaciones clásicas siguen siendo válidas, aunque estas también sean susceptibles
de correcciones relativistas por contracción de longitud (o dilatación del tiempo).

Dinámica relativista
Una parte esencial de la mecánica pre-relativista consiste en el estudio de las
fuerzas estáticas que ejercen entre sí partículas o cuerpos o inclusive puentes y edificios que
están en reposo absoluto sin que haya movimiento relativo alguno entre ellos. Esta rama de la
física no cambia en nada bajo la Teoría de la Relatividad. Podemos seguir calculando las
tensiones en las vigas de acero que sirven de apoyo a los rascacielos, podemos seguir calculando
la fuerza de fricción necesaria entre una escalera y el piso para que la escalera inclinada a cierto
ángulo reposando contra una pared no se resbale, y podemos seguir calculando la forma en la
que se reparten las fuerzas de una bóveda sobre las columnas que sirven de apoyo a una
catedral, de la misma manera como siempre se ha hecho inclusive desde antes de los tiempos de
Newton. Lo que cambia es nuestro manejo de fuerzas en situaciones dinámicas, sobre todo
cuando hay involucradas velocidades cercanas a la velocidad de la luz.

Clásicamente, si una fuerza Fx actuando sobre un cuerpo de masa M le imprimía al cuerpo una
aceleración ax de acuerdo con la fórmula Fx = Max dada por Newton, entonces para otro
observador moviéndose a una velocidad constante V la fórmula seguirá siendo exactamente la
misma en virtud de que las transformaciones de Galileo nos señalan que ax = a’x y por lo
tanto F’x = Ma’x = Max, lo que a su vez implica F’x = Fx, y una misma fuerza permanece
invariante (clásicamente) para otros observadores en movimiento relativo el uno con respecto
al otro.

Sin embargo, de acuerdo con las transformaciones relativistas (las transformaciones de


Lorentz) la aceleración de un cuerpo al pasar de un sistema de referencia S’ en movimiento a
otro sistema de referencia S en reposo debe ser corregida de la siguiente manera:
O bien, multiplicando ambos miembros por la masa M:

Max = { 1 /γ3 (1 + Vux /c²)3 } Ma’x

Fx = { 1 /γ3 (1 + Vux /c²)3 } F’x

De este modo, la fuerza F’x = Ma’x que es medida por el observador en movimiento ya no tiene
el mismo valor que el que tiene cuando es medida por el observador en reposo, ya que tiene que
ser corregida mediante el factor:

1 / { γ3 ( 1 + Vu’x /c²)3 }

con lo cual bajo las transformaciones de Lorentz la fuerza Newtoniana ha dejado de ser una
invariante. Entonces debemos aceptar que una misma fuerza F cambie de valor al pasar de un
marco de referencia a otro por el factor señalado, o bien debemos aceptar que la fórmula
clásica F = Ma ha dejado de ser válida. Es razonable suponer que la fórmula F = Mapierde su
validez a altas velocidades porque esta fórmula implica que una fuerza constante puede acelerar
a un cuerpo a velocidades ilimitadas si actúa por un tiempo largo. Por otro lado, si la velocidad
de un cuerpo en un marco de referencia S’ es mayor que la velocidad de la luz, entonces no
podemos llevar a cabo con las transformaciones de Lorentz la conversión del marco de
referencia S’ a un marco de referencia en resposo S porque el factor γ se vuelve imaginario
cuando la velocidad V del marco de referencia móvil es mayor que la velocidad de la luz c.

El concepto de una fuerza aplicada directamente sobre un cuerpo en movimiento es un concepto


tan natural, tan esencial, tan básico, que antes que prescindir por completo de dicho concepto se
vuelve deseable redefinirlo de alguna manera. Y para poder redefinirlo, tenemos que echar un
vistazo a la forma en la cual Newton obtuvo la fórmula F = Ma.

Para poder desarrollar su esquema de dinámica clásica, Isaac Newton concibió un concepto
sobre el cual descansa toda la estructura de su filosofía en lo que concierne a la dinámica. Para
un cuerpo de masa m moviéndose a una velocidad v con respecto a un observador, si
multiplicamos directamente la masa por la velocidad obtenemos una cantidad considerada
como fundamental, una cantidad que Newton llamó la “cantidad de movimiento” de un cuerpo
o momentum, frecuentemente simbolizada con la letra p (se ha utilizado notación vectorial para
indicar que, por convención, el momentum de un cuerpo es una cantidad que posee la misma
dirección y sentido en la cual se está moviendo el cuerpo con velocidad v):
p = mv

Así, para una masa de 5 kilogramos moviéndose a una velocidad de 4 metros por segundo, la
cantidad de movimiento del cuerpo es:

p = (5 Kg)(4 m/seg)

p = 20 Kg-m/seg

A esta cantidad de movimiento se le asigna una dirección, la misma dirección que la que lleva el
cuerpo al estar moviéndose. Puesto que la cantidad de movimiento p de un cuerpo es algo que
tiene dirección y sentido, la fórmula es representada no en notación escalar sino en notación
vectorial:

p = mv

Esta fórmula que nos fue dada por Newton no impone límite alguno a la velocidad a la cual se
mueve el cuerpo, el cual se puede mover a una velocidad mayor que la velocidad de la luz, lo cual
relativísticamente hablando es imposible.

Aunque no parezca obvio, entre las tres leyes del movimiento de Newton está injertado el
concepto de que el momentum para una partícula o inclusive para todo un sistema de partículas
es una cantidad que permanece invariable a menos de que intervenga una fuerza externa que lo
modifique. Esta es esencialmente la ley de la inercia de Newton, pero ahora expresado como
una de las leyes de conservación más básicas que pueda haber: el principio de la
conservación de la cantidad de movimiento. Esta ley la podemos aplicar poniendo
números a todo tipo de situaciones para obtener resultados concretos, como lo es el caso de
un choque inelástico entre dos partículas:
En los anteriores diagramas: (a) antes de la colisión tenemos dos esferas moviéndose en la
misma dirección, una de masa m1 moviéndose con velocidad u1 y otra de masa m2
moviéndose con velocidad u2, (b) la masa m1 moviéndose a una velocidad u1 que es mayor que
la velocidad u2 eventualmente alcanza a la esfera que tiene por delante, ocurriendo un choque
que supondremos que es perfectamente elástico y durante el cual a través de una fuerza de
contacto F se lleva a cabo una transferencia de la cantidad de movimiento entre ambos
cuerpos, (c) las masas se separan al impartirle la masa m1 algo de su momentum a la masa
m2, adquiriendo cada uno de los cuerpos velocidades ν1 y ν2.

Si la cantidad de movimiento del sistema se conserva, entonces debemos tener como hecho dado
para la anterior colisión que:

momentum antes del choque = momentum después del choque

PROBLEMA: Un observador que está en reposo con respecto a la Tierra observa una colisión
en la cual una partícula de masa m1 = 3 kilogramos que se mueve a velocidad u1 = 4
metros/seg a lo largo del eje-x se aproxima a una partícula de masa m2 = 1 kilogramo que se
mueve con velocidad u2 = -3 metros/seg también a lo largo del eje-x (obsérvese por el signo
negativo que se está moviendo hacia la izquierda). Después de un choque frontal, el
observador en Tierra encuentra que m1 lleva una velocidad de ν1 = 2 metros/seg mientras que
m2 lleva una velocidad de ν2 = 3 metros/seg. Verificar que el momentum se ha conservado
antes y después de la colisión.

momentum inicial = m1u1 + m2u2

momentum inicial = (3 Kg)(4 metros/seg) + (1 Kg)(-3 metros/seg)

momentum inicial = 9 Kg · m/seg

momentum final = m1ν1 + m2ν2

momentum final = (3 Kg)(2 metros/seg) + (1 Kg)(3 metros/seg)

momentum final = 9 Kg · m/seg

Puesto que el momentum inicial es igual al momentum final, se concluye que la cantidad total
de movimiento se conserva para este evento.

El principio de la conservación de la cantidad de movimiento es un principio que permanece


válido al cambiar de un marco de referencia a otro usando las transformaciones clásicas de
Galileo, como podemos comprobarlo con el siguiente problema que es un seguimiento al
problema anterior:

PROBLEMA: Un segundo observador O’ que se mueve a una velocidad de 2 metros/seg


relativa a la Tierra y a lo largo del eje-x observa el choque descrito en el problema anterior.
¿Cuáles serán los momentums antes y después del choque? ¿Se sigue conservando la cantidad
de movimiento?

De acuerdo con las transformaciones clásicas de velocidad de Galileo:

u’1 = u1 - V = 4 metros/seg - 2 metros/seg = 2 metros/seg

u’2 = u2 - V = -3 metros/seg - 2 metros/seg = - 5 metros/seg

ν’1 = ν1 - V = 2 metros/seg - 2 metros/seg = 0

ν’2 = ν2 - V = 3 metros/seg - 2 metros/seg = 1 metro/seg


Entonces:

momentum inicial = m1u’1 + m2u’2

momentum inicial = (3 Kg)(2 metros/seg) + (1 Kg)(-5 metros/seg)

momentum inicial = 1 Kg · m/seg

momentum final = m1ν’1 + m2ν’2

momentum final = (3 Kg)(0) + (1 Kg)(1 metro/seg)

momentum final = 1 Kg · m/seg

Puesto que el momentum inicial es igual al momentum final, se concluye que la cantidad total
de movimiento también se conserva para el segundo observador. Clásicamente, el principio de
la conservación de la cantidad de movimiento sigue siendo válido al pasar de un sistema de
referencia S a otro sistema de referencia S’.

Sin embargo, al utilizar las transformaciones de Lorentz en vez de usar las transformaciones
clásicas de Galileo, descubrimos rápidamente que la cantidad de movimiento no se conserva
invariable al pasar de un marco de referencia a otro. Esto lo podemos ver mejor considerando
un experimento de balística en donde un observador O’ en un sistema de referencia S’ dispara
un proyectil en la dirección del eje-y’. El proyectil penetra en un bloque que se encontraba
inmóvil con respecto al observador O’:
La cantidad de masa m del proyectil que penetra en el bloque debe poder determinarse a partir
de la componente en y’ del momentum del proyectil, el cual está dado por p’ y = mu’yen donde m
es la masa del proyectil medida por O’ que suponemos invariable.

Ahora considérese el mismo experimento desde el punto de vista del observador en reposo O
para quien O’ se mueve a lo largo del eje x-x’ con velocidad V. Obviamente, antes de impactar
con el bloque, la bala se estará moviendo no sólo hacia abajo sino también hacia la derecha con
una cantidad de movimiento que podemos designar como p’x = mu’x, y después de haberse
impactado con el bloque la combinación bala-bloque se seguirá moviendo hacia la derecha con
una cantidad de movimiento que debe ser igual a p’x de acuerdo con el principio de la
conservación de la cantidad de movimiento, además de moverse hacia abajo. Sin embargo, para
el análisis simplificado que llevaremos a cabo, enfocaremos nuestra atención única y
exclusivamente sobre lo que ocurre en el eje vertical.

Puesto que el orificio dejado por el proyectil forma un ángulo recto con la dirección del
movimiento relativo, tanto O como O’ estarán de acuerdo en cuanto al valor de la distancia que
el proyectil penetra en el bloque, y por lo tanto esperan que el valor de la componente en el eje-y
del momentum del proyectil tenga el mismo valor para ambos de cumplirse el principio de
conservación de la cantidad de movimiento. El momentum medido por O es py= muy en donde
m es la masa del proyectil medida por O. De las transformaciones de Lorentz para la velocidad y
teniendo en cuenta que u’x = 0, se obtiene:
uy = { u’y√ 1 - V²/c² } / { 1 + (V²/c²) u’x }

uy = u’y√ 1 - V²/c²

Entonces:

py = muy

py = mu’y√ 1 - V²/c²

Resulta indudable que p’y ≠ py, y por lo tanto el momentum clásico no se conserva bajo las
transformaciones de Lorentz.

El concepto de la cantidad de movimiento es tan esencial y tan básico para la resolución de


tantos problemas, que en vez de abandonarlo por completo optamos mejor por modificarlo
adaptándolo a una nueva dinámica, la dinámica relativista. Esto fue precisamente lo que
hizo Einstein. Lo más lógico es tomar la definición original que nos fue dada por Newton y
modificarla de alguna manera agregándole algún factor de corrección relativista tal como el
factor de corrección γ al cual ya estamos acostumbrados, obteniendo la definición de
un momentum relativista. Si logramos obtener una definición correcta para el momentum
relativista, entonces debemos obtener también un principio de conservación del
momentum relativista que es a final de cuentas la razón de ser para haber definido desde un
principio al momentum mu en la mecánica clásica como aquella cantidad que es conservada
cuando no hay fuerzas exteriores actuando sobre un sistema (como lo es el caso de la colisión
elástica entre dos cuerpos que acabamos de ver). Si nuestra definición de momentum relativista
ha de ser válida, tiene que cumplir con los siguientes requisitos:

a) El momentum relativista es una cantidad que se debe conservar invariante para un sistema
cerrado bajo las transformaciones de Lorentz.

b) El momentum relativista debe acercarse más y más a la definición clásica del momentum
para velocidades bajas en comparación con la velocidad de la luz, o sea cuando V/c se va
acercando a cero. Esto último nos lo impone la experiencia cotidiana que nos ha confirmado la
validez del principio de la conservación de la cantidad de movimiento de un sistema a través de
numerosos experimentos que se han llevado a cabo en donde los efectos relativistas son
indetectables.
En la dinámica clásica, Newton formalizó el concepto de la fuerza interpretándola como la
acción requerida para cambiarle a un cuerpo su cantidad de movimiento, dándole al tiempo
absoluto un papel clave en esta interpretación. En el esquema de Newton, todo cuerpo mantiene
su estado de reposo o un estado de movimiento rectilíneo constante (lo cual ocurre en el espacio
exterior en donde no hay aire ni obstáculo alguno que le haga perder a un objeto la velocidad
que lleva) mientras no intervenga una fuerza externa que modifique ese estado de reposo
absoluto o de movimiento absoluto, y entre mayor sea la masa del cuerpo tanto mayor debe ser
la fuerza requerida para hacerle cambiar su cantidad de movimiento. En este esquema, la fuerza
tiene la siguiente definición matemática expresada usando infinitesimales:

La fuerza F es simplemente el cambio en la cantidad de movimiento p del cuerpo entre el lapso


de tiempo requerido para provocar tal cambio en su cantidad de movimiento. En la notación
vectorial utilizada para F, se le está dando a la fuerza la misma dirección que la dirección que
toma el cambio de movimiento provocado sobre el cuerpo. Y puesto que p=mv, entonces:

F = d(mv)/dt

Si suponemos que la masa m del cuerpo es constante (lo cual no es cierto en todos los casos
como el caso de un cohete que va lanzando combustible al exterior conforme se va despegando
de su plataforma), entonces:

F = m * dv/dt

Pero el cambio en la velocidad con respecto al tiempo es simplemente la aceleración que


experimenta el cuerpo al cambiar de velocidad. Entonces:

F = ma

Pero esta fórmula como está dada no puede ser sostenida dentro de la Teoría Especial de la
Relatividad, porque implica que un cuerpo puede ser acelerado hasta alcanzar cualquier
velocidad, incluso una velocidad superior a la velocidad de la luz, lo cual no es imposible.
Obviamente, también aquí se requiere alguna modificación de conceptos. Pero ello empezará
con la redefinición del momentum que sirve a su vez para definir el concepto de fuerza.
PROBLEMA: Hacer una gráfica que muestre el efecto relativista de la variación de la masa
con la velocidad para un cuerpo con una masa de 1 kilogramo, graficando desde V = 0 hasta V
= 0.9c.

Este es un problema de resolución directa que requiere evaluar algunos puntos que serán unidos
por una curva de “mejor ajuste” en la gráfica. Para una velocidad de V = 0.7c, la masa relativista
será:

m = m0/√ 1 - V²/c²

m = (1 Kg) / √ 1 - (0.7)² = 1.4 Kg

La gráfica resultante tiene el siguiente aspecto:

El aumento en la masa de un cuerpo de acuerdo con la velocidad del mismo frecuentemente


provoca un efecto sorpresivo en quienes toman conocimiento por vez primera de este efecto,
porque clásicamente la masa de un cuerpo era considerada como algo propio del cuerpo,
inalterable, que nada tenía que ver con su velocidad; un kilogramo de tortillas de maíz seguía
siendo un kilogramo de tortillas de maíz bajo cualquier ángulo que se le mirase. Sin embargo, en
virtud de que la dinámica relativista impone un límite absoluto a la velocidad que puede
alcanzar un cuerpo, la cual no puede ser mayor que la velocidad de la luz ya que en un caso así el
término √ 1 - V²/c² se vuelve imaginario, si se trata de continuar aumentando la cantidad de
movimiento de un cuerpo conforme se acerca a velocidades cada vez más cercanas a la velocidad
al no poder rebasarse dicho límite entonces la cantidad de movimiento únicamente puede
aumentar como resultado de un aumento en la masa. Es aquí en donde muchos acostumbrados
a leer libros en los que sólo se dan unas cuantas fórmulas sin mayores explicaciones se
preguntan: ¿De dónde sale esa masa? ¿Se está violando el principio de la conservación de la
materia?

En realidad, la masa no está aumentando. El observador O’ que viaje en su marco de referencia


S’ junto con el cuerpo verá a dicho cuerpo en reposo (con respecto a él) y no lo verá aumentar ni
siquiera un miligramo. No hay creación alguna de materia salida de la nada. La materia “extra”
es la que sería detectada por otro observador O en su marco de referencia S ante el cual el
cuerpo se está moviendo a grandes velocidades. ¿Y de dónde sale ese incremento de masa para
el observador O? En realidad, esa masa “extra” tiene que ver con el consumo de energía que hay
que invertir para ir acercando al cuerpo a velocidades cada vez más cercanas a la velocidad de la
luz. La aceleración de un cuerpo, el aumento en su cantidad de movimiento, es algo que no se
logra gratuitamente, hay que invertir energía en el proceso. Para llevar a un cuerpo del reposo a
una velocidad V = 0.7c se requiere el uso de cierta cantidad de energía que no saldrá de la nada.
Esta energía va directamente al aumento en la cantidad de movimiento del cuerpo. Y si
queremos subirle la velocidad a un cuerpo de V = 0.9998c a V = 0.99985c, ello requerirá
también un consumo de energía. En realidad, esa masa “extra” aparente tiene que ver
directamente con la energía que estamos invirtiendo en irle subiendo al cuerpo su velocidad. Esa
energía no se va a la nada como tampoco puede sacar el cuerpo una cantidad de movimiento
cada vez mayor sin que haya algo que lo continúe acelerando. Lo que estamos viendo en acción
es ni más ni menos una equivalencia que llevó a Einstein a una de sus conclusiones más
famosas, la cual encierra el secreto de la bomba atómica y la razón del por qué una estrella
puede estar “ardiendo” liberando cantidades enormes de energía por millones de años sin
“apagarse”. Esto es ya un asunto que nos lleva del tema del momentum relativista a la energía
relativista de importancia tal que es necesario discutirlo por separado.

Teniendo en nuestras manos la definición del momentum relativista p = γmV, podemos


proceder a reemplazar el concepto Newtoniano de la fuerza dinámica con el concepto relativista
de fuerza, basándonos para ello en la definición original de fuerza como aquello que produce un
cambio en la cantidad de movimiento de un cuerpo en cierto período de tiempo, en este caso del
momentum relativista.

PROBLEMA: Una fuerza F actúa sobre un cuerpo en la misma dirección y sentido que su
velocidad. Encontrar la expresión que corresponde a dicha fuerza acorde con la segunda ley
de Newton.

La fuerza relativista es igual a la derivada del momentum relativista con respecto al tiempo:

Tomando la derivada:

Simplificando:

Finalmente, obtenemos la expresión que estábamos buscando:

De nueva cuenta, para velocidades suficientemente bajas en comparación a la velocidad de la


luz, la expresión para la fuerza relativista se reduce a la expresión Newtoniana clásica F = ma.

Una aplicación práctica del concepto de la fuerza relativista está relacionada con el efecto que
produce un campo magnético de intensidad B (el cual generalmente es representado con líneas
de campo magnético que apuntan en la misma dirección de Norte a Sur en la cual apuntaría el
imán de una brújula en puntos distintos de dicho campo) sobre una carga eléctrica que penetra
en dicho campo a un ángulo recto al campo:

Una vez que la partícula con carga eléctrica ha penetrado a una velocidad V en una región en
donde hay un campo magnético, la partícula experimenta una fuerza F determinada por la
famosa “regla de la mano derecha” (usamos el dedo índice para indicar la dirección hacia la cual
se está moviendo la partícula, usamos el dedo medio para apuntar la dirección de las líneas del
campo magnético, obteniendo la dirección de la fuerza F con el dedo pulgar):

que actúa sobre la carga de modo tal que si el campo magnético es uniforme la pondrá en un
movimiento de rotación inicialmente circular que sería perpetuo de no ser porque una particula
cargada electricamente no puede permanecer por siempre girando en un campo magnetico
dando vuelta tras vuelta ya que al estarse acelerando -vectorialmente hacia el centro de la
rotación- la particula emite radiacion electromagnetica lo cual le va restando energía, con lo cual
la partícula más que trazar un círculo va trazando una espiral hacia el centro:

Si imaginamos las líneas del campo magnético entrando hacia el monitor de la computadora
como si fuesen unas flechas (con unas cruces indicando la cola en cada flecha), entonces
podemos ver la acción de la rotación de la manera siguiente:
En este caso, la fuerza F no actúa en la misma dirección y sentido que la velocidad V del cuerpo,
razón por la cual al llevar a cabo derivaciones de fórmulas relativistas de esta índole es necesario
formalizar los cálculos con notación vectorial.

La magnitud de la fuerza F para una partícula con carga eléctrica atrapada en un campo
magnético está dada por la siguiente relación:

║ F║ = F = qVB

Si esta fuerza está reteniendo a la carga con una fuerza centrípeta F = mV²/R de igual magnitud,
entonces tenemos que la velocidad V estará dada por:

mV²/R = qvB

V = qBR/m

Esta relación es válida a velocidades suficientemente bajas en comparación con la velocidad de


la luz. Pero para partículas energéticas con velocidades que se van aproximando a la velocidad
de la luz, esta relación deja de ser válida, y tenemos que obtener la relación relativista para
poder predecir correctamente lo que ocurre en una situación experimental.

PROBLEMA: Obtener la expresión para la velocidad relativista de una carga eléctrica que se
mueve en un círculo de radio R y en ángulo recto con el campo magnético B.

En notación vectorial (usaremos negritas para representar cantidades vectoriales que tienen
dirección y sentido), la segunda ley de Newton está definida como:

La fuerza relativista se obtiene utilizando en esta definición la masa relativista, con lo cual:
Pondremos ahora en el denominador la expresión V² como producto escalar V·V:

A continuación tomamos la derivada aplicando la regla de la cadena:

En el campo magnético, resulta claro que el vector velocidad V, siguiendo la dirección hacia la
cual se está moviendo la carga, y el vector aceleración centrípeta dV/dt dirigido hacia el “centro”
de la fuerza, son perpendiculares, y por lo tanto el producto punto de los mismos es cero:

Por otra parte, como vimos arriba, la fuerza que actúa sobre una carga a consecuencia de su
interacción con el campo magnético es F = qvB, y además la magnitud de la aceleración
centrípeta dirigida en la misma dirección que de la fuerza está dada por:

a = ║ dV/dt ║ = V²/R

Entonces:

A continuación se llevarán a cabo los pasos algebraicos necesarios para despejar para la
velocidad V:
qB = m0V/R√ 1 - V²/c²

qB√ 1 - V²/c² = m0V/R

(qB)² (1 - V²/c²) = (m0V/R)²

(qB)² = [(m0/R)² + (qB/c)²] V²

V² = (qB)²/[(m0/R)² + (qB/c)²]

V² = (qBR)²/[(m0)² + (qBR/c)²]

V² = (qBR/m0)²/[1 + (qBR/m0c)²]

Finalmente, extrayendo raíz cuadrada, obtenemos el resultado deseado:

PROBLEMA: Supóngase que un haz de electrones describe un círculo de 0.2 metros de radio
en un campo magnético uniforme con una densidad de flujo magnético igual a 0.03 teslas.
¿Cuál es la velocidad de dichos electrones?

Cada electrón en el haz de electrones posee la siguiente carga y masa en el sistema de unidades
MKS:

q = 1.6 · 10-19 coulomb

m0 = 9.1 · 10-31 kilogramo

Con esto:

qBR/m0 = (1.6 · 10-19 coulomb) (0.03 tesla) (0.2 metros)/9.1 · 10-31 kilogramo

qBR/m0 = 1.0549 · 109 metros/segundo


qBR/m0 = 3.5165 c

Aplicando la fórmula obtenida en el problema anterior:

V = 3.5165 c / √ 1 + (3.5165)²

V = 0.962 c

Trabajando sobre uno de los pasos intermedios en la derivación de la fórmula:

qB√ 1 - V²/c² = m0V/R

podemos obtener la siguiente relación:

qBR = m0V/√ 1 - V²/c²

qBR = γm0V

Pero lo que tenemos en el lado derecho es simplemente el momentum relativista:

qBR = p

Esta también es otra relación útil en la resolución de problemas de este tipo

La ecuación más famosa de Einstein


Antes del advenimiento de la Teoría Especial de la Relatividad, los físicos contaban con dos
leyes de conservación independientes: la ley de la conservación de la materia enunciada desde
los tiempos del químico francés Antoine-Laurent Lavoisier que nos dice que la cantidad total de
materia que hay en el universo nunca cambia (la materia no se crea ni se destruye, simplemente
se transforma) y la ley de la conservación de la energía enunciada como la primera ley de la
termodinámica (no es posible sacar energía de la nada, porque la energía ni se crea ni se
destruye). Ambas leyes eran consideradas independientes la una de la otra. Una consecuencia
sorprendente de la Teoría Especial de la Relatividad es que ambas leyes pueden ser fusionadas
en una sola: la ley de la conservación de la masa-energía(obsérvese que al igual que los
conceptos independientes del espacio y el tiempo terminaron siendo fusionados en un solo
concepto único e indivisible, el espaciotiempo, también la masa y la energía terminan siendo
fusionados en uno solo, la masa-energía), al descubrirse que toda masa equivale e inclusive
puede ser convertida a una cantidad limitada de energía (este es el mismo principio bajo el cual
operan las bombas atómicas y con el cual nuestra estrella el Sol nos proporciona cantidades
abundantes de energía que posibilitan la vida en la Tierra) y viceversa. Aquí se verá cómo fue
que se llegó a esta conclusión.

El concepto de que la energía no se crea ni se destruye, de que la energía no puede salir de la


nada, es un concepto tan esencial en el estudio de la Naturaleza que ni siquiera Einstein se
atrevió a modificarlo en lo más mínimo. De este modo, tanto en la mecánica clásica como en la
mecánica relativística, el principio de la conservación de la energía en una de sus formulaciones
nos dice que la energía cinética K adquirida por un cuerpo debe ser igual al trabajo hecho por
una fuerza externa F al aumentar la velocidad del cuerpo desde cero hasta un valor u. Por
definición:

K = ∫F·ds

Para un movimiento unidimensional que se lleva a cabo a lo largo del eje-x:

K = ∫0 u Fdx

La fuerza relativística F está dada por el cambio del momentum relativístico P = γm0u con
respecto al tiempo (siendo m0 la masa en reposo del cuerpo, la cual es una constante), de tal
modo que:

K = ∫0 u [d/dt(γm0u)] dx

K = ∫0 u [d(γm0u)] [dx/dt]

K = ∫0 u [d(γm0u)] [u]

K = ∫0 u u·d(γm0u)

En el factor de corrección γ es importante reemplazar la velocidad constante V por la


velocidad variable u ya que como resultado de la aplicación de la fuerza F la velocidad del
cuerpo estará aumentando constantemente:

γ = 1 / √1 - u²/c²
Tomando diferenciales de la cantidad γm0u usando la regla d(uv) = udv + vdu:

d(γm0u) = m0γdu + m0udγ

De acuerdo al cálculo infinitesimal, la diferencial dγ es igual a:

dγ = d (1 /√1 - u²/c²)

dγ = d {1 - u²/c²}-½

dγ = (u/c²) {1 - u²/c²}-3/2 du

Con esto, la diferencial d(γm0u) resulta ser:

d(γm0u) = m0 [ {1 - u²/c²}-½ du + (u/c²) {1 - u²/c²}-3/2 du ]

Simplificando con un poco de álgebra, esto se reduce a:

d(γm0u) = m0 {1 - u²/c²}-3/2 du

Con esto, regresando a la expresión original de la energía cinética K:

K = ∫0 u u·d(γm0u)

K = ∫0 u u·{m0 {1 - u²/c²}-3/2 du)}

K = m0 ∫0 u { {1 - u²/c²}-3/2 u du)}

Llevando a cabo la integración y tomando los límites:

K = m0c² [ (1 - u²/c²)}-½ - 1 ]

K = γm0c² - m0c²

Este resultado nos dice que la energía cinética K de un cuerpo representa la diferencia entre lo
que llamaremos la energía total E de la partícula en movimiento y la energía en reposoE0 de
la partícula precisamente cuando la partícula está en reposo.
K = E - E0

en donde:

E = γm0c²

E0 = m0c²

La conclusión que hemos dado a las definiciones anteriores es correcta ya que si la velocidad del
cuerpo es cero, entonces V/c también es igual a cero y el factor γ = 1, con lo cual tendríamos que
E = m0c² y por lo tanto K = 0, o sea una energía cinética de cero (un cuerpo en reposo no tiene
energía de movimiento, su energía cinética K es cero). Habiendo definido la energía en reposo
que posee el cuerpo cuando no se está moviendo ante nosotros de modo tal que

E0 = m0c²

nos vemos obligados a concluír que la masa de todo cuerpo en reposo equivale a cierta
cantidad de energía dada por la ecuación anterior, la materia y la energía son dos
cosas completamente equivalentes, son dos manifestaciones distintas de lo mismo. Así como
los conceptos independientes del espacio y del tiempo fueron fusionados en un solo concepto
único e indivisible bajo una sola palabra, el espacio-tiempo, también la masa y la energía han
sido fusionadas como una sola cosa. Esta es indudablemente la conclusión más conocida de
Einstein, su fórmula más famosa, obtenida completamente dentro del marco de la Teoría
Especial de la Relatividad.

Toda cantidad limitada de materia es equivalente a cierta cantidad limitada de


energía, y viceversa. Y resulta que una cantidad muy pequeña de materia es equivalente a
una cantidad enorme de energía.

PROBLEMA: Verificar que la expresión relativista para la energía cinética de un cuerpo se


reduce a la expresión clásica para velocidades suficientemente bajas en comparación con la
velocidad de la luz.

Clásicamente, la energía cinética de un cuerpo está dada por la expresión:

K = ½ mv²
Para velocidades bajas en comparación con la velocidad de la luz, podemos recurrir al teorema
del binomio para expandir el primer término en el lado derecho de la igualdad de la expresion

K = γm0c² - m0c²

K = (1 /√1 - u²/c²) m0c² - m0c²

K = {1 - u²/c²}-½ m0c² - m0c²

K = {1 + (½) (u²/c²) + ...} m0c² - m0c²

Ignorando los términos de orden superior, tenemos que la expresión relativista se nos reduce a:

K = m0c² + (½) (u²/c²) m0c² - m0c²

K = ½ m0u²

lo cual está en acuerdo con la expresión clásica.

Una forma común de abreviar la expresión para la energía cinética relativista K, fácil de
recordar, es la siguiente:

K = (γ - 1) m0c²

Sin embargo, esta expresión resumida no muestra en forma explícita la relación que hay entre la
energía cinética relativista K, la energía total E y la energía en reposo, y debe ser considerada
más bien como una ayuda mnemotécnica en la resolución de problemas.

PROBLEMA: Si la energía en reposo de un gramo de agua pudiera ser transformada


completamente en energía, ¿cuánta agua podría ser calentada desde los cero grados
centígrados (el punto de congelación del agua) hasta los cien grados centígrados (el punto de
ebullición del agua)? Tómese 1 caloría = 4.19 joules.

Los cálculos serán llevados a cabo bajo el sistema MKS de unidades. Un gramo de agua es igual
a una milésima de kilogramo, con lo cual la energía en reposo de un gramo de agua es igual a:
E0 = m0c²

E = (0.001 Kg) (3·108 metros/segundo)

E = 9·1013 Kg·metro²/segundo²

E = 9·1013 joules

E = 2.14·1013 calorías

Por la misma definición de lo que es una caloría, la capacidad calorífica del agua;

C = ΔQ/mΔT

es igual a la cantidad de calor requerida para elevar la temperatura de un gramo de agua en un


grado centígrado, o sea C = 1 caloría/gramo·°C.

Si el calor ΔQ proviene de la energía en reposo E de un gramo de agua, entonces:

m = ΔQ/CΔT = E/CΔT

m = E/CΔT

m = (2.14·1013 calorías)/(1 caloría/gramo·°C)(100 °C)

m = 2.14·1011 gramos = 2.14·1011 Kg

m = 214,000,000 Kg.

Podríamos calentar 214 mil toneladas de agua llevándolas desde su punto de su punto de
congelación hasta su punto de ebullición con tan sólo la energía que podríamos obtener
convirtiendo la masa de un gramo de agua en energía.

La enorme cantidad de energía que podemos obtener de una cantidad tan pequeña de materia es
precisamente el medio mediante el cual nuestra propia estrella el Sol nos puede proporcionar
diariamente abundantes cantidades de energía que hacen posible la vida en la Tierra. Cada día
somos testigos de una de las confirmaciones más espectaculares de la Teoría Especial de la
Relatividad.

PROBLEMA: Un electrón es acelerado en un ciclotrón hasta alcanzar una energía cinética K


de 2 GeV (= 109 eV). ¿Cuál es la relación entre la masa del electrón que ha sido acelerado y su
masa en reposo?

La relación entre la masa m del electrón que ha sido acelerado y su masa en reposo m0 se puede
expresar como m/m0 o bien mc²/m0c². Tenemos además lo siguiente:

E = K + E0

mc² = K + m0c²

Entonces:

m/m0 = mc²/m0c² = (K + m0c²) /m0c² = (2·109 eV + 0.511·106 eV) / 0.511 MeV

m/m0 = 3,914

De este modo, una vez acelerado por el ciclotrón, el electrón se comporta como si tuviera una
masa casi 4 mil veces mayor que la que tiene cuando está en reposo. Sin embargo, esta no es una
masa real en el sentido de que el electrón haya aumentado su masa propia. Lo que sucede es que
la energía que le ha sido impresa hace que experimentalmente se comporte como si tuvierse una
masa mucho mayor que la que realmente tiene, en virtud de la equivalencia que hay entre la
masa y la energía.

Lo que acabamos de obtener nos permite analizar los procesos de índole atómica o sub-atómica
en los cuales por la desintegración de un átomo tengamos dos o más partículas resultantes cuyas
masas sumadas no sean iguales a la masa del átomo original (lo que llamamos un defecto de
masa) nos indica que, al no haber desaparecido dicha masa hacia la nada, necesariamente tuvo
que haber sido convertida dicha masa ausente en energía pura, ya que el principio de la
conservación de la energía sigue siendo completamente válido inclusive dentro de la Teoría de la
Relatividad.

Antes de continuar, definiremos una unidad ampliamente utilizada en la resolución de


problemas de índole atómica y sub-atómica, el electron-voltio simbolizado como eV. Es la
energía E adquirida por la carga q de un electrón cuando es acelerado por una
diferencia ΔV de potencial eléctrico de un voltio, bajo la fórmula E = qΔV, aplicándosele las
mismas convenciones del sistema de unidades MKS, de modo tal que MeV representa una
energía medida en millones de electron-voltios. Puesto que la carga de un electrón es igual a
1.6·10-19 coulombs en el sistema MKS de unidades, tenemos entonces el siguiente factor de
conversión:

1 eV = (1.6·10-19 coulombs) · (1 volt) = 1.6·10-19 joule

PROBLEMA: ¿Cuál es la energía en reposo de un electrón, sabiendo que su masa en reposo el


sistema MKS es de 9.1·10-31 Kg? Dar la respuesta tanto en joules como en MeV.

Este problema tiene una resolución directa:

E0 = m0c²

E0 = (9.1·10-31 Kg) (3·10-8 metros/seg)²

E0 = 8.19 10-14 joules

E0 = (8.19 10-14 joules) (1 eV /1.6·10-19 joule) (1 MeV / 106 eV)

E0 = 0.511 MeV

La energía en reposo dentro de la Teoría de la Relatividad es una forma nueva de proporcionar


la masa en reposo de una partícula, lo cual tiene sus ventajas en estudios de física atómica y
nuclear, como lo demuestra lo que veremos a continuación.

PROBLEMA: La energía en reposo de un protón es de 938.256 MeV, y la energía en reposo


de un neutrón es de 939.550 MeV. Si la energía en reposo de un deuterón (una partícula
nuclear formada por un protón y un neutrón unidos el uno al otro) es de 1875.580 MeV, ¿es
factible esperar que el deuterón se pueda fisionar por sí solo descomponiéndose en sus partes
elementales?

Sumando las energías en reposo del protón y el neutrón:

938.26 MeV + 939.55 MeV = 1877.81 MeV


encontramos que, por una diferencia pequeña, las energías en reposo de ambas partículas
tomadas independientemente es mayor que la energía en reposo del deuterón, y por lo tanto el
deuterón no se puede fisionar por sí solo. Se requiere suministrarle una energía al deuterón para
provocar tal fisión, ya que la energía del enlace es:

1877.81 MeV - 1875.58 MeV = 2.23 MeV

Esta energía necesaria para romper el enlace puede ser suministrada ya sea bombardeando al
deuterón con una partícula energética o con radiación electromagnética. Del mismo modo,
cuando se forma un deuterón, se libera una cantidad de energía igual a los 2.23 MeV que serían
necesarios para volver a descomponerlo en sus partes esenciales.

PROBLEMA: ¿Cuál es la velocidad adquirida por un electrón que es acelerado a través de


una diferencia de potencial de 100 mil voltios?

La energía cinética (no la energía total que incluye la masa en reposo) adquirida por un electrón
bajo una diferencia de potencial de 100 mil voltios es igual a K = qΔV = (1 electrón)(100 mil
voltios) = 100 KeV. Entonces, empleando la relación relativista:

K = γm0c² - m0c²

K = (γ - 1) m0c²

La masa en reposo del electrón ya la obtuvimos en un problema previo, es de 0.511 MeV. Por lo
tanto:

100 KeV = (γ - 1) (0.511 MeV)

γ - 1 = 0.1957

γ = 1.1957

1 / √1 - u²/c² = 1.1957

u = 0.548c
PROBLEMA: Un mesón K0 en reposo decae en dos mesones π0:

K0 → π0 + π 0

Si la energía en reposo del mesón K0 es de 498 MeV y la energía en reposo del mesón π0 es de
135 MeV, ¿cuál será la energía cinética K de cada mesón π0 suponiendo que toda la energía
que resulta del decaimiento del mesón K0 será portada como energía cinética por ambas
partículas π0 resultantes del decaimiento?

Si la energía en reposo de cada mesón π0 es de 135 MeV, entonces la energía en reposo de dos de
dichas partículas será de 270 MeV, una diferencia de 228 MeV con respecto a la energía en
reposo de 498 MeV del mesón K0. Por el principio de la conservación de la energía, la energía
total inicial Einicial que es igual a la energía en reposo del mesón K0debe ser igual a la energía en
reposo de cada mesón π0 más la energía cinética K con la que sale disparado cada mesón en
sentido contrario:

Einicial = Efinal

Einicial = (m2c² + K) + (m2c² + K)

Einicial = 2m2c² + 2K

498 MeV = 2 (135 MeV) + 2K

K = 114 MeV
En el problema anterior, toda la energía aparentemente perdida termina siendo convertida en la
energía cinética de las dos partículas resultantes.

El diagrama espacio-tiempo para lo que acabamos de ver tendrá el siguiente aspecto en el cual
una línea del mundo única para una sola partícula se rompe en dos líneas del mundo diferentes
para dos partículas diferentes, una moviéndose en un sentido (hacia la derecha, en la
dirección +x) y la otra moviéndose en el sentido contrario (hacia la izquierda, en la dirección -x):

PROBLEMA: Un cuerpo en reposo se rompe espontáneamente en dos partes que se mueven


en sentidos opuestos. Las masas en reposo y las velocidades de las partes son m 1 = 3 Kg a u1 =
0.8c y m2 = 5.33 Kg a u2 = 0.6c. Hallar la masa en reposo del cuerpo original.

Por el principio de la conservación de la energía:

Einicial = Efinal

La energía inicial es la del cuerpo que estaba en reposo, siendo ésta Einicial = mc². Las
energías totales de las dos partes en las que se rompe el cuerpo están dadas E1 =
γ1m1c² y E2 = γ2m2c²:
Entonces tenemos lo siguiente:

mc² = γ1m1c² + γ2m2c²

m = (√1 - u1²/c²) m1 + (√1 - u2²/c²) m2

m = (3 Kg / √1 - 0.64) + (5.33 Kg / √1 - 0.36)

m = 11.66 Kg

Así, al empezar teníamos una masa total de 11.66 Kg, y después de la desintegración terminamos
con una masa total de 8.33 Kg. En la Teoría de la Relatividad no hay un principio de
“conservación de la masa”. Lo que hay es un principio de conservación de la masa-
energía.

Habiendo visto procesos de desintegración, veamos ahora procesos relativistas que involucran
colisiones en las cuales dos cuerpos quedan trabados después del choque:

El análisis que llevaremos a cabo es completamente válido aunque el cuerpo absorbido no sea
un cuerpo material sino un fotón de luz, como lo veremos en el siguiente problema.

PROBLEMA: Se pueden presentar argumentos para demostrar que un fotón no puede ser
absorbido por un electrón libre. Sin embargo, puede ser absorbido por un electrón
estacionario en la vecindad de un núcleo pesado. Si un fotón con una energía de 1 MeV choca
con un electrón estacionario en la vecindad de un núcleo pesado, y si despreciamos la energía
de retroceso del núcleo, ¿cuál será la velocidad del electrón después del choque al ser sacado
fuera del átomo?

Apelamos nuevamente al principio de la conservación de la energía antes y después del choque:

Einicial = Efinal

Antes del choque, el sistema consiste en la energía Efoton de 1 MeV que lleva el fotón consigo
mismo, más la energía en reposo del electrón mec² más la energía en reposo mnc²del núcleo
pesado, y después del choque el sistema constará de la energía total del electrón en movimiento
sumada a la energía en reposo del núcleo pesado:

Efoton + mec² + mnc² = γmec² + mnc²

1 MeV + 0.511 MeV = γ (0.511 MeV)

γ = 2.957

u = 0.941c

Hay otros procesos de índole atómica en los cuales por la desintegración de un átomo también
se tienen dos o más partículas resultantes cuyas masas sumadas no son iguales a la masa del
átomo original (lo que llamamos un defecto de masa) pero en los cuales además de la energía
cinética que se lleve consigo cada partícula resultante hay una energía pura liberada como
energía radiante.

Existe una expresión muy útil que nos relaciona a la energía total E de un cuerpo con su
momentum relativista p. Si la energía total del cuerpo es E = γm0c² = γE0 y su momentum
relativista es p = γm0u, entonces usando E² = γ²E0² tenemos:

p² = γ²m0²u² = (γ² m0² c4) (u²/c4)


p² = γ² (m0c²)² (u²/c4) = γ² E0² u²/c4

Con esto:

E² - p² c² = γ² E0² (1 - u²/c²)

E² = p²c² + E0²

La relación anterior se puede memorizar mejor con la ayuda del siguiente “triángulo
relativístico”:

El “triángulo relativístico” se traza empezando con el pie del triángulo que es la masa en reposo
m0c² y levantando el otro cateto que representa la cantidad pc. Con un compás imaginario se
tiende un arco hasta cortar a la hipotenusa. El segmento adicional a la longitud m0c² (que es la
energía en reposo de la partícula) es el segmento K (que es la energía cinética de la partícula),
segmentos que sumados dan la longitud total de la hipotenusa que es también la longitud total
de la partícula. Aplicando entonces el teorema de Pitágoras a este triángulo rectángulo,
obtenemos la siguiente relación:

(K + m0c²)² = (pc)² + (m0c²)²

PROBLEMA: ¿Cuál es la relación entre la energía y el momentum de un fotón de luz?


En virtud de que los fotones viajan a la velocidad de la luz, su masa en reposo, de acuerdo con la
Teoría de la Relatividad, debe ser cero, y por lo tanto su energía debe ser totalmente cinética,
energía radiante pura. Si un fotón existe, entonces debe estarse moviendo a la velocidad de la
luz, y deja de existir en el momento en el que deja de moverse a esta velocidad (como cuando es
absorbido por uno de los orbitales de un átomo de hidrógeno haciendo saltar a un electrón en
dicho orbital a un nivel más alto de energía). Para una masa en reposo m 0 igual a cero (y por lo
tanto una energía en reposo E0 igual a cero), la relación relativista entre momentum y energía
nos conduce a:

E² = p²c² + E0²

E = pc

Se destaca aquí que esta relación es válida únicamente para un fotón, no para una partícula
material.

PROBLEMA: Calcular la cantidad de movimiento de un electrón cuya velocidad es 0.8c,


expresada en unidades MeV/c.

La cantidad de movimiento relativista está dada por p = γm0u. Entonces, con unas
manipulaciones simples y usando el resultado anterior de m0c² = 0.511 Mev para el electrón:

p = γm0u = γm0c² (u/c²)

p = (1 /√1 - u²/c²) m0c² (u/c²)

p = (1 /√1 - (0.8)²) (0.511 MeV) (0.8/c)

p = 0.681 MeV/c

PROBLEMA: Calcular el momentum para un electrón de 1 MeV dando la respuesta en


unidades MeV/c.

E² = p²c² + E0² = (pc)² + E0²

Se debe entender que la energía de 1 MeV es una energía cinética K. Entonces al electrón con
energía cinética K = 1 MeV hay que sumarle su energía en reposo para obtener su energía total E
ya que E = K + E0. Entonces:

(1 MeV + 0.511 MeV)² = (pc)² + (0.511 Mev)²

p = 1.42 MeV/c

PROBLEMA: Calcular la energía cinética de un electrón cuyo momentum es de 3 MeV/c.

E² = p²c² + E0²

(K + E0)² = (pc)² + E0²

(K + 0.511 MeV)² = [(3 Mev/c) c]² + (0.511 MeV)²

K = √9.261 MeV² - 0.511 MeV = 2.53 MeV

PROBLEMA: Demostrar que la velocidad relativista de una partícula está dada


por u = pc²/E.

Por un lado tenemos la expresión para el momentum relativista p = γm0u en donde el


momentum p es una cantidad vectorial que tiene la misma dirección y sentido que la
velocidad u de la partícula; y por el otro tenemos que la energía total E de la partícula es igual a
γm0c². Entonces γm0 = E/c² y:

p = (E/c²) u

u = pc²/E

PROBLEMA: Demostrar que la rapidez de una partícula está dada por u = dE/dp.

Por un lado, de la definición de la magnitud del momentum relativístico, tenemos:

p = γm0u

Tomando diferenciales sobre lo anterior:

dp = d(γm0u) = m0d(γu) = m0 (γdu + udγ)


La expresión simplificada para ya la obtuvimos anteriormente, y es:

d(γm0u) = m0 {1 - u²/c²}-3/2 du

Por otro lado tenemos:

E = γm0c²

Tomando diferenciales:

dE = d(γm0c²) = m0c² dγ

La expresión para dγ también la obtuvimos ya con anterioridad, y es:

dγ = (u/c²) {1 - u²/c²}-3/2 du

Entonces:

dE = m0c² (u/c²) {1 - u²/c²}-3/2 du

dE = (m0u) {1 - u²/c²}-3/2 du

Dividiendo dE entre dp obtenemos:

dE/dp = {(m0u) {1 - u²/c²}-3/2 du} / { m0 {1 - u²/c²}-3/2 du}

dE/dp = u

En este problema hablamos de la rapidez de una partícula, en contraste con el problema


anterior en el cual se habló acerca de la velocidad de la partícula, enfatizando el hecho de que la
rapidez es una cantidad a la cual no se le asigna dirección y sentido en oposición a la velocidad
que se representa vectorialmente por tener dirección y sentido. Así decimos que un carro tiene
una rapidez u de 30 kilómetros por hora sin especificar dirección, pero el mismo carro tiene
una velocidad u de 30 kilómetros por hora en el sentido Norte a Sur. La misma diferencia sutil
manejada en la física clásica se sigue manejando en la Teoría de la Relatividad.

Física atómica relativista


La ecuación
E = mc²

que nos dá la equivalencia relativista entre la materia y la energía mostró a la humanidad su


enorme poder cuando el 16 de julio de 1945 cerca de Alamogordo, Nuevo México, el hombre
detonó por vez primera una bomba basada no en el uso de la pólvora o en la nitroglicerina sino
en la fuerza del átomo:

Aunque hay quienes argumentan que la bomba atómica no es en realidad una transformación de
materia en energía, que sólo es una conversión de una energía potencial de ligadura almacenada
en los átomos que es convertida en otro tipo de energía, la ecuación relativista es esencial para
poder describir otros procesos en los cuales hay una transformación directa de materia en
energía y, algo más espectacular aún, la transformación de energía en materia.

Antes de proseguir, haremos un alto breve para repasar otros hechos que no vienen de la Teoría
de la Relatividad sino de otra rama de la física moderna, la Mecánica Cuántica. De acuerdo con
la Mecánica Cuántica, dependiendo del experimento que se esté llevando a cabo una misma
partícula puede comportarse como una partícula material o como una onda de materia. Esta
dualidad onda-partícula fue enunciada por vez primera por Louis de Broglie en 1924. Del mismo
modo, y dependiendo del experimento que se esté llevando, un haz luminoso puede comportarse
como una onda electromagnética o como si estuviese formado de partículas discretas llamadas
fotones. La energía de cada una de estas partículas está dada por la relación:

E = hf

en donde E es la energía del fotón individual, f es la frecuencia de la luz que el fotón lleva
consigo, y h es una constante conocida como la constante de Planck cuyo valor experimental es
el siguiente en dos sistemas de unidades distintos:

h = 6.626·10-34 Joule·segundo

h = 4.136·10-15 eV·segundo

La constante de Planck es una constante física de carácter universal tan fundamental para la
Mecánica Cuántica como la constante de gravitación universal G lo es para cuantificar la
atracción de la gravedad.

Para abreviar cálculos, y utilizando la definición del Angstrom como medida de longitud:

1 Angstrom = 1 Å = 10-8 centímetro = 10-10 metro

es frecuente utilizar la expresión siguiente:

hc = (4.136·10-15 eV·segundo)(3·108 metros/segundo)(1 Å/10-10 metros)

hc = 12.4 KeV·Å

Puesto que los fotones viajan a la velocidad de la luz, su masa en reposo de acuerdo con la Teoría
de la Relatividad debe ser cero y por lo tanto su energía debe ser totalmente una energía de
movimiento (energía cinética). Para una masa en reposo de cero, m 0 = 0, la relación relativista
entre momentum y energía:

E² = (pc)² + E0

se convierte en

E = pc

en virtud de que E0 = m0c² = 0, lo cual nos permite obtener otra relación importante, la que nos
proporciona el momentum del fotón:

E = hf = pc

p = hf/c
p = h/λ

Esta última relación inspeccionada en detalle por vez primera tal vez pueda dejar un poco
perplejos a quienes crecieron acostumbrados a la idea Newtoniana del momentum definido
como la masa de una partícula multiplicada por su velocidad, ya que si la masa (en reposo) de
una partícula es cero la definición parecería inaplicable. Sin embargo, el fotón aunque tenga una
masa de reposo igual a cero definitivamente tiene una energía cinética de movimiento, y es con
esta energía cinética de movimiento hacia la cual extendemos nuestro concepto de momentum.

PROBLEMA: Calcular la longitud de onda y la frecuencia de un fotón de 2.0 KeV.

E = pc = (h/λ) c = (hc)/λ

λ = (hc)/E = 12.4 KeV·Å/2.0 KeV = 6.2 Å

f = c/λ = (3·108 metros/segundo)/(6.2·10-10 metros) = 4.84·1017 Hertz

La unidad derivada para el momentum mv está dada como 1 Kilogramo·metro/segundo. Sin


embargo, en cálculos relativistas es frecuente utilizar las unidades de MeV/c para el momentum,
lo cual proviene de la expresión relativista que relaciona la energía y el momentum:

E² = p²c² + E0²

PROBLEMA: Calcular el momentum de un fotón de 20 MeV.

p = E/c = (20 MeV)/c = 20 MeV/c

A la hora de calcular el momentum para una partícula, es muy importante tener en cuenta si se
trata de un fotón o de una partícula material, porque en este último caso es necesario utilizar la
expresión relativista completa en virtud de que la energía en reposo de una partícula material no
es cero.
PROBLEMA: Calcular el momentum para un electrón de 2 MeV.

En este caso, se trata de una partícula material, un electrón, cuya masa en reposo ya habíamos
visto en una entrada anterior que es igual a 0.511 MeV. Entonces:

E² = p²c² + E0²

(K + m0c²)² = (pc)² + (m0c²)²

( 2 MeV + 0.511 MeV)² = (pc)² + (0.511 MeV)²

p = 6.305 -.2611 = 2.458 MeV/c

PROBLEMA: Calcúlese la energía cinética de un neutrón cuyo momentum es de 200 MeV/c.


Tómese la masa en reposo del neutrón como 939.55 MeV.

(K + m0c²)² = (pc)² + (m0c²)²

(K + 939.55 MeV)² = (200 MeV/c · c)² + (939.55 MeV)²

K = 21.05 MeV

Como resultado de la equivalencia E = mc² es enteramente posible (y de hecho ocurre) que al


impactar una partícula sub-atómica con otra haya una conversión de buena parte de la energía
cinética en energía radiante produciéndose un fotón en donde antes no lo había. Todo es
cuestión de que los balances de energía antes y después de la colisión lo permitan.

PROBLEMA: Calcúlese la frecuencia de un fotón producido cuando un electrón de 20 KeV


queda en reposo al chocar con un núcleo atómico pesado, suponiendo que toda la energía que
llevaba el electrón va a dar al fotón. ¿Se conserva el momentum en este proceso?

Supondremos que el núcleo pesado queda igual tanto antes como después del choque, y por lo
tanto su masa en reposo sigue siendo la misma y puede ser sacada fuera de los cálculos al
permanecer invariable.

Si un electrón va en camino para chocar con un núcleo pesado, entonces el balance total de la
energía total antes del choque (no tomando en cuenta la masa en reposo del núcleo pesado) es
igual a la energía cinética relativista K que lleva el electrón sumada a la masa en reposo del
electrón de 0.511 MeV. La energía cinética después del choque será igual a la energía del fotón
creado, o sea E = hf, sumada a la energía en reposo del electrón el cual al quedar en reposo
pierde toda la energía cinética que llevaba entregándola para la creación del fotón. Como el
principio de la conservación de la energía exige que la energía total antes del choque sea igual a
la energía total después del choque, entonces tenemos que:

Einicial = Efinal

K + m0c² = hf + m0c²

f = K/h = 20·103 eV/4.136·10-15 eV·segundo

f = 4.836·1018 ciclos/segundo = 4.836·1018 Hertz

El momentum del electrón antes del choque lo encontramos a partir de la ecuación relativista:

(K + m0c²)² = (pc)² + (m0c²)²

(0.o20 MeV + 0.511 MeV)² = (pc)² + (0.511 MeV)²

pinicial = 0.144 MeV/c

Por otro lado, si toda la energía que llevaba el electrón va a dar a la producción del fotón,
entonces el fotón tendrá una energía de 20 KeV y su momentum será:

p = E/ c

pfinal = 20 KeV/c

Aparentemente, tenemos aquí un caso en el que el momentum no se conserva como resultado de


la colisión, ya que del momentum inicial que teníamos de 0.144 MeV/c ahora sólo nos queda un
momentum de 20 KeV/c. Esta diferencia se explica por el hecho de que el momentum restante
es absorbido por el núcleo que detiene al electrón.

Uno de los primeros resultados extraordinarios de la unión entre la Teoría Especial de la


Relatividad y la Mecánica Cuántica fue logrado por el físico teórico inglés Paul Adrian Maurice
Dirac en 1928: la predicción de la existencia de la antimateria, específicamente la predicción de
la existencia de una partícula bautizada como el positrón (la antipartícula del electrón), una
predicción que fue confirmada experimentalmente cuatro años después por Carl Anderson en
1932, el concepto de la antimateria es algo que llegó a nosotros para quedarse. Hay varias
formas en las cuales se puede producir experimentalmente en el laboratorio un positrón, y una
de ellas es precisamente mediante la conversión relativista de energía pura en partículas de
materia. A continuación tenemos una ilustración del principal y mejor conocido proceso
mediante el cual un fotón luminoso, energía radiante pura, se convierte en dos partículas de
materia:

En este proceso, un fotón de alta energía pasa cerca del núcleo de un átomo, y ayudado con su
interacción con el campo eléctrico intenso que hay en la cercanía del núcleo del átomo que
absorbe en buena parte el momentum del fotón, el fotón se transforma en dos partículas de
materia, un electrón y un positrón (el positrón es una partícula idéntica al electrón pero con
carga electrica positiva en lugar de negativa, de allí su nombre). Aunque la tendencia de dos
cargas eléctricas de signo contrario es atraerse la una a la otra, en el diagrama tenemos la
influencia de un campo magnético exterior aplicado al conjunto, el cual hace que el electrón
inicie una trayectoria circular en un sentido (en el sentido de las manecillas del reloj) mientras
que el positrón la inicia en el sentido opuesto (en sentido contrario a las manecillas del reloj).
Visto más de cerca el proceso, si imaginamos al núcleo del átomo (con carga eléctrica positiva)
cubierto por varias capas de electrones (cargas eléctricas negativas) en torno suyo, entonces
para esta interacción mediante la cual la energía radiante se transforma en materia en materia el
fotón debe atravesar esas capas de electrones para llegar a la cercanía del núcleo del átomo, lo
cual puede hacer sin problema alguno porque un fotón de luz es eléctricamente neutro. En pocas
palabras, tenemos una situación como la que se muestra a continuación (obsérvese con cuidado
que el fotón no es uno que choca de frente con el núcleo del átomo):

El par de partículas producido ha sido identificado con letras rojas para no confundirlo con los
electrones que están orbitando como constituyentes del átomo, con la letra e-simbolizando al
electrón del par con su carga negativa y con la letra e+ simbolizando al positrón del par con su
carga positiva.

De acuerdo con el principio de la conservación de la masa-energía (ya no estamos hablando del


principio de la conservación de la materia y el principio de la conservación de la energía como
cosas separadas, sino como manifestaciones distintas de una misma cosa), para que se puedan
producir dos partículas como el electrón y el positrón a partir de un fotón se requiere que la
energía del fotón sea igual por lo menos a la masa en reposo de las dos partículas, ya que de lo
contrario no podrá haber ninguna conversión en energía en materia bajo ningún tipo de
circunstancia. Puesto que en la fórmula relativista de equivalencia entre masa y energía tenemos
como factor multiplicativo el cuadrado de la velocidad de la luz, se requiere una gran cantidad
de energía para poder producir tan sólo una muy pequeña cantidad de masa. Esta es la razón
por la cual los fotones de la luz visible tienen una energía insuficiente para convertirse bajo
condiciones normales en partículas de materia. Ni siquiera los fotones de rayos-X tiene la
energía suficiente para transmutarse en partículas atómicas ligeras. Se requiere de fotones de
muy alta energía conocidos como rayos-gamma para que estos puedan producir partículas de
materia. Y las partículas de materia que puedan ser producidas a partir de un fotón tienen que
ser partículas sumamente ligeras, ya que la creación de una partícula como un protón o un
neutrón requiere de una cantidad extremadamente grande de energía con todo y que estamos
hablando de pequeñísimas partículas atómicas.

Si la masa en reposo del electrón, medida en unidades MeV, es de 0.511 MeV, entonces el fotón
debe tener por lo menos una energía de 1.022 MeV para poder producir las dos partículas (el
electrón y su contraparte el positrón) en reposo. Y puesto que la energía de un fotón depende en
forma directa de la frecuencia de la onda electromagnética que representa, podemos hablar de
una frecuencia de umbral (threshold frequency) debajo de la cual un fotón no nos podrá
producir un par electrón-positrón, o bien de una longitud de onda umbral arriba de la cual
la creación del par no será posible.

PROBLEMA: Determinar la longitud de onda umbral para la creación de un par electrón-


positrón.

Puesto que el fotón se mueve a la velocidad de la luz, su longitud de onda de umbral λu y su


frecuencia de umbral fu están relacionadas como:

c = fu · λu

Y puesto que la energía del fotón individual está dada por E = hf, tenemos entonces:

E = h · c / λu

λu = hc/E

λu = (4.136·10-15 eV·segundo)(3·108 metros/segundo)/(1.022·106 eV)

λu = 0.0121 Angstroms

Pero no sólo la masa-energía debe ser conservada antes y después de la transformación de la


energía en materia, también se requiere la conservación del momentum. Como lo vimos arriba,
el momentum del fotón está dado por p = h/λ, y esta es una cantidad que también tiene que ser
conservada. En el umbral, toda la energía del fotón se nos va en la producción de un electrón y
un positrón con energía cinética cero, pero al estar en reposo el momentum inicial del fotón
parecería haberse esfumado hacia la nada, lo cual no puede ser. Esta es la razón por la cual se
requiere de la cercanía del núcleo de un átomo pesado, en virtud de que para que el momentum
se pueda conservar se requiere de algo que pueda absorber el momentum del fotón inicial; esto
es precisamente lo que hace el núcleo del átomo, actuar como una especie de amortiguador que
absorbe el momentum que el fotón traía consigo. Puesto que el núcleo del átomo es miles de
veces más masivo que el electrón y el positrón juntos, puede absorber una gran cantidad de
momentum sin necesidad de tener que absorber mucha energía. Esta es la razón por la cual la
producción de pares es observada cuando rayos gamma de alta energía penetran un sólido en
donde hay un núcleo atómico de alta densidad. El requerimiento de la cercanía del núcleo para
lograr la conservación del momentum nos indica que la producción de pares no puede darse en
el vacío.

El requerimiento de la conservación del momentum no es el único argumento que puede


esgrimirse para negar la posibilidad de que la producción de pares pueda darse en el vacío.
También podemos recurrir a argumentos de índole puramente relativista.

PROBLEMA: Demostrar, usando únicamente argumentos relativistas, que la producción


espontánea de pares de partículas a raíz de un fotón de luz no puede darse en el espacio vacío.

La producción de un par de partículas debe ser considerada, hablando relativísticamente, como


una invariante. Si un observador encuentra que se ha producido un par de partículas entonces
cualquier otro observador que esté en moviento con respecto al primero también encontrará que
se ha producido ese par de partículas. Sin embargo, como ya lo vimos en la entrada
correspondiente al efecto Doppler relativista, la longitud de onda (o bien la frecuencia) de un
fotón difiere de un observador a otro, esto es precisamente lo que dá origen al desplazamiento
Doppler. Siempre es posible encontrar un observador que se esté moviendo con una velocidad y
dirección tales que la longitud de onda de un fotón dado esté por encima de la longitud de
umbral mínima necesaria para la creación de un par de partículas. En el problema resuelto
arriba, esta longitud de onda resultó ser igual a 0.0121 Angstroms. Si el observador se está
moviendo con respecto a un fotón en tal forma que la longitud de onda del fotón es de unos 0.5
Angstroms, para este observador no será posible que el fotón pueda convertirse en un electrón y
en un positrón puesto que no tiene la suficiente energía para ello. Puesto que este observador
encuentra que la producción de pares no es posible en el espacio vacío, cualquier otro
observador encontrará también que es imposible la producción de un par en un espacio
vacío. Se requiere forzosamente de la cercanía de un núcleo atómico pesado para que en la
interacción del fotón con el mismo se reúnan las condiciones necesarias para la creación del
par. La cercanía del contenido energético del campo eléctrico del núcleo es lo que compensa por
el movimiento relativo que pueda tener otro observador que detecta un corrimiento Doppler que
disminuye el contenido energético del fotón, ya que al ocurrir tal cosa aumenta la velocidad del
núcleo con respecto al observador en movimiento y con ello aumenta el núcleo su contenido
energético relativista total con respecto a dicho observador.

PROBLEMA: Un fotón de longitud de onda 0.00030 Å produce un par electrón-positrón en la


vecindad de un núcleo pesado. Calcular la energía cinética de cada una de las partículas si la
energía cinética del positrón es el doble de la energía cinética del electrón.

Del principio de la conservación de la energía tenemos:

Einicial = Efinal

La energía inicial es la que posee el fotón, y la energía final es la que poseen el positrón y el
electrón sumadas a sus masas en reposo que son 0.511 MeV para ambos. Designando a la
energía cinética del positrón como K+ y a la energía cinética del protón como K- con lo cual K+ =
2K- , entonces:

hf = Epositron + Eelectron

hc/λ = K+ + m0c² + K- + m0c²

(12.4 KeV·Å)/(0.0030 Å) = 2K- + 0.511 MeV + K- + 0.511 MeV

4.133 MeV = 3K- + 1.022 MeV

K- = 1.037 MeV para el electrón

K+ = 2K- = 2(1.037 MeV) = 2.074 MeV para el positrón

Hemos visto cómo es posible que ocurra el espectacular proceso de conversión de energía en
materia al llevarse a cabo experimentos con rayos gamma incidiendo sobre elementos con
número atómico elevado (este proceso es uno de los procesos más efectivos de absorción de
rayos gamma que se conocen). El fenómeno de aniquilación de partículas, el proceso
inverso a la creación de pares de partículas, es el que que ocurre cuando juntamos materia con
antimateria, y es el que estudiaremos a continuación.

PROBLEMA: Demuéstrese que la aniquilación de un par electrón-positrón produciendo un


solo fotón de luz no puede ocurrir.

La aniquilación de un par de partículas produciendo un solo fotón constituiría una violación


directa a los principios de conservación de la energía y el momentum. Si consideramos al
electrón y al positrón inicialmente en reposo, el momentum inicial debe ser cero, y entonces tras
la aniquilación el momentum final debe seguir siendo cero. Pero si se produce un solo fotón, el
cual lleva consigo una cantidad definitiva de momentum p = E/c, no habría un fotón viajando en
sentido opuesto cancelando con una cantidad igual de momentum negativo el momentum del
otro fotón.

PROBLEMA: Calcúlense las energías de los dos fotones que se producen cuando ocurre una
aniquilación entre un electrón y un positrón inicialmente juntos en reposo.

En virtud de que el momentum inicial del par electrón-positrón antes de la aniquilación es cero
por estar ambas partículas en reposo, el momentum final después de la aniquilación también
debe ser cero, lo cual implica que los dos fotones deben salir disparados en direcciones
contrarias y deben tener de la misma energía. La energía de cada partícula del par es 0.511 MeV,
de modo tal que el par combinado tiene una energía en reposo igual a 1.022 MeV. Al producirse
los dos fotones a partir de esta energía previa de 1.022 MeV, cada fotón se lleva la mitad de
dicha energía. Entonces las energías de los dos fotones es de 0.511 MeV.

PROBLEMA: Un electrón y un positrón llevan a cabo un choque frontal, y la aniquilación de


pares que dá como resultado la creación de dos fotones de 1.0 MeV cada uno viajando en
sentidos opuestos. ¿Cuáles eran las energías cinéticas del electrón y el positrón antes del
choque?

Puesto que los dos fotones salen disparados en sentidos opuestos y tienen la misma energía
Eγ de 1.0 MeV, el momentum final después de haberse llevado a cabo la aniquilación del par
debe ser cero. Esto a la vez implica que el electrón y el positrón han de haber tenido energías
cinéticas K+ y K- iguales antes del choque. Haciendo el balance de la energía antes y después del
choque e igualando en virtud del principio de la conservación de la energía, tenemos lo
siguiente:
K+ + m0c² + K- + m0c² = Eγ + Eγ

2K + 2m0c² = 2Eγ

2K + 2(0.511 MeV) = 2 (1.0 MeV)

Eγ = 0.489 MeV

PROBLEMA: Después de una aniquilación de un par en reposo, se encuentra que se producen


tres fotones. ¿Cuál es la energía del tercer fotón, si los otros dos fotones producidos tienen
energías de 0.10 MeV y 0.20 MeV?

Aplicando el principio de la conservación de energía al par inicialmente en reposo (con energía


cinética K igual a cero para ambas partículas del par):

Einicial = Efinal

m0c² + m0c² = Efoton-1 + Efoton-2 + Efoton-3

0.511 MeV + 0.511 MeV = 0.1 MeV + 0.2 MeV + Efoton-3

Efoton-3 = 0.722 MeV

PROBLEMA: ¿Cuál es la cantidad máxima de positrones que puede producir un fotón de 100
MeV?

La cantidad máxima de positrones que pueda producir un fotón de 100 MeV tendrá lugar
cuando todos los pares de partículas sean partículas en reposo, y cada par que incluye un
positrón tiene una energía en reposo igual al doble de cada partícula del par, o sea igual a
2(0.511 MeV) = 1.022 MeV. Entonces la cantidad máxima de positrones que pueda producirse
será igual a:

100 MeV / 1.022 MeV = 97 positrones

En todo lo que hemos estudiado, la equivalencia E = mc² es una fórmula indispensable para
poder explicar en el análisis de fenómenos atómicos el destino de materia que aparece o
desaparece aparentemente de la nada al igual que energía que aparece o desaparece
aparentemente de la nada. Si Einstein no hubiera obtenido dicha fórmula a partir de los dos
postulados básicos de la Teoría Especial de la Relatividad, lo más seguro es que al ir avanzando
la física atómica y nuclear dicha fórmula se habría tenido que deducir empíricamente, a reserva
de que algún teórico explicase su verdadero significado. Es posible que tengamos en estos
momentos fórmulas a la mano detrás de las cuales hay mucha filosofía de fondo y de la cual ni
siquiera nos estamos dando cuenta.

Puesto que las expresiones clásicas (no-relativistas) son más sencillas de utilizar que las
expresiones relativistas, surge la interrogante sobre aquellos casos en los cuales sea válido
utilizar con un buen grado de aproximación las expresiones clásicas en lugar de las expresiones
relativistas, sabiendo de antemano que conforme el factor γ se acerca a la unidad (γ→1) las
fórmulas relativistas se reducen a sus contrapartes clásicas. De la relación entre la energía
cinética relativista K, la energía total E y la energía en reposo m 0c²:

K = E - E0

K = γm0c² - m0c²

tenemos que γ es igual a:

γ = 1+ (K/m0c²)

Aquí vemos que cuando la energía cinética K es mucho menor que la energía en reposo m 0c² (K
« m0c²) entonces γ se acerca a la unidad y los resultados clásicos diferirán muy poco de los
resultados relativistas. Entonces podemos utilizar la expresión clásica que nos relaciona a la
energía cinética K de una masa m con su velocidad u:

K ≈ ½m0u²

Sin embargo, si la energía cinética K es de un orden de magnitud comparable con la energía en


reposo m0c² (K ≈ m0c²), entonces no podemos utilizar la aproximación señalada, y de hecho no
podemos utilizar ninguna aproximación, tenemos que utilizar las relaciones relativistas exactas.

Del otro extremo, si la energía cinética K es mucho mayor que la energía en reposo m0c² (K »
m0c²) entonces podemos utilizar la expresión

E² = p²c² + E0²
para obtener una aproximación. Sacando raíz cuadrada de ambos miembros:

E = [p²c² + E0²]½

E = pc [1 + E0²/p²c²]½

Usando la expansión binomial tenemos entonces:

E = pc [1 + (½)(E0²/p²c²) + ...]

Entonces para energías cinéticas tales que la energía cinética K es mucho mayor que la masa en
reposo m0c², algo que conocemos como energías ultrarelativistas (posiblemente aquí la
semántica de la palabra sea desfortunada), podemos utilizar la aproximación:

E ≈ pc

A continuación se hará un breve resumen de las aproximaciones que pueden utilizarse, según
sea el caso:

(1) Para K « m0c²: Cuando la energía cinética K de una partícula es suficientemente menor
que la energía que corresponde a su masa en reposo, podemos utilizar la expresión clásica que
nos relaciona su energía cinética K con su velocidad u:

K ≈ ½m0u²

(2) Para K ≈ m0c²: Cuando la energía cinética K de una partícula es comparable a la energía de
su energía en reposo, no podemos recurrir a ninguna aproximación.

(3) Para K » m0c²: Cuando la energía cinética K de una partícula es suficientemente mayor
que la energía que corresponde a su masa en reposo, podemos utilizar la aproximación
ultrarelativista:

E ≈ pc

PROBLEMA: Calcúlese usando las aproximaciones aplicables el momentum en unidades de


MeV/c de (a) un electrón de 30 MeV y (b) un protón de 30 MeV. Calcúlense tras esto los
valores exactos sin recurrir a aproximación alguna. Considérense las energías en reposo del
electrón y del protón como 0.511 MeV y 938 MeV respectivamente.

De la expresión:

γ = 1+ (K/m0c²)

podemos ver que para un electrón de 30 MeV:

γ = 1+ (30 MeV/0.511 MeV) = 58.70

En este caso la energía cinética relativista K del electrón es casi sesenta veces mayor que su
energía en reposo, y no podemos utilizar la aproximación clásica entre su energía cinética y su
velocidad u. Pero podemos utilizar la aproximación para altas energías:

E ≈ pc

p = E/c

p = (K + m0c²)/c

p = (30 MeV + 0.511 MeV)/c = 30.511 MeV

Por otro lado, para un protón de 30 MeV:

γ = 1+ (K/m0c²) = = 1+ (30 MeV/938 MeV) = 1.03198

Puesto que γ ≈ 1, podemos utilizar la aproximación clásica para obtener la velocidad u de la


partícula:

K ≈ ½m0u²

2K/(m0c²) ≈ (u/c)²

(u/c)² ≈ 2(30 MeV)/938 MeV

u/c ≈ 0.252
y vemos que el protón se está moviendo a la cuarta parte de la velocidad de la luz. Un valor
aproximado del momentum es entonces:

p = γm0u

p = γm0c² · (u/c) /c

p = (1.03198)(938 MeV)(0.252)/c

p = 244 MeV/c

Para el electrón determinaremos ahora su velocidad u sin recurrir a ninguna aproximación:

γ = 1/√1 - u²/c² = 58.70

u = .9997097 c

Con esto:

p = γm0u = γm0c² · (u/c) /c = (58.70)(0.511 MeV)(0.9997097)/c

p = 29.987 MeV/c

Este valor compara favorablemente con el valor aproximado que habíamos obtenido de 30.511
MeV.

Procederemos de una manera similar para obtener para el protón su velocidad u sin recurrir a
ninguna aproximación:

γ = 1/√1 - u²/c² = 1.03198

u = 0.247 c

Por lo tanto:
p = γm0u = γm0c² · (u/c) /c = (1.03198)(938 MeV)(0.247)/c

p = 239.1 MeV/c

Este valor está debajo del valor aproximado de 244 MeV/c en un 2% que podemos considerar un
error mínimo.

PROBLEMA: Un electrón y un protón son acelerados cada uno en un acelerador de


partículas a través de un potencial de 10 millones de voltios. Encontrar el momentum y la
velocidad de cada una de estas partículas.

En el caso del electrón, su energía en reposo de 0.511 MeV es unas veinte veces menor que los 10
MeV de energía cinética que adquiere en el ciclotrón, con lo cual:

γ = 1+ (K/m0c²) = 1 + (10 MeV/0.511 MeV)

γ = 20.57

Puesto que γ no tiene un valor cercano a la unidad, no podemos utilizar la aproximación clásica,
pero podemos utilizar la aproximación ultrarelativista:

p ≈ E/c

p ≈ (K + m0c²)/c

p ≈ (10 MeV + 0.511 MeV)/c

p ≈ 10.511 MeV/c

Una vez obtenido el momentum del electrón, podemos obtener su velocidad utilizando la
definición del momentum relativista:

p = γm0u

p = γ (m0c²) u/c²

u/c = pc/γ(m0c²)
u/c = (10.511 MeV/c · c)/(20.57)(0.511 MeV)

u = 0.999974 c

En el caso del protón, su energía en reposo dada en el problema anterior como 938 MeV es unas
93 veces mayor que los 10 MeV de energía cinética que adquiere en el ciclotrón, con lo cual:

γ = 1+ (K/m0c²) = 1 + (10 MeV/938 MeV)

γ = 1.010

Teniendo un valor tan cercano a la unidad, esperamos que la aproximación clásica sea bastante
buena:

K ≈ ½m0u²

½m0u² ≈ K

u²/c² ≈ 2K/(m0c²)

(u/c)² ≈ 2(10 MeV)/(938 MeV) ∼ 0.02132

u/c ≈ 0.146

u ≈ 0.146 c

El momentum puede ser calculado con la expresión relativista o con la expresión clásica.
Calculado con la expresión relativista resulta ser:

p = γm0u

p = γ (m0c²) u/c²

p = (1.010) (938 MeV) (0.146 c) / c²

p = 138 MeV/c
Y calculado con la expresión clásica que relaciona a la energía cinética K con el momentum p:

K = ½ mu² = ½ m (p/m)² = p²/2m

el momentum del protón resulta ser:

p² = 2mK

(pc)² = 2(mc²)K = 2(938 MeV) (10 MeV) = 18,760 MeV²

p = 137 MeV/c

PROBLEMA: Determínese la intensidad del campo magnético B requerido para poder


mantener en una órbita circular con un arco de radio de 2 metros un electrón con una energía
de 20 MeV.

En la entrada titulada “Dinámica relativista”, casi al final de la misma obtuvimos una fórmula
para resolver este tipo de problemas, la cual nos relaciona el momentum relativista de la
partícula con la carga eléctrica, la intensidad del campo magnético B y el radio R de la órbita:

p = qBR

Tenemos que obtener el momentum relativista a partir de la energía cinética proporcionada


para el electrón. En este caso vemos que:

γ = 1+ (K/m0c²) = 1 + (20 MeV/0.511 MeV)

γ = 40.14

Puesto que la energía cinética relativista K del electrón es casi 40 veces mayor que su energía en
reposo, no podemos utilizar la aproximación clásica entre su energía cinética y su velocidad u.
Pero podemos utilizar la aproximación para altas energías:

E ≈ pc

p ≈ E/c
p ≈ (K + m0c²)/c

p ≈ (20 MeV + 0.511 MeV)/c ≈ 20.511 MeV/c

Teniendo el momentum relativista, podemos recurrir a la fórmula (recuérdese que hay que
dividir entre la velocidad de la luz c tomada aquí como 300,000 kilómetros por segundo, y que
para la carga eléctrica utilizamos simplemente 1 electrón = 1 e para cancelar la parte de la
unidad correspondiente dentro de la expresión MeV):

B = p/qR

B = (20.511 MeV/c)/[(1 e) (2 metros)]

B = 0.0341 tesla

Puesto que 1 tesla es igual a 10,000 gauss, la respuesta la podemos expresar también en función
de estas unidades:

B = 341 gauss

Estableceremos por completitud otra equivalencia que también es utilizada a menudo en el


estudio de la física atómica y nuclear relativistas. Se trata de lo que llamaremos unidad de
masa atómica unificada simbolizada como u. Para la definición de esta unidad, podemos
recurrir al número de Avogadro que representa exactamente el número de átomos (o
moléculas) que contiene un mol de una substancia (el científico italiano Amadeo Avogadro fue el
primero que propuso que el volumen ocupado por un gas en un recipiente a cierta temperatura y
presión mantenidas fijas es el mismo independientemente de la naturaleza del gas, de modo tal
que un recipiente cerrado de unos 22.4 litros a temperatura ambiente y a una presión de una
atmósfera contendrá la misma cantidad de moléculas de gas cloro que de gas oxígeno o de gas
hidrógeno, aunque la masa contenida del gas variará según el gas):

NA = 6.022 141 79 · 1023 átomos (o moléculas)

Para obtener la equivalencia de una unidad u, simplemente dividimos un gramo entre el


número de Avogadro:
1 u = 1 gramo / 6.022 141 79 · 1023 átomos

1 u = 1.660538783 · 10-24 gramo/átomo

Formalmente, la unidad de masa atómica unificada u es definida como la doceava porción


de la masa de un átomo neutral de carbono C12, con lo cual el carbono viene teniendo una masa
atómica de 12 u (en un principio, la base unitaria para mediciones atómicas era definida
simplemente como la masa de un átomo de hidrógeno, por ser el primer y más sencillo elemento
en la tabla periódica, pero posteriormente fue re-definida como la dieciseisava porción de la
masa de un átomo de oxígeno O16, hasta llegarse a la definición actual basada en el carbono-12
adoptada en 1961 por la International Union of Pure and Applied Physics, aunque en realidad
las tres definiciones son equivalentes ya que todas se reducen aproximadamente a lo mismo, la
masa de un átomo de hidrógeno). Puesto que un átomo de carbono C12 tiene una masa de 19.92 ·
10-27 Kilogramo, la doceava parte de dicha masa viene siendo:

(19.92 · 10-27 Kilogramo)/12 = 1.66 · 10-27 Kilogramo

= 1.66 · 10-24 gramo ≈ 1 u

Para cálculos breves, podemos utilizar simplemente 1 u ≈ 1.66 · 10-24 gramo ≈ 1.66 · 10-
27Kilogramo. Como ya se dijo, en realidad esta es simplemente la masa de un átomo de
hidrógeno, aunque los formalismos de definición tiendan a obscurecer el hecho.

Relativísticamente, de acuerdo con la relación E = mc² la energía equivalente de una unidad de


masa unificada es:

1 u = 931.5 MeV

PROBLEMA: Obtener el valor de una unidad de masa atómica unificada expresado en


unidades MeV.

Trabajaremos en el sistema MKS. El cuadrado de la velocidad de la luz sin usar la aproximación


c = 3·108 metros/segundo es:

c² = (299,792,458 metros/seg)² = 8.98755 · 1016 metros²/seg²


El valor de una unidad u expresado en joules será entonces, de acuerdo con la relación
relativista E = mc²:

1 u = 1.660538783 · 10-27 Kilogramo

1 u · c² = (1.660538783 · 10-27 Kilogramo)(8.98755 · 1016 metros²/seg²)

1 u · c² = 1.4924175 · 10-10 joule

Usando el factor de conversión 1 MeV = 1.602 · 10-13 joule:

1 u · c² = (1.4924175 · 10-10 joule)/(1.602 · 10-13 joule/MeV)

1 u · c² = 931.59 MeV

La unidad u no debe ser confundida con su ya obsoleta progenitora simbolizada


como amu(atomic mass unit), aunque desafortunadamente muchos libros de texto continúan
utilizándola dada su similitud con la unidad u.

El concepto básico detrás de de la liberación de energía en los reactores y las bombas atómicas
es la energía de enlace. La energía de enlace es la energía que se libera (se pierde) cuando el
núcleo atómico de un elemento es creado a partir de sus nucleones (protones y neutrones)
constituyentes. Y es también la energía requerida para poder desensamblar el núcleo de un
átomo cualquiera en sus partículas elementales constituyentes. Por lo tanto, un núcleo atómico
que viene siendo un sistema de partículas nucleares ligadas o sistema ligado está a un nivel
energético inferior al de las partículas constituyentes separadas. Esto lo detectamos al sumar la
masa total de los nucleones separados que van a formar un átomo comparándola con la masa
total del átomo ya formado; al hacer tal cosa descubriremos que la suma de los constituyentes es
menor que la masa total del átomo. La “masa ausente”, conocida como el defecto de masa, es
por la relación E = mc² una medida de la energía de enlace del átomo que es liberada durante la
formación de un núcleo a partir de los nucleones constituyentes. Entre mayor sea la energía de
enlace por nucleón en el átomo tanto mayor será su estabilidad. Para poder calcular la energía
de enlace (en MeV) de un átomo todo lo que tenemos que hacer es sumar la masa de los
nucleones individuales y restar dicha masa de la masa experimentalmente medida del átomo,
convirtiendo la “masa faltante” en su equivalente energético de acuerdo con la relación E = mc²
Invariantes
Anteriormente, habíamos considerado problemas en los que dos acontecimientos (eventos) que
no ocurrían simultáneamente (al mismo tiempo) para un observador eran simultáneos para
otro, o problemas en los que dos acontecimientos diferentes tenían lugar en la misma posición
para uno de los observadores, lo cual nos permitía hacer una simplificación del tipo t = t’ o una
simplificación del tipo x = x’. Pero hay acontecimientos que no ocurren al mismo tiempo para
dos observadores distintos y que tampoco se repiten en el mismo lugar en ninguna de las
coordenadas espaciales. Sobre este tipo de acontecimientos aún podemos llevar a cabo un
análisis definiendo matemáticamente una “distancia” entre dichos acontecimientos que incluya
en una sola definición las diferencias de tiempo (temporales) y las diferencias de posición
(espaciales).

Armados con las transformaciones de Lorentz podemos, sin perder tiempo en los detalles de
casos particulares, obtener resultados generales como el que logramos en respuesta al siguiente

PROBLEMA: ¿Cuál será la forma en un marco de referencia S’ de un pulso esférico luminoso


obtenido al hacer estallar un petardo en el marco de referencia S?

En un sistema de coordenadas Cartesianas en tres dimensiones (x,y,z) puesto en el marco de


referencia S, la ecuación de una esfera de radio r centrada en el origen estará dada por:

x² + y² + z² = r²

Si en el marco de referencia S hacemos estallar un petardo obteniendo con ello una esfera de luz
en torno al petardo que actúa como el centro de dicha esfera, dicha esfera se irá expandiendo
conforme avanza el tiempo, y el radio de la misma será r = ct. Entonces, para el pulso luminoso
esférico en el marco de referencia S, tenemos:

x² + y² + z² = c²t²

La forma de dicho pulso esférico luminoso estará dada en el marco de referencia S’ por lo que
dictan las transformaciones de Lorentz:

x = γ(x’ - vt’)

y = y’
z = z’

t = γ(t’ - Vx’/c²)

Substituyendo estas ecuaciones de transformación en la ecuación del pulso esférico luminoso,


tras un poco de álgebra laboriosa obtenemos lo siguiente para el pulso esférico luminoso en el
marco de referencia S’:

(x’)² + (y’)² + (z’)² = c²(t’)²

Pero esta es también la ecuación de una esfera luminosa dentro del marco de referencia S’.

Un pulso esférico luminoso en un marco de referencia S tendrá también la misma


forma esférica en otro marco de referencia S’ que se está moviendo a una
velocidad V con respecto a S.

El que la forma geométrica de un pulso esférico luminoso sea la misma independientemente del
marco de referencia en el que estemos situados, invariante, nos hace concebir la posibilidad de
que también pueda haber otras invariantes que no cambien de un marco de referencia a otro.
Esto nos lleva al estudio de algo que en la Teoría Especial de la Relatividad se conoce como
el intervalo.

Por convención, el intervalo relativista entre dos eventos distintos A y B se define de la


manera siguiente:

Δs² = (cΔt)² - (Δx)² - (Δy)² - (Δz)²

Δs² = (ctB - ctA)² - (xB - xA)² - (yB - yA)² - (zB - zA)²

A continuación haremos un ejercicio llevando a cabo el cálculo del intervalo relativista entre dos
eventos A y B. Para este ejemplo, las coordenadas cuatri-dimensionales del evento A serán:

(ctA = 5.0 m, xA = 3.0 m, yA = 2 m, zA = 0.0 m )

Y para el evento b las coordenadas cuatri-dimensionales serán:

(ctB = 6.0 m, xB = 3.0 m, yB = 2.5 m, zB = 0.0 m )


El intervalo relativista será entonces:

Δs² = (ctB - ctA)² - (xB - xA)² - (yB - yA)² - (zB - zA)²

Δs² = ( 6.0 m - 5.0 m)² - (3.0 m - 3.0 m)² -(2.5 m - 3.0 m)² - ( 0.0 m - 0.0 m)²

Δs² = 1.0 m² - 0.0 m² - (-0.5 m)² - 0.0 m² = 0.75 m²

Podemos tomar la raíz cuadrada si así lo deseamos para obtener:

Δs = 0.87 m.

Sin embargo, esto no es lo que se acostumbra hacer en los estudios de la Teoría Especial de la
Relatividad. El estudiante para el que todo esto es nuevo se debería de acostumbrar a considerar
a Δs² como un solo símbolo y no como el cuadrado de una cantidad Δs. Puesto que Δs² puede
ser una cantidad positiva o negativa, no es conveniente tomar la raíz cuadrada. Debe ser claro
también que la notación Δs² NO significa Δ(s²), y por ello es preferible acostumbrarse a leerla
como un solo símbolo.

A continuación veremos un problema que nos confirmará que el intervalo es una cantidad
invariante que no cambia al pasar de un marco de referencia a otro.

PROBLEMA: Usando las transformaciones de Lorentz, encontrar las coordenadas (x,t) que
corresponden en el sistema S’ al evento E1 cuyas coordenadas son (x’,t’) = (2,5) si la velocidad
relativa entre ambos marcos de referencia es V = 0.6 metros/segundo. A continuación, repetir
los cálculos para el evento E2 cuyas coordenadas son (x,t) = (2,5). Hecho esto, comprobar que
el intervalo Δs² entre los eventos E1 (x,t) y E2(x,t) tiene el mismo valor que el intervalo (Δs’)²
entre los eventos E1 (x’,t’) y E2(x’,t’).

En este caso:

γ = 1/√1 - V²/c² = 1/√1 - (0.6 m/seg)²/(1 m/seg)²

γ = 1/√1 - 0.36 = 1/√0.64 = 1/0.8

γ = 1.25
A continuación recurrimos a las transformaciones de Lorentz:

x = γ(x’ + Vt’)

x = (1.25) [2 + (0.6)(5)] = (1.25)(5)

x = 6.25

t = γ(t’ + Vx’/c²)

t = (1.25) [5 + (0.6)(2)]

t = 7.75

Entonces tenemos lo siguiente:

E1 (x,t) = (6.25, 7.75)

E1 (x’,t’) = (2, 5)

Obsérvese que no usamos la comilla para denotar E1 (x’,t’) como E1’ porque se trata del mismo
evento. Lo único que cambian son sus coordenadas al pasar de un marco de referencia a otro.

Usando nuevamente las transformaciones de Lorentz, para el evento E2 cuyas coordenadas en S’


son (x’,t’) = (3, 10), sus coordenadas en S serán:

x = (1.25) [3 + (0.6)(10) ] = 11.25

t = (1.25) [10 + (0.6)(3) ] = 14.75

El cálculo del intervalo Δs² entre los dos eventos E1 y E2 en el marco de referencia S arroja lo
siguiente:

Δs² = (cΔt)² - (Δx)²


Δs² = (14.75 - 7-75)² - (11.25 -6.25)²

Δs² = 24

Por otro lado, el cálculo del intervalo (Δs’)² entre los dos eventos E1 y E2 en el marco de
referencia S’ arroja lo siguiente:

(Δs’)² = (cΔt)² - (Δx)²

(Δs’)² = (10 - 5)² - (3 - 2)²

(Δs’)² = 24

Con esto se concluye que:

Δs² = (Δs’)²

Se verifica aquí que el intervalo entre dos eventos es una invariante al pasar de un marco de
referencia a otro.

Para demostrar lo anterior en el caso general, sin recurrir a números, simplemente repetimos lo
que hicimos en la resolución del problema numérico, usando símbolos. La diferencia entre dos
eventos E1 y E2 en S está dada por:

Δs² = (cΔt)² - (Δx)²

Δs² = c²(t2-t1)² - (x2 - x1)²

Usamos ahora las transformaciones de Lorentz:

t1 = γ(t’1 + Vx’1/c²)

t2 = γ(t’2 + Vx’2/c²)

x1 = γ(x’1 + Vt’1)

x2 = γ(x’2 + Vt’2)
Sustituyendo estas cuatro relaciones en la relación anterior y simplificando y reduciendo lo más
posible, obtenemos:

Δs² = (ct’2 - ct’1)² - (x’2 - x’1)²

Δs² = (cΔt’)² - (Δx’)²

Δs² = (Δs’)²

En todo intervalo relativístico identificamos dos partes claramente distiguibles, el


componente espacial:

(Δx)² - (Δy)² - (Δz)²

y el componente temporal:

(cΔt)²

Cuando en un intervalo relativista entre dos eventos predomina el componente temporal sobre
el componente espacial, lo llamamos un intervalo tipo temporal (timelike). Cuando en un
intervalo relativista predomina el componente espacial sobre el componente temporal, lo
llamamos intervalo tipo espacial (spacelike). Y cuando en un intervalo relativista el
componente espacial es igual al componente temporal (en cuyo caso el intervalo será igual a
cero) se le conoce como intervalo tipo luminoso (lightlike) o intervalo nulo (null).

PROBLEMA: Para los pares de eventos cuyas coordenadas (ct, x, y, z) en algún marco de
referencia son las que se dan a continuación, clasificar la separación entre cada par de eventos
como tipo temporal, tipo espacial, o tipo luminoso.

a) (0,0,0,0) y (-1,1,0,0)
b) (1,1,-1,0) y (-1,1,0,2)
c) (6,0,1,0) y (5,0,1,0)
d) (-1,1,-1,1) y (4,1,-1,6)

a) (0 -(-1))² - (0 - 1)² - (0 - 0)² - (0 - 0)² = 1 - 1


Puesto que la parte temporal es igual a la parte espacial, la separación es tipo luminoso.

b) (1 -(-1))² - (1 - 1)² - (-1 - 0)² - (0 - 2)² = 4 - 5

Puesto que la parte espacial es mayor que la parte temporal, la separación es tipo espacial.

c) (6 -5)² - (0 - 0)² - (1 - 1)² - (0 - 0)² = 1 - 0

Puesto que la parte temporal es mayor que la parte espacial, la separación es tipo temporal.

d) (-1 -4)² - (1 - 1)² - (-1 - (-1))² - (1 - 6)² = 25 - 25

Puesto que la parte temporal es igual a la parte espacial, la separación es tipo luminoso.

Si prescindimos de los símbolos Δ por sobreentenderse y designamos a x²+y²+z²simplemente


como r², el intervalo s² se puede simbolizar como:

s² = (ct)² - r²

y en un diagrama espacio-tiempo tenemos entonces tres regiones distinguibles:

El origen en el diagrama espacio-tiempo (ct, r) = (0, 0) representa el “ahora”. En la región de


color amarillo que representa el “futuro” que le espera al observador predomina el componente
temporal sobre el componente espacial, con lo cual s² siempre es mayor que cero (positivo) y
por lo tanto es una región de intervalos tipo temporal (timelike). En la región de color ciano que
representa el “pasado” que recorrió el observador también predomina el componente temporal
sobre el componente espacial, con lo cual s² siempre es mayor que cero (positivo) y por lo tanto
también es una región de intervalos tipo temporal (timelike). En las líneas que delimitan al cono
de luz la componente temporal es igual a la componente espacial con lo cual s² = 0, y es aquí en
donde tenemos a los intervalos tipo luminoso que involucran rayos de luz. Y fuera de todo esto
tenemos a los intervalos en donde el componente espacial es mayor que el componente temporal
con lo cual s² es menor que cero (negativo) siendo por lo tanto la región de intervalos tipo
espacial(spacelike).

La definición que se ha dado arriba para el intervalo relativista no es universal. Aunque es muy
utilizada, muchos otros textos lo definen usando una convención inversa de signos:

Δs² = - (cΔt)² + (Δx)² + (Δy)² + (Δz)²

De cualquier manera, las definiciones que se han dado arriba para el intervalo tipo espacial, el
intervalo tipo temporal, y el intervalo tipo luminoso, no cambian en lo absoluto, ya que en
dichas definiciones lo que cuenta es la predominancia de un componente sobre el otro. Sin
embargo, es necesario hacer esta aclaración porque mientras que en textos sobre la relatividad
como el de David W. Hogg el intervalo es considerado como un intervalo tipo espacial si Δs² es
menor que cero (negativo), en otros libros como el de Kip Thorne la situación es al revés y el
intervalo es considerado como un intervalo tipo espacial si Δs² esmayor que cero (positivo),
siendo la diferencia ocasionada por la forma en la cual se ha definido a Δs².

Al tratar sobre el tema de “Los diagramas espacio-tiempo de Minkowski” en donde estudiamos


la Teoría Especial de la Relatividad desde una perspectiva geométrica, había quedado un asunto
pendiente, el asunto de graduar o calibrar tanto los ejes coordenados del observador en reposo
O como del observador en movimiento O de modo tal que los diagramas espacio-tiempo se
pudieran utilizar para una resolución de problemas un poco más cuantitativa que cualitativa.
Esto lo podemos llevar a cabo, también geométricamente, utilizando lo que se conoce como
la hipérbola invariante.

Primero que nada, haremos un repaso de lo que es la hipérbola de acuerdo con la Geometría
Analítica.
Una hipérbola es el lugar de los puntos tales que la diferencia de las distancias de cada uno
de ellos a dos puntos fijos es constante. La hipérbola está dada por una ecuación como la
siguiente:

y² - x² = C²

en donde C es una constante numérica y cuya gráfica tiene el siguiente aspecto para C = 1:

Sin necesidad de tener que hacer cálculos numéricos, tal como lo hacían los griegos en la
antigüedad (los cuales no conocían el álgebra y mucho menos la geometría analítica) podemos
construír geométricamente la hipérbola mostrada arriba con un simple compás con el
procedimiento que será dado a continuación. Primero localizamos sobre el eje-y dos puntos A y
B que estén ubicados ambos a una distancia de 2 unidades del origen, o sea en los puntos A(0,2)
y B(0,-2):
A continuación, empezamos a trazar una curva de modo tal que para cualquier punto P de la
curva la diferencia entre la distancia del punto P al punto A (PA) y del punto P al punto B(PB)
sea igual a una constante de 2 unidades, o sea:

PB - PA = 2

Si continuamos adelante con nuestro procedimiento de construcción, iremos obteniendo una


curva como la siguiente:
Aplicando el mismo procedimiento podemos construír la parte correspondiente al lado
izquierdo de la curva. Una vez que hemos completado la construcción de la curva superior,
podemos llevar a cabo la construcción de la parte inferior:

Para la curva inferior tenemos:

PA - PB = 2

Es importante destacar que una hipérbola en realidad son dos curvas, las curvas que tenemos en
el diagrama de arriba. En sus extremos, ambas curvas casi toman la forma de líneas rectas,
conocidas como las asíntotas.

Hay también otra hipérbola, la cual está dada por la siguiente ecuación:

x² - y² = C²

y cuya gráfica es la siguiente (el procedimiento de construcción es el mismo que el anterior):

Si reescribimos la ecuación de la hipérbola

y² - x² = C²

hacemos el siguiente cambio de notación:

(cΔt)² - (Δx)² = Δs²

Δs² = (cΔt)² - (Δx)²

esto lo reconocemos inmediatamente como un intervalo relativista. El intervalo no es solo una


invariante de un marco de referencia a otro. Graficado sobre un diagrama espacio-tiempo
resulta ser una hipérbola equilátera, conocida como la hipérbola invariante, la cual podemos
trazar directamente sobre el diagrama espacio-tiempo.
El hecho de que toda la curva hiperbólica represente una invariante de un marco de referencia a
otro nos permite llevar a cabo algo que había quedado pendiente en la entrada “Los diagramas
espacio-tiempo de Minkowski” en la construcción del diagrama espacio-tiempo: la calibración
de los ejes de las coordenadas (x’,t’). Teniendo ya graduados con divisiones iguales los ejes
horizontal y vertical del diagrama espacio-tiempo correspondiente al observador estacionario O
en el marco de referencia S, nos basta con construír hipérbolas para llevar las graduaciones
respectivas a los dos ejes coordenados del observador O’. De este modo, en el siguiente
diagrama, la graduación del punto 1 es llevada al punto 1’ del marco de referencia de O’, y es
llevada al punto 1’’ del marco de referencia del observador O’’ que se mueve a una velocidad aún
más cercana a la velocidad de la luz, y así sucesivamente:

De este modo así es como llegamos a tener la siguiente graduación de ejes:


A continuación tenemos la siguiente hipérbola invariante sobre la cual se han llevado a cabo
algunos cálculos numéricos sobre el intervalo relativista AB para un objeto que se desplaza del
punto B al punto A:

Y a continuación tenemos un ejemplo de una serie completa de hipérbolas equiláteras que se


han construído sobre escalas graduadas:
Estamos ahora en una posición que nos permite explicar la naturaleza del intervalo relativista
como una invariante. Cuando dos naves espaciales pasan la una frente a la otra moviéndose a
gran velocidad en direcciones contrarias, los viajeros de cada nave verán ciertos cambios en la
apariencia de la otra nave así como cambios en el comportamiento de los relojes de la otra nave.
Esto se debe a que el espacio y el tiempo no son absolutos que tengan una existencia
independiente el uno del otro. Son, por así decirlo, proyecciones de sombras de un objeto
cuatri-dimensional, del mismo modo que la sombra de un cubo nos muestra únicamente una
imagen en dos dimensiones de algo que en realidad tiene una existencia en tres dimensiones:

Si vemos un invernadero por arriba, por el frente, y por uno de sus lados:
resulta obvio que mientras que la vista desde arriba parece mostrarnos un objeto rectangular
delgado, al movernos hacia abajo la vista de lado parece mostrarnos un objeto menos
rectangular, menos delgado. El objeto en sí no cambia de forma ni de tamaño, lo único que
cambia es la proyección de su sombra hacia un plano de dos dimensiones. De la misma manera,
en relatividad lo que un observador aprecia es un objeto de cuatro dimensiones, como en el caso
de los viajeros en las dos naves espaciales, los cuales ven proyecciones tri-dimensionales
diferentes de un mismo objeto dependiendo de su movimiento relativo en relación a dicho
objeto. En algunos casos, la proyección de la sombra muestra más de tiempo que de espacio, y
en otros casos muestra más de espacio que de tiempo. Los cambios que un viajero en una de las
naves observa en las dimensiones de espacio y de tiempo de la otra nave pueden ser explicados
como una especie de “rotación” en el espacio-tiempo, la cual ocasiona que se alteren las
proyecciones de las sombras arrojadas por el espacio y el tiempo. Esto es precisamente lo que
tenía en mente Hermann Minkowski, el creador de los diagramas de espacio-tiempo, cuando
señaló el 21 de septiembre de 1908 en su discurso de inauguración de la 80 ava reunión de la
Asamblea General Alemana de científicos naturales y físicos: “Las ideas sobre el espacio y el
tiempo que deseo mostrarles hoy descansan en el suelo firme de la física experimental, en la cual
yace su fuerza. Son ideas radicales. De aquí en delante, el espacio y el tiempo por separado están
destinados a desvanecerse como meras sombras, y tan sólo una unión de ambos puede preservar
una realidad independiente”. Y esta idea la podemos ver reflejada claramente en un diagrama
espacio-tiempo de Minkowski que muestra el intervalo entre dos eventos A y B:
En este diagrama espacio-tiempo tenemos el privilegio de ver un intervalo cuatri-
dimensional AB cuya sombra proyectada sobre el espacio del observador O en el eje X (de color
verde) tiene una magnitud diferente de su sombra proyectada sobre el espacio del observador O’
en el eje X’ (de color ciano), y cuya sombra proyectada sobre el tiempo del observador O en el
eje ct (de color verde) tiene una magnitud diferente de su sombra proyectada sobre el tiempo
del observador O en el eje ct’ (de color ciano), pero nosotros que lo estamos viendo “desde
arriba” lo vemos tal como es.

Lo importante a captar aquí es el hecho de que la estructura espacio-tiempo, la


estructura cuatri-dimensional de un objeto tal como una nave espacial, es algo tan rígido como
lo era en la física clásica tri-dimensional. Esta es la diferencia esencial entre la teoría de la
contracción de Lorentz-Fitzgerald ocasionada sobre los objetos físicos al moverse en el espacio
venciendo la resistencia del supuesto éter, y la contracción Einsteniana. Para Lorentz, la
contracción era una contracción real de un objeto tri-dimensional, mientras que para Einstein el
objeto “real” es un objeto cuatri-dimensional que no cambia en lo absoluto, un objeto que cuyos
cambios aparentes se deben a que es visto desde diferentes ángulos. Su proyección tri-
dimensional en el espacio y su proyección uni-dimensional en el tiempo pueden cambiar, pero el
objeto cuatri-dimensional del espacio-tiempo no cambia en nada. De este modo, el intervalo
cuatri-dimensional entre dos eventos en el espacio-tiempo es un intervalo absoluto, invariante.
Dos observadores distintos moviéndose el uno con respecto al otro a grandes velocidades
estarán en desacuerdo sobre qué tan separados estarán dos eventos en el espacio, o qué tan
separados estarán los dos eventos en el tiempo, pero dos observadores diferentes siempre
estarán en total acuerdo sobre qué tan separados están dos eventos en el espacio-tiempo. En su
libro “Spacetime Physics”, E. F. Taylor y J. A. Wheeler lo ponen de la siguiente manera: “El
espacio es diferente para dos observadores distintos. El tiempo es diferente para dos
observadores distintos. Pero el espacio-tiempo es el mismo para todos”.

Desde una perspectiva más formal, podríamos preguntarnos: ¿por qué el intervalo relativista es
una cantidad que permanece inalterable de un marco de referencia a otro?

Para responder a esta última pregunta, haremos un repaso sobre la interpretación física y
geométrica que les damos a las cantidades conocidas como los escalares y los vectores.

Los escalares son cantidades tales como la temperatura de un cuerpo o el color de una
esmeralda. Tales cantidades no tienen dirección alguna que se les pueda asignar, y son
cantidades que permanecen invariables sin cambiar en lo absoluto cuando se cambia de un
marco de referencia a otro.

En cambio los vectores representan cantidades que apuntan definitivamente en cierta


dirección, como la dirección en la cual está soplando el viento o como la dirección en la cual se
está moviendo la Luna en un momento dado al girar en torno a la Tierra. Esta es la razón por la
cual frecuentemente se representan en los pizarrones con una flechita puesta encima de ellos.

Un objeto que se está moviendo en línea recta en la dirección del eje de las equis (en un plano
Cartesiano x-y) puede ser representado como una flecha apuntando en una dirección específica
(+x) en la cual su vector velocidad tiene cierta longitud que se representará de mayor magnitud
cuanto mayor sea la velocidad del objeto. Supóngase para fines de demonstración numérica que
se trata de un avión moviéndose hacia la derecha a una velocidad de 50 metros por segundo.

Ahora bien, si le damos al vector velocidad una rotación con respecto al origen, la magnitud del
vector no cambiará, lo que cambiarán serán las componentes utilizadas para especificarlo.
Es así como podemos tener un vector en dos dimensiones como el siguiente:
Podemos imaginar al avión representado por la línea m moviéndose en dirección Norte-Este a
una velocidad de 5 metros por segundo. La magnitud de la velocidad sigue siendo la misma,
pero su dirección ha cambiado. Podemos imaginar que su velocidad horizontal ha disminuído a
3 metros por segundo pero que un viento que está soplando de Sur a Norte lo está empujando a
una velocidad de 4 metros por segundo. Por el teorema de Pitágoras, la magnitud de la velocidad
es de 5 metros por segundo. La velocidad total tiene dos componentes, una componente
horizontal de 3 metros por segundo y una componente vertical de 4 metros por segundo.

No hay razón alguna por la cual tengamos que limitar a nuestro vector a un espacio
bidimensional. Podemos imprimirle otra rotación adicional para situarlo en un espacio
tridimensional. El vector velocidad de esta manera estará especificado por tres componentes, las
cuales requieren de tres planos diferentes, ortogonales (situados a ángulos rectos el uno del
otro) entre sí:
para poder especificar a nuestro vector tridimensional mediante tres componentes, siendo cada
componente la proyección del vector sobre cada uno de los planos:

De este modo, podemos especificar nuestro vector en un plano Cartesiano tridimensional de una
manera como la siguiente:
Representamos la descomposición del vector A en tres componentes como un triplete ordenado:

A = ( a x , ay , a z )

Nuevamente, la longitud del vector sigue siendo la misma, lo único que ha cambiado es su
representación en un espacio tridimensional en vez de un espacio bidimensional.

Ahora viene un salto que al principio requiere algo de fé. Supondremos la existencia de un
espacio en cuatro dimensiones, y que el vector que hemos estado considerando de alguna
manera puede ser girado (rotado) de modo tal que el vector tenga ahora proyecciones sobre cada
una de estas cuatro dimensiones. El vector ahora tendrá cuatro componentes que podemos
escribir como una cuadrupla ordenada:

A = ( a 1 , a 2 , a3 , a4 )

Geométricamente hablando, nos es imposible poder visualizar un espacio de cuatro dimensiones


porque nuestros cerebros están “alambrados” para trabajar y pensar en tres dimensiones. Pero,
matemáticamente hablando, no hay nada que nos impida hacer tal descomposición de nuestro
vector en cuatro componentes bajo la condición de que la longitud del vector siga
permaneciendo la misma. La longitud del vector, en efecto, debe permanecer invariante en
todo momento.

La pregunta ahora es: ¿cómo podemos evaluar la longitud de un vector cuando ese vector está
especificado en un espacio de cuatro dimensiones?
La respuesta obvia consiste en tratar de extender el teorema de Pitágoras hacia un espacio de
varias dimensiones, empezando con lo que ya se tiene y se sabe que es cierto. En un plano de dos
dimensiones, el teorema de Pitágoras que nos permite obtener la longitud d de un vector
trazado en un plano nos dice que para todo triángulo rectángulo el cuadrado de la
hipotenusa c es igual a la suma de los cuadrados de los catetos a y b:

d² = a² + b²

De este modo, la longitud del vector, que es invariable porque es un escalar, se obtiene
simplemente sacando la raíz cuadrada de ambos lados:

¿Y cómo obtenemos la longitud de un vector tridimensional como el siguiente, en el cual no


parece haber un triángulo con dos catetos?:

Lo podemos hacer de la siguiente manera. Primero obtenemos la longitud L de la hipotenusa del


triángulo rectángulo formado por los catetos a y b:
Por el teorema de Pitágoras en dos dimensiones, sabemos que:

L² = a² + b²

Una inspección al diagrama nos revela que el lado L es a su vez el cateto de otro triángulo
rectángulo formado por los catetos L y c:

Para este triángulo rectángulo plano, la aplicación del teorema de Pitágoras nuevamente nos dá:

d² = L² + c²

Pero puesto que L² = a² + b², tenemos entonces que la longitud de un vector tridimensional
cuyas componentes en los tres ejes son a, b y c está dada por la fórmula:

Este es esencialmente el teorema de Pitágoras en tres dimensiones. El mismo


procedimiento que hemos llevado a cabo aquí lo podemos utilizar para ir extendiendo la fórmula
del teorema de Pitágoras hacia un espacio de cuatro dimensiones, aunque no nos sea posible
visualizarlo, e inclusive la podemos ir extendiendo hacia un espacio n-dimensional con
cualquier cantidad n de dimensiones.

Para un vector V cuyas tres componentes están dadas por el triplete (a, b, c), la cantidad la
podemos representar de la siguiente manera como el producto de los componentes respectivos
del vector con los cuales obtenemos la longitud del vector:
a² + b² + c² = a·a + b·b + c·c

a² + b² + c² = d·d

Esta es precisamente la forma en la cual obtenemos la longitud de un vector, más formalmente


(y más pomposamente) conocida como la norma de un vector; multiplicando los
componentes rectangulares respectivos, sumándolos y extrayendo la raíz cuadrada. La longitud
de un vector en n dimensiones cuyas componentes sean x1 , x2 , x3 ... xn estará dada por:

En un espacio de cuatro dimensiones, como el que tenemos en la Teoría Especial de la


Relatividad en donde la cuarta dimensión está especificada por la longitud obtenida al
multiplicar la constante c (la velocidad de la luz) por la variable tiempo, la longitud de un vector
cuatri-dimensional es invariable por ser una magnitud escalar, y en este caso el vector que
une a dos eventos diferentes E1 y E2 en ese espacio de cuatro dimensiones también tendrá la
misma longitud al darle una rotación en algún sentido al cambiar de un marco de referencia a
otro. Esta es la razón del por qué el intervalo relativista es una cantidad invariable, porque se
trata de una longitud (o mejor dicho, el cuadrado de una longitud), se trata de un escalar.

El teorema de Pitágoras extendido a cinco dimensiones nos diría “el cuadrado de la


hipotenusa d de un triángulo rectángulo concebido en cinco dimensiones es igual a la suma de
los cuadrados de los cinco “catetos” adyacentes a, b, c, d y e a la hipotenusa”:

d² = a² + b² + c² + d² + e²

Este es el teorema de Pitágoras extendido a cinco dimensiones. Ahora bien, si definimos una
“distancia” s² en cuatro dimensiones de la siguiente manera:

s² = a² - b² - c² - d²

el lector podrá objetar diciendo que esto ya no es el teorema de Pitágoras, a causa de la


introducción de los signos negativos reemplazando a los signos positivos, máxime que esta
definición abre la posibilidad de que la “distancia” s² sea cero pese a que ninguno de los
componentes a, b, c y d sean cero. Sin embargo, aunque esto no sea ya el teorema de Pitágoras
“clásico”, esta es una definición perfectamente válida de “distancia”. Esta selección de signos
nos ha proporcionado ya una cantidad invariable, el intervalo relativista. Lo que hemos
definido, más que una distancia clásica, es una métrica. La métrica contiene toda la
información que necesitamos conocer para poder describir lo que sucede tanto en
la Teoría Especial de la Relatividad como en la Teoría General de la Relatividad. Y
al ir ajustando nuestra manera de pensar nos estamos preparando mentalmente para dar el gran
salto hacia los marcos de referencia acelerados que estaban proscritos dentro de la Teoría
Especial de la Relatividad.

La razón por la cual en la Teoría de la Relatividad no nos resulta de utilidad alguna definir una
distancia al “estilo” del teorema de Pitágoras como la siguiente, usando únicamente signos
positivos:

(cΔt)² + (Δx)² + (Δy)² + (Δz)²

es porque no resulta difícil comprobar que ésta cantidad no es una invariante bajo las
transformaciones de Lorentz, aunque se trate de una cantidad escalar. El primer requisito
fundamental que toda métrica debe cumplir es que debe ser capaz de producir un
intervalo invariante al llevarse a cabo un cambio de coordenadas.

Podemos representar de una manera más elegante (y mucho más útil) las
componentes x1 , x2 , x3 y x4 de un vector cuatri-dimensional ya sea como un vector renglón:

[ x1 _x2 _x3 _x4]

o como un vector columna (al cual en matemáticas se le llama transpuesta):

Estas dos definiciones nos permiten representar a la cantidad escalar:

a·b = a1b1 + a2b2 + a3b3

como el producto matricial:


y, mucho más importante, representar a la cantidad escalar:

(cΔt)² - (Δx)² - (Δy)² - (Δz)²

como el producto de tres matrices:

El núcleo del asunto, lo verdaderamente importante, radica en la matriz intermedia, puesto que
esta matriz es precisamente la matriz que nos define a la métrica, a la cual podemos
llamar matriz métrica. Es precisamente esta matriz la que nos proporciona el intervalo
relativista que permanece invariante bajo las transformaciones de Lorentz. Es precisamente esta
matriz la que nos define un espacio-tiempo plano, Euclideano, en el cual se cumple el quinto
postulado de Euclides que nos dice que “dos rectas paralelas nunca se cruzan ni divergen
separándose la una de la otra” (como las líneas del mundo de los extremos de una vara de medir
que está reposo y las cuales nunca se cruzan ni se separan en un diagrama espacio-tiempo). Y
será esta matriz la que, con una selección diferente en sus 16 componentes, nos definirá un
espacio-tiempo curvo en el que no se cumple el quinto postulado de Euclides.

En la Teoría General de la Relatividad en donde los observadores ya no se mueven en línea recta


a una velocidad constante el uno con respecto al otro, no nos es posible seguir considerando
simples diferencias lineares Δ entre las coordenadas por no mantenerse constantes dichas
diferencias de un punto a otro. Tenemos que considerar intervalos relativísticos infinitesimales.
Así, en vez de usar la distancia

(cΔt)² - (Δx)² - (Δy)² - (Δz)²

tenemos que usar el intervalo relativista infinitesimal

(cdt)² - (dx)² - (dy)² - (dz)²


Este intervalo relativista es el intervalo que corresponde a un espacio-tiempo plano, un espacio-
tiempo Minkowski o Lorentziano. Generalmente hablando, el intervalo que corresponde a un
espacio-tiempo curvo como el que se estudia en la Teoría General de la Relatividad tiene
una métrica como la siguiente:

g0(cdt)² - g1(dx)² - g2(dy)² - g3(dz)²

Como un anticipo de lo que nos espera en la Teoría General de la Relatividad, y como nuestro
primer contacto con un espacio-tiempo curvo, a continuación tenemos lo que se conoce como
la métrica de Schwarzchild:

ds² = (1 - 2GM/rc²)(cdt)² - (1 - 2GM/rc²) -1(dr)² - (r²)(dθ)²

- (r² sen² θ)(dφ)²

(Tómese nota de que, a diferencia de lo que ocurre con el intervalo relativista ds² considerado
dentro de la Teoría Especial de la Relatividad para un espacio-tiempo planocomo el que nos
retratan los diagramas espacio-tiempo de Minkowski, a ese mismo intervalo relativista ds² en la
Teoría General de la Relatividad se le conoce ya sea con el nombre de métrica y con el nombre
de elemento de línea, pero en realidad el concepto esencial sigue siendo el mismo extendido
para un espacio-tiempo curvo.) La métrica que se acaba de dar arriba es la métrica que
corresponde a una masa perfectamente esférica sin rotación alguna. Obsérvese con sumo
cuidado que en esta métrica no estamos utilizando las coordenadas Cartesianas (x, y, z) que
habíamos venido utilizando hasta ahora sino que estamos utilizando coordenadas esféricas.
(r, θ, φ). En la Teoría General de la Relatividad podemos utilizar no sólo otros tipos de
coordenadas sino inclusive podemos inventar nuestros propios sistemas de coordenadas como
las coordenadas Kruskal-Szekeresinventadas por Martin Kruskal y George Szekeres
(tomando como base la métrica de Schwarzchild) para describir el comportamiento del espacio-
tiempo curvo en el interior del horizonte de uno de los objetos más interesantes cuya existencia
es predicha por la Teoría General de la Relatividad: los agujeros negros.

Todo lo que sea invariante tiene un interés central en todo lo que tenga que ver con la Teoría de
la Relatividad en virtud de un corolario de los postulados básicos conocido como el Principio
de covariancia, el cual nos dice que las leyes de la física deben tomar la misma forma en
todos los marcos de referencia. La covariancia de Lorentz (y análogamente
la contravariancia de Lorentz) o principio especial de la relatividad se refiere a la propiedad de
ciertas ecuaciones físicas de no cambiar de forma bajo cambios de coordenadas de un tipo
particular. Las leyes de la física tienen que tomar la misma forma en todos los marcos de
referencia inerciales. El requerimiento de covariancia de Lorentz afirma concretamente que si
dos observadores usan coordenadas (x,y,z,ct) y (x',y',z',ct') tales que ambas se pueden relacionar
mediantes las ecuaciones de transformación de Lorentz de las coordenadas, entonces
cualesquiera dos ecuaciones que relacionen magnitudes que presentan covariancia de Lorentz se
escribirán de la misma forma para ambos observadores. Por lo tanto una magnitud, ecuación
o expresión matemática que presenta covariancia de Lorentz responderá a la mismas “leyes” o
ecuaciones para todos los sistemas inerciales (es importante notar que si comparamos las
medidas de un observador inercial con las de un observador no inercial que se está acelerando
en vez de mantener su movimiento a una velocidad constante, la forma de las ecuaciones será
diferente, lo cual se dá no sólo en la mecánica relativística sino en la mecánica Newtoniana en
donde el estudio del movimiento de un cuerpo visto desde un sistema no-inercial en rotación
requiere la inclusión de la fuerza centrífuga y la fuerza de Coriolis, y por tanto sus ecuaciones
para explicar el movimiento de un móvil cuentan con términos adicionales a las que escribiría
un observador inercial, y por tanto las ecuaciones de movimiento no tienen la misma forma para
un observador inercial que para uno no inercial.)

Un ejemplo de la aplicación del principio de covariancia lo sería la ley del gas ideal:

PV = nRT

en donde P es la presión del gas contenido en un recipiente, V el volumen del gas dentro del
recipiente, n es el número de moles del gas, R es la constante del gas ideal y T es la temperatura
del gas. Esta es la fórmula que obtendría un observador en reposo en su laboratorio haciendo
mediciones experimentales. Pero si el observador que está dentro de su laboratorio haciendo los
experimentos para llegar a la anterior fórmula pasa a gran velocidad frente a nosotros en su
marco de referencia S (o nosotros pasamos a gran velocidad frente a él), entonces dentro de
nuestro marco de referencia S', haciendo mediciones sobre lo que él tiene en su laboratorio en
su marco de referencia S nosotros debemos obtener la misma fórmula:

P’V’ = nRT’

ya que si no la obtuviéramos así, si la hubiéramos obtenido en otra forma, entonces habríamos


encontrado una manera de medir el movimiento absoluto. Y si la fórmula cambia, entonces
tenemos que encontrar la forma en la cual se pueda expresar dicha fórmula de modo tal que
permanezca invariante
Rotaciones y transformaciones
En la geometría Euclideana no-relativista en dos dimensiones, al hablar acerca de
una rotación podemos estar haciéndolo en dos sentidos completamente equivalentes: la
rotación de un objeto con respecto a los ejes coordenados manteniendo los ejes coordenados
fijos, y la rotación de los ejes coordenados manteniendo al objeto fijo. En el primer caso,
podemos suponer que tenemos un vector v0 al cual le imprimimos una rotación en sentido
contrario al giro de las manecillas del reloj en un ángulo θ, situándolo en su nueva posición
como el vector v’:

Para llevar a cabo matemáticamente esta operación de rotación, tomamos el vector original
expresando en sus componentes rectangulares:

v0 = (x, y)

y le aplicamos un operador, específicamente, una matriz de rotación Rθ:

v’ = Rθ v0

Con mayor detalle, la matriz de rotación en este caso es una matriz 2x2 que consta de los
siguientes componentes:
En el segundo caso, podemos suponer que tenemos el mismo vector v0 al cual sin moverlo del
lugar en donde está le imprimimos una rotación a los ejes coordenados en los que está
especificado, siendo dicha rotación también una rotación en sentido contrario al giro de las
manecillas del reloj en un ángulo θ, situándolo en su nueva posición como el vector v:

Esta operación de rotación de ejes coordenados se lleva a cabo matemáticamente en forma


semejante al caso anterior:

v = R’θ v0

en donde lo único que cambia es la matriz de rotación R’θ, la cual es ahora la siguiente matriz
2x2:

En realidad, para obtener la matriz de rotación R’θ, lo único que se hace es substituír el ángulo θ
por el ángulo - θ en la matriz Rθ, lo cual equivale a un giro en un ángulo negativo(en sentido
contrario), usando además el hecho de que sen(- θ) = - sen(θ) y cos(- θ) = cos(θ). En ambos
casos, tanto Rθ como R’θ a fin de cuentas son lo mismo, una rotación de ejes.
En la teoría del Álgebra Linear, el primer caso en el cual se rota el vector manteniéndose fijos los
ejes coordenados la rotación es conocida como una rotación Alibi, mientras que en el segundo
caso en el cual se rotan los ejes coordenados manteniéndose fijo el vector la rotación es conocida
como una rotación Alias (la figura de ejemplo muestra un vector de color rojo y de longitud
igual a la unidad);

Las rotaciones que se han llevado a cabo han sido sobre un espacio bi-dimensional Euclideano
en torno al tercer eje, el eje-z:

Podemos llevar a cabo, desde luego, una rotación tal que dicha rotación no esté limitada
exclusivamente a un plano bi-dimensional, sino que se lleve a cabo con respecto a los tres ejes
sobre ángulos α, β y γ, en cuyo caso las matrices de rotación en torno a cada eje se pueden
especificar de una manera como la siguiente:

Estamos interesados ahora en extender el concepto de una rotación del espacio tri-dimensional
Euclideano al espacio cuatri-dimensional relativista. Sin embargo, esto no es un asunto tan
sencillo, en virtud de que mientras que la magnitud (la longitud) invariante de un vector en el
espacio Euclideano está definida usando signos positivos en la adición vectorial de los
componentes del vector:

║V║² = Vx² + Vy² + Vz²

en la Teoría de la Relatividad el equivalente que viene siendo el intervalo relativista tiene


revueltos signos negativos y positivos:

Δs² = (cΔt)² - (Δx)² - (Δy)² - (Δz)²

Esto significa que cualquier intento por aplicar las relaciones trigonométricas que definen a los
ángulos a una rotación que se ha de llevar a cabo en el espacio cuatri-dimensional relativista se
va a venir abajo.

¿Significa esto que no podemos definir el equivalente de una rotación en el espacio cuatri-
dimensional de la Teoría de la Relatividad?

Interesantemente, esto aún es posible. Pero para lograrlo, tenemos que prescindir de la
trigonometría regular y recurrir en cambio a otro tipo de funciones matemáticas que comparten
muchas similitudes con las funciones e identidades de la trigonometría clásica. Nos estamos
refiriendo a las funciones hiperbólicas, de las cuales podemos empezar con la primera de ellas,
el seno hiperbólico definido de la siguiente manera:

Además del seno hiperbólico, tenemos la definición del coseno hiperbólico:

Con estas dos definiciones, podemos definir la tangente hiperbólica de la misma manera en
la que se define en la trigonometría clásica como la razón que hay entre el seno y el coseno de un
ángulo:

Con estas definiciones en nuestras manos, estamos en mejores condiciones para atacar el asunto
al cual le queremos dar solución.

PROBLEMA: Demuéstrese que las ecuaciones de transformación de Lorentz que conectan a


dos sistemas de referencia S y S’ pueden ser expresadas de la manera siguiente:

x’ = x cosh(α) - ct senh(α)

y’ = y

z’ = z

ct’ = - x senh(α) + ct cosh(α)

en donde tanh(α) = V/c. Demuéstrese que esta transformación de Lorentz corresponde a una
rotación a lo largo de un ángulo α en el espacio cuatri-dimensional.
Primero que nada, empezaremos con las transformaciones de Lorentz convencionales:

x’ = γx - γVt

y’ = y

z’ = z

ct’ = γct - (γV/c) x

Puesto que el “empuje” (boost) de Lorentz se lleva a cabo aquí únicamente a lo largo del eje-
x común sobre el cual hay un movimiento relativo a una velocidad V, podemos ignorar las
componentes y’ y z’, lo cual equivale a afirmar que la rotación que se llevará a cabo será una
rotación limitada a dos dimensiones dentro del espacio cuatri-dimensional relativista. Con un
ligero reacomodo podemos escribir las dos ecuaciones relevantes de modo tal que prepararemos
el sistema para su representación en forma de matriz:

x’ = γx - γVt

ct’ = - (γV/c) x + γct

Este sistema de ecuaciones, así como está escrito, se puede representar matricialmente de la
siguiente manera:

Para guiarnos mejor en lo que estamos haciendo, estableceremos una analogía entre esta
representación matricial en la geometría del espacio-tiempo y la representación matricial para
una rotación llevada a cabo en la geometría bi-dimensional Euclideana. Ya vimos arriba que la
matriz para una rotación de coordenadas efectuada en la geometría bi-dimensional Euclideana
es:
Tentativamente, todo parece indicar que podemos establecer las siguientes correspondencias
entre las funciones trigonométricas y las funciones hiperbólicas para reemplazarlas en el caso de
una rotación llevada a cabo en el espacio 4-dimensional relativista:

cos(θ) ↔ cosh(α) ↔ γ

sen(θ) ↔ senh(α) ↔ γV/c

Si hacemos:

cosh(α) = γ

senh(α) = γV/c

Tenemos entonces las siguientes transformaciones modificadas de Lorentz:

x’ = x cosh(α) - ct senh(α)

ct’ = - x senh(α) + ct cosh(α)

Esta es la transformación que estabamos buscando, la cual puede ser puesta en forma matricial
de la siguiente manera:

Geométricamente hablando, la matriz simple de Lorentz lleva a cabo una rotación


de coordenadas a través de un ángulo α en el espacio 4-dimensional propio de la
Teoría de la Relatividad.

El lector observador posiblemente objetará que mientras que en la geometría bi-dimensional


Euclideana el término sen(θ) dentro de la matriz de rotación tiene signos diferentes, el término
correspondiente senh(α) tiene el mismo signo (negativo). Ciertamente, tenemos una
transformación válida, en la forma en la que la hemos definido, pero ¿cómo podemos estar tan
seguros de que dicha transformación pueda ser considerada como una rotación del plano x-ct?
La respuesta final dependerá del hecho de que la transformación modificada de Lorentz pueda
ser capaz de respetar la longitud del intervalo relativista de la misma manera en que una
rotación sobre el plano Euclideano deja intacta la longitud de un vector, lo cual confirmaremos
un poco más adelante. Empezaremos por aclarar esta duda formulándonos otra pregunta:

¿Por qué razón nos fue posible llevar a cabo una rotación en el espacio 4-dimensional relativista
mediante el uso de las funciones hiperbólicas senh(α) y cosh(α)? La respuesta la encontramos
en el graficado de dichas funciones. Así como los puntos (cos t, sin t) trazan un círculo unitario
(de radio 1), del mismo modo los puntos (cosh α, sinh α) forman la mitad derecha de una
hipérbola equilátera. Haciendo:

x = cosh(a)

y = sinh(a)

y trazando este par de ecuaciones paramétricas (ambas dependientes del parámetro a)


obtenemos la siguiente gráfica:
en la cual la ecuación de la hipérbola equilátera resultante está dada por la ecuación Cartesiana:

x² - y² = 1

Esta es precisamente la misma hipérbola que se vió en la entrada titulada “Invariantes”.

Comprender lo que acabamos de ver nos prepara mejor para la resolución del siguiente

PROBLEMA: Utilizando la identidad:

cosh²(α) - senh²(α) = 1

demostrar la invariancia del intervalo relativista a partir de estas ecuaciones.

El intervalo relativista entre dos puntos en un marco de referencia S, considerando que no hay
movimiento relativo alguno entre los ejes Cartesianos en relación al eje-y y al eje-z, puede ser
definido de la siguiente manera:

Δs² = (cΔt)² - (Δx)²

Ya hemos visto que, al pasar de un marco de referencia a otro, este intervalo relativista debe
permanecer invariante bajo las ecuaciones de transformación de Lorentz. Para mayor
simplicidad notacional, consideraremos un intervalo relativista tal que uno de los puntos
extremos del intervalo está situado en el origen del sistema de coordenadas. Con esto, el
intervalo relativista puede ser representado en forma más sencilla de la siguiente manera:

Δs² = (ct)² - (x)²

Utilizando funciones hiperbólicas para llevar a cabo geométricamente una rotación de los ejes
coordenados en el espacio 4-dimensional, ya vimos arriba que las transformaciones de Lorentz
para pasar de un marco de referencia S a otro marco de referencia S’ se pueden escribir de la
siguiente manera:

x = x’ cosh(α) - ct’ senh(α)

ct = - x’ senh(α) + ct’ cosh(α)


Procedemos a meter directamente estas ecuaciones de transformación en la definición que
tenemos del intervalo relativista:

Δs² = [- x’ senh(α) + ct’ cosh(α)]² - [x’ cosh(α) - ct’ senh(α)]²

Expandiendo y simplificando:

Δs² = (x’)² senh²(α) - 2(x’)(ct’) senh(α) cosh(α) + (ct’)² cosh²(α)


- (x’)² cosh²(α) + 2(x’)(ct’) senh(α) cosh(α) - (ct’)² senh²(α)

Δs² = [cosh²(α) - senh²(α)](ct’)² - [cosh²(α) - senh²(α) ](x’)²

Utilizamos aquí la identidad hiperbólica dada en el enunciado del problema, para obtener:

Δs² = (ct’)² - (x’)²

Δs² = Δs’²

De este modo, el intervalo relativista permanece invariante al haberse llevado a cabo la rotación
geométrica de las coordenadas del 4-espacio mediante el uso de las funciones hiperbólicas.

PROBLEMA: La ley de adición de velocidades relativista tiene una forma más sencilla si
recurrimos a la ayuda de la tangente hiperbólica. Si usamos la definición:

tanh(α) = V/c

demostrar que la ley de adición de velocidades puede escribirse de la siguiente manera:

V = c tanh(α1 + α2)

en donde α1 es el parámetro de velocidad asociado con una de las velocidades a ser sumada, y
α2 es el parámetro de velocidad asociado a la otra velocidad. Obsérvese que, de este modo, los
parámetros de velocidad se suma linealmente.

Empezando con la ley de adición de velocidades:


podemos utilizar la definición de la tangente hiperbólica para escribir lo siguiente:

V1 = c tanh(α1)

V2 = c tanh(α2)

Reemplazando estas dos igualdades en la ecuación anterior:

Simplificando:

Dada la enorme semejanza que hay entre las funciones hiperbólicas y las funciones
trigonométricas, el aspecto de la ecuación que acabamos de obtener nos hace sospechar sobre la
posibilidad de que haya una identidad similar a la que encontramos en la trigonometría clásica.
Un búsqueda breve confirma nuestras sospechas, al encontrar la siguiente
identidad hiperbólica:

cuya contraparte en la trigonometría clásica es la siguiente identidad trigonométrica:

Con esto obtenemos entonces el resultado que se deseaba demostrar:


V = c tanh(α1 + α2)

PROBLEMA: Suponiendo que dentro de un vagón de ferrocarril moviéndose a una velocidad


de 200 kilómetros por segundo, o sea dos terceras partes de la velocidad de la luz, una pelota
es arrojada dentro del vagón también a una velocidad de 200 mil kilómetros por segundo,
¿cuál será la velocidad de la pelota vista en tierra a un lado de las vías por un observador en
reposo? Trabájese el problema con la fórmula que se acaba de obtener arriba.

Si la pelota es arrojada dentro de un vagón de ferrocarril a una velocidad V1 igual a dos terceras
partes de la velocidad de la luz, o sea V1 = 2c/3, entonces el parámetro de velocidad α1 asociado
con la pelota es:

tanh( α1) = V1/c

α1 = tanh-1(V1/c)

α1 = tanh-1(2/3)

α1 = 0.805

Siendo V2 = V1 = 2c/3, entonces α2 = α1, con lo cual aplicamos la fórmula:

V = c tanh(α1 + α2) = c tanh(0.805 + 0.805)

V = 0.923 c

La representación matricial de las transformaciones de Lorentz nos permite obtener otra


perspectiva diferente sobre lo que se lleva a cabo con dichas transformaciones.

PROBLEMA: Desde una estrella un viajero espacial mide la velocidad de otra estrella que se
está alejando a una velocidad de 0.9c. Desde la segunda estrella se mide la velocidad de otra
tercera estrella que se está alejando también a 0.9c de la segunda, y así sucesivamente, hasta
llegar a cierto número N de estrellas. ¿Cuál es la velocidad de la estrella N relativa a la
velocidad de la primera estrella?

La resolución de este problema requiere sumar relativísticamente la velocidad de la primera


estrella a la segunda, y tras esto la velocidad de la segunda estrella a la tercera, y así
sucesivamente, hasta llegar a la estrella N. Utilizando la fórmula convencional para adición
relativista de velocidades el problema se vuelve laborioso. Pero si en lugar de utilizar la fórmula
convencional utilizamos la fórmula relativista dada en función de parámetros de velocidad,
entonces el problema se reduce a la suma linear de los parámetros de velocidad:

V = c tanh(α1 + α2 + α3 + ... + αn)

Puesto que las velocidades relativas de recesión son iguales (0.9c), entonces los parámetros de
velocidad también son iguales:

α1 = α2 = α3 = ... = αn = α

con lo cual:

V = c tanh(Nα)

Pero cada parámetro de velocidad está dado individualmente por:

α = tanh-1(V/c)

Entonces la relación que buscamos resulta ser la siguiente:

V = c tanh[N tanh-1(V/c)]

El intervalo relativista, en su forma más general admitiendo la posibilidad de que pueda haber
movimientos relativos entre los cuatro ejes coordenados del sistema de referencia S y del
sistema de referencia S’, puede ser definido como:

Δs² = (cΔt)² - (Δx)² - (Δy)² - (Δz)²

tiene a su vez la siguiente representación matricial:

La matriz intermedia representa los 16 componentes de ese objeto que anteriormente ya


habíamos dicho que se conoce como el tensor métrico, en este caso el que corresponde a un
espacio-tiempo plano (Lorentziano).

Para la derivación que vamos a llevar a cabo, escogemos un intervalo relativista tal que un
extremo del mismo tenga el punto situado en el origen (0,0,0,0) común a ambas coordenadas en
un tiempo t = 0. De este modo, podemos representar dicho intervalo relativista
mediante coordenadas generalizadas:

x0 = cΔt___x1 = x___x2 = y___x3 = z

simplemente como:

Δs² = (x0) ² - (x1) ² - (x2) ² - (x3) ²

y representando a las 16 componentes de la matriz 4x4 a la cual llamaremos G como gij, el triple
producto matricial arriba mostrado se puede representar mediante una doble sumatoria de la
siguiente manera:

Para un intervalo relativista tipo luminoso en el que Δs² = 0, lo anterior tiene que tener un valor
igual a cero:

Bajo una rotación cuatri-dimensional que involucre a las cuatro coordenadas, el intervalo
relativista de tipo luminoso debe seguir siendo igual a cero. Esto nos lleva a lo que se conoce
como la invariancia del cono de luz, con lo cual:

( x1) ² - ( x2) ² - ( x3) ² - ( x4) ² = 0

y la representación de lo mismo mediante sumatorias es:


De este modo, usando sumatorias, la ecuación de invariancia del cono de luz se puede expresar
de la siguiente manera:

En notación matricial explícita, escribiendo todos los elementos de la matriz G = (gij), podemos
representar la ecuación de doble sumatoria del lado derecho de la manera siguiente:

En notación matricial compacta, podemos escribir lo mismo en la forma:

X G XT = 0

en donde X T representa un vector columna que viene siendo la transpuesta del


vector renglón X .

Por otro lado, la matriz general de Lorentz Λ = (λij):

que lleva al 4-vector en el sistema S:

[ x1__x2 __x3__x4 ]
al siguiente 4-vector en el sistema S:

[ x1__x2 __x3__x4 ]

debe ser necesariamente el arquetipo de la transformación linear, lo cual requiere de la


existencia de constantes λij tales que:

Puesto que tenemos dos sumatorias en la ecuación de invariancia del cono de luz que involucran
en forma repetida a las coordenadas x, vamos a tener que definir dostransformaciones lineares,
una para cada transformación de coordenadas, usando para ello sub-índices diferentes:

Obedeciendo las reglas de multiplicación de matrices, una de estas transformaciones la


podemos representar matricialmente escribiendo al vector de coordenadas como un
vector renglón para pasar de un sistema S a otro sistema S:

En notación matricial compacta, esto se escribe de la siguiente manera:

X = XΛT

siendo ΛT la matriz transpuesta de la matriz Λ:


La otra transformación la podemos representar escribiendo al vector de coordenadas como un
vector columna para pasar de un sistema S a otro sistema S:

En notación matricial compacta, esto se escribe de la siguiente manera:

X T = ΛXT

Obsérvese que podemos obtener rápidamente una representación matricial de la otra usando la
propiedad fácilmente verificable para dos matrices de que la transpuesta del producto de dos
matrices A y B es igual al producto matricial de las transpuestas tomadas en el orden inverso, o
sea:

(AB)T = BTAT

Por extensión:

(ABC)T = CTBTAT

Volviendo a la ecuación de invariancia del cono de luz:

X G XT = 0

si substituímos en la representación de sumatorias las transformaciones para cada uno de


los vectores de coordenadas X, obtenemos lo siguiente:
Reagrupando los símbolos y el orden de la tercera y la cuarta sumatorias:

El reagrupamiento en el orden de los factores de las sumatorias que aparecen en el lado derecho
de la ecuación no parece haber sido suficiente para poder visualizar una simplificación
posterior. A estas alturas, resultará mucho más provechoso intentar acomodar dichos factores
de modo tal que la sumatoria multiple se pueda trasladar a una representación matricial. Y de
hecho, ya vimos precisamente esto mismo al final de la entrada “Representaciones matriciales”,
en donde partiendo de la siguiente sumatoria múltiple:

reacomodamos los factores de la sumatoria usando como guía el requerimiento de que los sub-
índices estén apareados conforme son leídos de izquierda a derecha en la sumatoria ya
reacomodada:

con lo cual la representación matricial salta a la vista casi de inmediato, la cual en notación
matricial compacta resulta ser:

XTΛT G Λ X

Para poder lograr esta representación matricial, tomando en cuenta que la sumatoria múltiple
debe producir al final el número cero (que matricialmente viene siendo una matriz que consta
de un solo renglón y de una sola columna), la necesidad de aparear los sub-índices nos obligó a
tomar la transpuesta de la matriz Λ, la cual representamos de color rojo como ΛT; y también
nos obligó a usar la representación del vector columna X como el vector renglón tomando la
transpuesta de X y representándolo como XT. Esto significa que en la sumatoria múltiple
preparada para su representación matricial en donde aparecen XTy ΛT de color rojo como
corresponde a las transpuestas, si bien en lo que respecta al componente xi dentro de la
sumatoria el cambio no tiene efecto alguno, el componente λiren caso de llevarse a cabo la
sumación sobre esa expresión tiene que ser interpretado no como el elemento dentro de la
matriz Λ que está en el renglón i y la columna r sino como el elemento dentro de la matriz que
está dentro del renglón r y la columna i.

Así pues, lo que tenemos en el lado derecho de la ecuación original de la ecuación de invariancia
del cono de luz representado mediante sumatorias es algo que representado mediante un
producto matricial nos involucra el producto de cinco matrices, lo cual si se tratase de matrices
3x3 en vez de matrices 4x4 tendría un aspecto como el siguiente:

Usando vectores con cuatro componentes y matrices 4x4, el número de multiplicaciones y


adiciones de componentes requeridas para tratar de llevar a cabo cualquier simplificación
posterior parece intimidante. En notación matricial compacta, lo que tenemos en esto último
que hemos llevado a cabo es el resultado de las siguientes operaciones:

X G XT = 0

(XΛT) G (ΛXT) = 0

XΛTGΛXT = 0

Esto es justo lo que tenemos arriba tanto en la notación matricial explícita como en la
representación mediante sumatorias múltiples.

Usando la representación que más nos convenga, no es difícil demostrar que si:

XGXT=0
entonces el requerimiento en la ecuación de invariancia del cono de luz:

nos debe resultar en lo siguiente:

o bien en notación matricial compacta:

ΛTGΛ = G

El aspecto del lado izquierdo de la ecuación matricial en donde tenemos el producto de tres
matrices en la forma XTAX posiblemente resultará familiar para muchos que han tomado un
buen curso de Álgebra Linear, ya que la operación XTAX = B es precisamente el tipo de
operación que se lleva a cabo para diagonalizar una matriz A, obteniendo el equivalente Bde la
misma que seguirá poseyendo algunas características importantes de la matriz original excepto
que únicamente la diagonal principal de la matriz contendrá valores diferentes de cero, todos los
demás elementos fuera de la diagonal principal serán iguales a cero. Sin embargo, y esto es
importante, aquí no estamos llevando a cabo una operación para diagonalizar una matriz, ya
que la matriz intermedia G queda intacta tras la operación matricial, esto es:

ΛTGΛ = G

Aquí lo que estamos haciendo es en cierta forma un procedimiento “al revés”, en el cual
tratamos de determinar los valores de los componentes de la matriz Λ para que una vez que se
haya efectuado la operación del lado izquierdo obtengamos el resultado que aparece en el lado
derecho, o sea G. Este truco que estamos efectuando no es más que la implementación matricial
de la validez de la invariancia del cono de luz bajo dos sistemas de coordenadas distintos.

Llevando a cabo las multiplicaciones matriciales en el lado izquierdo de la ecuación matricial e


igualando cada uno de los 16 componentes con las entradas que aparecen en la matriz del lado
derecho, y eliminando los resultados repetidos, obtenemos las siguientes diez condiciones para
determinar si una matriz cualquiera es una matriz general de Lorentz:

(λ00)² - (λ10)² - (λ20)² - (λ30)² = 1

(λ0j)² - (λ1j)² - (λ2j)² - (λ3j)² = - 1___para j = 1, 2, 3

λ0i λ0j - λ1i λ1j - λ2i λ2j - λ3i λ3j = 0___para i ≠ j

PROBLEMA: Demostrar que la siguiente matriz es una matriz general de Lorentz:

Recurriremos a las relaciones que acabamos de obtener arriba, las cuales se deben cumplir si la
matriz es realmente una matriz general de Lorentz.

Primera condición, se cumple:

(λ00)² - (λ10)² - (λ20)² - (λ30)² =

(√3)² - (1)² - (1)² - (1)² = 1

Segunda condición, se cumple:

(λ01)² - (λ11)² - (λ21)² - (λ31)² =

(√2)² - (√6/2)² - (√6/2)² - (0)² = - 1


Tercera condición, se cumple:

(λ02)² - (λ12)² - (λ22)² - (λ32)² =

(0)² - (1/2)² - (-1/2)² - (-√2/2)² = -1

Cuarta condición, se cumple:

(λ02)² - (λ12)² - (λ22)² - (λ32)² =

(0)² - (1/2)² - (-1/2)² - (√2/2)² = -1

Quinta condición (multiplicación conjunta de las primeras dos columnas), se cumple:

λ00 λ01 - λ10 λ11 - λ20 λ21 - λ30 λ31 =

(√3)(√2) - (1)(√6/2) - (1)(√6/2) - (0)(0) = 0

Sexta condición (multiplicación conjunta de la primera columna y la tercera columna), se


cumple:

λ00 λ02 - λ10 λ12 - λ20 λ22 - λ30 λ32 =

(√3)(0) - (1)(1/2) - (1)(-1/2) - (0)(-√2/2) = 0

Séptima condición (multiplicación conjunta de la primera columna y la cuarta columna), se


cumple:

λ00 λ03 - λ10 λ13 - λ20 λ23 - λ30 λ33 =

(√3)(0) - (1)(1/2) - (1)(-1/2) - (0)(√2/2) = 0

Octava condición (multiplicación conjunta de la segunda columna y la tercera columna), se


cumple:
λ01 λ02 - λ11 λ12 - λ21 λ22 - λ31 λ32 =

(√2)(0) - (√6/2)(1/2) - (√6/2)(-1/2) - (0)(-√2/2) = 0

Novena condición (multiplicación conjunta de la segunda columna y la cuarta columna), se


cumple:

λ01 λ03 - λ11 λ13 - λ21 λ23 - λ31 λ33 =

(√2)(0) - (√6/2)(1/2) - (√6/2)(-1/2) - (0)(√2/2) = 0

Décima condición (multiplicación conjunta de la tercera columna y la cuarta columna), se


cumple:

λ02 λ03 - λ12 λ13 - λ22 λ23 - λ32 λ33 =

(0)(0) - (1/2)(1/2) - (-1/2)(-1/2) - (-√2/2)(√2/2) = 0

Habiendose cumplido todas las condiciones requeridas, se concluye que la matriz


proporcionada es, en efecto, una matriz general de Lorentz.

PROBLEMA: En la derivación de la condición ΛTGΛ = G, al ser llevada a cabo utilizando


sumatorias se encontró que el procedimiento era algo tardado y laborioso. Llevar a cabo la
derivación de esta misma condición utilizando exclusivamente notación matricial compacta,
sin utilizar sumatorias y sin recurrir a notación matricial explícita.

En notación matricial compacta, la ecuación de invariancia del cono de luz puede ser expresada
de la siguiente manera:

XTGX = 0 = X TGX

Si la matriz general de transformación de Lorentz Λ preserva X TGX, entonces haciendo :

X = ΛX

tenemos lo siguiente:
XTGX = 0 = (ΛX)TG(ΛX)

XTGX = 0 = XTΛTGΛX

XTGX = 0 = XT(ΛTGΛ)X

con lo cual se concluye que ΛTGΛ = G.

Obsérvese cómo el uso de la notación matricial, sobre todo la notación matricial compacta,
puede simplificar enormemente la resolución de un problema que involucre varias sumatorias.
Esto será de enorme importancia cuando pasemos al estudio de la Teoría General de la
Relatividad, en la cual entramos en contacto con notación tensorial que se basa precisamente en
el uso intensivo de sumatorias. Al resolver problemas planteados en notación tensorial, la
primera prioridad debe ser trasladar la planteación tensorial basada en sumatorias a su
representación equivalente utilizando matrices, con lo cual podemos avanzar mucho más
rápidamente.

En lo que hemos estado tratando en realidad se ha estado hablando acerca de la preservación de


la métrica G bajo las transformaciones de Lorentz. Si hacemos extensiva la
condición ΛTGΛ = G para cualquier tipo de matriz métrica G, tenemos entonces una conclusión
importante: las métricas G de los espacios-tiempos curvos de la Teoría General de la
Relatividad son invariantes bajo las transformaciones de Lorentz.

Hemos visto cómo comprobar si una matriz dada es una matriz que representa una
transformación general de Lorentz. Pero no hemos visto aún cómo podemos obtener las
ecuaciones que nos conduzcan a una transformación general de Lorentz, o sea,
cómo obtener dicha matriz. Por ejemplo, si la velocidad entre los ejes coordenados a lo largo
del eje-x es Vx = (3/4) c, y si la velocidad entre los ejes a lo largo del eje-y es Vy = (5/6) c, y si la
velocidad entre los ejes a lo largo del eje-z es Vz = (1/2) c, ¿cuál es la matriz que representa la
transformación general de Lorentz entre el sistema de referencia S y el sistema de referencia S’?

Ya se había mencionado en una entrada anterior que si realmente estamos interesados en


derivar las relaciones que corresponden a la transformación general de Lorentz cuando los
marcos de referencia están en movimiento relativo el uno con respecto al otro a través de tres
ejes coordenados en lugar de uno solo, la demostración se puede simplificar enormemente si
recurrimos a notación vectorial clásica denotando como el vector posición x a la ubicación de un
punto en el sistema coordenado S:

x = (x, y, z)

y denotando la ubicación del mismo punto en el sistema coordenado S’ como:

x’ = (x’, y’, z’)

simbolizando asimismo a la velocidad relativa V que hay entre los dos marcos de referencia
como un vector V (con letra negrita) con componentes relativos en cada uno de los tres ejes
Cartesianos:

v = (Vx, Vy, Vz)

Lo anterior lo hacemos en conjunción con la notación vectorial del producto punto ó producto
escalar entre dos vectores:

x · v = (x, y, z) · (Vx, Vy, Vz) = xVx + yVy + zVz

Con esta notación, estamos preparados para obtener la transformación general de Lorentz que
estamos buscando tanto para las componentes espaciales como para la componente temporal.

PROBLEMA: Suponiendo que el movimiento relativo entre dos sistemas de referencia a una
velocidad V se lleva a cabo no sólo a lo largo del eje-x sino también a lo largo del eje-y y del
eje-z, demostrar que la transformación general de Lorentz está dada por las siguientes dos
relaciones:

Este problema es ni más ni menos que la obtención de las transformación general de Lorentz en
la cual el movimiento relativo entre los dos marcos de referencia no está limitado ya a un
movimiento relativo entre los ejes-x. La clave para la resolución de este problema radica en
darse cuenta que la única transformación Lorentziana de componentes se llevará a cabo
únicamente sobre aquellos componentes vectoriales que estén dirigidos en la misma
dirección (paralelos, en el espacio tri-dimensional) al vector de velocidad v que ocurre entre
ambos marcos de referencia. Los componentes que sean perpendiculares permanecerán
inalterados ya que no recibirán un “empuje” (boost) Lorentziano. El vector posición x de un
punto en el sistema de referencia S se puede descomponer en la suma vectorial de dos vectores,
uno perpendicular (en la misma dirección) que el vector velocidad v, y el otro paralelo al vector
velocidad v:

Gráficamente, lo que estamos haciendo es lo siguiente:

La componente perpendicular al vector velocidad v permanecerá inalterada entre ambos marcos


de referencia:

mientras que la componente del vector posición paralela al vector velocidad v sufrirá un empuje
Lorentziano, el cual vectorialmente es una extensión de la transformación básica de Lorentz:

x’ = γ(x - Vt)

que ya habíamos obtenido anteriormente:


En la derivación que llevaremos a cabo, utilizaremos la siguiente relación vectorial que se
demuestra en cualquier curso bueno de Análisis Vectorial:

Esta relación nos dice que si descomponemos a un vector A (que en nuestro caso será el vector
posición x) en la suma vectorial de una componente perpendicular a otro vector B y en una
componente paralela al vector B (a la cual llamamos la proyección de A sobre B) la componente
paralela será igual al producto escalar de los vectores A y B (A·B) entre el cuadrado de
la magnitud del vector B (= B²) multiplicado todo por el vector B que le fija dirección a dicha
componente en el mismo sentido de B. En nuestro caso, la relación nos garantiza que:

Ahora bien, el vector posición x’ en el sistema de referencia S’ también se debe poder


descomponer en dos componentes, una perpendicular y la otra paralela al vector velocidad v:

Introducimos aquí la relación de transformación de Lorentz dada arriba:

Recurrimos ahora a la relación vectorial dada arriba:

A continuación, sacamos fuera de los paréntesis cuadrados el vector velocidad v y metemos el


factor γ:
Hacemos uso ahora de la descomposición del vector posición x en sus componentes paralela y
perpendicular puesta arriba:

Nuevamente recurrimos a la relación vectorial dada arriba:

Metemos el segundo término dentro de los paréntesis cuadrados:

Por último, factorizando a la constante γ que obra en el primer término y el segundo término de
los paréntesis cuadrados, obtenemos la relación general de transformación de Lorentz para las
coordenadas espaciales dada arriba.

En lo que respecta a la coordenada del tiempo, la coordenada temporal, tomando como base la
transformación de Lorentz para dicha coordenada cuando el movimiento se lleva a cabo única y
exclusivamente entre los ejes-x:

t’ = γ(t - Vx/c²)

t’ = γ[t - (V/c²) x]

introducimos para x la magnitud del vector posición (¡no el vector!) que corresponde a la
componente paralela al vector velocidad que dá el empuje de Lorentz, y que viene siendo:
Metiendo esta relación arriba para convertirla en una transformación general de Lorentz para la
coordenada del tiempo obtenemos el paso que completa las demostraciones pedidas:

Al recurrir a notación vectorial para resolver en forma abreviada lo que de otra manera sería un
problema laborioso si usáramos la notación explícita de las componentes rectangulares
(Cartesianas) estamos haciendo algo parecido a lo que hizo Einstein al recurrir a la
notación tensorial por las mismas razone

Los 4-vectores I
Darle a la Teoría Especial de la Relatividad una interpretación geométrica resultó ser el paso
crucial que preparó a Einstein para poder concebir la Teoría General de la Relatividad. Para ello,
el paso intermedio resultó ser la adopción de lo que matemáticamente conocemos como los 4-
vectores.

Si bien hemos definido el momentum relativista y la energía relativista, es lógico suponer que
ambas cantidades tomadas independientemente la una de la otra no permanecerán invariantes
al pasar de un marco de referencia a otro. Podemos esperar que el simple momentum relativista
P = γm0u cambie al pasar de un marco de referencia a otro en virtud de que con el cambio del
marco de referencia la velocidad u de un cuerpo ya no será la misma para distintos
observadores. Y de la energía relativista podemos afirmar otro tanto similar. Requerimos, pues,
establecer las ecuaciones de transformación con las cuales dados el momentum relativista y la
energía relativista de un cuerpo en cierto marco de referencia podamos obtener el momentum
relativista y la energía relativista del mismo cuerpo en otro marco de referencia.

PROBLEMA: Obtener las transformaciones del momentum y la energía que deben ser
utilizadas al pasar de un marco de referencia a otro cuando ambos marcos están moviéndose
el uno con respecto al otro a una velocidad relativa V con respecto a sus ejes comunes
alineados en x. Obtener asimismo las transformaciones inversas.

En el caso de la energía, puesto que la energía es una cantidad escalar que no posee dirección y
sentido, sólo requerimos de una ecuación de transformación. En cambio el momentum, por ser
una cantidad vectorial que definitivamente posee dirección y sentido, este momentum p tendrá
tres componentes distintas en un sistema de coordenadas rectangulares (Cartesiano) que serán
el triplete (px, py, pz).

Ya habíamos visto que el momentum relativista (dentro del marco de referencia S de un


observador en reposo) de un cuerpo con masa propia m0 moviéndose a una velocidad u está
dado por la relación:

p = γm0u² = m0u²/√1 - u²/c²

Por otro lado, ya habíamos visto también que la energía total del mismo cuerpo moviéndose a
esa velocidad u está dada por la relación:

E = γm0c² = m0c²/√1 - u²/c²

Vamos a poner ahora a dicho cuerpo en un marco de referencia que está moviéndose a una
velocidad V a lo largo del eje-x, dentro del cual el cuerpo tendrá una velocidad u’. Es importante
recordar que esta velocidad u’ es una velocidad que no está confinada única y exclusivamente al
eje-x, ya que puede tener componentes en los otros dos ejes que sumados vectorialmente nos
dan la velocidad resultante u en el marco de referencia S’:

(u’)² = (u’x)² + (u’y)²+ (u’z)²

Obviamente, y del mismo modo, en el marco de referencia S:

(u)² = (ux)² + (uy)²+ (uz)²

Adoptaremos ahora una convención a la que nos aferraremos rígidamente. El símbolo γ lo


reservaremos única y exclusivamente para denotar el movimiento relativo entre ambos marcos
de referencia a lo largo de sus ejes comunes en la abcisa x a una velocidad V, o sea:

γ = /√1 - V²/c²

Lo anterior significa que, en ningún momento, intentaremos utilizar el símbolo γ para


representar ya sea:

1/√1 - u²/c²
ó:

1/√1 - (u’)²/c²

Estas últimas dos expresiones las dejaremos tal cual. Esta aclaración es importante porque el
tratar de asignarles el símbolo γ a cualquiera de ellas (ó ambas) puede ser causa de confusión
posterior dificultando las derivaciones que estamos tratando de llevar a cabo.

Las componentes en un sistema de coordenadas rectangulares de la velocidad u del cuerpo en el


marco de referencia S están relacionadas con las componentes en un sistema de coordenadas
rectangulares de la velocidad u’ del cuerpo en el marco de referencia S’ de acuerdo con la suma
relativista de velocidades que ya habíamos estudiado con anterioridad:

Dada la similitud de los cálculos algebraicos requeridos para obtener las transformaciones de
momentum y energía de un marco de referencia a otro, llevaremos a cabo aquí una
manipulación general que servirá para ambos casos. Podemos ver de ambas relaciones para el
momentum y la energía que requerimos poner el denominador de ambas:

1/√1 - u²/c²

en función de u’x, u’y y de u’z, haciéndolo a través de u. Empezaremos primero por la relación:

u² = (ux)² + (uy)²+ (uz)²


introduciendo en la misma las tres transformaciones dadas arriba para la suma relativista de
velocidades en cada uno de los tres ejes:

Elevando al cuadrado el lado derecho y poniendo todo bajo común denominador:

Entonces:

En el lado derecho de la igualdad, después de haber puesto todo bajo un común denominador,
tenemos el siguiente numerador:

γ²c² (1 + Vu’x/c²)² - γ² (u’x + V)² - u’y² - u’z²

Como paso intermedio de simplificación, factorizaremos ahora a γ sacándolo del camino:

γ²[c² (1 + Vu’x/c²)² - (u’x + V)² - u’y²/γ² - u’z²/γ²]

Dentro de los paréntesis cuadrados, en relación a los dos últimos términos, tenemos 1/γ², que es
igual a:

1/γ² = 1 - V²/c²
con lo cual:

γ²[c² (1 + Vu’x/c²)² - (u’x + V)² - u’y²(1 - V²/c²) - u’z²(1 - V²/c²)]

Expandiendo los binomios cuadráticos y removiendo paréntesis:

γ²[c² + 2Vu’x + V²u’x²/c² - u’x² - 2u’xV - V² - u’y² + V²u’y²/c² - u’z² + V²u’z²/c² ]

γ²[c² - V² + V²u’x²/c² - u’x² - u’y² + V²u’y²/c² - u’z² + V²u’z²/c²]

γ²[c² - V² + (u’x² + u’y²+ u’z²)V²/c² - (u’x² + u’y²+ u’z²)]

Para continuar simplificando el numerador, recurrimos a la relación dada arriba:

(u’x)² + (u’y)²+ (u’z)² = (u’)²

con lo cual podemos continuar adelante con la simplificación:

γ²[c² - V² + u’²V²/c² -u’²)]

γ²[c² - V² - u’²(1 - V²/c²)]

γ²[c²(1 - V²/c²) - u’²(1 - V²/c²)]

γ²[(1 - V²/c²)(c² - u’²)]

γ²c²(1 - V²/c²)(1 - u’²/c²)

Poniendo este numerador simplificado sobre el denominador:

γ²c² (1 + Vu’x ²/c²)²

entonces tras cancelarse mutuamente los factores γ²c² que hay arriba en el numerador y abajo
en el denominador tenemos lo siguiente:
Invirtiendo ambos miembros de la igualdad y extrayendo raíz cuadrada:

Reestableciendo la cantidad γ subiendo √1 - V²/c² al numerador para formar 1/√1 - V²/c² :

Con esto, encontramos que la componente del momentum sobre el eje-x, Px, que está definida
por la siguiente relación:

toma la siguiente forma con el resultado que obtuvimos arriba para 1/√1 - u²/c²:

Teniendo en mente que el desplazamiento relativo entre los marcos de referencia S y S’ ocurre
únicamente a lo largo del eje-x, la componente del momentum sobre el eje-y, Py, está dada por:
Finalmente, la componente del momentum sobre el eje-z, Pz, está dada por:

En lo que respecta a la energía relativista, tenemos lo siguiente:

Utilizando las expresiones para el momentum y la energía en el marco de referencia S’, las
expresiones anteriores pueden ser escritas de la siguiente manera:

Para obtener las transformaciones inversas simplemente despejamos de las transformaciones


de energía y momentum obteniendo de este modo lo siguiente:
Las leyes de transformación para la energía y el momentum de un marco de referencia a otro no
son difíciles de recordar en virtud de que son similares a las ecuaciones de transformación de
Lorentz para la longitud y el tiempo. Comparemos las leyes de transformación para la
energía y el momentum de un marco de referencia S a otro marco de referencia S’:

E = γ(E’ + Vp’x)

py = p’y

pz = p’z

px = γ(p’x + VE’/c²)

con las ecuaciones de transformación de Lorentz:

x = γ(x’ + Vt’)

y = y’

z = z’

t = γ(t’ + Vx’/c²)

Aunque se trata de cantidades físicas distintas, obsérvese la similitud entre ambos conjuntos de
transformaciones. px se transforma como la coordenada espacial x, y la energía E se transforma
como c²t. Esto nos hace sospechar que hay algo común de fondo en la similitud que hemos
obtenido en las transformaciones.
Puesto que el tiempo y el espacio, ambos conceptos independientes en la física clásica, han sido
unificados bajo un solo concepto en la interpretación geométrica de Minkowski de la Teoría
Especial de la Relatividad, el concepto del espacio-tiempo, y han sido agrupados como
componentes iguales bajo un solo vector cuatri-dimensional:

[ct, x, y, z]

entonces, ¿por qué no hacer lo mismo con el momentum y la energía relativistas, agrupándolos
en igualdad de condiciones como los cuatro componentes de un vector cuatri-dimensional? Esto
es precisamente lo que se ha hecho, adoptándose el uso del 4-vector energía-momentum
conocido también como el 4-momentum:

P = [E/c, px, py, pz]

simbolizado con una letra P mayúscula, el cual también puede ser escrito como:

[E, pxc, pyc, pzc]

En ambos casos, las cuatro componentes del 4-vector energía-momentum ó 4-


momentum deben tener la misma dimensión, ya sea de momentum o de energía.

Si escribimos las leyes de transformación del 4-vector energía-momentum utilizando notación


de vectores columna:

entonces resulta obvio que podemos reescribir el lado derecho de esta ecuación vectorial como
un producto de matrices:
que representa el siguiente sistema de ecuaciones:

E’ = γE - βγpxc + 0pyc + 0pzc

px’c = - βγE + γpxc + 0pyc + 0pzc

py’c = 0E + 0pxc + 1pyc + 0pzc

pz’c = 0E + 0pxc + 0pyc + 1pzc

Esto amerita ser contrastado con la representación matricial de la transformación del 4-


vector espacio-tiempo en un sistema de referencia S a un sistema de referencia S’:

Tanto en el caso en el que se involucra a 4-vectores energía-momentum como el caso en el que


se involucra a 4-vectores espacio-tiempo bajo un esquema Lorentziano, la matriz de
transformación resulta ser exactamente la misma.

De este modo, las definiciones como se han estado dando y las matemáticas del asunto nos
indican que, de modo natural, todo lo que tiene que ver con la Teoría Especial de la Relatividad
puede y debe ser manejado bajo un espacio cuatri-dimensional.

El haber juntado a la energía y el momentum como las cuatro componentes de un 4-vectorestá


justificado también por la nueva invariante que nos produce. Ya habíamos anteriormente la
siguiente expresión que nos relaciona la energía total de energía E de un cuerpo con la magnitud
de su cantidad de movimiento p y su energía en reposo m0c²:

E² = (pc)² + (m0c²)²

Despejaremos a continuación el lado derecho de la ecuación dejando únicamente a la masa en


reposo de dicho lado:
E² - (pc)² = (m0c²)²

El siguiente paso será dividir ambos miembros de la igualdad entre c² obteniendo:

(E/c)² - p² = m0²c²

Del lado derecho tenemos el producto de dos cantidades invariantes, porque la masa
propiam0 de un cuerpo debe ser la misma en cualquier sistema de referencia, y la velocidad de
la luz c también es una invariante absoluta de acuerdo con el segundo postulado de la Teoría
Especial de la Relatividad. Entonces el lado derecho de la ecuación es una invariante, y en virtud
de la igualdad el lado izquierdo de la ecuación también debe ser una cantidad invariante. Esto
significa que para dos sistemas de referencia distintos S y S’ en los cuales para el mismo cuerpo:

E² = (pc)² + (m0c²)²

E’² = (p’c)² + (m0c²)²

debemos tener:

E² - (pc)² = E’² - (p’c)²

o bien:

(E/c)² - p² = (E’/c)² - p’²

Al haber obtenido una nueva invariante, además de otras que iremos obteniendo al adentrarnos
en el tema de la Teoría General de la Relatividad, debe irse despejando la creencia de que en la
Teoría de la Relatividad todo es relativo. Aunque el movimiento dejó de ser absoluto, Einstein
introdujo un nuevo absoluto en su segundo postulado, la velocidad de la luz, tras lo cual fueron
apareciendo nuevos absolutos como las invariantes que hemos estado descubriendo. Es falso,
pues, que en la Teoría de la Relatividad todo es relativo.

La representación combinada de la energía y el momentum relativistas en un 4-vector nos


resume dos principios fundamentales de la dinámica, la conservación del momentum y la
conservación de la energía, en un solo paquete. Igualando los componentes de un 4-vector antes
y después de un choque o de una interacción podemos resolver los problemas que requieren de
dichos principios para su resolución. Un ejemplo de tales problemas es el de un fotón de energía
E0 que choca contra un electrón inicialmente en reposo, saliendo en retroceso el electrón a un
ángulo φ y a una velocidad V, mientras que el fotón es dispersado con una energía (menor) E a
un ángulo θ:

Los 4-vectores II
Si hemos podido reformular el espacio-tiempo como un 4-vector, y si hemos podido hacer lo
mismo con la energía y el momentum, entonces nos debe ser posible postular la existencia de
otros 4-vectores realizables dentro de la Teoría de la Relatividad. Uno de ellos resulta ser lo que
se conoce como el 4-vector velocidad. Para poder definir el 4-vector velocidad, mejor conocido
como la 4-velocidad, usamos como punto de partida el 4-vector espacio-tiempo y extendemos
el concepto de velocidad que estábamos acostumbrados a utilizar en la física clásica, el cual nos
dice que para un móvil cuya posición x varía con el tiempo su velocidad instantánea es:

u = dx/dt

Si el móvil se está desplazando en un espacio tri-dimensional y si sus componentes de posición


en cualquier instante dado de tiempo son:

x = (x1, x2, x3)

en donde (x1, x2, x3) puede representar la posición bajo el conjunto usual de coordenadas
rectangulares Cartesianas (x, y, z) pero también puede representar la posición bajo otro
conjunto de coordenadas tales como las coordenadas esféricas (r, φ, θ), entonces su velocidad
instantánea en este espacio tri-dimensional se obtiene tomando la derivada con respecto al
tiempo de cada una de las tres componentes:
Por convención, a este vector velocidad clásico tri-dimensional se le asigna una dirección y
sentido tangente a la curva en el punto en donde es evaluado, apuntando hacia la dirección a la
cual se está moviendo la partícula en el momento en que se encuentra en dicho punto.

Pero en la física relativista, la posición instantánea de una partícula está representada en un


espacio 4-dimensional como un punto cualquiera en la línea del mundo que la partícula va
trazando en un diagrama espacio-tiempo de Minkowski. La pregunta entonces es, ¿con respecto
a qué podemos tomar la derivada de esa 4-posición para poder definir la 4-velocidad relativista,
si el tiempo ha dejado de ser absoluto en la Teoría de la Relatividad? La respuesta a este dilema
resulta ser mucho más sencilla de lo que parece. Recurrimos al tiempo propio medido por un
reloj que se está desplazando junto con el móvil. Si bien es cierto que el tiempo ha dejado de ser
absoluto y avanzará de modo distinto para varios observadores moviéndose el uno con respecto
al otro, el tiempo propio, simbolizado como τ, siempre seguirá siendo el mismo para un viajero
que se esté desplazando a lo largo de su línea del mundo. Siendo el tiempo propio una
invariante, esto nos garantiza que la derivada con respecto al tiempo propio de cualquier 4-
vector también será un 4-vector. De este modo, definimos a la 4-velocidad de la manera
siguiente:

siendo este 4-vector un vector tangente a la curva (línea del mundo) en el punto en donde es
evaluado, como el siguiente vector tangente de color rojo (aunque la figura está hecha en un
plano, téngase en cuenta que la línea del mundo representada por la curva de color negro es una
línea trazada en un espacio de cuatro dimensiones):
Al familiarizarnos con el fenómeno relativista de la dilatación del tiempo obtuvimos la siguiente
relación entre el tiempo propio τ medido en un sistema en reposo y el tiempo medido por un
observador en movimiento relativo con respecto al observador en reposo:

t = γτ

Tomando infinitesimales, tenemos lo siguiente:

dτ = dt/γ

En un sistema de coordenadas Cartesianas, si tomamos el vector posición para fijar un punto en


el espacio cuatri-dimensional:

[ct, x, y, z]

entonces la 4-velocidad correspondiente la obtendremos tomando la derivada de cada una de


las componentes con respecto al tiempo propio τ:

U = [d(ct)/dτ, dx/dτ, dy/dτ, dz/dτ]

Sustituyendo dτ por dt/γ:

U = [cγ, γ(dx/dt), γ(dy/dt), γ(dz/dt)]

Pero:

ux = dx/dt
uy = dy/dt

uz = dz/dt

Entonces:

U = [γc, γux, γuy, γuz]

Si multiplicamos ambos miembros de esta igualdad por la masa propia del cuerpo que se está
desplazando a lo largo de una línea del mundo con esta velocidad U tendremos entonces:

m0U = [γm0c, γm0ux, γm0uy, γm0uz]

Reescribiendo el primer componente en el lado derecho:

m0U = [γm0c²/c, γm0ux, γm0uy, γm0uz]

podemos identificar de inmediato al término γm0c² como la energía relativista total E, y del
mismo modo podemos identificar a γm0ux como el momentum relativista en el eje-x,
γm0uy como el momentum relativista en el eje-y, y γm0uz como el momentum relativista en el
eje-z, o sea:

m0U = [E/c, px, py, pz]

Pero el lado derecho es lo que ya habíamos definido como el 4-momentum o el 4-vectorenergía-


momentum. Esto significa que la masa propia de un cuerpo m0 multiplicada por su 4-
velocidad U es igual al 4-momentum del cuerpo:

P = m 0U

Queda claro que el 4-momentum es una consecuencia directa del 4-vector espacio-tiempo. Esta
es la razón de fondo del por qué las leyes de transformación de la energía-momentum son tan
parecidas a las transformaciones de Lorentz.

Del mismo modo en que definimos a la 4-velocidad como la derivada de los cuatro componentes
que forman las coordenadas del espacio-tiempo relativista, podemos definir también a la 4-
aceleración, la cual no es más que la derivada con respecto al tiempo propio del móvil de la 4-
velocidad:
Esta definición de aceleración es perfectamente válida para un cuerpo que siempre se está
trasladando en movimiento rectilíneo en un espacio-tiempo plano (un marco de referencia
Lorentziano), o sea el espacio-tiempo en el cual ocurre la fenomenología de la Teoría Especial de
la Relatividad. Sin embargo, resultará ser insuficiente para poder manejar movimientos que
ocurren en un espacio-tiempo curvo en los cuales el cuerpo está cambiando constantemente de
dirección, como ocurre con el movimiento de los planetas en torno al Sol. Si intentamos usar
esta definición de aceleración, las expresiones resultantes variarán en forma al pasar de un
marco de referencia a otro. La única manera en la cual es posible continuar utilizando una
definición de aceleración en este último caso consistirá en redefinir el vector clásico como
un tensor, y en reemplazar la derivada con respecto al tiempo propio por otro tipo de derivada
conocida como la derivada covariante.

La definición de un 4-espacio de uso general nos va preparando para el salto eventual que
daremos de la Teoría Especial de la Relatividad a la Teoría General de la Relatividad, en donde
seguiremos utilizando los 4-vectores, eso permanecerá inalterado. Lo único que cambiará será
la matriz de transformación. La matriz de transformación que hemos estado utilizando hasta
ahora es una basada en las transformaciones de Lorentz, propias de lo que llamamos un
espacio-tiempo plano en donde los marcos de referencia se han estado moviendo el uno con
respecto al otro a velocidad constante. Pero si los marcos de referencia han de
estar acelerándose el uno con respecto al otro sin mantenerse una velocidad constante, es de
suponerse que ello se verá reflejado directamente en la matriz de transformación de un marco
de referencia a otro, una matriz basada ya no en las transformaciones de Lorentz sino en algo de
carácter más general, propio de eso que llamamos un espacio-tiempo curvo.

Habiendo sido capaces de definir una 4-velocidad, un 4-momentum y una 4-aceleración en el


espacio-tiempo Lorentziano, nos preguntamos ahora si es posible definir una 4-fuerza. La
respuesta es afirmativa, y tal 4-vector es conocido como la 4-fuerza de Minkowski o
simplemente como la 4-fuerza. Para definirla, empezaremos extendiendo la definición
Newtoniana clásica de la fuerza como el cambio de la cantidad de movimiento de un cuerpo con
respecto al tiempo, tomando en la derivada con respecto al tiempo tiempo propio τ:
La diferencia crucial de la 4-fuerza con respecto a la definición clásica es que esta última está
especificada como un vector de tres componentes espaciales, mientras que la 4-fuerza relativista
está especificada como un 4-vector:

Usando como guía los resultados intermedios obtenidos arriba, vemos que cada una de las
cuatro componentes del 4-momentum se puede reemplazar de la siguiente manera:

Puesto que la derivada de un vector (en este caso con respecto al tiempo propio) es igual a la
derivada de sus componentes, metiendo la derivada d/dτ tenemos:

Esta es esencialmente la definición de la 4-fuerza de Minkowski, para la cual podemos utilizar


las siguientes abreviaturas para la identificación del primer componente F t (el componente
temporal) y los tres componentes espaciales F x, Fy y Fz:

PROBLEMA: Encontrar las relaciones de tranformación para una 4-fuerza de Minkowski de


un marco de referencia S a otro marco de referencia S’.

Utilizaremos las siguientes relaciones de transformación de Lorentz:

t’ = γ(t - Vx/c²)

x’ = γ(x - Vt)
y’ = y

z’ = z

Empezaremos trabajando sobre la componente temporal de la 4-fuerza de Minkowski en el


marco de referencia S’ en donde esta componente temporal F’t debe estar dada por la siguiente
relación:

Recurriendo a la relación apropiada de transformación de Lorentz, tenemos que:

Tomando la derivada interior y utilizando la abreviatura β = V/c tenemos entonces:

Tomando ahora la otra derivada y reagrupando:

Pero lo que tenemos entre los paréntesis son las componentes temporal y espacial que
corresponden a la 4-fuerza en el marco de referencia S, de modo que podemos asentar lo
siguiente:

F’t = γFt - γβFx

F’t = γ(Ft - VFx/c)

Esta es nuestra primera relación de transformación para la 4-fuerza, correspondiente a la


componente temporal. Ahora trabajaremos sobre la primera componente espacial de la 4-fuerza
de Minkowski en el marco de referencia S’ en donde esta componente espacial F’xdebe estar
dada por la siguiente relación:

Recurriendo a la relación apropiada de transformación de Lorentz, tenemos que:

Tomando la derivada interior tenemos entonces:

Reagrupando y utilizando la abreviatura β = V/c tenemos entonces::

Nuevamente, lo que tenemos entre los paréntesis son las componentes espacial y temporal que
corresponden a la 4-fuerza en el marco de referencia S, de modo que podemos asentar lo
siguiente:

F’x = γFx - γβFt

F’x = γ(Fx - VFt/c)

Esta es nuestra segunda relación de transformación para la 4-fuerza, correspondiente a la


primera componente espacial.

Las transformaciones correspondientes a las otras dos componentes espaciales son triviales:
De este modo, el conjunto de las transformaciones correspondientes a la 4-fuerza de Minkowski
se puede resumir de la siguiente manera:

F’t = γ(Ft - VFx/c)

F’x = γ(Fx - VFt/c)

F’y = F’y

F’z = F’z

Ahora bien, haciendo una analogía con el intervalo relativista, podemos tomar el producto
escalar de dos vectores A y B tal y como se define en el análisis vectorial Euclideano tradicional:

y definir un producto escalar relativista o 4-producto escalar de la siguiente manera:

Es extremadamente importante no confundir en ningún momento el producto escalar entre dos


vectores del espacio tridimensional Euclideano y el 4-producto relativista, empezando por el
hecho de que uno tiene únicamente signos positivos mientras que el otro tiene una combinación
de signos positivos y negativos.

PROBLEMA: Usando la definición del 4-producto escalar relativista, demostrar que el 4-


producto escalar del vector 4-velocidad consigo mismo es una invariante.

Empezaremos con la definición del 4-vector velocidad al cual denominaremos U:

cuyas componentes espaciales podemos representar del modo siguiente:

Usando la definición básica del “factor de corrección” γ así como la relación que nos
proporciona cuantitativamente la dilatación del tiempo:

γ = 1/√1 - V²/c²

dt/dτ = γ

podemos obtener lo siguiente:

El 4-producto escalar relativista del vector velocidad U consigo mismo será:


Factorizando:

Pero la suma de términos cuadráticos dentro de los paréntesis cuadrados es igual al cuadrado de
la magnitud del vector velocidad tri-dimensional Euclideana V. Entonces:

Factorizamos ahora de la siguiente manera:

Usando la relación explícita para γ, esto nos produce el siguiente resultado:

Puesto que la velocidad de la luz es una constante absoluta que permanece invariante para todos
los marcos de referencia, se concluye que el 4-producto escalar del vector 4-velocidad consigo
mismo es una invariante.

PROBLEMA: Usando la definición del 4-producto escalar relativista, demostrar que el 4-


producto escalar del vector 4-momentum consigo mismo es una invariante.

Usando la 4-velocidad U del problema anterior, el vector 4-momentum lo podemos definir de la


siguiente manera:

P = m0U

El 4-producto escalar del vector 4-momentum consigo mismo será entonces:

P · P = m0U · m0U

P · P = m0² [U · U]
Pero ya vimos en el problema anterior que U·U = c². Entonces:

P · P = m0² c²

Puesto que tanto la masa propia m0 como la velocidad de la luz son invariantes, se concluye
que el 4-producto escalar del vector 4-momentum consigo mismo es una invariante.

PROBLEMA: Si A es un 4-vector relativista, demostrar que:

En este caso:

A · A = a 1 · a 1 - a 1 · a1 - a 1 · a 1 - a 1 · a1

A · A = (a1)² - (a2)² - (a3)² - (a4)²

Tomando la derivada con respecto al tiempo propio:

Puesto que:

dA/dτ = [ da1/dτ , da2/dτ , da3/dτ , da4/dτ ]

recurriendo nuevamente a la notación del 4-producto escalar obtenemos el resultado pedido.

PROBLEMA: Demostrar que el 4-producto escalar entre el 4-vector velocidad y el 4-vector


aceleración es igual a cero.
Siendo el 4-vector aceleración la derivada con respecto al tiempo propio del 4-vector velocidad,
o sea:

dU/dτ

Podemos utilizar la relación obtenida en el problema anterior para poner:

Pero ya vimos en un problema anterior que U·U = c². Y como la derivada de una constante, en
este caso con respecto al tiempo propio, es igual a cero, se concluye que:

Al estar hablando acerca de aceleraciones, podemos estarnos refiriendo a una de dos cosas
diferentes: (1) una aceleración dirigida en el mismo sentido en el cual está apuntando el vector
velocidad de un objeto que se desplaza siguiendo una trayectoria rectilínea, y (2) una
aceleración que saca al objeto de su trayectoria rectilínea y lo desvía hacia otro lado. Para un
objeto que se está acelerando, no hay marco de referencia alguno en el cual se le pueda
considerar en reposo. Sin embargo, existe un marco de referencia inercial el
cual momentáneamente tiene la misma velocidad que la del objeto que se está acelerando. Este
marco de referencia es conocido como el sistema de referencia comóvil (en
inglés, comoving reference frame) o, más apropiadamente, marco de reposo
instantáneo(instantaneous rest frame) o marco de referencia comóvil
momentáneo(momentarily comoving reference frame). Por un instante, este marco de
referencia moviéndose a velocidad constante en movimiento rectilíneo coincide con el objeto
que se está acelerando, y en ese instante de tiempo ambos tienen la misma velocidad y se dirigen
en la misma dirección. Por eso se le llama comóvil. Una vez pasado ese instante, la partícula ya
no se está comoviendo junto con el marco de referencia. Siendo el sistema de referencia comóvil
un sistema de referencia que por un instante de tiempo se mueve junto con un objeto en
movimiento a la misma velocidad que en ese instante lleva el objeto, respecto al sistema de
referencia comóvil el objeto siempre está en reposo. Para cada instante de tiempo, habrá un
sistema comóvil diferente para el objeto. En un espacio tri-dimensional Euclideano (no-
relativista) esto tendrá un aspecto como el que se bosqueja en la siguiente figura en la cual el
objeto se está desplazando a lo largo de una curva de color rojo y en la cual el vector T es la
velocidad tangente en cada punto de la curva mientras que el vector Nes el vector que apunta
hacia el centro instantáneo de la curvatura de la trayectoria (el vector B es un vector
perpendicular a ambos vectores T y N, formándose así un pequeño “sistema de coordenadas
rectangulares Cartesianas” que parece estar viajando con el objeto:

Normalmente se usa el sistema comóvil en el cual la partícula o el centro de gravedad del sólido
ocupa el origen de coordenadas del sistema comóvil.

PROBLEMA: ¿Es el sistema de referencia comóvil un marco de referencia que viaja junto con
el objeto que se está trasladando en un espacio-tiempo?

Si el objeto se desplaza a velocidad constante siguiendo un movimiento rectilíneo, entonces en


cada punto de su trayectoria tiene tiene un marco de referencia en el que se encuentra
instantáneamente en reposo que se puede considerar que “viaja” con él. Pero si el cuerpo se está
acelerando cambiando de dirección, un marco de referencia ligado al objeto en movimiento
también se estaría acelerando y dentro de dicho marco se experimentarían fuerzas de
aceleración inexistentes en un marco en reposo. En este último caso, para cada instante de
tiempo habrá un marco de referencia comóvil que ciertamente no “viaja” junto con el objeto.

En la mecánica relativista al igual que en la mecánica clásica, el objeto está en reposo respecto al
sistema de referencia comóvil por lo que su velocidad espacial respecto al mismo será cero en
todo momento, y por tanto la 4-velocidad sólo tendrá componente temporal:
V = (Vt, Vx, Vy, Vz) = (Vt, 0, 0, 0)

Desafortunadamente, el sistema de referencia comóvil no siempre puede asociarse a un sistema


de coordenadas curvilíneas, y esto se debe a que no existe una equivalencia entre la clase de
todos los posibles sistemas de coordenadas y la clase de todos los observadores posibles del
espacio-tiempo. De cualquier modo, este sistema de referencia resulta útil al dar el salto de la
Teoría Especial de la Relatividad hacia la Teoría General de la Relatividad en donde pasamos de
un espacio-tiempo plano a un espacio-tiempo curvo.

El germen de una idea


Bernhard Riemann, el fundador de la geometría moderna, considerado por muchos como el
padre de la geometría diferencial, no vivió el tiempo suficiente para ver el nacimiento de la
Teoría Especial de la Relatividad, lo cual tuvo lugar en 1905, 39 años después de su muerte, y
por lo tanto jamás tuvo conocimiento alguno de efectos físicos relativistas tales como la
contracción de longitud o de conceptos tales como un espacio-tiempo cuatri-dimensional. Cierto
es que consolidó las herramientas matemáticas necesarias para el estudio de espacios
geométricos de cualquier número de dimensiones, pero jamás estableció formalmente una
conexión directa entre sus propias contribuciones a la matemática teórica y la aplicación de
dichos conceptos al mundo real.

Sin embargo, Riemann, al igual que otros pensadores de su tiempo, se encontraba insatisfecho
con la postulación de la ley de la gravitación universal de Newton enunciada por vez primera en
1687, se resistía a creer en la existencia real de una fuerza totalmente invisible actuando entre
dos cuerpos, responsable de producir una atracción entre dichos cuerpos en razón directa del
producto de sus masas. Cierto, ya para su tiempo las leyes de Newton habían trabajado
admirablemente bien en la explicación de muchos fenómenos astronómicos y en la predicción
de sucesos tales como el retorno del cometa Halley (el regreso del Halley en 1759 constituyó en
su día un espectacular triunfo de la teoría de Newton). El difirendo no era tanto con la
confirmación exitosa de dicha ley, sino más bien una cuestión de fondo filosófico, con la
renuencia en aceptar la realidad de esa fuerza gravitatoria invisible entre dos cuerpos propuesta
por Newton.

Fueron precisamente estas dudas las que llevaron a Riemann a considerar la posibilidad de que
tal fuerza de gravedad ni siquiera existía, que la atracción entre dos cuerpos se debía no a fuerza
alguna actuando entre ellos a través del espacio interestelar, una acción-a-distancia, sino a un
efecto estrictamente geométrico, a la contracción del espacio existente entre dos cuerpos. Esta
era una diferencia muy sutil pero revolucionaria para su época. Para Newton, el espacio era
absoluto, invariable, y si dos cuerpos flotando en el espacio separados una distancia de 10
metros se acercaban entre sí por su atracción gravitatoria a una distancia de 4 metros, los diez
metros originales seguían allí, eran los cuerpos los que habían consumido seis metros de dicho
espacio al acercarse el uno al otro. Pero para Riemann, los cuerpos no se movían para nada de
sus posiciones originales, lo que sucedía era que el espacio entre ellos se había contraído.

Desafortunadamente, Riemann jamás pudo concretar estas ideas porque lo que visualizaba era
una contracción del espacio tridimensional, y lo que se necesitaba era un espacio de cuatro
dimensiones, no de tres. Pero la sospecha estaba sembrada, y Riemann le dejó al mundo las
herramientas matemáticas para explorarla.

No es difícil darse cuenta de cómo Einstein pudo haber llegado a la conclusión de que la
atracción gravitacional entre dos cuerpos pudiera deberse a efectos relativistas, tomando como
punto de partida la Teoría Especial de la Relatividad. Para ello, imaginemos a nuestro proverbial
viajero en el ferrocarril en su marco de referencia S', e imaginemos también a un lado de las vías
del ferrocarril no a uno sino a varios observadores en el marco de referencia S separados
distancias iguales. Supongamos también que al pie de cada uno de estos observadores hay dos
esferas metálicas iguales separadas diez metros entre sí.

Si el viajero pasa frente al primer observador a muy baja velocidad, a paso de tortuga, él también
verá el primer par de esferas separadas diez metros. Supongamos ahora que el tren aumenta su
velocidad hasta alcanzar una velocidad igual a la mitad de la velocidad de la luz (0.5c). Al pasar
frente al siguiente par de esferas, las verá más próximas la una a la otra. La Teoría Especial de la
Relatividad predice esto, y la distancia reducida puede ser calculada sin dificultad alguna
utilizando la fórmula para la contracción de longitud.

Ahora supongamos que el tren en el que se traslada nuestro viajero aumenta su velocidad de
0.5c a 0.8c. Al hacer esto, el tren dejó de moverse a una velocidad constante, se tuvo que
acelerar para poder cambiar su velocidad de 0.5c a 0.8c. La longitud entre el siguiente par de
esferas metálicas será más pequeña que la distancia de separación que había visto entre las
esferas anteriores.

Tras esto, supongamos nuevamente que el tren en el que se traslada nuestro viajero cambia su
velocidad de 0.8c a 0.9c, acelerándose nuevamente. La longitud entre el siguiente par de esferas
metálicas será todavía más pequeña que la distancia de separación que había visto entre las
esferas anteriores. Esto lo podemos visualizar en los siguientes diagramas:

Cambiemos ahora a nuestro viajero a un carrousel girando cada vez con mayor rapidez, pasando
cada vez más rápido frente a un solo y mismo observador en tierra el cual en su marco de
referencia S' tiene a sus pies a dos esferas metálicas separadas diez metros. Al volver a pasar el
viajero frente al observador una y otra vez a una velocidad cada vez mayor, abriendo y cerrando
sus ojos sólo cuando pasa frente a las esferas, para él las esferas se están acercando como si
hubiese un efecto de atracción entre las mismas. Pero para el observador en tierra, las dos
esferas en reposo frente a él siguen separadas a una misma distancia de diez metros. Lo que
sucede, tal y como lo imaginara Riemann, no es que las esferas se estén atrayendo la una a la
otra como si fuesen imanes, es el espacio entre las esferas el que está haciéndose más pequeño.
Esto explica la misteriosa “fuerza de atracción” entre dos cuerpos postulada por Newton,
redefiniéndola como la consecuencia directa de una disminución del espacio, o mejor dicho
del espacio-tiempo, entre dos cuerpos.

Por otro lado, como el viajero está moviéndose a velocidades cada vez mayores, se está
acelerando, definida la aceleración como un cambio en la velocidad con respecto al tiempo en
que aumentó (o disminuyó) dicha velocidad, lo cual encaja en la fórmula de Newton que nos
dice que una fuerza F aplicada sobre una masa m es directamente proporcional a la
aceleración a que produce sobre dicha masa, o sea F = ma. Tenemos pues una explicación
geométrica, basada en efectos relativistas propios de la Teoría Especial de la Relatividad, acerca
de la atracción gravitatoria entre dos cuerpos, bajo una situación en la que tenemos una
aceleración como la que provoca una fuerza sobre una masa m.

Sin embargo, hay algo ausente. En esta explicación que se acaba de dar no intervienen para nada
las masas de las esferas metálicas. Y sabemos que bajo el esquema de Newton la fuerza de
atracción entre dos cuerpos es directamente proporcional al producto de las masas, y en tanto
mayores sean las masas tanto mayor será la “fuerza gravitacional” entre las masas y por ende la
aceleración que se producen entre sí al estar la una en presencia de la otra. Este es el gran salto
que Riemann ya no pudo dar.

Para obtener el efecto de una contracción continua del espacio entre dos cuerpos como lo
acabamos de ver, el viajero tiene que estarse moviendo no a una velocidad uniforme y constante
con respecto al observador en tierra, sino a velocidades cada vez mayores, se tiene que
estar acelerando, y en esta situación en la cual aparentemente hay un observador privilegiado
(el que se está acelerando, ya que el observador en tierra no siente los efectos de ninguna
aceleración) la filosofía básica detrás de la Teoría Especial de la Relatividad ya no es suficiente,
la teoría tiene que ser ampliada de alguna manera para incluír marcos de
referencia acelerados el uno con respecto al otro. Tenemos que abandonar el cómodo universo
de movimientos rectilíneos uniformes a velocidad constante para extendernos hacia el ámbito
de movimientos acelerados, lo cual desde la perspectiva matemática nos va a complicar las cosas
al hacernos pasar de un entorno linear a un entorno no-linear, obligándonos a recurrir a las
herramientas del cálculo infinitesimal para poder describir con números lo que está ocurriendo.
Inclusive en la mecánica clásica, este salto es más que obvio si comparamos la gráfica de un
cuerpo que está en movimiento rectilíneo uniforme (recorriendo distancias iguales en tiempos
iguales):
con la de un cuerpo que está en movimiento rectilíneo uniformemente acelerado en el cual la
distancia recorrida es proporcional al cuadrado del tiempo transcurrido, o sea x = at²/2:

Y es importante tomar en cuenta también que no sólo un cuerpo que está en movimiento
rectilíneo moviéndose siempre hacia adelante en la misma dirección pero cambiando su
velocidad constantemente es capaz de experimentar una aceleración. También un cuerpo que se
está moviendo a una velocidad constante pero que está cambiando continuamente su dirección
experimenta una aceleración. En la siguiente gráfica trazada sobre un plano x-y en donde no se
muestra a la variable tiempo tenemos una descripción de esto:

Podemos imaginarnos a un carro que está a una distancia r1 de un origen O moviéndose a una
velocidad constante de 40 kilómetros por hora en la dirección indicada por el vector
velocidad V1, el cual al llegar a un punto que está a una distancia r2 del origen se sigue
moviendo a la misma velocidad de 40 kilómetros por hora pero ahora en la dirección indicada
por el vector velocidad V2. La magnitud de la velocidad (la rapidez del vehículo) sigue siendo
la misma, pero su dirección ha cambiado, y este cambio vectorial que podemos denotar
como ΔV definitivamente tiene una longitud que podemos calcular como se muestra arriba, la
cual al ocurrir en cierto tiempo Δt nos produce una aceleración a que podemos
definir vectorialmente de la siguiente manera:

En esta fórmula, la cual considera la posibilidad de cambios bruscos en el sentido de la


velocidad, tratamos de definirla en lo más cercano que pueda haber a un punto, de modo tal que
al avanzar vectorialmente una cantidad muy pequeña ΔV en una cantidad muy pequeña de
tiempo Δt, lo más pequeña posible, obtenemos lo más cercano que pueda haber a una
aceleración vectorial del vehículo al pasar por dicho punto. Esta, desde luego, es la definición
infinitesimal de una aceleración vectorial, usando diferenciales:
Un pasajero que viaje en un automóvil sabe que está experimentando este tipo de aceleración
cuando está dando la vuelta en una esquina a gran velocidad, se dá cuenta de las fuerzas que el
vehículo aplica sobre ella para hacerla cambiar de dirección junto con el vehículo. Este tipo de
aceleración es precisamente la aceleración centrípeta que experimentan la Luna al girar en
torno a la Tierra. Es precisamente el tipo de movimiento circular (o mejor dicho, elíptico) que
una Teoría de la Relatividad intenta explicar pero sin recurrir a la suposición de fuerzas de
atracción gravitacional, fuerzas invisibles que actúan “a distancia”.

La conexión crucial que tenía que ser establecida requirió igualar, filosóficamente y
matemáticamente, los efectos relativistas observados por nuestro proverbial viajero en su marco
de referencia acelerado con la aceleración provocada por un campo gravitacional, un campo
gravitacional que geométricamente hablando no es más que una curvatura en el espacio-tiempo
de cuatro dimensiones causada a su vez por la presencia de masa-energía en dicho espacio
cuatri-dimensional. Hecho esto, todo lo demás se obtiene como consecuencia directa de estas
premisas básicas.

El principio de equivalencia
Al estudiar la Teoría Especial de la Relatividad, había quedado un asunto pendiente, y este
asunto era el de los observadores sujetos a cambios de velocidad. Un observador como lo es el
caso de un astronauta que viaja en el espacio y que experimenta una aceleración al encender los
motores para aumentar la velocidad de su nave la puede medir con instrumentos que tenga a la
mano, y también puede sentir sobre su cuerpo los efectos de la aceleración. Esto parece
colocarlo en un plano privilegiado sobre otro observador estático en el espacio que lo está
viendo acelerarse y que no experimenta fuerza alguna y el cual de no ser por la confirmación
visual de que el astronauta se está acelerando no se daría cuenta de ello.

Para resolver y estudiar esta cuestión, Einstein formuló un principio sobre el cual descansa toda
la Teoría General de la Relatividad a la cual nos podemos referir simplemente como
la Relatividad General: el principio de equivalencia, el cual nos dice lo siguiente:

Principio de Equivalencia: Para una persona situada dentro de una caja herméticamente
sellada, no existe diferencia entre el estar en el espacio con la caja acelerándose y otra persona
situada en una caja similar reposando en un campo gravitacional.
Puesto de otra manera, si la persona está encerrada en una caja blindada del exterior, la persona
no tiene forma alguna de saber si la caja está en el espacio acelerándose o si la caja está en
presencia de un campo gravitacional. Ambas condiciones son equivalentes para cualquier tipo
de experimento que pretenda llevar a cabo. Esto lo podemos ilustrar de la siguiente manera:

En el dibujo de la izquierda, tenemos a un astronauta cuya nave espacial está acelerándose hacia
arriba. Si el astronauta suelta una pelota, la pelota caerá hacia abajo como consecuencia de la
aceleración. Y en el dibujo de la derecha, tenemos a una persona cuya caja en la que se
encuentra está en reposo en un campo gravitacional. También esta persona, si suelta una pelota,
la verá caer hacia abajo pero esta vez como consecuenciade la atracción ejercida por el campo
gravitacional. Ambas personas ven caer la pelota hacia abajo. Y si la caja en la que están
encerradas es una caja herméticamente sellada y blindada, no tienen forma de saber en base a
cualquier experimento que pretendan llevar a cabo si están en una caja que se está acelerando
en el espacio o si están en una caja que está en reposo en un campo gravitacional.

En el experimento hipotético considerado en la entrada “El germen de una idea” con nuestro
proverbial viajero montado en un carrousel que va pasando a velocidades cada vez mayores
frente a dos esferas metálicas que a causa de la contracción de longitud relativista propia de la
Teoría Especial de la Relatividad parecen irse acercando la una a la otra como si hubiese una
fuerza de atracción mágica entre ellas, la objeción podría formularse de que al pasar frente a las
esferas metálicas el viajero está experimentando una aceleración lineal, constante, y lo que vería
serían las esferas metálicas acercándose la una a la otra a una velocidad constante, no a
una aceleración constante propia de una atracción gravitacional. Pero se recuerda aquí que la
aceleración producida por la gravedad de la Tierra en su superficie (de 9.8 metros/segundo²) es
válida únicamente en la superficie de la Tierra. A distancias cada vez mayores de nuestro
planeta esa aceleración va disminuyendo hasta tomar prácticamente un valor de cero, de modo
tal que esta aceleración gravitacional no es constante. Del mismo modo, si la aceleración que
experimenta el viajero cada vez que pasa frente a las esferas metálicas no es constante sino que
va aumentando en forma graduada, el viajero verá a las esferas metálicas “atraerse” en forma
acelerada, propia de un campo gravitacional. Y esto justifica ya la equivalencia de un campo
gravitacional como consecuencia directa de efectos relativistas.

Detrás del Principio de Equivalencia subyace algo que inclusive el mismo Newton había ya
sospechado y considerado en su época, la equivalencia entre la masa inercial y la masa
gravitacional de un cuerpo. La masa inercial es esencialmente la resistencia que presenta un
cuerpo flotando en el espacio a ser acelerado, precisamente es a lo que se refiere la ley de la
inercia de Newton cuando nos dice que todo cuerpo de masa m presenta una resistencia a que
se le cambie su cantidad de movimiento, resistencia al cambio ocasionada precisamente por
su masa inercial mi. Por otro lado la masa gravitacional es la atracción que ejerce un campo
gravitacional sobre un cuerpo que medida nos indicaría una masa mg para dicho cuerpo. La
masa inercial es la que posee un cuerpo que está flotando en el espacio vacío interestelar, es la
característica propia del cuerpo que se resiste a ser acelerado sacándolo de su estado inerte o
estado de reposo poniéndolo en movimiento (regresándolo “a la vida”) cuando se le aplica una
fuerza, mientras que la masa gravitacional es la que determina el peso de un cuerpo en reposo
descansando sobre la superficie de un planeta, es la que determina que una persona sea más
ligera sobre la superficie de la Luna que sobre la superficie de la Tierra, y más pesada sobre la
superficie de Saturno. Clásicamente, en el espacio vacío, la fuerza F requerida para provocar una
aceleración a sobre un cuerpo está dada por la fórmula:

F = mi a

mientras que sobre la superficie de la Tierra el peso W de un cuerpo está dado por una fórmula
semejante:

W = mg g

siendo g la aceleración que tendría un cuerpo al ser dejado caer en la superficie de la Tierra.

La masa inercial es una medida de la resistencia de una masa al cambio de velocidad, mientras
que la masa gravitacional es la medida de la fuerza de atracción gravitatoria que experimenta
una masa en relación a la demás de acuerdo con la fórmula Newtoniana para la fuerza
gravitatoria entre dos partículas. Einstein lo que hizo fué, en efecto, adoptar matemáticamente
la relación:

mi = mg

elevándola al grado de postulado básico para usarla como punto de partida para su Teoría
General de la Relatividad.

Es importante aclarar que no hay razón a priori para suponer que la masa inercial de un cuerpo
sea igual a su masa gravitacional del mismo modo que no hay razón a priori para suponer que
un kilogramo de masa gravitacional de un bloque metálico de hierro tenga las mismas
propiedades físicas que la masa gravitacional de un bloque metálico de níquel (independiente
del tipo de elemento del que está formado el bloque), y del mismo modo que no hay razón
alguna para suponer de antemano que la cantidad de átomos que contenga un gramo de azúcar
sea igual a la cantidad de átomos que contenga un gramo de agua. Este tipo de datos son
información que se recaba experimentalmente, de la experiencia. Hasta donde nos lo han
permitido numerosos experimentos efectuados con un grado de precisión muy alto, la masa
inercial y la masa gravitacional se pueden tomar como si fueran iguales; si no lo son
posiblemente no exista en la actualidad un experimento con la suficiente sensibilidad que nos
permita detectar esa mínima diferencia que pudiera haber entre ambas (por ejemplo, de una
parte en 1080, lo cual estaría fuera de nuestro alcance).

El principio de equivalencia nos permite partir de la base que ya tenemos, la Teoría Especial de
la Relatividad, en donde se ha supuesto que el espacio-tiempo es plano, considerando
fenómenos de aceleración dentro de dicha teoría y dando por hecho que, si la aceleración es la
misma, el comportamiento de un cuerpo será el mismo ya sea que esté siendo acelerado en el
espacio libre mediante la aplicación de una fuerza (masa inercial) o que se encuentre en estado
de reposo en un campo gravitacional que le pueda provocar la misma aceleración si se le deja
caer (masa gravitacional). El efecto de las aceleraciones es incorporado dentro del modelo
matemático de la Teoría de la Relatividad dejando atrás el modelo plano del espacio cuatri-
dimensional propio de la Teoría Especial de la Relatividad, para permitirle al plano tomar una
curvatura. En efecto, el continuum tiempo-espacio puede adquirir una curvatura. ¿Y qué es lo
que puede provocar tal curvatura en un modelo plano en el que únicamente aplicaban los
principios de la Teoría Especial de la Relatividad? La presencia de masa. En donde hay
alguna masa, el espacio-tiempo resiente una deformación, la cual será mayor tanto mayor sea la
masa que está produciendo la curvatura. La imagen típica con la cual se intenta transmitir esta
idea es la de una malla flexible con la cual se intenta simbolizar un espacio-tiempo plano de
Minkowski, sobre la cual se coloca una esferita metálica que provoca el hundimiento que nos
representa la curvatura:

Sin embargo, es importante no tomar muy a pecho esta representación pictórica de la curvatura
introducida en un espacio-tiempo plano por la presencia de una masa, en virtud de que lo que se
está tratando de representar es una curvatura que ocurre en cuatro-dimensiones, utililizando
para ello no una representación gráfica cuatri-dimensional, ni siquiera una representación tri-
dimensional, sino una representación plana como la que tenemos arriba. La imagen sirve
únicamente para los fines de transmitir una idea, la idea de una curvatura en el espacio-tiempo
plano, pero no tiene intención alguna de ser interpretada literalmente.

Como en base a uno de los resultados básicos de la Teoría Especial de la Relatividad, la masa y la
energía son equivalentes, ambas son manifestaciones diferentes de la misma cosa, pudiendo
referirnos a ambas como la masa-energía, dentro de la Relatividad General podemos afirmar
que toda presencia de masa-energía introduce una curvatura en el continuum espacio-tiempo.
En donde no hay masa-energía (en castellano, en donde no hay nada de masa ni de energía)
cercana no habrá tampoco ninguna curvatura en el espacio-tiempo, y las fórmulas propias de la
Teoría Especial de la Relatividad son las únicas que necesitamos para estudiar los fenómenos
que se presenten en dicha región. Expresado sin recurrir a fórmula alguna:

curvatura = concentración de masa y energía

Esto es simbolizado de manera más formal con la ecuación más importante de la Teoría
General de la Relatividad:

Esta es la ecuación dimensionalmente correcta. Sin embargo, al igual que como ocurre en la
Teoría Especial de la Relatividad para fines de análisis y para fines de representación
esquemática en los diagramas espacio-tiempo de Minkowski, dada la enorme magnitud de la
cifra que representa la velocidad de la luz se acostumbra por convención hacerla igual a la
unidad, o sea c = 1, con lo cual tenemos a la ecuación en una de sus representaciones más
populares:

En el lado izquierdo de la ecuación tenemos una entidad conocida como la curvatura,


representada por el símbolo G. Y del lado derecho tenemos tenemos otra entidad que
representa todo lo que tiene que ver con la masa-energía, absolutamente todo, simbolizada
como T. La constante G es la constante de gravitación universal que en el sistema de mediciones
métrico decimal es igual a 6.674215 x 10-11 m3/kg-seg², una constante que debe ser medida y
obtenida experimentalmente; se trata de la misma constante universal que Newton requirió usar
para que su fórmula de atracción gravitacional entre dos cuerpos concordase con los fenómenos
astronómicos analizados bajo la mecánica Newtoniana. Puesto que 8 y π son también
constantes (numéricas) el factor 8πG en sí no es más que una constante, de la cual si
prescindimos tenemos una relación cualitativa que del lado derecho nos está simbolizando la
curvatura en el espacio-tiempo y del lado derecho nos está simbolizando el contenido en masa-
energía y momentum que está produciendo la curvatura señalada. Debe enfatizarse el hecho de
que la curvatura en la carta (manifold) espacio-tiempo es una curvatura de un espacio en
cuatro dimensiones, y por lo tanto no es una curvatura que podamos percibir geométricamente
de manera directa. Esta curvatura la percibimos a través de los efectos que produce tales como
la rotación de los planetas alrededor del Sol. La curvatura en el espacio-tiempo le dice a la masa-
energía cómo y en qué sentido debe moverse, mientras que la masa-energía le dice al espacio-
tiempo cuánto y de qué manera debe “curvearse”. Esta ecuación lo que nos está diciendo
esencialmente es que cuando T no tiene un valor de cero (en todas sus
componentes), G tampoco lo tendrá (en todas sus componentes) y por lo tanto habrá una
curvatura en el continuum tiempo-espacio. El lector avispado tal vez empiece a percibir aquí un
problema: si A le dice a Bcómo debe moverse, y si B le dice a A cómo debe “curvearse” para
que B a su vez le diga a Acómo debe moverse, ¿entonces cómo vamos a resolver las ecuaciones
que nos describan cualquier tipo de situación? Es aquí que tenemos que confrontar una dura
realidad: los problemas postulados dentro del marco de la Teoría General de la Relatividad,
hablando en términos generales, son irresolubles matemáticamente, sólo se pueden obtener
soluciones exactas para casos particulares o recurriendo a aproximaciones.Afortunadamente,
hay algunos casos particulares, especialmente aquellos en los que tomamos ventaja de la
simetría esférica, en donde podemos obtener soluciones exactas a las ecuaciones de Einstein.
Pero el caso general, sobre todo el caso en el que tenemos que recurrir a simulaciones
computarizadas a causa de la no-linearidad de las ecuaciones diferenciales involucradas, es algo
que inclusive justifica el tener que recurrir a las supercomputadoras de hoy en día para poder
encontrar soluciones razonablemente aproximadas.

Siguiendo una idea propuesta inicialmente por Max Planck de asignarle a las constantes físicas
un valor unitario en vez de utilizar sistemas de medición concebidos artificialmente por el
hombre que no están basados en algo válido en el Universo entero que sea independiente de
criterios arbitrarios, en lo que Max Planck llamó “unidades naturales” y que en la Teoría de la
Relatividad se conoce como unidades geometrizadas a la constante de gravitación
universal G se le asigna también un valor de 1. Con esto, la ecuación más importante de la Teoría
General de la Relatividad se nos presenta frecuentemente en muchos textos y trabajos
científicos de la siguiente manera simplificada:

Hay que tener mucha precaución con esta que podemos considerar la fórmula fundamental de
la Teoría General de la Relatividad, porque es una ecuación tensorial, y el nombre correcto
de G es el de tensor de curvatura de Einstein, mientras que el nombre correcto de T es el
de tensor energía-momentum ó tensor energía-tensión ó tensor energía-impulso, y cada uno
de ellos requiere para su especificación completa un total de 16 componentes. Las ecuaciones
del campo gravitacional o simplemente ecuaciones de campo de la Relatividad General,
expresadas en su forma más explícita, tienen el siguiente aspecto en notación tensorial:

R - ½gR = 8πGT

en donde R = (Rμν) es el tensor de curvatura de Ricci, R es el escalar de Ricci, g = (gμν) es


el tensor métrico y T = (Tμν) es el tensor energía-tensión o tensor energía-
impulso (stress-energy tensor). En notación de sub-índices, la anterior ecuación se escribe de
la siguiente manera:

En un espacio de cuatro dimensiones, cada uno de los tensores representa una cantidad física
que consta de 16 componentes y la cual puede ser representada como una matriz 4x4. A manera
de ejemplo, las 16 componentes del tensor T = (Tμν), expresadas en forma de matriz, tienen el
siguiente aspecto:

En su formulación de la ecuación fundamental de la Teoría General de la Relatividad, Einstein


siguió el ejemplo de Maxwell en su derivación de las cuatro ecuaciones básicas del
electromagnetismo, para las cuales Maxwell utilizó notación vectorial con lo cual las fórmulas
generales simplificadas se vuelven independientes del tipo de coordenadas (Cartesianas,
polares, cilíndricas, esféricas, etc.) que se utilicen para describir algún fenómeno
electromagnético en particular. Puesto que la formulación de la Teoría General de la Relatividad
requiere de un espacio de cuatro dimensiones (cuatri-dimensional), el uso de vectores no es
suficiente para la simplificación de todo hasta reducirlo a una fórmula (o a unas cuantas
fórmulas), se requiere el uso de notación tensorial. Sin embargo, es importante señalar aquí
que los vectores, esas magnitudes físicas que tienen dirección y sentido tales como la aceleración
de un automóvil o la fuerza que se le aplica a una palanca, en realidad también son
tensores, tensores de orden uno. Y de hecho, todas las demás magnitudes físicas conocidas
como escalares, esas magnitudes físicas que no tienen dirección y sentido tales como la
temperatura de un objeto, también son tensores, tensores de orden cero. Al estar hablando
de tensores, debe ir quedando claro que tendremos que ir un paso más allá del cálculo
infinitesimal ordinario que se enseña en los bachilleratos, tendremos que familiarizarnos con las
técnicas del cálculo diferencial absoluto, hoy mejor conocido como el cálculo tensorial,
inventado por el matemático italiano Gregorio Ricci y publicado por su alumno Tullio Levi-
Civita en un libro que sigue siendo de actualidad hoy en día, The Absolute Differential Calculus.

La ecuación tensorial básica de la Relatividad General, expresada en función de coordenadas


generalizadas (las cuales como ya se dijo pueden ser Cartesianas, polares, etc.) y escrita de la
siguiente manera (usando subíndices):

Gμν = 8πGTμν

adquiere su forma más sencilla cuando en el espacio circundante no hay nada de masa ni
energía presentes, en cuyo caso todos los componentes del tensor Tμν son iguales a cero, lo cual
equivale a decir que el tensor T = (Tμν) es igual al tensor cero 0, o sea T = 0 lo que a su vez
implica que G = 0. Para que el espacio-tiempo en alguna región del Universo sea plano,
Lorentziano, propio de la Teoría Especial de la Relatividad, la condición fundamental es que el
tensor de Einstein G sea igual al tensor cero.

Como ya se mencionó, el conjunto de ecuaciones representadas de esta manera (tensorial) es


conocido como las ecuaciones de campo. Si utilizamos coordenadas Cartesianas(x1, x2 ,
x3), entonces como una de las coordenadas es la coordenada que corresponde a la variable
tiempo t tanto la variable μ como la variable ν pueden representar a cualquiera de
las cuatro coordenadas del espacio-tiempo (x1, x2 , x3 , t). Hasta aquí hemos estado utilizando
coordenadas Cartesianas, rectangulares, pero podemos usar cualquier otro tipo de coordenadas
adecuadas a nuestros propósitos. Si utilizamos coordenadas esféricas (r, θ, φ) para
especificar la distancia radial, el ángulo del cenit θ y el ángulo azimutal φ, entonces en el
espacio cuatri-dimensional (r, θ, φ, t) también tanto la variable μ como la variable ν pueden
representar a cualquiera de las cuatro coordenadas en este espacio-tiempo especificado por
estas coordenadas esféricas, de modo tal que varios valores típicos de Gμν y de Tμν vendrían
siendo:

Grθ , Gθφ , Gφt

Ttθ , Trr , Tφθ

Es importante resaltar aquí que, por simetría Gμν= Gνμ, de modo tal que, por ejemplo:

Grθ = Gθr

Gφt = Gtφ

Igualando los componentes respectivos de Gμν y Tμν en una ecuación tensorial para un caso
particular, tenemos un sistema de ecuaciones con el cual en principio podemos resolver el
problema matemáticamente, lo cual a primera vista parecería fácil. Desafortunadamente, las
ecuaciones que involucran al tensor de curvatura de Einstein Gson ecuaciones diferenciales,
ecuaciones que involucran derivadas, así que el problema ya no es tan fácil. Peor aún, las
ecuaciones diferenciales resultantes por lo general resultan ser ecuaciones diferenciales no-
lineares, precisamente la situación matemática más difícil de todas. Para dar mayor detalle, la
forma precisa de la curvatura del espacio-tiempo está determinada por un total de 12 ecuaciones
del tipo que en matemáticas se conoce como ecuaciones diferenciales parciales hiperbólicas
acopladas. Esto nos limita severamente la cantidad de problemas que pueden ser resueltos de
manera exacta bajo algún sistema de coordenadas, llevándonos a considerar casos especiales
como el caso en el que la masa de uno de un par de cuerpos es mucho mayor que la masa del
otro cuerpo que tiene cerca. Aún así, hay triunfos espectaculares, como el logrado por Karl
Schwarzschild, el cual en una solución matemática dada a las ecuaciones de campo de Einstein
(una solución que impresionó a este último porque no creía factible la posibilidad de encontrar
soluciones exactas a sus ecuaciones de campo) sentó las bases para la predicción de la existencia
de los agujeros negros, regiones del espacio-tiempo con un campo gravitacional tan intenso
que ni siquiera a la misma luz puede escapar.

El que el espacio-tiempo pueda ser objeto de una torsión (curvatura) causada por la cercanía de
masa-energía tiene implicaciones directas tanto para el espacio medido por diferentes
observadores como para el tiempo medido por diferentes observadores. En el caso del espacio,
éste va experimentando una contracción relativista conforme un cuerpo se va acercando a un
objeto de masa apreciable como la Tierra:

Del mismo modo, en el caso del tiempo, éste va experimentando una dilatación relativista
conforme el cuerpo se va acercando a la Tierra:
El principio de equivalencia nos permite entender mejor algo que había quedado en cierta forma
inconcluso y pendiente en una entrada previa titulada “Una teoría libre de asimetrías y de
paradojas”, la paradoja de los gemelos. En dicha entrada se había señalado que la razón por la
cual uno de los gemelos envejece más que el otro es porque existe una asimetría en la cual uno
de los gemelos permanece en estado de reposo mientras que el otro que viaja en una nave
espacial experimenta una aceleración para ponerse en marcha hacia la estrella (o el planeta)
distante, experimenta otra aceleración para detenerse y dar la vuelta en sentido contrario (lo
cual equivale a un cambio en los marcos de referencia) y experimenta otra aceleración para
encaminarse de regreso hacia la Tierra. Como lo acabamos de ver, en un campo gravitacional el
tiempo se dilata. Pero de acuerdo con el principio de equivalencia, desde el punto de vista
relativista no existe diferencia alguna entre el estar en un campo gravitacional y el estar en un
marco de referencia acelerado (ambos con la misma magnitud de aceleración). Entonces el
tiempo medido por un viajero en una nave espacial que se está acelerando está dilatado
igualmente que si se encontrara situado dentro de un campo gravitacional. Con ello, queda
explicada cualitativamente la paradoja de los gemelos. Ponerle números al asunto requiere la
formulación matemática precisa dada por Einstein, lo cual requiere acceder a las herramientas
propias del cálculo tensorial.

A continuación tenemos una página del manuscrito escrito por Einstein dando forma a
su Teoría General de la Relatividad:

En la misma publicación científica Annalen der Physik en donde en 1905 Einstein dió a conocer
al mundo la Teoría Especial de la Relatividad, once años después se publicó en 1916 en Leipzig
la primera introducción a la Relatividad General en el volumen 49 del Annalen der Physik, bajo
el título “Die Grundlage der allgemeinen Relativitatstheorie”, un trabajo en la cual se avanzó por
vez primera el concepto revolucionario de que la atracción de la gravedad es el resultado de una
curvatura en el espacio-tiempo y no el resultado de una fuerza entre dos cuerpos como lo había
propuesto Newton:
Por el interés histórico que pueda despertar en los estudiosos sobre el tema así como por la
visión que nos puede dar sobre la manera en la cual Einstein fue dando forma matemática a su
Teoría General de la Relatividad, se ha incluído como acompañante de esta obra un apéndice en
el que se reproducen algunas de las páginas manuscritas del libro de apuntes (cuaderno de
notas) de Einstein dentro del cual fue anotando las ideas conforme se iban desarrollando en su
mente con el paso de los meses y los años, el cual ha sido puesto bajo el título “Relatividad
General: Manuscritos originales”.

Como ya se señaló, el salto de un espacio-tiempo plano a un espacio-tiempo curvo requerirá de


un uso intensivo no sólo de las herramientas del cálculo infinitesimal, requerirá del manejo de
cuatro dimensiones a la vez mediante el cálculo infinitesimal extendido a las cuatro
dimensiones, lo cual requerirá sistematizar las herramientas que ya teníamos dentro de otro
conjunto de técnicas conocidas como el análisis tensorial o cálculo tensorial en el cual
extendemos el concepto de magnitudes físicas como la temperatura y la masa sin dirección y
sentido (escalares) así como de la velocidad y la aceleración (vectores) que poseen dirección y
sentido a una nueva cantidad física: los tensores.

Las ecuaciones de campo de Einstein no son la única teoría concebida para explicar
matemáticamente el fenómeno de la gravedad. Un ejemplo de otras teorías alternas lo
constituye la teoría de gravitación Brans-Dicke (el principal competidor) desarrollada en
1961, la cual también es capaz de explicar la deflexión de la luz en presencia de un campo
gravitacional así como la precesión de las órbitas de los planetas en torno al Sol, y contiene
además características muy peculiares tales como el hecho de que la constante de gravitación
universal G no es realmente una constante e inclusive lo que la sustituye dentro de la teoría
Brans-Dicke puede variar de lugar así como en el tiempo. Esta teoría, a diferencia de la
Relatividad General de Einstein que es una teoría de índole puramente tensorial, es una
teoría escalar-tensorial en el sentido de que la interacción gravitacional depende tanto de lo que
llamamos un campo escalar así como del campo tensorial propio de la Relatividad General.
Ambas teorías concuerdan con los datos observados experimentalmente hasta la fecha. Sin
embargo, en comparación con la fórmula tensorial básica de la Relatividad General G = 8πGT,
las dos ecuaciones de la teoría Brans-Dicke:

en donde Tab es el tensor tensión-energía (o tensor energía-impulso) y φ es el campo escalar


introducido en la teoría Brans-Dicke y que está ausente en la Relatividad General de Einstein,
ciertamente muestran un aspecto mucho más intimidante. El consenso actual entre la mayoría
de la comunidad científica es de que, a menos de que haya alguna razón importante para
reemplazar a la Relatividad General Einsteniana con la más complicada teoría Brans-Dicke, no
hay razones fundamentales de peso ni ventaja alguna en irnos de lo moderadamente complicado
(Einstein) a lo más complejamente elaborado (Brans-Dicke y otras teorías) que, al menos
filosóficamente, descansan sobre bases mucho más endebles.

Predicciones, confirmaciones, y reflexiones


Relatividad General: Predicciones y confirmaciones de la teoría

En 1916, Einstein propuso tres hechos experimentales para confirmar la veracidad de la Teoría
General de la Relatividad:

1) La precesión anómala de la órbita del planeta Mercurio alrededor del Sol.


2) La deflexión de los rayos luminosos ocasionada por la curvatura en el espacio-tiempo
producida por el Sol en la cercanía a dicha estrella.

3) El corrimiento hacia el rojo de la luz ocasionado por la gravedad.

El primer gran triunfo de la Relatividad General fue, indudablemente, la explicación


satisfactoria de la precesión anómala de la órbita del planeta Mercurio alrededor del Sol en
concordancia con los datos experimentales. De hecho, en la derivación de sus ecuaciones
tensoriales para formalizar matemáticamente a la Relatividad General, Einstein obtuvo entre los
primeros resultados intermedios la explicación a la precesión anómala de Mercurio.

De acuerdo con las leyes de Kepler deducidas a partir de datos astronómicos y confirmadas por
Newton mediante su ley de atracción universal, los planetas del sistema solar al trasladarse
alrededor del Sol describen órbitas en forma de elipse, con el Sol ocupando uno de los focos de
la elipse:

La trayectoria elíptica se mantiene invariable bajo la formulación matemática de las leyes de


Newton, no hay absolutamente nada que pueda hacer cambiar dichas órbitas elípticas excepto la
proximidad ocasional de otro planeta que introduzca alguna alteración en el recorrido causada
por esa fuerza de atracción gravitacional extra. Sin embargo, en el caso del planeta Mercurio, el
planeta del sistema solar más cercano al Sol, su punto de máxima aproximación,
su perihelio (del griego peri que significa “cerca de” y helios que significa Sol) que está situado
en el extremo derecho de la órbita de la figura de arriba, no siempre ocurre en el mismo lugar,
sino que va cambiando de lugar año con año. Esta rotación gradual de la órbita elíptica de
Mercurio es conocida como precesión:

La precesión de la órbita no es algo que sea peculiar a Mercurio, ya que todas las órbitas
planetarias tienen su propia precesión, este es un efecto predicho por la teoría de Newton como
consecuencia del “jaloneo” gravitacional de un planeta sobre otro cuando dos planetas se
aproximan (también hay “jaloneos” múltiples cuando varios planetas se alinean a lo largo de
una línea imaginaria radial hacia el Sol, aunque los efectos sobre la precesión no son detectables
por su pequeñez). Lo importante en todo caso es si las predicciones hechas por Newton están de
acuerdo matemáticamente con la magnitud de las precesiones observadas a través del
telescopio. No basta con entender cualitativamente el origen de algún efecto, los argumentos
que explican el efecto tienen que estar respaldados por datos numéricos para poder darle
credibilidad a la teoría que explica el efecto. La precesión de las órbitas alrededor del Sol de
todos los planetas parecían estar bien explicadas en base a las ecuaciones de Newton. Pero
Mercurio parecía ser la excepción.

Vista desde la Tierra, la precesión de la órbita de Mercurio tiene un valor (angular) de unos
5600 segundos de arco por siglo (un segundo de arco es igual a 1/3600 de grado). Las
ecuaciones de Newton, tomando en consideración todos los efectos gravitacionales de los demás
planetas sobre Mercurio, así como la deformación ligera del Sol debida a su propia rotación, más
el hecho de que la Tierra no es un marco inercial de referencia en virtud de su propia rotación y
traslación alrededor del Sol, predicen mediante las fórmulas de Newton una precesión de 5557
segundos de arco por siglo. Existe entonces una discrepancia de 43 segundos de arco por siglo,
la cual no puede ser eliminada aún suponiendo que haya algunos errores experimentales de
medición solventados con mediciones astronómicas cada vez más refinadas. Y esta discrepancia
no puede ser explicada usando las fórmulas de Newton.

Se puede objetar con desconfianza, no sin cierta razón, el que una deflexión angular tan pequeña
ocurriendo de una órbita a la siguiente pueda ser medida con tanta precisión con simples
observaciones astronómicas obtenidas mediante telescopios inclusive desde antes de la
formulación de la Relatividad General. Sin embargo, después de unos cincuenta años de
observaciones astronómicas y de estar recabando datos, la precesión acumulada es ya de
cincuenta tantos con respecto a la que tuvo lugar entre el primer año y el siguiente, y con sólo
dividir entre 50 la precesión acumulada entre el primer año y el año cincuentavo obtenemos una
aproximación razonablemente buena, la cual va mejorando conforme el efecto acumulado de
más precesiones con el paso de más años se va volviendo más discernible en la mesa de los
datos.

Aunque se propusieron muchas explicaciones “ad-hoc” para explicar la diferencia entre la


precesión de la órbita del planeta Mercurio predicha por las ecuaciones de Newton y la
precesión observada con mediciones astronómicas (por ejemplo, el suponer que había cierta
cantidad de polvo estelar entre Mercurio y el Sol) estas explicaciones jamás pudieron ser
confirmadas (las sondas espaciales que han sido enviadas a dicha región del sistema solar no
han encontrado evidencia alguna de la existencia de polvo estelar entre Mercurio y el Sol).

En contraste, basándose en su Teoría General de la Relatividad, Einstein pudo explicar


correctamente, sin necesidad de tener que hacer corrección alguna, esa precesión extra de 43
segundos de arco por siglo del planeta Mercurio. Aunque todas las mediciones astronómicas
anteriores habían sido hechas mediante telescopios convencionales, las mediciones más precisas
en la actualidad son hechas mediante radar. En base a estas mediciones más exactas, la
precesión de la órbita de Mercurio tiene un valor de 5599.7 segundos de arco por siglo.

Fue el 18 de noviembre de 1915, poco antes de obtener las ecuaciones finales de campo de la
Relatividad General, cuando Einstein basándose en las ecuaciones de campo del vacío publicó
una derivación de la precesión orbital de Mercurio, la cual terminó siendo parte sin cambio
alguno de la teoría que estaba próxima a ser concluída. Ya desde 1907 le había escrito a Conrad
Habicht que estaba trabajando en una teoría de gravitación que esperaba que pudiera explicar la
precesión anómala de Mercurio. Ocho años después, logró obtener exitosamente el resultado
que esperaba obtener, comentándole a un amigo que estuvo sobrecogido por la emoción por
varios días después de haber establecido una conexión sólida entre la teoría y las observaciones
astronómicas. La demostración que publicó formalmente en 1915 es matemáticamente
interesante, no sólo por la manera en la cual obtuvo la ecuación del movimiento de las
ecuaciones de campo del vacío (vacuum field equations), sino por el método que utilizó para
inferir la cantidad de precesión a partir de dicha ecuación, sin contar con el beneficio de la
solución esféricamente simétrica de Schwarzschild, la cual fue encontrada por éste último a
menos de un mes después cuando trabajaba en su puesto en el frente de guerra ruso. Careciendo
de la solución esférica exactaa las ecuaciones de campo que sería encontrada por Schwarzschild,
Einstein trabajó con una aproximación a la solución esféricamente simétrica de las ecuaciones
de campo del vacío, escribiendo su métrica “aproximada” empleando coordenadas Cartesianas
(rectangulares), la cual escrita en coordenadas polares toma la siguiente forma:

(dτ)² = (1 - 2M/r) (dt)² - (1 + 2M/r) (dr)² - r² (dθ)² - r² sen² (θ) (dφ)²

Schwarzschild pronto demostró que el coeficiente de (dr)2 debería ser realmente (12m/r)1, lo
cual está de acuerdo con la aproximación de Einstein únicamente hasta el primer orden en M/r.
Dado el alto grado de simetría (esférica) en este caso, no es difícil obtener la solución exacta a
partir de las ecuaciones de campo, pero el mismo Einstein no había anticipado que una solución
exacta a las ecuaciones de campo pudiera existir.

En referencia a la derivación empleada por Einstein, el gran matemático David Hilbert, el cual
también estaba trabajando en una teoría de campo unificado basándose en parte en la naciente
teoría gravitacional de Einstein, le escribió con cierta envidia lo siguiente:
“... felicitaciones en su conquista del movimiento del perihelio. Si yo pudiera calcular tan
rápidamente como usted, en mis ecuaciones el electrón debe corresponder capitulando, y
simultáneamente el átomo de hidrógeno debería presentar sus disculpas sobre el por qué no
produce radiación.”

De acuerdo con la Relatividad General, el desplazamiento angular del perihelio por


revolución δφ (se entiende aquí por revolución una órbita completa del planeta aunque dicha
órbita no se “cierre”) a causa de la corrección relativística a la órbita elíptica Newtoniana clásica
está dado por la siguiente fórmula (cuyo resultado está dado en radianes por cada revolución
completa alrededor del Sol):
En esta relación el parámetro a es lo que llamamos el semieje mayor de la órbita (igual a la
mitad del diámetro mayor de la elipse) y e es la excentricidad de la elipse (en el caso de un
círculo, e = 0 y no hay excentricidad, y entre mayor sea e tanto más elongada será la elipse). En
algunos textos tradicionales, la cantidad a(1-e²) es conocida como el latus rectum. (Para una
órbita circular, el semi-latus rectum es igual al radio de la órbita.) Puesto que la distancia del
perihelio p está relacionada al semieje mayor mediante p = a(1-e), podemos escribir también:

La fracción GM/c² es igual a la mitad de una distancia conocida como el radio de


Schwarazschild. Poniendo valores:

Constante de Gravitación Universal = G = 6.674215·10-11 m3/kg-seg²

Masa del Sol = M = 1.99·1030 Kilogramos

encontramos que para el Sol:

GM/c² = (6.674215·10-11) (1.99·1030) /(3·108)² = 1.476 Kilómetros

Esta es una distancia muy pequeña si la comparamos con la distancia del perihelio de Mercurio
de 46 millones de kilómetros al centro del Sol. Por lo tanto, el desplazamiento angular del
perihelio por revolución es una cantidad muy pequeña.

Utilizando directamente la fórmula de arriba, obtenemos δφ = 4.99·10 -7 radianes por órbita, lo


cual utilizando la conversión:

2π radianes = 360 grados = 21,600 minutos = 1.296·10 6 segundos

1 segundo de arco = 1" arco = 4.848·10-6 radianes

encontramos que equivale a (4.99·10-7)/(4.848·10-6) = 0.103 segundos de arco por revolución, y


puesto que Mercurio le dá la vuelta al Sol cada 87.969 días o bien:

(87.969 días) /(365 días/año) = 0.241 año/revolución


entonces el desplazamiento angular δφ de la órbita a causa de la precesión es igual a:

δφ = (0.103"/revolución) /(0.241 año/revolución)

δφ = 0.43"/año = 43"/siglo

que es justamente lo requerido para explicar la discrepancia observada astronómicamente en la


precesión de la órbita de Mercurio, la cual no puede ser explicada mediante la aplicación de la
ley de la gravitación universal de Newton.

La derivación de la fórmula para el desplazamiento angular del perihelio por revolución no es un


asunto muy complicado si empezamos con la solución exacta a las ecuaciones de Einstein
conocida bajo una simetría esférica, o sea empleando la métrica de Schwarzschild, a partir de la
cual podemos obtener directamente la ecuación de movimiento de una partícula en proximidad
a un astro de masa grande como el Sol. Si el lector desea anticiparse un poco al material que será
tratado posteriormente, puede encontrar dos derivaciones de la fórmula en el
enlace Wikipedia proporcionado al final de esta entrada, en la sección titulada “Precession of
elliptical orbits”. Sin embargo, el lector tal vez quiera esperar un poco hasta que tratemos temas
tales como los tensores, las métricas y las geodésicas antes de intentar comprender plenamente
lo que hay detrás de la derivación de la fórmula.

Habiendo aceptado la noción de que la presencia de cualquier cantidad de masa en el espacio-


tiempo introduce una curvatura en el mismo, la Relatividad General nos prepara para una de
sus predicciones que junto con la explicación de la precesión anómala del planeta Mercurio fue
la primera en ser confirmada experimentalmente: la curvatura de la trayectoria de un
rayo de luz en presencia de un campo gravitacional intenso.

Todavía hasta los tiempos de James Clerk Maxwell, el padre de la teoría del electromagnetismo,
e inclusive después de él, no había razón alguna para suponer que la luz pudiera interactuar de
modo alguno con un campo gravitacional. Siendo la luz una onda electromagnética carente de
masa, se trataba de fenómenos completamente diferentes, y punto. De las cuatro ecuaciones de
Maxwell no era posible deducir ni obtener interacción alguna ya sea de carácter eléctrico o
magnético con la gravedad de la Tierra o cualquier otro cuerpo, la fórmula para la fuerza de
atracción la gravedad no entraba en ellas. Sin embargo, la Teoría General de la Relatividad no
tardó en cambiar el panorama.
Primero que nada, debe sernos claro que un observador que esté en reposo con respecto a un
rayo de luz y un observador que esté acelerándose con respecto al mismo rayo de luz verán al
rayo de luz de maneras distintas. El observador que está en reposo sin estar sujeto a aceleración
alguna verá a un rayo de luz viajar en línea recta. En cambio, un observador que esté
acelerándose verá al rayo de luz seguir una trayectoria curva. Esto se vuelve más claro
considerando el siguiente experimento hipotético:

En la plataforma de lanzamiento de la nave que suponemos que se está acelerando rápidamente


con la ayuda de motores muy potentes, la vista que tiene un observador descansando sobre la
plataforma de lanzamiento de un rayo de luz que es disparado horizontalmente desde una
lámpara montada sobre la plataforma de lanzamiento es precisamente de un rayo de luz
horizontal. Eso es lo que vería al ver a la nave despegando al mismo tiempo a una aceleración
enorme. Pero la vista que tiene un viajero que va adentro de la nave de ese mismo rayo de luz es
diferente, ya que lo que él ve es un rayo de luz que se va curveando hacia abajo.

Supóngase que tomamos a nuestro viajero de ferrocarril con el cual empezamos nuestra
discusión sobre el tema de la relatividad en la entrada “El movimiento absoluto”, y lo movemos
a un elevador especial, el cual tiene una ventana al exterior, de modo tal que el movimiento de
nuestro viajero ya no será llevado a cabo horizontalmente sino verticalmente. Supóngase que
inicialmente está reposo con respecto a un observador externo que dispara un rayo de luz
horizontal. Nuestro pasajero en el elevador verá también al rayo de luz desplazarse
horizontalmente. Si el elevador se está desplazando hacia arriba a una gran velocidad que se
mantiene constante, entonces por los efectos propios de los dos postulados de la Teoría Espacial
de la Relatividad con los cuales descubrimos los efectos de la dilatación del tiempo y la
contracción de longitud el rayo de luz recorrerá una distancia mayor tal y como lo ve nuestro
viajero desde su ventanilla de observación:

Al estarse moviendo el elevador a una velocidad constante, nuestro viajero no experimenta


fuerza alguna que le permita determinar si es él quien está en movimiento en un elevador que
está subiendo o si la persona fuera del elevador con la linterna de luz en la mano es la que está
bajando a gran velocidad provocando que el rayo de luz tome la ruta de una línea recta
inclinada. Pero si el elevador va cambiando bruscamente de velocidad, moviéndose hacia arriba
a velocidades cada vez más cercanas a la velocidad de la luz, nuestro viajero sabe perfectamente
que él está sujeto a una aceleración producida ya sea por unos motores potentes puestos debajo
del elevador impulsándolo hacia arriba a velocidades cada vez mayores, y esto lo confirmará al
asomarse por la ventanilla y ver que el rayo de luz toma una trayectoria curva.

Ahora apelaremos al principio de equivalencia de la Relatividad General que nos dice que estar
en un marco de referencia acelerado es equivalente a estar en reposo en un campo gravitacional.
Si esto es cierto, entonces un rayo de luz que pase cerca de un campo gravitacional será desviado
experimentando una curvatura en su trayectoria. Puesto de otra manera, un rayo de luz que pase
cerca de un planeta será desviado de su dirección rectilínea. Sin embargo, aquí no hay atracción
gravitacional alguna que esté siendo ejercida sobre el rayo de luz, en virtud de que la atracción
gravitacional postulada por Isaac Newton no existe. Lo que sucede es que el rayo de luz se
mueve a lo largo de la curvatura introducida en una región del espacio-tiempo por la presencia
de un objeto con una cantidad apreciable de masa. Esto quiere decir que si llega a nosotros un
rayo de luz de una estrella distante, y ese rayo de luz ha pasado cerca de uno de los planetas
exteriores de nuestro sistema solar, ese rayo será desviado y la posición en el cielo en la que
nosotros vemos a dicha estrella no es su posición verdadera. Esto está ilustrado en el siguiente
dibujo:

La estrella cuya luz nos llega desde muy lejos, en su posición verdadera, sufre una desviación en
su trayectoria a causa de la curvatura introducida en el espacio-tiempo por el planeta cerca del
cual pasa el rayo de luz. Si nos dejamos guiar por la línea recta a lo largo de la cual viaja
directamente hacia nosotros la luz de la estrella, terminaremos creyendo que la estrella está
situada en el lado derecho en donde aparece la estrella en la parte superior del dibujo. Pero la
estrella está realmente situada a la izquierda de esta ilusión óptica, que bien pudieramos
llamar ilusión óptica gravitacional.

Es importante dejar otra cosa en claro: aunque la trayectoria que sigue un rayo de luz puede ser
desviada en presencia de un campo gravitacional intenso, la luz mantiene exactamente su
misma velocidad en presencia de un campo gravitacional, ni aumenta ni
disminuye su velocidad. Sigue siendo la misma referencia absoluta, universal, que no
cambia ni en la Teoría Especial de la Relatividad ni en la Teoría General de la Relatividad. Sin
embargo, al tomar una trayectoria curvilínea en vez de continuar adelante siguiendo una
trayectoria en línea recta, un rayo de luz nos puede confirmar de inmediato si en el lugar por
donde está pasando el espacio-tiempo ha dejado de ser plano adquiriendo una curvatura.

Para confirmar la predicción teórica de la deflexión de los rayos luminosos ocasionada por la
curvatura en el espacio-tiempo producida por el Sol, nuestra estrella más cercana, el 29 de mayo
de 1919 poco después de la Primera Guerra Mundial se llevó a cabo una expedición encabezada
por Sir Arthur Eddington a la isla de Príncipe cerca de Africa, en donde se esperaba un eclipse
solar total. Normalmente, la luz que nos llega de las estrellas lejanas y que pasa cerca del borde
exterior del disco solar no se puede distinguir a causa de la brillantez de la misma luz solar. Sin
embargo, si el disco del Sol es cubierto por un cuerpo opaco lo suficientemente grande, como el
de la Luna durante un eclipse, entonces la luz solar ya no opaca totalmente a la luz de las
estrellas que llega hasta nosotros pasando por dicho borde. En principio, una fotografía de la
región del Universo situada justo detrás del Sol al momento de ser tomada durante el eclipse
solar, comparada con otra fotografía tomada de esa misma región con el Sol fuera del camino en
virtud del movimiento de traslación de la Tierra alrededor del Sol, debe mostrarnos a las
estrellas más cercanas entre sí al crearse el efecto óptico por la desviación relativista gravitatoria
de la luz de esas estrellas al pasar cerca del Sol que cuando las vemos en una noche obscura. A
continuación tenemos el “negativo” fotográfico de una de las placas tomadas durante esa famosa
expedición (el término “negativo” fotográfico, una inversión de la luminosidad mostrada por
una placa, tal vez no sea muy claro para las nuevas generaciones acostumbradas a las cámaras
fotográficas digitales sin haber conocido las cámaras “antigüitas” basadas en soluciones de plata,
y una comparación equivalente sería imaginarnos a la placa como una placa de rayos-X aunque
en realidad no lo es):
Los resultados positivos anunciados por Eddington en su tiempo fueron aplaudidos como una
confirmación de la Relatividad General, aunque eventualmente esos resultados estuvieron
siendo puestos en tela de duda por las incertidumbres experimentales astronómicas capaces de
ser confundidas con efectos relativistas. Si nos fijamos en la placa fotográfica, pese a la oclusión
del astro solar ocasionada por la Luna, la posición de las estrellas situadas alrededor del Sol así
como la nitidez de las mismas no es algo tan pronunciado como pudiera esperarse. Aún así,
Eddington y otros astrónomos, en su interpretación de los resultados obtenidos, encontraron
suficiente evidencia para considerar a los resultados como una confirmación de la Relatividad
General. De cualquier manera, hay otro efecto similar de confirmación astronómica que en su
tiempo no se le había ocurrido ni siquiera al mismo Einstein: la creación de imágenes dobles o
inclusive múltiples por el efecto conocido como lentes gravitacionales. Y la detección de
este efecto es posible llevarla a cabo en un cielo totalmente obscuro, porque la masa que desvía
los rayos luminosos que nos llegan de las estrellas no es la masa del Sol brillante tan cercano a
nosotros sino otra masa grande que incluso puede ser opaca (como una estrella de neutrones)
situada entre nosotros y dichas estrellas. La siguiente ilustración nos muestra cómo es posible
que se formen imágenes dobles, de las cuales ya se han corroborado varias:
A continuación tenemos una fotografía tomada por el telescopio espacial Hubble que nos
muestra de manera concluyente un ejemplo de lente gravitacional:

En esta fotografía, lo que en las puntas parecen ser cuatro estrellas situadas en forma de cruz (la
configuración es conocida como la Cruz de Einstein) en realidad son imágenes de la misma
estrella, una estrella quásar designada en el catálogo astronómico internacional como
G2237+0305. El cuerpo central en realidad es una galaxia situada entre nosotros y la estrella, la
galaxia CGCG 378-15 que está actuando como una lente gravitacional desviando los rayos
luminosos de la quásar de modo tal que nos llegan cuatro imágenes de la misma estrella a la
Tierra.

En la entrada “El efecto Doppler relativista” correspondiente a la Teoría Especial de la


Relatividad, vimos cómo cuando en el espacio libre un viajero con una fuente luminosa en sus
manos se está alejando de nosotros la frecuencia de las ondas luminosas que nos llega de su
lámpara es menor no sólo por el efecto del corrimiento Doppler sino por los efectos relativistas
de la dilatación del tiempo. Esto supone que la fuente está en movimientoalejándose de
nosotros.

Pero en la Relatividad General, no es necesario que una fuente luminosa se esté alejando de
nosotros a gran velocidad para que la frecuencia de una señal emitida desde la fuente nos llegue
disminuída a nosotros. Podemos estar siempre a la misma distancia de otro observador
(digamos unos mil millones de kilómetros) y sin embargo un haz luminoso que nos envíe el
observador que él ve de color azul nos puede llegar de color verde o rojo. Para que esto ocurra, el
observador que nos manda el haz de luz debe estar en la superficie de un planeta o de un cuerpo
celeste con un campo gravitacional intenso, con lo cual la curvatura provocada en lo que de otro
modo sería un espacio-tiempo plano hace que la coordenada del tiempo se dilate en la superficie
del cuerpo masivo con respecto al tiempo medido en el espacio libre exterior por un observador
en reposo libre del campo gravitacional. La fórmula para la dilatación gravitacional del
tiempo medida por un reloj situado dentro de un campo gravitacional es:

en donde T es el intervalo de tiempo medido por un observador que se encuentra en el espacio


libre alejado del campo gravitacional. Se recalca aquí que esta dilatación del tiempo es distinta a
la dilatación del tiempo tratada dentro de la Teoría Especial de la Relatividad. Esta misma
fórmula, para el campo gravitacional de la Tierra en su superficie, se convierte en:
Utilizando la expansión binomial por series:

y los valores de g = 9.8 metros/seg² para la superficie de la Tierra así como R = 6.38·10 6metros
para el radio medio de la Tierra, encontramos que:

con lo cual se antoja extremadamente difícil el poder medir en la superficie de la Tierra un


corrimiento al rojo gravitacional.

Puesto que la gravedad dilata al tiempo, al estar lejos de una estrella masiva tenemos que
esperar más para ver pasar la siguiente cresta de una onda luminosa que los observadores que
estén en la superficie de la estrella masiva. Puesto que la luz viaja siempre a la misma velocidad,
este incremento en el período de tiempo de cresta a cresta de la onda luminosa implica que la
longitud de onda λ será mayor al llegar a nosotros que al salir disparada del cuerpo masivo:
En otras palabras, hay un corrimiento hacia el rojo causado por el campo gravitacional, el cual
no tiene absolutamente nada que ver con el efecto Doppler ya que el cuerpo masivo puede estar
siempre estacionario (a la misma distancia) de nosotros y el corrimiento al rojo ocurrirá de
todas maneras. Este efecto de corrimiento hacia el rojo ocasionado por un campo gravitacional
intenso y el cual no tiene nada que ver con el efecto Doppler causado por un movimiento del
cuerpo alejándose de nosotros es conocido como el corrimiento al rojo
gravitacional ó desplazamiento Einstein.

El corrimiento al rojo gravitacional es una consecuencia directa del Principio de Equivalencia de


la Relatividad General, ya que de acuerdo a dicho principio cualquier corrimiento de frecuencia
que pueda ser ocasionado por una fuente que se está acelerandoalejándose de nosotros (lo cual
ya hemos tratado en la entrada “El efecto Doppler relativista”) también puede ser producido por
un campo gravitacional. Por lo tanto, el corrimiento al rojo que se puede esperar como
consecuencia de un campo gravitacional puede ser relacionado directamente con el corrimiento
Doppler relativista que se obtiene de una fuente luminosa que se está alejando de nosotros. Para
una velocidad V de la fuente luminosa suficientemente baja en comparación con la velocidad de
la luz, el desplazamiento Doppler está dado por la fórmula:

f = f0 [ 1 + V/c]

Para una aceleración constante a (como es el caso con la gravedad de la Tierra) con la cual el
observador al recorrer una distancia L se ha acelerado a una velocidad V en un tiempo L/c, la
expresión se transforma en:

f = f0 [ 1 + aL/c²]

Y el símil de esta fórmula en un campo gravitacional será, reemplazando la aceleración por g:

f = f0 [ 1 + gL/c²]

Desde la óptica de la mecánica cuántica y el principio de la conservación de la energía, no es


difícil ver el por qué un haz luminoso debe experimentar un corrimiento hacia el rojo cuando es
emitido en presencia de un campo gravitacional intenso. Considérese el
siguientegedanken (experimento hipotético) que fue propuesto inicialmente por el mismo
Einstein, en el cual tenemos una torre alta de altura h y desde la cual dejamos caer libremente
hacia el suelo con una aceleración g desde lo alto de la torre una partícula cuya masa en reposo
es m0 y cuya energía de movimiento al tocar el suelo es convertida totalmente por algún
procedimiento ingenioso en un fotón de haz luminoso γ de frecuencia f:

Al caer libremente hacia la superficie de la Tierra por la acción de la gravedad, la partícula toca
el suelo con una velocidad v. Puesto que toda la energía potencial E p que tenía la partícula fue
convertida en energía cinética Ec, esta velocidad será igual a:

Ep = Ec

mgh = ½mv²

v = √2gh

De este modo, un observador al pie de la torre medirá en la partícula una energía total E igual a
la energía en reposo E0 de la partícula más su energía cinética Ec:

E = E0 + Ec

E = m0c² + ½mv²

Esto nos indica que al haber dejado caer a la partícula inicialmente en reposo desde lo alto de la
torre hemos ganado energía. La energía no es simplemente E0 sino E. Supongamos ahora que el
observador al pie de la torre tiene un método ingenioso que puede utilizar para convertir toda
esta energía E en un fotón luminoso que envía hacia lo alto de la torre. Este es un procedimiento
que no viola las leyes de conservación puesto que la Tierra absorbe el momentum del fotón pero
no su energía. Si el fotón no cambia en nada, entonces va a llegar a lo alto de la torre con la
misma energía que tenía al momento de ser enviado desde el pie de la torre. Después de llegar a
lo alto de la torre, el fotón es convertido nuevamente por otro procedimiento ingenioso a una
partícula cuya masa en reposo es m'0 siendo su energía E'0. Pero ahora tenemos una masa con
un contenido energético total mayor que el que teníamos antes. Si repetimos el proceso
dejando caer la partícula desde lo alto de la torre, ganará todavía más energía, la cual al ser
convertida la partícula en un fotón enviado hacia lo alto de la torre se sumará a la
energía extra que ya se había adquirido antes. En pocas palabras, estamos terminando con más
energía que la que teníamos cuando empezamos. Se está creando energía de la nada. Sin
embargo, si algo nos ha mostrado la Naturaleza que ha sido confirmado por todos los
experimentos habidos y por haber, es que no hay nada gratis tratándose de cuestiones de
energía. La energía simplemente no aparece de la nada gratuitamenete, cuando lo hace podemos
estar seguros de que hay un déficit en otro lado que neutraliza la ganancia. Es así como
sospechamos que la energía en reposo E'0 que tiene la masa al ser devuelta como un fotón hacia
lo alto de la torre debe ser igual a la energía en reposo original E0 con la cual se dejó caer a la
partícula desde lo alto de la torre (o lo que es lo mismo, la masa de la partícula que llega a lo alto
de la torre debe ser la misma que la masa de la partícula que fue dejada caer desde la torre), ya
que de no ser así podríamos obtener un movimiento perpetuo con la energía ganada por la
partícula al caer de lo alto de la torre. Pero desde hace ya bastantes años que la ciencia descartó
la posibilidad de máquinas de movimiento perpetuo. Ahora bien, de acuerdo con la mecánica
cuántica, la energía Ef de un fotón depende única y exclusivamente de la frecuencia f del
fotón de acuerdo con la siguiente fórmula:

Ef = h f

en donde h es la constante de Planck. Esto nos lleva a concluír que la energía del fotón al ser
enviado desde el suelo hasta lo alto de la torre no es igual a la energía con la cual el fotón llega
a lo alto de la torre, la energía debe ser necesariamente menor ya que de otra manera
podríamos construír una máquina de movimiento perpetuo violando el segundo principio de la
termodinámica que excluye la posibilidad de poder construír máquinas de movimiento
perpetuo. Y la única manera en la cual el fotón puede llegar a lo alto de la torre con una energía
menor a la que tenía cuando fue enviado desde el suelo hacia la torre es llegando con una
frecuencia que la que tenía cuando fue enviado; en otras palabras, experimentando un
corrimiento hacia el rojo. En principio, la frecuencia del fotón se va corriendo hacia el rojo
conforme el fotón se va alejando del campo gravitacional, y al llegar a la torre la energía perdida
por el fotón debe ser exactamente igual a la energía cinética ganada por la masa al caer desde lo
alto de la torre. Ni creación ni desaparición de energía, tal y como lo pide el principio de la
conservación de la energía (o mejor dicho, el principio de la conservación de la masa-energía).

Imaginemos un edificio situado sobre la superficie de un planeta con un campo gravitacional


intenso. Entonces, al menos teóricamente, el tiempo correrá más lentamente en el primer piso
del edificio que en cualquiera de los pisos superiores (para una persona ordinaria esta diferencia
será indetectable):

Entonces, por el efecto de la dilatación del tiempo, la onda luminosa se irá estirando conforme
sube del primer piso al segundo piso y hacia los pisos superiores del edificio:
Aunque resulte difícil de creer, el corrimiento al rojo gravitacional ha sido verificado
experimentalmente aquí mismo en la Tierra utilizando el efecto Mössbauer (descubierto en 1957
por el físico Rudolf Mössbauer, un efecto que tiene que ver con la emisión y absorción resonante
y libre de retroceso de rayos gamma por parte de átomos de un sólido). El experimento,
conocido como el experimento Pound-Rebka, fue efectuado en 1959 por R. V. Pound y G. A.
Rebka Jr. en el Jefferson Physical Laboratory de la Universidad de Harvard utilizando una
variación de la espectroscopía Mössbauer basada en el efecto del mismo nombre. Para ello se
utilizaron dos emisores separados a una altura de 22.6 metros, uno apuntando hacia abajo y el
otro apuntando hacia arriba, con detectores situados en los extremos opuestos:
En base a lo que se ha señalado anteriormente, la fórmula para obtener el cambio debido al
corrimiento al rojo gravitacional es:

En una diferencia de altura de 22.6 metros el corrimiento al rojo por la diferencia entre la
gravedad de la Tierra a esa diferencia en la altura es de apenas 4.92·10 -15, pero gracias al efecto
Mossbauer utilizando rayos gamma con una energía de 14.4 KeV del hierro-57, se encontró que
los resultados experimentales confirmaron que las predicciones de la Relatividad General
estaban apoyadas por las observaciones con un nivel del 10% de confianza, refinándose más
tarde el resultado por Pound y Snider consiguiéndose mejorar el nivel de confianza hasta un 1%
de confianza. El experimento fue repetido con ambos emisores y detectores colocados al mismo
nivel sobre la superficie de la Tierra en vez de ser colocados a alturas diferentes, aunque
manteniendo la separación de 22.6 metros, y se encontró que la frecuencia de cada señal al ser
emitida era la misma que la frecuencia que tenía la señal al ser recibida por el detector situado a
22.6 metros de distancia al mismo nivel sobre la superficie de la Tierra. Los corrimientos de
frecuencia cuando los emisores y detectores están separados verticalmente, no cuando están
separados horizontalmente, resultan ser iguales a los predichos por las fórmulas obtenidas de la
Relatividad General. Se considera que fue el experimento Pound-Rebka, cuyos resultados
fueron publicados en 1959 por el Physical Review Letters, el que introdujo una era de pruebas
de precisión de la Relatividad General.

Desafortunadamente el corrimiento hacia el rojo por efecto de un campo gravitacional


ocasionado desde la superficie de un astro se confunde con el corrimiento hacia el rojo debido al
movimiento rápido con el cual el astro se está alejando de nosotros que produce su propio efecto
relativista, lo cual hace que los efectos se combinen dando como consecuencia un solo resultado,
el corrimiento hacia el rojo, pero sin quedar muy claro cuánto de ese corrimiento hacia el rojo
puede ser ocasionado por el efecto del campo gravitacional y cuánto se puede deber al efecto
Doppler relativista al estarse alejando el astro rápidamente de nosotros. Inclusive en la
actualidad esto sigue siendo un tema de controversia que no se ha resuelto del todo y sigue
siendo objeto de una investigación intensa.

Al empezar a cubrir el tema de la Teoría Especial de la Relatividad en una entrada anterior


titulada “Las consecuencias directas de la teoría”, se señaló que el tiempo medido por un satélite
artificial en órbita alrededor de la Tierra como ocurre con cada uno de los 24 satélites utilizados
por el Sistema de Posicionamiento Global ó Global Positioning System (GPS) será más lento que
el tiempo medido en la Tierra. Este es un efecto relativista debido enteramente a la Teoría
Especial de la Relatividad, cuando aún no se había desarrollado la Relatividad General, cuando
aún no se sabía que los cambios en la gravedad de la Tierra con la altura también podían
introducir sus propios efectos relativistas de dilatación del tiempo. Esto significa que para un
satélite que está en órbita dándole vueltas a la Tierra, el efecto relativista total tiene que ser
calculado sumando el efecto relativista debido al movimiento relativo entre el satélite y la Tierra
junto con el efecto relativista debido a la diferencia que hay entre la gravedad de la superficie de
la Tierra y la gravedad a una altura de más de 500 kilómetros sobre la superficie de la Tierra.
(Esta complicación no ocurre desde luego tratándose de los satélites
artificiales geoestacionarios, los cuales se mueven en la misma dirección de la rotación de la
Tierra de modo tal que parecen estar suspendidos en el aire a gran altura sobre nosotros sin
cambiar de posición; en tal caso la única corrección relativista por efectos de dilatación del
tiempo que hay que aplicar es la que predice la Relatividad General, en todos los demás casos
hay que combinar ambos efectos.) No es inusual encontrarse con la necesidad de tener que
aplicar correcciones relativistas combinadas motivadas por el hecho de que, además de
las correciones relativistas requeridas para compensar por los efectos causados por la Teoría
Especial de la Relatividad, a estos efectos tengamos que agregar los efectos relativistas causados
por la gravedad. Esto lo podemos expresar mediante la siguiente fórmula:
Otra consecuencia interesante de la Relatividad General concierne algo que posiblemente al
mismo Newton le despertó sospechas. De acuerdo con la teoría de la gravitación universal, dos
cuerpos se atraen en razón directa del producto de sus masas y en razón inversa del cuadrado de
la distancia que separa sus centros de gravedad. Así es como la Tierra mantiene a la Luna dentro
de una órbita aproximadamente circular en torno a la Tierra. La fuerza de atracción ejercida por
la Tierra sobre la Luna es la misma ya sea que la Tierra esté girando con un movimiento de
rotación sobre su eje o que permanezca estática frente a la Luna. Esto quiere decir que si la
Tierra empezara a girar con mayor velocidad angular, la Luna no sentiría efecto alguno, porque
la fuerza de atracción propuesta por Newton no tiene absolutamente nada que ver con la
cantidad de energía rotacional que posea la Tierra, únicamente depende de la masa de la Tierra
y la distancia de la Tierra a la Luna. Sin embargo, un planeta en rotación definitivamente posee
cierta cantidad de energía, definida clásicamente mediante la siguiente fórmula:

E = ½Iω²

en donde ω es la velocidad angular de la Tierra y I es el momento de inercia de la Tierra, la cual


si es considerada como un objeto aproximadamente esférico de radio R y de densidad constante
entonces para fines de cálculo posee un momento de inercia I que está dado por la fórmula:

I = 2MR²/5

Considerando la cantidad de masa M que posee la Tierra (5.98·1024 kilogramos) y un


movimiento de rotación con un período de 24 horas, estamos hablando aquí de una cantidad
considerable de energía de movimiento. ¿Cómo es posible que tanta energía no produzca
absolutamente ningún efecto así sea minúsculo sobre el cuerpo que está siendo objeto de
atracción? Esto quiere decir que si pudieramos ocultar a la Tierra detrás de una cortina plana
que le impidiera a un astronauta ver a la Tierra desde la Luna, éste no tendría forma alguna de
saber si la Tierra está estática, girando lentamente o girando a gran velocidad, a menos de que la
lámina sea levantada y se le permita ver a la Tierra. La formulación matemática de las leyes de
Newton no permite establecer diferencia alguna. La ley de Newton para la gravitación universal
no permite que esta energía rotacional pueda ser tomada en consideración aunque pueda variar
enormemente, algo que posiblemente habrá frustrado al mismo Newton dejándolo con dudas
sobre los alcances de su teoría.

Desde la perspectiva de la Relatividad General, la masa M de la Tierra es equivalente a cierta


cantidad de energía E en base a la relación E = mc², de modo tal que si decimos que la energía
en reposo resultante de la masa de la Tierra es la que está manteniendo a la Luna en su órbita,
estaríamos en lo correcto. Pero al hablar del equivalente energético de la masa M de la Tierra,
estamos utilizando un concepto en el cual podemos incluír sin problema alguno la energía
rotacional de la Tierra. En la Relatividad General, tanto la masa como la energía son capaces de
provocar una curvatura en el espacio-tiempo, porque han sido unificadas bajo un solo concepto
en la Teoría Especial de la Relatividad. Si la Tierra no girase en torno a su propio eje, si estuviese
estática frente a la Luna, entonces todo su contenido energético sería el que deriva de su masa.
Pero al estar girando la Tierra, su contenido energético es mayor en virtud de que al contenido
energético resultante de la masa (la energía en reposo) hay que sumarle el contenido energético
resultante de la rotación. En otras palabras, la energía total de la Tierra es igual a la energía
equivalente de su masa sumada a la energía angular en virtud de su movimiento de rotación:

Etotal = Emasa + Erotacion

Etotal = Mc² + ½Iω²

Al introducir en el lado derecho de la ecuación tensorial

curvatura espacio-tiempo = energía total

la energía extra producida por la rotación de la Tierra, se provocará una curvatura en el espacio-
tiempo aún mayor que la que produciría la Tierra si estuviese estática, lo cual hará que la Tierra
parezca “jalar” con mayor fuerza la Luna hacia la Tierra. De este modo, tenemos dos
conclusiones completamente diferentes:

Newton: La rotación de un cuerpo no tiene efecto alguno sobre la atracción gravitacional que
ejerce sobre otro cuerpo.

Einstein: La rotación de un cuerpo tendrá un efecto directo adicional en la curvatura del


espacio-tiempo que a su vez dicta la órbita del cuerpo que esté girando en torno a él, lo cual se
traducirá directamente en una atracción gravitacional mayor.

Otra predicción de la Relatividad General es la de la existencia de los hoyos


negros o agujeros negros, cuerpos con tanta masa y tanta “atracción gravitacional” que ni
siquiera la luz puede escapar de ellos. Interesantemente, esta misma predicción había sido
hecha también por la mecánica Newtoniana, aunque por las razones equivocadas. A partir de las
ecuaciones de Newton, se puede demostrar con poca dificultad que para un cuerpo grande de
radio r y de masa M la velocidad de escape para un proyectil lanzado verticalmente desde la
superficie de dicho objeto no depende de la masa del cuerpo lanzado (el cual suponemos
pequeño) sino de la masa del cuerpo grande y de su radio. Para un objeto lanzado verticalmente
desde el planeta Tierra, esta velocidad resulta ser de 11.2 kilómetros por segundo:

Puesto que la velocidad de la luz es de 300 mil kilómetros por segundo, podemos calcular bajo la
mecánica Newtoniana qué tanta masa M debe tener concentrada un planeta de radio r para que
la velocidad vertical de escape de dicho planeta sea exactamente igual a la velocidad de la luz. Y
si el planeta, con el mismo radio, tiene una cantidad de masa M mayor que ésta, la luz no podrá
escapar de la “atracción gravitacional” del planeta.

Pero bajo la mecánica Einsteniana, la “atracción gravitacional” no existe. Lo que sucede es que
la curvatura que va siendo introducida en una región de espacio-tiempo por una cantidad cada
vez mayor de masa llega a tal extremo que se perfora un punto en esa región de espacio-tiempo,
al cual matemáticamente se le conoce como una singularidad. En ese punto, la caída en la
curvatura conduce directamente hacia el infinito:
De este modo, en aquella región del cosmos en donde haya un hoyo negro, tenemos lo que es ni
más ni menos que una perforación matemática en el espacio-tiempo:

En principio, un agujero negro es un objeto totalmente invisible, puesto que si es capaz de


tragarse la luz impidiendo que pueda salir del mismo confirmación visual alguna que pueda
darnos una pista de su existencia, ni siquiera sabemos que está allí. La detección del mismo se
tiene que llevar a cabo por métodos indirectos como cuando está devorando una estrella o como
cuando tiene una estrella en órbita en torno suyo. El estudio de estos objetos exóticos se verá
posteriormente en mayor detalle cuando se hayan sentado las bases matemáticas requeridas
para poder entender lo que está sucediendo dentro y fuera de los agujeros negros.

Además de las tres pruebas originales propuestas por Einstein en 1916 para confirmar
experimentalmente la Teoría General de la Relatividad, gracias a los avances recientes en la
astronomía y en la astrofísica constantemente se están dando a conocer nuevas verificaciones de
la teoría que solidifican su credibilidad. Una búsqueda aleatoria en Internet nos puede mostrar
en poco tiempo artículos como el publicado el 14 de septiembre de 2006 por el
sitio ScienceDaily bajo el título “General Relativity Survives Gruelling Pulsar Test: Einstein At
Least 99.95 Percent Right”, que se traduce del inglés como “La Relatividad General Sobrevive
Extenuante Prueba de Pulsar: Einstein Correcto en Al Menos 99.95 por ciento”, accesible en el
enlace:

http://www.sciencedaily.com/releases/2006/09/060914094623.htm

Del mismo sitio, se puede citar otro artículo publicado el 4 de julio de 2008 bajo el título
“Einstein Estaba en lo Cierto, Afirman Astrofísicos”, que se traduce del inglés como “Einstein
Was Right, Astrophysicists Say”, accesible en el enlace:

http://www.sciencedaily.com/releases/2008/07/080703140721.htm

Dos filosofías opuestas

Hagamos ahora una comparación entre la mecánica Newtoniana de Sir Isaac Newton basada
en el concepto del movimiento absoluto y la mecánica Einsteniana basada en el concepto del
movimiento relativo.

La mecánica Newtoniana basa su creencia en el concepto de acción-a-distancia, la creencia de


que entre dos cuerpos celestes flotando en el espacio existe una forma de atracción universal, la
cual se puede expresar mediante una fórmula que nos dice que dicha fuerza de atracción es
directamente proporcional al producto de las masas M y m de dos cuerpos que se atraen, e
inversamente proporcional al cuadrado de la distancia r que separa los centros geométricos de
dichas cuerpos:

Newton creía que un cuerpo podía ejercer una fuerza de atracción sobre otro cuerpo a través del
espacio intermedio entre dichos cuerpos, y su formulación de su ley de atracción universal
requería que tal “acción a distancia” ocurriera de manera instantánea, sin límite alguno
impuesto a la rapidez de tal interacción. Aquí la velocidad de la luz no era obstáculo alguno, y si
bien un rayo de luz tarda cierto tiempo en llegar desde la Tierra hasta el planeta Marte, los
efectos de la atracción gravitatoria universal Newtoniana de un cuerpo sobre otro eran
instantáneos aunque dichos cuerpos estuviesen situados en extremos opuestos de una galaxia.
La velocidad de la luz ni siquiera aparece en la fórmula de Newton. Esta hipótesis que nos dice
que si tenemos dos cuerpos celestes pesados separados el uno del otro a una distancia de mil
trillones de kilómetros y uno de dichos cuerpos es alejado súbitamente del otro (al ser golpeado
por un asteroide enorme, por ejemplo), de alguna manera el otro cuerpo “sabe”
instantáneamente lo que ocurrió a esa enorme distancia. Es un efecto que se antoja más como
un truco de magia que como una teoría científica seria.

La enorme influencia ejercida por los conceptos filosóficos de Newton, el cual creía firmemente
en la existencia del espacio absoluto y del tiempo absoluto, no tardó en ser aplicada en las
primeras leyes que se fueron formulando para los fenómenos eléctricos y magnéticos,
empezando con la Ley de Coulomb, la cual a primera vista parece una calca de la ley de
gravitación universal de Newton por la manera en la que está formulada: Dos cargas eléctricas
se atraen (o se repelen, dependiendo del signo de las cargas) en razón directa del producto de las
magnitudes de las cargas y en razón inversa al cuadrado de la distancia que las separa.

La ley de Coulomb, al igual que la ley de Newton, también se basa en la creencia de un efecto de
“acción a distancia”, el cual se propaga instantáneamente entre dos cargas eléctricas sin
importar la distancia que haya entre dichas cargas.
En contraste, la mecánica Einsteniana niega por completo la existencia de los efectos
instantáneos y casi mágicos de la “acción a distancia”, niega por completo la existencia de una
fuerza de atracción gravitatoria universal entre dos cuerpos celestes. El concepto de la “acción a
distancia” es reemplazado por otro concepto, el concepto de que la presencia de cualquier
cantidad de masa o de energía introduce una curvatura en el espacio cuatri-dimensional que de
otra manera sería perfectamente plano, y esta curvatura es precisamente la que explica los
movimientos de los planetas alrededor del Sol y todos los demás fenómenos celestes.

En una región del universo completamente desprovista de la cercanía de objeto alguno, el


diagrama espacio-tiempo de Minkowski de tal región es perfectamente plano, porque no hay
nada que introduzca curvatura alguna en dicho diagrama:

Pero la sola presencia de un objeto cualesquiera introduce una curvatura en el plano espacio-
tiempo cuya magnitud dependerá de la magnitud de la masa que produzca dicha curvatura,
siendo la curvatura mayor en tanto mayor sea la masa. Es así como el Sol en torno al cual gira
nuestro planeta introduce su propia curvatura la región del espacio-tiempo que está ocupando
(por cierto, el marco de la figura de abajo no es un rombo con el lado inferior más pequeño que
el lado superior, la forma aparente de trapecio no es más que una ilusión óptica, del mismo
modo que la mecánica Newtoniana no es más que una ilusión que prevaleció por muchos años):
Bajo la mecánica Einsteniana, cuando un objeto pequeño está en la proximidad de un objeto
masivo, rodará enfilándose hacia el objeto masivo a causa de la curvatura en el continuo
espacio-tiempo del mismo modo en que una canica rodará hacia una pequeña región que esté
situada a una altura menor que la altura a la cual se encuentra:

Si el cuerpo pequeño no está enfilado directamente hacia el objeto de mayor tamaño sino que va
a pasar de lado, entonces la curvatura en el espacio-tiempo provocada por el objeto mayor lo
jalará haciéndolo caer en una espiral hacia él. Si el cuerpo pequeño va viajando con suficiente
rapidez al irse acercando hacia el cuerpo mayor, entonces no caerá sino que entrará en órbita
permanente alrededor del cuerpo. Esto es posible porque si el cuerpo que servirá de centro
orbital (en torno al cual girará otro cuerpo) tiene suficiente masa, entonces hará que el
espacio-tiempo se cierre sobre sí mismo produciendo las trayectorias curvas cerradas que
el cuerpo en movimiento seguirá en torno al cuerpo alrededor del cual estará girando. Esta es la
verdadera razón, de acuerdo con la Relatividad General, por la cual la Tierra gira alrededor del
Sol, no porque haya una fuerza de atracción entre dos masas según lo propuso Newton. Esta es
esencialmente la explicación Einsteniana moderna de la mecánica celeste.

En nuestro sistema solar, no sólo el Sol produce una hendidura en el espacio-tiempo


introduciendo una curvatura que le permite mantener a todos los planetas del sistema solar
girando en torno suyo, también cada planeta introduce su propia hendidura que le permite tener
sus propios satélites. Es así como tenemos un conjunto de hendiduras en el espacio-tiempo de
nuestro sistema solar:

De este modo, la Teoría de la Relatividad reemplaza todo el concepto filosófico en el que estaban
basadas las ideas de Newton por otro concepto que está más acorde con resultados
experimentales que están siendo obtenidos en la actualidad.

Introducción al cálculo tensorial


La formulación básica de la Teoría General de la Relatividad es una formulación matemática en
notación tensorial, usando tensores, y es por ello que se vuelve necesario dar una idea de lo que
son estos objetos matemáticos que llamamos tensores. En vez de empezar con una definición
axiomática (formal) de lo que es un tensor, postpondremos dicha definición para después,
empezando en cambio con una definición intuitiva.
Aunque sin algo que le corresponda en el mundo físico real, podemos definir matemáticamente
en un plano de dos dimensiones un “campo de números” como el siguiente:

φ = 0.2x + 0.1y

De este modo, al par (x,y) = (1,1) le corresponde el número φ = 0.3, y así sucesivamente.
Tabulando algunos números y poniéndolos en el plano tendríamos una distribución de números
como la que se muestra a continuación:

A cada punto en el plano x-y le corresponde un número. Así, podemos “sembrar” un campo de
números, de escalares, con lo que tenemos un campo de escalares o simplemente un campo
escalar.

Una cantidad escalar Q, la cual no tiene dirección ni sentido y se representa con un simple
número (como la masa m de un cuerpo o su temperatura T) es un tensor de orden cero. Esta
cantidad, por ser un simple número, permanece igual ya sea que se le considere en un espacio de
dos dimensiones, de tres dimensiones, o inclusive en un espacio que posea cualquier número de
dimensiones.

Una cantidad vectorial V, a la cual definitivamente le podemos asignar dirección y sentido


(como la velocidad que lleva un avión moviéndose horizontalmente hacia la derecha a una
velocidad de 30 metros por segundo y hacia arriba a 40 metros por segundo) y se representa
como una n-pla de números (un par de números ordenados cuando se trata de un vector en dos
dimensiones, un triplete de números ordenados cuando se trata del mismo vector trazado en
tres dimensiones, un cuádruple ordenado de números cuando se trata de un vector trazado en
un espacio cuatri-dimensional, etc.) es un tensor de orden uno en un espacio n-dimensional.

Una cantidad tensorial Trs en donde empleamos dos sub-índices es una extensión de los
conceptos anteriores, también a un espacio n-dimensional, denotado como tensor de orden
dos. Los componentes Tij de un tensor de orden dos se pueden representar mediante ese
arreglo rectangular de números conocido como matriz:

En todo lo que hemos señalado anteriormente, hemos supuesto que al hablar de un tensor de
orden cero (una cantidad escalar), un tensor de orden uno (una cantidad vectorial) o un tensor
de orden dos, estamos haciendo referencia a algo que es representado en el espacio n-
dimensional como un punto, como en el caso de la masa que se representada simbólicamente
con su centro de masa especificado en cierta posición, o como el vector velocidad de un avión
que en un instante dado se especifica sobre cierto punto de origen (no necesariamente el punto
de origen del sistema de coordenadas utilizado para representar el vector con la flechita usual) el
cual va cambiando de lugar conforme el avión se va trasladando de un punto a otro. Pero hay
muchas situaciones físicas en las cuales se vuelve necesario extender las definiciones anteriores.

Supóngase que estamos midiendo la temperatura no de una esferita metálica muy pequeña que
por su tamaño está completamente a la misma temperatura, sino de una placa metálica
rectangular uno de cuyos bordes laterales está tocando un horno con los otros tres bordes
tocando un recipiente de agua. Al llevarse a cabo una transmisión del calor del borde caliente a
los tres bordes fríos, no podemos hablar de que toda la placa esté a una sola temperatura. Un
punto de la placa estará a una temperatura T1, otro punto de la placa estará a una
temperatura T2, otro punto de la placa estará a una temperatura T3, en fin, teóricamente hay
una cantidad infinitamente grande de puntos dentro de la placa, y cada uno de ellos tendrá su
propia temperatura en un momento dado (la distribución de temperaturas en un caso así
tratándose de una placa rectangular se obtiene mediante una ecuación diferencial que involucra
derivadas parciales de segundo orden conocida como la ecuación de Laplace). En este caso,
tenemos un ejemplo de lo que viene siendo un campo escalar en un plano, con cada punto en
el plano especificando un valor escalar distinto (que en este caso es la temperatura) para el
plano. Si representamos la distribución de temperaturas en la placa rectangular poniendo a la
placa en un plano de coordenadas y asignándo a la tercera coordenada el valor de la
temperatura en cada punto de la placa, tendremos algo como lo siguiente:

Como podemos ver, la placa tendrá su temperatura máxima de 500 grados en el punto (i,j) =
(20,0), y la temperatura en cada punto de la placa va descendiendo (y con ello la altura de la
superficie que une las alturas de las temperaturas) conforme nos vamos alejando de dicho punto
que es el más caliente. Este es un ejemplo de un campo escalar en dos dimensiones.

Si lo deseamos, podemos utilizar un cubo metálico en lugar de una placa metálica poniendo uno
de los lados del cubo en contacto completo con el horno y los otros cinco lados en contacto con
un medio frío. Nuevamente, dentro del cubo tenemos una distribución distinta de temperaturas
en el espacio tridimensional, tenemos entonces un ejemplo de lo que viene siendo un campo
escalar en un espacio de tres dimensiones.

Además de poder asignar un escalar a cada punto en el espacio para representar cierta situación
física, podemos también asignar un vector a cada punto en el espacio para representar algo que
no puede ser representado con un solo punto. Un ejemplo de ello es el flujo de una corriente de
agua que está entrando de un torbellino. Obviamente, dentro de un torbellino, cada molécula
del agua apuntará hacia una dirección diferente, y el comportamiento del conjunto no puede ser
representado con un solo vector. Se necesita todo un enjambre de vectores para poder
representar la situación. Este enjambre de vectores es lo que nos define un campo vectorial. A
continuación tenemos la representación gráfica de tal torbellino mediante un campo vectorial:

Obsérvese que el torbellino es más intenso en el centro, por el grosor y la longitud con la que
hemos representado las flechas vectoriales de la velocidad asignadas a cada uno de los puntos en
el plano. Lo que tenemos arriba es la representación gráfica de un campo vectorial en un
espacio de dos dimensiones, el cual a veces se puede representar matemáticamente como
una función vectorial V(x,y) en la que a cada punto del plano identificado con la coordenada x y
con la coordenada y se le asigna un valor específico V al vector ligado a dicho punto.

Para ciertos problemas, la interpretación del campo vectorial puede requerir un poco más de
imaginación, como es el caso del siguiente campo vectorial:
En una situación física real, en donde los fenómenos ocurren no en un plano sino en un espacio
de tres dimensiones, obviamente requerimos un campo vectorial en un espacio de tres
dimensiones, representado como V(x,y,z) Si lo deseamos, aunque nuestra intuición
geométrica no nos ayude, podemos extender este concepto matemáticamente a un campo
vectorial en un espacio de n-dimensiones.

V ( x1 , x2, x3 , ... , xn)

Así como hemos hablado de campos escalares y de campos vectoriales, podemos hablar también
acerca de campos tensoriales. Del mismo modo en que lo hicimos con las magnitudes
escalares y las magnitudes vectoriales, a cada punto en un plano podemos asignarle un
tensor. Esta es esencialmente la idea detrás de un campo tensorial. Si lo hacemos en un plano,
estaríamos hablando de un campo tensorial en un espacio de dos dimensiones. Si lo
hacemos en un espacio tridimensional, estaríamos hablando de un campo tensorial en un
espacio de tres dimensiones. Y si lo hacemos matemáticamentepodemos hablar de un campo
tensorial en un espacio de n-dimensiones.

En la Teoría General de la Relatividad, el fondo del asunto se maneja con un campo tensorial
de cuatro dimensiones.

De este modo, a cada punto en un espacio cuatri-dimensional con coordenadas ( x1 , x2, x3 , x4) le
podemos asignar un tensor cuatri-dimensional. Y cada punto, en el caso de un tensor Trs en
donde los sub-índices r y s corran de uno a cuatro (o de cero a tres, que es lo mismo), tendrá
asignado un total de 16 valores numéricos, las componentes del tensor.
Frecuentemente, al manejar temas relacionados con la Teoría General de la Relatividad, se
recurre frecuentemente a una simplificación notacional conocida como la convención de
sumación de Einstein, con la cual debemos estar familiarizados si queremos entender los
libros especializados sobre el tema de la Teoría General de la Relatividad.

La convención de sumación, la cual en ciertos casos reemplaza al familiar símbolo de


sumación Σ (letra griega sigma mayúscula) utilizado para representar sumaciones:

nos propone que cuando en una expresión tengamos un término en dicha expresión con
índices repetidos sobre los cuales se lleva a cabo una suma, en lugar de utilizar el símbolo de
sumación Σ podemos prescindir del símbolo dejando que los índices repetidos se conviertan en
los indicadores de la sumación, debiendo especificar (en caso de que no se sobreentienda) el
número n de veces en que se habrá de llevar a cabo la sumación.

La convención sólo es válida para índices repetidos, de modo tal que el siguiente símbolo:

AijBk

no representa sumación alguna, y en este caso los índices i, j y k son llamados índices libres.
Cuando hay una sumación, los índices utilizados para representar dicha sumación son
conocidos como índices monigote (dummy indexes).

Para adquirir destreza en tan importante simplificación notacional, a continuación veremos


unos problemas de práctica.

PROBLEMA: Expandir la fórmula aibi para n=6.

En el término tenemos repetido el índice i, y por lo tanto este es el índice monigote, de modo tal
que de acuerdo a la convención de sumación aquí tenemos una sumación que debe ser
expandida a:

a1b1 + a2b2 + a3b3 + a4b4 + a5b5 + a6b6


PROBLEMA: Escribir completamente la expresión Rijki (n=4). ¿Cuáles son los índices libres?

En el término tenemos repetido el índice i que es el índice sobre el cual se debe llevar a cabo la
sumación:

R1jk1 + R2jk2 + R3jk3 + R4jk4

Los índices libres son j y k, con lo cual si también para ellos se tiene n=4 hay un total de 16
expresiones como la anterior para todas las combinaciones posibles de números.

PROBLEMA: Simplificar notacionalmente lo siguiente con la convención de sumación,


especificando el valor de n:

a13b13 + a23b23 + a33b33

La expresión condensada con la convención de sumación será:

ai3bi3__(n = 3)

Como puede verse, la convención de sumación es el equivalente de un sistema de taquigrafía con


el que podemos reducir todo lo que tenemos que escribir al estar manejando un tema como el
que nos ocupa.

PROBLEMA: Escribir completamente la expresión aiixk para n=4.

aiixk = a11xk + a22xk + a33xk + a44xk

aiixk = (a11 + a22 + a33 + a44) xk

PROBLEMA: Escribir completamente la expresión aijxj para n=4.

aijxj = ai1x1 + ai2x2 + ai3x3 + ai4x4

PROBLEMA: Escribir de la manera más compacta que se pueda el siguiente sistema de


ecuaciones que representan una transformación linear:
y1 = c11x1+ c12x2

y2 = c21x1+ c22x2

Usando la convención de sumación, podemos llevar a cabo la primera simplificación en cada


una de las ecuaciones:

y1 = c1jxj

y2 = c2jxj

La segunda simplificación sobre lo mismo la podemos llevar a cabo usando el índice libre:

yi = cijxi

PROBLEMA: Escribir explícitamente el sistema de ecuaciones representado en forma


compacta mediante la convención de sumación como

Ti = airTr__(n = 4)

Llevando a cabo la expansión sumatoria sobre el índice monigote r que es el índice repetido:

Ti = ai1T1 + ai2T2 + ai3T3 + ai4T4

El índice libre nos proporciona cuatro ecuaciones de transformación:

T1 = a11T1 + a12T2 + a13T3 + a14T4

T2 = a21T1 + a22T2 + a23T3 + a24T4

T3 = a31T1 + a32T2 + a33T3 + a34T4

T4 = a41T1 + a42T2 + a43T3 + a44T4

En este último problema, si suponemos que lo que se está describiendo es algo así como una
transformación de Lorentz de un marco de referencia S de un observador a otro marco de
referencia S' de otro observador, el lector se habrá dado cuenta de que en lugar de utilizarse las
comillas individuales para denotar cada componente transformado (por ejemplo z al ser
transformado a z') se están utilizado barras (líneas) horizontales puestas sobre cada
componente (así T3 es transformado a T3). Aunque en muchos textos sobre la Teoría General de
la Relatividad y sobre el Cálculo Tensorial el uso de las comillas se sigue reteniendo para tal
propósito, el aferrarse a la simbología de las comillas tiene sus inconvenientes. El principal
inconveniente es que las comillas no sólo son más difíciles de distinguir en comparación con las
barras horizontales superiores, sino que en expresiones en las cuales se utilizan junto con
superíndices (por ejemplo, R'2) hay ocasiones en las cuales las comillas incluso se pueden
confundir con el número “1”. Encima de ello, está el hecho de que dentro de la Teoría General de
la Relatividad, en donde se tiene que hacer uso intensivo de las herramientas del cálculo
infinitesimal, la comilla se puede utilizar para indicar la derivada de una función como en el
ejemplo siguiente:

y' = dy/dx

Es por ello que, para reducir lo más que se pueda las posibles confusiones en la lectura de las
expresiones matemáticas, se ha preferido recurrir aquí al uso de las barras superiores. De
cualquier manera, no debe quedar duda en el lector de que en muchos otros textos en donde se
mantiene el uso de las comillas para denotar a los componentes de un objeto tras un cambio de
coordenadas, la comilla es completamente equivalente a la barra horizontal superior que
estamos utilizando aquí. De este modo, las siguientes dos expresiones ambas representan lo
mismo:

Se deben formular también aquí las siguientes dos advertencias sobre la convención de
sumación de Einstein:

(1) La convención de sumación solo es aplicable a índices repetidos, como lo es el caso de la


expresión AiAi que no puede ser “simplificada” a (Ai)² porque pierde totalmente su sentido
original que es:

AiAi = A1A1 + A2A2 + A3A3 + A4A4 + ... + AnAn

AiAi = A1² + A2² + A3² + A4² + ... + A²n

(2) La convención de sumación solo es aplicable a un índice que aparece no más de dos veces en
una expresión. Un término como AiiXi no representa sumación alguna. Sin embargo, un término
cualquiera puede contener más de un par de índices repetidos, sobre lo cual no hay restricción
alguna.

PROBLEMA: Suponiendo que (dx0,dx1,dx2,dx3) = (dt, dx, dy, dz) y que

ds² = gij dxi dxj__(n = 4),

llevar a cabo la expansión de ds².

En este caso tenemos dos índices monigote, i y j. Llevando a cabo la expansión de acuerdo con lo
que nos dicta la convención de sumación para índices repetidos, tendremos lo siguiente:

ds² = g00(dx0)(dx0) + g01(dx0)(dx1) + g02(dx0)(dx2) + g03(dx0)(dx3)


+ g10(dx1)(dx0) + g11(dx1)(x1) + g12(dx1)(dx2) + g13(dx1)(dx3)
+ g20(dx2)(dx0) + g21(dx2)(dx1) + g22(dx2)(dx2) + g23(dx2)(dx3)
+ g30(dx3)(dx0) + g21(dx3)(dx1) + g32(dx3)(dx2) + g33(dx3)(dx3)

Reemplazando los dxr por las coordenadas que representan:

Si hacemos gij = 0 para todos los casos en los que los índices son diferentes (i≠j), y hacemos
g00 = -1, g11 = 1, g22 = 1 y g33 = 1, lo anterior se reduce a:

ds² = -(dt)² + (dx)² + (dy)2 + (dz)²

Esto nos debe parecer ya familiar. Es la distancia (intervalo) infinitesimal entre dos eventos
diferentes muy cercanos el uno al otro que ocurren en un espacio-tiempo relativístico plano
(Lorentziano). Y esto solo ocurre cuando los índices en el símbolo gij son iguales y corresponden
a los valores de los gij que se han indicado arriba y los valores gij son iguales a cero cuando los
índices en el símbolo son diferentes (i≠j). Si a estas alturas el lector está empezando a sospechar
que esto es lo que produce la diferencia fundamental entre un espacio-tiempo plano y un
espacio-tiempo curvo, estará en lo correcto.

Además de la convención de sumación de Einstein, tenemos un símbolo que se utiliza


frecuentemente en la simplificación notacional, el delta de Kronecker δij, definido de la
manera siguiente:

δ ij = 1__para i = j

δ ij = 0__para i ≠ j

PROBLEMA: Llevar a cabo la expansión de

δij xi xj__(n = 3)

Aplicando la definición del delta de Kronecker, tenemos:

δ ij xi xj = 1x1 x1 + 0x1 x2 + 0x1 x3 + 0x2 x1 + 1x2 x2 + 0x2 x3 + 0x3 x1 + 0x3 x2 + 1x3 x3

δ ij xi xj = x1 x1 + x2 x2 + x3 x3

δ ij xi xj = (x1)² + (x2)² + (x3)²

Expuestas las ideas y conceptos anteriores, definimos ahora formalmente a


un vectorcovariante Tr en un espacio de n-dimensiones (o más rigurosamente,
un tensorcoavariante de orden 1 en un espacio de n-dimensiones) como toda aquella n-pla
(T1, T2, T3 , ... , Tn) de componentes que puedan ser transformados a otra n-pla de componentes
(T1, T2 , T3 , ... , Tn) de acuerdo con la siguiente relación:

en donde usamos el símbolo ∂ para denotar la diferenciación parcial de una variable con
respecto a otra de varias variables que son mantenidas constantes al llevar a cabo la
diferenciación parcial como lo muestra el siguiente ejemplo:
u = xy²exz

Obsérvese con cuidado que, en virtud de los índices repetidos que tenemos en la definición del
tensor covariante de orden uno, la convención de sumación ha entrado automáticamente en
acción sobre el índice monigote r. Sin la convención de sumación, esta expresión se escribe
(metiendo el símbolo sigma de sumación) como:

Ti = Σ r (∂xr/∂x i) Tr____r=1, 2, 3, ... , n

Para un espacio de dos dimensiones, la anterior definición de un vector covariante (que por lo
pronto llamaremos simplemente vector) nos produce la siguiente relación de transformaciones
llevando a cabo la sumación sobre el índice monigote j (el índice repetido):

Ti = (∂x1/∂x i) T1 + (∂x2/∂x i) T2

que a su vez nos produce las siguientes relaciones a través del índice libre i:

T1 = (∂x1/∂x1) T1 + (∂x2/∂x1) T2___para i=1

T2 = (∂x1/∂x2) T1 + (∂x2/∂x2) T2___para i=2

Consideremos un vector T = (T1,T2) = (4,3) en un espacio de dos dimensiones para el cual la


transformación de coordenadas está dada por los siguientes valores:

∂x1/∂x1 = 0.500___ ∂x2/∂x1 = -0.866

∂x1/∂x2 = 0.866___ ∂x2/∂x2 = 0.500

Entonces la transformación de los componentes del vector T= (T1,T2) = T(4,3) hacia los
componentes del vector que le corresponde T = (T1,T2) después de la transformación estará dada
por el siguiente conjunto de ecuaciones:

T1 = 0.5 T1 - 0.866 T2

T2 = 0.866 T1 + 0.5 T2

Poniendo números:

____T1 = 0.5 T1 - 0.866 T2

____T1 = (0.500) 4 + (-0.866) 3

____T1 = 2.0 -2.6 = -0.6

____T2 = 0.866 T1 + 0.5 T2

____T2 = (0.866) 4 + (0.500) 3

____T2 = 3.464 + 1.5 = 4.964

Es así como obtenemos el nuevo vector T = (T1,T2) = (-0.6, 4.964).

Los mismos cálculos los podríamos haber llevado a cabo empleando notación matricial:

Ahora calcularemos la longitud ║T║ del vector T= (4,3):

____║T║² = 4² + 3² = 25

____║T║ = 5

Veamos ahora cuál es la longitud del vector ║T║:


____║T║² = (-0.6)² + (4.964)² = 0.36 + 24.64 = 25.0

____║T║ = 5

El vector T tiene la misma longitud ║T║ que la que tiene el vector T. Y este resultado no aplica
únicamente al vector T= (4,3) bajo este cambio de coordenadas. Aplica a cualquier vector bajo
este cambio de coordenadas, lo cual no es difícil de demostrar:

║T║² = (T1)² + (T2)²

║T║² = [(0.500) T1 + (-0.866) T2]² + [(0.866) T1 + (0.500) T2)]²

║T║² = 0.25T1² - 0.433T1T2 + 0.75T2 ² + 0.75T1² + 0.433T1T2 + 0.25T2²

║T║² = (T1)² + (T2)²

║T║² = ║T║²

No todas las transformaciones tienen esta propiedad de preservar intacta la longitud de un


vector. El lector puede comprobarlo dando otros valores numéricos a las transformaciones y
llevando a cabo sus propios cálculos.

Si ponemos énfasis en la representación matricial de las operaciones que hemos llevado a cabo,
representando a la matriz como M, podemos ver a dicha matriz como un operador(o más
propiamente dicho, como un operador matricial) que al ser aplicado sobre un vector T en un
sistema de coordenadas (x1,x2) lo transforma en otro vector T relativo a otro sistema de
coordenadas ( x'1,x'2). Y como la longitud de un vector cualesquiera es preservada bajo el cambio
de coordenadas ordenado por la transformación del ejemplo que acabamos de ver, no nos queda
ninguna duda de que para dicho ejemplo el vector en sí permanece invariante. Y si un vector
cualesquiera puede permanecer invariante bajo cierto cambio de coordenadas como es el caso
del ejemplo que acabamos de ver, se sobreentiende que también un campo
vectorial permanecerá invariante bajo dicha transformación. Este es precisamente el tipo
de transformaciones que necesitamos en una Teoría General de la Relatividad,
aplicadas sobre los vectores de un espacio de cuatro dimensiones (4-vectores),
porque bajo este tipo de transformaciones las leyes de la Naturaleza permanecen
invariantes. Este es ni más ni menos el principio de covariancia, extendido de la Teoría
Especial de la Relatividad a la Teoría General de la Relatividad. El principio adquiere ahora una
naturaleza universal.

PROBLEMA: Expresar en notación de matriz las ecuaciones de transformación para un


tensor covariante de orden uno para N = 3.

Representando a los tensores como vectores columna, las ecuaciones de transformación se


pueden representar en forma matricial de la siguiente manera:

Con un ligero cambio de notación, introducimos ahora formalmente la definición de


un vector contravariante Tq en un espacio de n-dimensiones (o más rigurosamente,
un tensor contravariante de orden 1) como toda aquella n-pla (T1, T2 , T3 , ... , Tn) de
componentes que puedan ser transformados a otra n-pla de componentes (T1, T2 , T3 , ... , Tn) de
acuerdo con la siguiente relación:

Sin la convención de sumación, esto se escribe explícitamente como:

(T) i = Σ r (∂xi/∂xr) Tr____r=1, 2, 3, ... , n

Se hace hincapié aquí en que los índices superscriptos en cada uno de los
componentes T i no indican exponenciación matemática, sólo denotan la posición
de cada componente del vector contravariante dentro de la n-pla ordenada (esto al
principio puede ser causa de mucha confusión al igual que el empleo de la convención de
sumación de Einstein para notación tensorial).
Los vectores covariantes y los vectores contravariantes siempre van de la mano juntos, y carece
de sentido hablar de uno de ellos sin que haga acto de presencia el otro. En este sentido, la
convención adoptada aquí de simbolizar a los componentes de los vectores covariantes con
índices subscriptos y a los componentes de los vectores contravariantes con índices
superscriptos utilizada en muchos libros es completamente arbitraria; igualmente podríamos
haber adoptado la convención (también utilizada en muchos otros libros) de simbolizar a los
componentes de los vectores covariantes con índices superscriptos y a los componentes de los
vectores contravariantes con índices subscriptos. Lo importante es tener una manera simbólica
de distinguir entre los vectores covariantes y los vectores contravariantes del mismo modo que
en las ecuaciones de transformación de Lorentz empleadas en la Teoría Especial de la
Relatividad utilizamos las comillas para distinguir los componentes del marco de referencia de
un observador en movimiento con respecto al marco de referencia de un observador (en
reposo); igual podríamos haber invertido la asignación de las comillas sin alterar la distinción
que estamos haciendo entre los dos marcos de referencia.

En el espacio-tiempo plano de cuatro dimensiones propio de la Teoría Especial de la


Relatividad (marco de referencia Lorentziano o inercial), no tiene objeto alguno hacer una
distinción entre vectores covariantes y vectores contravariantes (se aprovecha aquí la ocasión
para señalar que la palabra covariante utilizada para la definición de vectores con índices
superscriptos no tiene nada que ver con el principio de covariancia mencionado en la entrada
“Invariantes”, lo cual lamentablemente también puede ser causa de muchas confusiones entre
los principiantes); ambos son la misma cosa. Sin embargo, en el espacio-tiempo curvo de
cuatro dimensiones propio de la Teoría General de la Relatividad, la diferencia entre un vector
covariante y un vector contravariante se vuelve más que obvia. Esta es una de las complejidades
inevitables que resultan de saltar de un espacio-tiempo plano a un espacio-tiempo curvo.

Un observador que esté dentro de un elevador en caída libre en presencia de un campo


gravitacional no se dará cuenta de ello haciendo experimentos con rayos de luz dentro de su
elevador, porque todo estará en caída libre junto con él en un marco de referencia Lorentziano,
su espacio-tiempo es plano. Pero un observador externo alejado de dicho campo gravitacional lo
verá de un modo distinto, lo verá acelerándose en un espacio-tiempo curvo. Este salto de un
entorno linear a un entorno curvo no-linear es lo que nos obliga a recurrir al uso del cálculo
infinitesimal, al uso de ecuaciones diferenciales, específicamente a las derivadas parciales que
requerimos para poder analizar los cambios que toman lugar en un espacio-tiempo curvo de
cuatro dimensiones. En la Teoría Especial de la Relatividad, pasamos de un espacio-
tiempo plano (marco de referencia S) a otro espacio-tiempo plano (marco de referencia S') o
viceversa con la ayuda de las ecuaciones de transformación de Lorentz, pero en la Teoría
General de la Relatividad pasamos de un espacio-tiempo plano a un espacio-tiempo curvo o
viceversa, o peor aún de un espacio-tiempo curvo a otro espacio-tiempo curvo complicando aún
más el asunto. En la Teoría Especial de la Relatividad en donde siempre considerábamos a una
partícula en movimiento rectilíneo uniforme trasladándose a velocidad constante, su línea del
universo (world line) en un diagrama espacio-tiempo de Minkowski siempre era una línea recta
para cualquier observador. Pero en la Teoría General de la Relatividad en donde la partícula
puede cambiar la dirección de su movimiento a causa de una aceleración producida por un
campo gravitacional (como lo es el caso de los cometas) su línea del universo deja de ser una
línea recta para todos los observadores externos, y entendiblemente requerimos de las
herramientas del cálculo infinitesimal para poder analizar este movimiento no-linear.

El siguiente paso en las generalizaciones (abstracciones) que estaremos llevando a cabo


consistirá en extender las definiciones que se han dado arriba del tensor covariante y del tensor
contravariante hacia tensores de orden superior, construyendo una aritmética de tensores en
base a las definiciones básicas y buscando en todo momento considerar aquellas
transformaciones que puedan preservar intactas, invariables, ciertas características no de un
campo escalar o de un campo vectorial sino de un campo tensorial, al igual que como lo hemos
encontrado en los ejemplos puestos arriba para un campo vectorial. Esto requerirá entrar en
mayor detalle en las herramientas del cálculo tensorial, lo cual será cubierto en entradas
posteriores.

Tensores de orden superior y mixtos


Una vez que hemos definido lo que es un tensor covariante de orden uno y lo que es un tensor
contravariante de orden uno, cuyas componentes son diferenciadas la una de la otra únicamente
por el uso de sub-índices y super-índices respectivamente, el siguiente paso natural consiste en
extender estas definiciones para definir un tensor de orden dos, ya sea T = (Tij) ó T = (Tij),
usando dos índices para ello.

Definimos ahora formalmente a un tensor covariante T de orden dos en un espacio de n-


dimensiones como todo aquél conjunto ordenado de componentes (Tij) que puedan ser
transformados de acuerdo con la siguiente relación:

Tpr = ΣΣ
r s (∂xq/∂xp) (∂xs/∂xr) Tqs____q, s =1, 2, 3, ... , n

Obsérvese que al igual que como ocurrió con el tensor covariante de orden uno, los
componentes del tensor covariante de orden dos también son representados mediantes sub-
índices. Obsérvese también que la doble sumación nos genera un arreglo de componentes que
pueden ser ubicados en una rejilla cuadrada de números, en una matriz. Obsérvese también que
tenemos el producto de dos sumaciones, posibilitándose en cada una de ellas el empleo de la
convención de sumación por tener repetidos los índices q y s en el doble sumando.
Prescindimos, pues, de los símbolos Σ de sumación entendiéndose la sumación implicada en
cada caso por el índice repetido:

La definición anterior se puede extender a la de un tensor covariante de orden tres, ó de orden


cuatro, ó de cualquier otro orden superior, estableciendo la misma regla de transformación que
se debe cumplir como se ha señalado arriba.

PROBLEMA: Escribir explícitamente, sin ninguna abreviatura matemática, las relaciones de


transformación para un tensor covariante T de orden dos en un espacio de dos dimensiones.

En un espacio de dos dimensiones, un tensor covariante de orden dos estará especificado por
cuatro componentes, a saber: T11, T12, T21 y T22; los cuales al ser transformados de acuerdo a la
definición del tensor producirán cuatro componentes denotados como T11, T12, T21 y T22. Las
cuatro relaciones de transformación son las siguientes, empezando por la primera:

seguida por la segunda:


seguida por la tercera:

y por último, la cuarta:

Habiendo definido formalmente al tensor covariante de orden dos, pasamos a definir al tensor
contravariante T de orden dos en un espacio de n-dimensiones como todo aquél conjunto
ordenado de componentes (Tij) que puedan ser transformados a de acuerdo con la siguiente
relación:

Tpr = Σ Σ
q s (∂xp/∂xq) (∂xr/∂xs) Tqs____q, s = 1, 2, 3, ... , n

Obsérvese que los componentes del tensor contravariante de orden dos son representados
mediantes dos super-índices. Obsérvese que también en este caso que la doble sumación nos
genera un arreglo de componentes que pueden ser ubicados en una matriz. Obsérvese también
que tenemos el producto de dos sumaciones, posibilitándose en cada una de ellas el empleo de la
convención de sumación por tener repetidos los índices r y s en el doble sumando.
Prescindimos, pues, de los símbolos Σ de sumación entendiéndose la sumación implicada en
cada caso por el índice repetido:

La definición anterior se puede extender a la de un tensor contravariante de orden tres, o de


orden cuatro, o de cualquier otro orden superior, estableciendo la misma regla de
transformación que se debe cumplir como se ha señalado arriba.

Siempre distinguiremos a un tensor covariante de orden n de un tensor contravariante del


mismo orden mediante la colocación de los índices, los componentes de un tensor covariante
serán sub-índices mientras que los componentes de un tensor contravariantes serán super-
índices, aclarándose que esta convención no es universal ya que en muchos textos y
documentos se utilizan los sub-índices para denotar a los tensores contravariantes y a los super-
índices para denotar a los tensores covariantes. Lo importante en todo caso es no confundir a
uno con otro una vez que se ha establecido un acuerdo en seguir cierta convención.

Habiendo establecido la existencia de tensores covariantes y contravariantes de orden n,


podemos definir un concepto que consiste en una combinación de ambos, el tensor mixto, el
cual consiste en una extensión de las definiciones aplicadas anteriormente a los componentes
del tensor según la colocación de sus índices.

Decimos que un tensor mixto es un tensor covariante de orden N y contravariante de


orden M, cuando cada uno de sus componentes está especificado por N sub-índices y M super-
índices, aplicándose las mismas reglas de transformación que ya vimos con anterioridad. Es
frecuente encontrar la notación:

para referirnos a un tensor mixto contravariante de orden M y covariante de orden N. Al hablar


del orden de un tensor mixto nos estamos refiriendo a la cantidad total de índices (sub-
índices y super-índices) empleados para especificar al tensor.

El tensor mixto más elemental de todos es el tensor contravariante de orden uno y covariante de
orden uno, el cual es un tensor de orden dos, simbolizado ya sea como ya sea T = (Tij) ó
como T = ((Tji), y el cual está definido de la siguiente manera:

Así como hemos defininido al tensor de orden dos, ya sea covariante, contravariante o mixto,
podemos definir un tensor de orden tres, ya sea covariante, contravariante, o mixto,
habiendo cinco posibilidades:

T = (Tijk)__T = (Tijk)__T = (Tijk)__T = (Tijk)__T = (Tijk)

Desafortunadamente, ya no es posible representar los componentes de un tensor de orden tres o


de un tensor de orden mayor que tres en forma de un arreglo rectangular de números, en forma
matricial. Pero podemos imaginar a los componentes del tensor de orden tres ordenados dentro
de un cubo matricial tri-dimensional como el siguiente:

El tensor generalizado puede ser representado de la siguiente manera:

PROBLEMA: Clasificar cada uno de los siguientes tensores según su tipo.

a) T = (Tijk)

b) T = (Tαβγδε)
c) T = (Tpqrstuv)

a) Este es un tensor de covariante de orden tres.

b) Este es un tensor de orden cinco, contravariante de orden dos y covariante de orden tres.

c) Este es un tensor de orden siete, contravariante de orden cuatro y covariante de orden tres.

La ley de transformación para un tensor de orden mixto no es más que una generalización de las
leyes de transformación que ya se habían definido para tensores covariantes y contravariantes:

PROBLEMA: Escríbase la ley de transformación para cada uno de los siguiente tensores.

1) T = (Tijk)

2) T = (Tijk)

3) T = (Tijkm)

4) T = (Tmnijk)

5) T = (Tqstkl)

Extendiendo las definiciones de transformación para tensores covariantes y para tensores


contravariantes podemos escribir lo siguiente:

1)

2)
3)

4)

5)

Estudiando las leyes de transformación obtenidas para los tensores del problema anterior,
podemos deducir una regla muy sencilla para escribir rápidamente y en forma segura la ley de
transformación para cualquier tensor contravariante de orden M y covariante de orden N:
refiriéndonos al último tensor T = (Tqstkl) obsérvese que las posiciones relativas de los
índices p, r, m, i, j en el lado izquierdo de la transformación son las mismas que las posiciones
de los mismos índices en el lado derecho. Puesto que estos índices están asociados con las
coordenadas x y puesto que los índices q, s, t, k, l están asociados respectivamente con los
índices p, r, m, i, j, la ley de transformación se puede escribir de inmediato.

Habiendo definido los tensores mixtos, definiremos ahora el tensor mixto más sencillo de todos,
el tensor delta Kronecker, simbolizado como δ = (δ i j). Como podemos verlo por la forma en
la cual está escrito, el tensor delta Kronecker es un tensor contravariante de orden uno y
covariante de orden uno, cuyas componentes están definidas de la siguiente manera:
δ i j = 1___ para i = j

δ i j = 0___ para i ≠ j

No se confunda el tensor delta Kronecker δ con el delta Kronecker que es utilizado en el


álgebra ordinaria. Esta es precisamente una de las razones para haber definido el tensor delta
Kronecker como un tensor mixto, con un índice arriba y el otro índice abajo. Y podemos
demostrar (esto se hará posteriormente) que el tensor delta Kronecker es un tensor porque se
transforma de acuerdo con la definición para un tensor mixto covariante de orden uno y
contravariante de orden uno.

En la práctica, al estar efectuando cálculos con ecuaciones tensoriales, hay un detalle que
podemos utilizar ventajosamente a nuestro favor:

Los componentes de todo tensor (covariante ó contravariante) de orden dos


siempre se pueden representar en forma de matriz. Del mismo modo, una
operación matemática tensorial que involucre tensores de orden dos siempre se
puede llevar a cabo con operaciones matriciales.

De éste modo, una ecuación tensorial como la siguiente expresada en notación de índices
(obsérvese que, por tener dos índices doblemente repetidos en la ecuación, se debe aplicar la
convención de sumación dos veces si es que se desea eliminar los índices monigote i y jdejando
únicamente los índices libres r y s):

gij air ajs = grs

en donde cada elemento apq se puede ubicar dentro de una matriz A, puede ser escrita como la
siguiente ecuación matricial:

ATGA = G

en donde AT es simplemente la transpuesta de la matriz A en donde intercambiamos los


renglones por las columnas.

PROBLEMA: Si G = (gij) representa los 16 componentes de una matriz 4x4 tales que:
g00 = 1

g11 = g22 = g33 = g33 = -1

gij = 0 para todo i ≠ j

y si suponemos que en el elemento a pq el superíndice p representa el renglón y el subíndice q


representa la columna de la matriz A en donde está colocado el elemento, demostrar que la
ecuación tensorial

gij air ajs = grs

representa lo mismo que lo que representa la ecuación matricial

ATGA = G

La resolución de este problema requiere demostrar que ambas expresiones, tanto la ecuación
tensorial como la ecuación matricial, generan el mismo conjunto de ecuaciones.

Si trabajamos primero sobre la ecuación tensorial, podemos llevar a cabo una expansión sobre el
primer índice monigote i de conformidad con lo que nos dicta la convención de sumación para
índices repetidos, con lo cual obtenemos la primera expansión:

g0j a0r ajs + g1j a1r ajs + g2j a2r ajs + g3j a3r ajs = grs

Trabajando ahora sobre el segundo índice monigote j de acuerdo a la convención de sumación,


obtenemos una expresión explícita en la que tenemos sumados 16 términos del lado izquierdo
de la ecuación:

g00 a0r a0s + g01 a0r a1s + g02 a0r a2s + g03 a0r a3s

+ g10 a1r a0s + + g11 a1r a1s + + g12 a1r a2s + + g13 a1r a3s

+ ...

= grs
Tenemos así una expresión con dos índices libres, r y s. Para cada combinación de los
índices r y s podemos obtener una relación específica, como la siguiente:

(a00)² + (a10)² + (a20)² + (a30)² = 1

En total, obtenemos 16 ecuaciones diferentes, después de algo de álgebra laboriosa. Las


ecuaciones obtenidas se pueden resumir mediante las siguientes tres relaciones generales:

(a00)² + (a10)² + (a20)² + (a30)² = 1

(a0j)² + (a1j)² + (a2j)² + (a3j)² = -1___para j = 1, 2, 3

a0i a0j - a0i a0j - a0i a0j - a0i a0j = 0___para todo i ≠ j

Si llevamos a cabo ahora la multiplicación matricial A TGA igualando la matriz resultante a la


matriz G, obtenemos las mismas 16 ecuaciones que habíamos obtenido expandiendo la
ecuación tensorial, lo cual resuelve el problema. Al resolverlo, el lector se dará cuenta de que
recurriendo a una representación matricial podemos avanzar de manera mucho más rápida que
si lo hacemos trabajando directamente sobre la ecuación tensorial.

Se había señalado con anterioridad que así como una expresión vectorial en un espacio multi-
dimensional representa físicamente un campo vectorial, del mismo modo una expresión
tensorial en un espacio multi-dimensional representa físicamente un campo tensorial. Como
acabamos de verlo, en el caso de los tensores de orden dos una ecuación tensorial se puede
reescribir como una ecuación matricial, y por lo tanto no es de extrañar que al utilizar la
representación matricial estemos hablando de un campo matricial. Sin embargo, un campo
tensorial descrito por un tensor de orden dos y un campo matricial vienen siendo lo mismo a fin
de cuentas, aunque el manejo matemático del asunto sea diferente en ambos casos.

Aritmética de tensores
El cálculo tensorial va directamente al corazón de todo lo que tenga que ver con un cambio de
coordenadas, cuando el mismo punto P en un mismo plano puede ser localizado en el plano de
varias maneras, como lo es el caso en el cual en un plano se puede localizar a dicho punto
mediante coordenadas rectangulares Cartesianas (X, Y) o mediante coordenadas polares (r, θ):
En este caso, es fácil obtener las relaciones de transformación para convertir de coordenadas
polares a Cartesianas (y viceversa):

X = r cos θ

Y = r sen θ

Esto se puede extender hacia tres dimensiones, en donde necesitamos especificar una
coordenada adicional. Es así como tenemos coordenadas Cartesianas (rectangulares) en tres
dimensiones, coordenadas esféricas, coordenadas cilíndricas, y coordenadas afines.

Aquí resulta conveniente introducir coordenadas generalizadas (x0, x1, x2, x3 , ... , xn) con las
cuales podemos simplificar nuestra notación, aplicándola en un espacio de tres dimensiones a
las coordenadas cilíndricas:

(x0, x1, x2) = (r, θ, z)

y a las coordenadas esféricas:

(x0, x1, x2) = (r, θ, z)


A estas alturas, el lector cuyo interés principal es el estudio de la Teoría de la Relatividad se
preguntará qué tiene que ver el estudio de las coordenadas cilíndricas y esféricas propias de un
espacio tridimensional, con el espacio de cuatro dimensiones que utilizamos dentro de la Teoría
de la Relatividad. No es difícil responder a esta pregunta, ya que podemos extender el alcance de
las coordenadas cilíndricas y esféricas tal y como lo hicimos mediante coordenadas Cartesianas
rectangulares hacia cuatro dimensiones con tan sólo agregar el cuarto componente, la
coordenada del tiempo t (la cual supondremos que está multiplicada por la constante universal
de la luz c a la cual le damos el valor de un metro por segundo, con el fin de darle a la cuarta
coordenada la dimensión de longitud -en metros- en lugar de la dimensión de tiempo -en
segundos- poniéndola así en igualdad total con las otras tres coordenadas que también miden
longitud).

Así, las coordenadas cilíndricas en tres dimensiones son extendidas a:

(x0, x1, x2, x3) = (r,φ,z,t)

y las coordenadas esféricas en tres dimensiones son extendidas a:

(x0, x1, x2, x3) = (r,θ,φ,t)

Una vez familiarizados con las coordenadas generalizadas, podemos ver a continuación lo que
tiene que ver con la aritmética de los tensores. Pero antes de entrar en materia, es importante
dejar una cosa en claro. Al igual que en el caso de los vectores cuatri-dimensionales cuando los
empezamos a manejar bajo el contexto de la Teoría Especial de la Relatividad, en donde se llevó
a cabo la multiplicación de la coordenada del tiempo t por la velocidad de la luz c con el
propósito de tener un vector [x, y, z, ct] en donde todos sus cuatro elementos estuviesen
medidos en las mismas unidades de distancia (metros, kilómetros, millas, etc.), esto para no
revolver peras con manzanas, del mismo modo en la aplicación de los tensores a los fenómenos
físicos tampoco se acostumbra revolver peras con manzanas. Si uno de los componentes de un
tensor está expresado en cierta dimensión física (presión, temperatura, humedad, tensión
eléctrica, etc.) entonces todos los demás componentes del tensor estarán expresados en la
misma dimensión física. Todos los componentes de un tensor están definidos en las mismas
unidades. Esto es precisamente lo que nos permite llevar a cabo operaciones aritméticas con
tensores, con la seguridad de que no estaremos sumando peras a manzanas.
PROBLEMA: Interpretar la siguiente relación utilizada con cierta frecuencia en las
simplificaciones que se llevan a cabo al estar trabajando con coordenadas generalizadas:

usando como ejemplo ilustrativo en la interpretación el sistema de coordenadas polares (r,θ).

Para el caso en el cual a = b, la relación nos expresa lo obvio, que son las siguientes identidades
matemáticas:

Y para el caso en el cual a ≠ b, la relación nos expresa la independencia de las coordenadas; ya


que uno de los requisitos fundamentales de todo sistema de coordenadas es que la variación de
cualquiera de sus componentes no produzca efecto alguno sobre las demás. Así, en las
coordenadas polares el aumento o la disminución en la distancia radial es completamente
independiente del cambio que se lleve a cabo en el ángulo que está siendo especificado, lo cual
indicamos como:

Estos hechos los podemos resumir en la siguiente identidad matricial:

Pero también los podemos resumir utilizando la definición del tensor delta Kronecker como se
ha hecho arriba en el planteamiento del problema. En la relación proporcionada se toman las
derivadas parciales de los componentes que corresponden a un vector (tensor) covariante de
orden uno. Sin embargo, la relación sigue siendo válida por las mismas razones cuando los
componentes sobre los cuales se toman las derivadas parciales corresponden a un
vector contravariante de orden uno:

Naturalmente, nos interesa saber cómo fue que llegó a nosotros la idea y la necesidad de tener
que inventar y recurrir a algo como los tensores. Como ya se dijo, los tensores van directamente
a la raíz de lo que es un cambio de coordenadas. Una de las relaciones matemáticas más
importantes que involucran a funciones continuas de variables múltiples continuas es la
definición del diferencial total. Para una expresión que depende de dos variables continuas
como:

z = z (x, y)

el diferencial total de z se define como:

En un espacio de dos dimensiones, para un cambio de coordenadas Cartesianas (x,y) a


coordenadas polares (r,θ), tendríamos dos expresiones:

En un espacio de tres dimensiones, para un cambio de coordenadas esféricas (r,θ,φ) a


coordenadas rectangulares (Cartesianas) tendríamos tres expresiones:
En general, si se nos dá una función F suave y continua en n variables, definimos el diferencial
total de dicha función F sobre cualquier número de dimensiones de la siguiente manera:

En notación de coordenadas generalizadas x1,x2, x3, ... , xn, el cambio incremental en la función
continua suave F = F(x1,x2, x3, ... , xn) que resulta de los cambios incrementales dx 1, dx2, dx3, ... ,
dxn en las variables x1,x2, x3, ... , xn estará dado por la siguiente relación(se recuerda aquí que los
superíndices son simplemente índices, no exponentes):

Por definición, un tensor T cualesquiera de cualquier tipo y cualquier orden es un tensor


cero O cuando todos los componentes del tensor son iguales a cero, lo cual implica que para
cualquier tensor A diferente de cero:

A+O=A

Así, todos los 16 componentes de un tensor de orden 2 en un espacio cuatri-dimensional serán


iguales a cero si ése tensor es un tensor cero. En el caso de tensores de orden dos (más no así en
el caso de los tensores de orden 3 o mayor), los 16 componentes del tensor pueden ser
representados en forma de matriz:
Del mismo modo, si el tensor mixto R ij klm = 0 para todos los valores de los índices i, j, k, l y m,
entonces el tensor R de orden 5 será también un tensor cero, o sea R= O. (Obsérvese que un
tensor de orden 5, en un espacio de dos dimensiones, está especificado por un total de
2x2x2x2x2 = 32 componentes.)

Los tensores, al igual que otros objetos matemáticos, también pueden ser sometidos a las
operaciones usuales propias de la aritmética, y podemos hablar de una aritmética de
tensores. Considérense dos tensores A y B que sean del mismo orden y del mismo tipo.
Entonces podemos sumar dichos tensores, componente por componente, para obtener un
tensor C:

C=A+B

La suma anterior está dada en notación tensorial. También podemos representarla de modo
más explícito mostrando la suma de los componentes respectivos, por ejemplo:

Cij = Aij + Bij

Pij = Qij + Rij

Fijk mn = Hijk mn + Iijk mn

Obsérvese que no es notacionalmente correcto escribir A = Aij, ya que lo de la izquierda


representa todos los componentes de un tensor mientras que lo de la derecha hace referencia
a un solo componente, el componente con subíndices i y j. Sin embargo, podemos escribir A =
(Aij), lo cual es notacionalmente correcto.

PROBLEMA: A partir de la definición de un tensor (covariante o contravariante)


demuéstrese que la suma de dos tensores A y B del mismo orden y del mismo tipo producirá
también un tensor C del mismo orden y del mismo tipo.
Considérense dos tensores covariantes de orden uno A y B. Por la definición de tensor, ambos
obedecen la misma regla de transformación:

Sumando miembro a miembro ambas igualdades y simplificando:

Resulta evidente que sumando miembro a miembro los componentes respectivos de cada
tensor, obtenemos un elemento C que también es un tensor ya que se transforma de acuerdo con
la definición básica del tensor covariante, resultando también evidente que el tensor resultante
es un tensor del mismo orden y del mismo tipo que los tensores de los cuales provino. De este
problema resulta obvio también que la suma de dos tensores goza de la propiedad conmutativa,
o sea:

A+B=C=B+A

y que el producto de un tensor por una constante multiplicativa resultará en un tensor.

Procediendo de modo similar al problema que acabamos de ver, podemos demostrar que el
resultado es válido tanto para tensores contravariantes como para tensores covariantes, y que la
resta o diferencia de dos tensores resultará tambié en un tensor del mismo orden y del mismo
tipo (covariante o contravariante, según sea el caso).

Así como hay multiplicación de números, multiplicación algebraica y multiplicación de matrices,


y del mismo modo en el que llevamos a cabo la multiplicación de dos cantidades P y Q:
P = p1 + p2

Q = q1 + q2

obteniendo:

PQ = (p1 + p2) (q1 + q2) = p1q1 + p1q2 + p2q1 + p2q2

podemos definir también el producto externo de dos tensores o simplemente el producto


de dos tensores. Podemos demostrar formalmente, recurriendo a la definición del tensor, que
el producto de dos tensores también tendrá las propiedades de un tensor.

PROBLEMA: Sean A = (Apqr) y B = (Bst) dos tensores. Demostrar que

Cpqsrt = Apq r·Bs t

es también un tensor.

Tenemos que demostrar que C = (Cpqsrt) es un tensor cuyos componentes son formados tomando
los productos de los componentes de los tensores A y B. Si A y B son tensores, entonces deben
obedecer las siguientes reglas de transformación:

Multiplicando ambas igualdades en sus lados respectivos:

Esto nos demuestra que el resultado final de la multiplicación de los dos tensores es un tensor
de quinto orden, con índices contravariantes p, q y s e índices covariantes r, t, justificando la
notación tensorial C = (Cpqsrt).
En general, la multiplicación de un tensor T1 de orden M por otro tensor T2 de orden N resultará
en un tensor nuevo T de orden M+N formado por MxN componentes distintos. Así, el producto
externo de dos tensores involucra simplemente la multiplicación ordinaria de los componentes
del tensor, y es un tensor cuyo orden es simplemente la suma de los órdenes de los tensores que
fueron multiplicados.

En ciertos textos se acostumbra denotar el producto externo de dos tensores S y T de la


siguiente manera:

[ST]

En otros textos también se utiliza para denotar la misma operación del producto externo de dos
tensores un círculo con una cruz puesta adentro:

S⊗T

Esta última notación tal vez le resultará familiar a los que son afectos al lenguaje de las
matemáticas puras. Es ni más ni menos que la definición del producto Cartesiano utilizado para
formar n-plas ordenadas de números. A manera de ejemplo de este concepto, si tomamos dos
matrices distintas 2x2 y las multiplicamos no en el sentido usual de la multiplicación de
matrices sino en el sentido del producto Cartesiano para así formar una nueva matriz a partir
del producto de las matrices de base, tendremos algo como lo siguiente:

Inspirados en lo anterior, a continuación tenemos el resultado del producto tensorial externo de


dos tensores U y V de orden dos en un espacio multi-dimensional indefinido cuyas
componentes acomodadas en forma de matriz producen el siguiente resultado:
Debe resultar obvio que el producto externo de dos tensores de orden uno como:

T1 = (x1, x2, x3, x4)

T2 = (x1, x2, x3, x4)

nos resultará en un tensor de orden dos que contendrá todas las combinaciones posibles de
productos xαxβ, de modo tal que en un espacio de cuatro dimensiones el tensor resultante estará
compuesto por 16 componentes.

PROBLEMA: Dados los tensores:

A = (Aij)___B = (Bk)

obtener las componentes del producto externo de estos dos tensores en un espacio de dos
dimensiones.

En un espacio de dos dimensiones, el tensor mixto A tendrá el siguiente conjunto de elementos:

{A11, A21, A12, A22}

mientras que el tensor covariante B tendrá el siguiente conjunto de elementos:

{B1, B2}

El producto externo de los tensores A y B, al cual simbolizaremos como C:


C = A⊗ B

contendrá todas las combinaciones posibles de pares de productos de elementos del tensor A y
de elementos del tensor B, o sea:

{A11B1, A21B1, A12B1, A22B1, A11B2, A21B2, A12B2, A22B2}

El tensor C termina siendo un tensor mixto de orden tres, cuyos componentes son Cijk = AijBk. Si
los componentes del tensor A tienen unidades físicas de fuerza (newtons) y los componentes del
tensor B tienen unidades físicas de distancia (metros) entonces los componentes del
tensor C tendrán las unidades físicas que corresponden a la unidad compuesta, en este caso de
energía (joules).

Un caso especial del producto de dos tensores ocurre cuando multiplicamos dos tensores del
mismo orden e igualamos dos de sus índices, lo cual tiene una consecuencia directa e
inmediata: la convención de sumación para índices repetidos entra automáticamente en
acción. Pero antes de entrar en la definición de este producto muy especial de dos tensores,
haremos un repaso de un concepto elemental que se aprende en los primeros cursos de
matemáticas o de física intermedia: el producto de dos vectores, los cuales como ya se ha dicho
en realidad son tensores de orden uno.

PROBLEMA: Redefinir, en lenguaje tensorial, el concepto vectorial del producto escalar (ó


producto punto) de dos vectores, usando para ello dos vectores de un espacio cuatri-
dimensional Cartesiano.

Empezamos con dos vectores A y B cuyas componentes respectivas son las siguientes:

A = (a1, a2, a3, a4)

B = (b1, b2, b3, b4)

Del análisis vectorial se sabe que el producto escalar de estos vectores está dado por:

A·B = a1b1 + a2b2 + a3b3 + a4b4

Redefinimos ahora ambos vectores como dos tensores A y B (siguen siendo lo mismo) de orden
uno, definiendo a uno de ellos como un tensor covariante y al otro como un tensor
contravariante, empleando notación de índices y coordenadas generalizadas:

A = (x1, x2, x3, x4)

B = (x1, x2, x3, x4)

El producto de los dos tensores A y B será entonces:

AB = (x1x1 + x2x2 + x3x3 + x4x4)

Un momento de reflexión nos revela que, gracias a la forma en la que hemos escrito lo anterior,
podemos utilizar la convención de sumación:

AB = (xαxα)

Como resultado de esta operación de multiplicación de los tensores del mismo orden A y B, que
definimos formalmente como contracción de tensores, vemos que partiendo de dos tensores
de orden uno la operación de contracción abate el orden de cada uno de ellos convirtiéndolo en
un tensor de orden cero, o sea en un escalar.

La anterior definición puede ser generalizada a dos tensores de cualquier ordenimplementando


el siguiente procedimiento:

Para llevar a cabo la contracción de dos tensores, igualamos uno de los índices
superiores de un tensor con uno de los índices inferiores del otro tensor, sumando
los productos de las componentes sobre los índices repetidos al entrar en acción
automáticamente la convención de sumación. Esto tiene el efecto de disminuír el orden
total de los dos tensores.

Para que la definición dada arriba sea válida, se requiere que los índices igualados correspondan
a un índice covariante y a un índice contravariante.

Al llevar a cabo una contracción, los índices utilizados de la contracción


desaparecen del tensor original. En la simbología del tensor resultante, simplemente se
borran los índices que fueron contraídos.
La operación de contracción se puede aplicar inclusive a un mismo tensor siempre y cuando
haya por lo menos dos índices que puedan ser igualados (con lo cual entra en acción de
inmediato la convención de sumación), como lo demuestra el siguiente

PROBLEMA: Suponiendo que la contracción de un tensor nos produce otro tensor, ¿cuántos
tensores diferentes pueden ser creados mediante la contracción repetida del tensor T = (Tijkl)?

El tensor que nos ha sido dado es un tensor de orden cuatro. La primera contracción la podemos
llevar a cabo igualando el superíndice i con el superíndice k, haciendo i = k = u:

Tujul = T1j1l + T2j2l + T3j3l + T4j4l + ... + Tnjnl = Tjl

La segunda contracción la podemos llevar a cabo igualando el superíndice i con el superíndice l,


haciendo i = l = u:

Tujku = T1jk1 + T2jk2 + T3jk3 + T4jk4 + ... + Tnjkn = Tjk

La tercera contracción la podemos llevar a cabo igualando el superíndice j con el superíndice k,


haciendo j = k = u:

Tiuul = Ti11l + Ti22l + Ti33l + Ti44l + ... + Tinnl = Til

La cuarta contracción la podemos llevar a cabo igualando el superíndice j con el superíndice l,


haciendo j = l = u:

Tiuku = Ti1k1 + Ti2k2 + Ti3k3 + Ti4k4 + ... + Tinkn = Tik

En todos los casos anteriores obtenemos tensores con dos índices libres, o sea tensores de orden
dos. La operación de contracción entre dos índices abate el orden de 4 a 2, pudiendo obtenerse
de este modo cuatro tensores diferentes a partir del tensor original.

La contracción repetida (doble contracción) aplicada sobre el tensor T = (Tijkl) nos produce en
todos los casos los tensores (Tuvuv) y (Tuvvu). Y como en cada uno de estos dos tensores tenemos
dos índices monigote iguales, lo cual requiere la aplicación por partida doble de la convención
de sumación reduciéndolo todo a un simple número, a un escalar, podemos ver que para el
tensor T del problema la doble contracción nos produce dos tensores de orden cero, o sea
dos invariantes.
Se concluye en la resolución de este problema que se pueden generar hasta seis tensores
diferentes a partir del tensor T = (Tijkl) mediante la operación de contracción.

PROBLEMA: Escribir los tensores que nos resultan de las siguientes contracciones:

1) T = (Tijkmlmnp)

2) T = (Tabcdeafgh)

3) T = (Tpqrsqstu)

4) T = (Tabijkmabkms)

1) En el tensor T = (Tijkmlmnp) de orden ocho tenemos el cuarto índice superior y el segundo


índice inferior iguales (m), con lo cual la contracción automáticamente entra en efecto
dejándonos el tensor de orden seis T = (Tijklnp).

2) En el tensor T = (Tabcdeafgh) de orden nueve tenemos el primer índice superior y el primer


índice inferior iguales (a), con lo cual la contracción automáticamente entra en efecto
dejándonos el tensor de orden siete T = (Tbcdefgh).

3) En el tensor T = (Tpqrsqstu) de orden ocho tenemos el primer índice superior y el primer índice
inferior iguales (q) y además tenemos el último índice superior y el segundo índice inferior
iguales, con lo cual la contracción automáticamente entra en efecto dejándonos el tensor de
orden seis T = (Tprtu).

4) En el tensor T = (Tabijkmabkms) de orden once tenemos cuatro índices superiores que son
iguales a cuatro índices inferiores (a,b,k,m), con lo cual al entrar en efecto la contracción nos
deja un tensor de orden tres, el tensor T = (Tijs).

PROBLEMA: Usando directamente la definición de tensor, demuéstrese que el producto de


un tensor contravariante A de orden uno por un tensor covariante B también de orden uno,
ambos de la misma dimensión, nos producirá una invariante sin importar la dimensión (el
número de coordenadas o componentes) involucrados.
Queremos demostrar que siendo A un tensor contravariante de orden uno y siendo B un tensor
covariante también de orden uno se debe cumplir la siguiente relación:

A·B = A·B

Si A = (Ai) es un tensor contravariante de orden uno y B = (Bi) es un tensor covariante de orden


uno, entonces de acuerdo a la definición básica del tensor tenemos lo siguiente (la convención
de sumación está aplicada en ambos casos en virtud de los índices repetidos, y es la que nos fija
la dimensión o el número de componentes de ambos tensores):

Multiplicando directamente ambas igualdades miembro a miembro:

Aquí podemos aplicar la regla de la cadena que para derivadas ordinarias es:

y que para derivadas parciales es:

con la cual:
Entonces:

Puesto que tenemos índices repetidos en ambos lados de la igualdad, al entrar en acción la
convención de sumación los productos se reducen a un escalar, a un simple número, que es el
mismo en ambos casos.

En notación tensorial compacta:

A·B = A·B

Esto significa que el producto de dos tensores, ambos de orden uno, el uno contravariante y el
otro covariante, permanece igual después de haberse llevado a cabo un cambio de
coordenadas. Puesto que un tensor de orden uno es en realidad un vector, lo que hemos hecho
en la resolución de este problema ha sido formalizar matemáticamente y de manera rigurosa, a
partir de la definición de tensor, el producto escalar de dos vectores. El hecho de haber utilizado
tensores del mismo orden en la resolución de este problema hizo que, implícitamente, al entrar
en acción la convención de sumación se llevara a cabo la contracción del producto de ambos
tensores reduciéndose todo a un escalar.

Pero lo que acabamos de ver tiene repercusiones profundas por el hecho de que el producto
interno de dos tensores no sólo es una invariante para dos tensores de orden uno. También
resulta ser una invariante para el producto interno de dos tensores de orden dos.

PROBLEMA: Demostrar que la contracción del producto externo de dos tensores, siendo uno
de ellos un tensor contravariante de orden dos y el otro un tensor covariante de orden dos,
ambos de la misma dimensión, nos produce un escalar, y por lo tanto es una invariante.

Este problema es simplemente una repetición del procedimiento llevado a cabo en el problema
anterior, excepto que ahora utilizamos tensores de orden dos en lugar de tensores de orden uno.

Si A = (Aij) es un tensor contravariante de orden dos y B = (Bij) es un tensor covariante también


de orden dos, entonces de acuerdo a la definición básica del tensor tenemos lo siguiente (la
convención de sumación está aplicada en ambos casos en virtud de los índices repetidos, y es la
que nos fija la dimensión o el número de componentes de ambos tensores):

Multiplicando directamente ambas igualdades miembro a miembro:

Aplicando la regla de la cadena para derivadas parciales ordinarias tenemos entonces:

Nuevamente, puesto que tenemos índices repetidos en ambos lados de la igualdad, al entrar en
acción la convención de sumación los productos se reducen a un escalar, a un simple número,
que es el mismo en ambos casos, y tenemos nuevamente, en notación tensorial compacta:

A·B = A·B

Lo que acabamos de obtener no es un resultado sin trascendencia, porque el procedimiento que


hemos aplicado en los últimos dos problemas, válido tanto para un par de tensores covariante y
contravariante de orden uno como para un par de tensores covariante y contravariante de orden
dos, es válido para cualquier par de tensores siempre y cuando en un espacio N-dimensional a
cada índice covariante en un tensor corresponda un índice contravariante en el otro, y esto es
válido incluso para tensores mixtos, de modo tal que si tenemos dos tensores
mixtos A y B de orden cuatro tales que A = (Aijkl) y B = (Bijkl), entonces también se cumplirá la
igualdad tensorial del producto de contracción de tensores A·B = A·B. Este resultado es de
importancia fundamental porque todo lo que permanezca invariante va directamente al
corazón de lo que trata la física: el principio de la conservación de la energía (invariancia de la
energía), el principio de conservación de la cantidad de movimiento (invariancia del
momentum), el principio de conservación del momento angular, en fin, todo lo que tenga que
ver con cualquier fenómeno físico. En la teoría matemática de grupos aplicada a la Mecánica
Cuántica, la prioridad es la búsqueda de las operaciones de simetría que dejan al sistema físico
en sí intacto. Hemos encontrado por fin justo la herramienta matemática que necesitamos para
poder llevar a la Teoría de la Relatividad del 4-espacio Lorentziano plano al 4-espacio curvo en
donde a pesar de requerir una mayor cantidad de índices podremos anclar invariantes.

PROBLEMA: Demostrar que cualquier producto interno de dos tensores A = (Apr) y B =


(Bqst) nos producirá un tensor de orden tres.

La demostración formal se debe llevar a cabo recurriendo a la definición del tensor. El producto
interno se llevará a cabo aquí entre el índice p de A y el índice t de B igualando ambos índices, o
sea haciendo p = t, lo cual activa la convención de sumación.

Si A = (Apr) es un tensor mixto, entonces por definición:

Y si B = (Bqst) es un tensor mixo, covariante de orden uno y contravariante de orden dos,


entonces por definición:

Multiplicando ambos tensores haciendo j = n (que es la igualación de índices que corresponde a


la igualación de índices p = t) para activar la convención de sumación sobre índices repetidos,
tenemos:

Simplificamos ahora con la ayuda de la regla de la cadena:


Pero la igualación de índices p = t se traduce en ∂xt/∂xp = 1. Con esto llegamos a:

Esto nos demuestra que (AprBqsp) es un tensor de orden tres. Obsérvese que fue necesario
cambiar el sub-índice en B de t a p en la última expresión. Si en el producto original (A prBqst)
llevamos a cabo una contracción entre el índice r y el índice q, o entre el índice r y el índice s,
podemos demostrar que cualquier contracción entre los dos tensores A y B nos producirá un
tensor de orden tres.

Propiedades de los tensores


Los tensores tienen algunas propiedades que nos resultan extremadamente útiles en la
simplificación de expresiones ahorrándonos una buena cantidad de tiempo. Una de dichas
propiedades es la propiedad de simetría que caracteriza a los tensores simétricos.

Decimos que dos tensores son simétricos con respecto a dos índices covariantes o
contravariantes cuando sus componentes respectivos son iguales tras un intercambio de
índices.

De este modo, si para un tensor T = (Tmprqs) tenemos que Tmprqs = Tpmrqs, decimos que el tensor
es simétrico en los índices m y p. Si el tensor es simétrico con respecto a dos índices
contravariantes cualesquiera y dos índices covariantes cualesquiera, se dice que el tensor es
simétrico.

PROBLEMA: (a) ¿Es simétrico un tensor contravariante de orden tres T = (Tabc) en un


espacio de dos dimensiones, en donde sus componentes en cierto punto adquieren los
siguientes valores?:

T111 = 7 , T211 = 3 , T121 = 3 , T221 = 0

T112 = 7 , T212 = -2 , T122 = -2 , T222 = 5

(b) ¿Es simétrico un tensor covariante de orden dos U = (Uij) en un espacio de cinco
dimensiones para el cual sus componentes adquieren los siguientes valores?:
U11 = a, U12 = -p, U13 = 3u, U14 = -t, U15 = -m²

U21 = -p, U22 = b, U23 = cpt, U24 = b + d, U25 = -c

U31 = 3u, U32 = cpt, U33 = j, U34 = -b, U35 = t

U41 = -t, U42 = b + d, U43 = -b, U44 = e, U45 = -u

U51 = -m², U52 = -c, U53 = t, U54 = -u, U55 = b

(a) Puesto que, en todos los casos, el intercambio entre el primer índice y el segundo índice nos
resulta en el mismo valor numérico para el componente del tensor, independientemente del
valor que tenga el otro índice al ser mantenido constante:

T211 = 3 = T121

T212 = -2 = T122

podemos afirmar que el tensor es simétrico en el primer y segundo índices en el punto en donde
sus componentes adquieren esos valores. Sin embargo, no podemos afirmar que el tensor sea
simétrico en todo el espacio bi-dimensional disponible de puntos, porque para ello
necesitaríamos tener a la mano la expresión matemática que define a dicho tensor. Por otro
lado, el tensor no es simétrico respecto al segundo y el tercer índices al ser diferentes los
siguientes componentes:

T121 = 3 , T112 = 7

T221 = 0 , T212 = -2

El tensor tampoco es simétrico respecto al primero y el tercer índices al ser diferentes los
siguientes componentes:

T112 = 7 , T211 = 3

T122 = -2 , T221 = 0
(b) Puesto que, en todos los casos, el intercambio entre los dos índices nos resulta en el mismo
valor simbólico para el componente del tensor:

U12 = U21 = -p

U13 = U31 = 3u

U14 = U41 = -t

U15 = U51 = -m²

U23 = U32 = cpt

U24 = U42 = b + d

U25 = U52 = -c

U34 = U43 = -b

U45 = U54 = -u

podemos afirmar que el tensor es simétrico, y es simétrico en todo el espacio 5-dimensional.

Aunque esto último lo resolvimos aplicando estrictamente la definición de simetría sin recurrir a
ayudas visuales (algo que le gusta mucho a los practicantes de la matemática pura), podemos
aprovechar en ventaja nuestra el hecho de que el tensor es un tensor de orden dos, acomodando
sus componentes en una matriz cuadrada 5x5 en la cual la simetría salta a relucir casi de
inmediato:
Obsérvese la simetría de los componentes con respecto a la diagonal principal cuyos
componentes han sido puestos de color rojo, una simetría en la cual se reflejan como si
estuviesen puestos frente a un espejo.

Desafortunadamente, este método visual fracasa al tratar de extenderlo hacia tensores de orden
tres en adelante. Por esta misma razón no pudimos utilizarlo en la primera parte del problema
en el caso del tensor contravariante T = (Tabc) de orden tres. Afortunadamente, una buena
cantidad de los tensores que manejamos en la Teoría General de la Relatividad resultan ser
precisamente de orden dos.

Una vez definidos los tensores simétricos, podemos definir los tensores hemi-
simétricos o semi-simétricos. En la literatura es muy frecuente encontrarse estos tensores
referidos como tensores anti-simétricos. Sin embargo, esta última definición sugiere una
antisimetría cuando en realidad sigue habiendo cierto tipo de simetría en los componentes del
tensor, razón por la cual aquí retendremos aquí la convención de llamarlos tensores hemi-
simétricos (skew-symmetric) aunque esta definición será acompañada por la más
frecuentemente usada palabra de anti-simetría.

Decimos que dos tensores son hemi-simétricos con respecto a dos índices covariantes o
contravariantes cuando sus componentes respectivos son iguales en magnitud pero opuestos
en signos tras un intercambio de índices.

Una de las propiedades más obvias de un tensor es que cuando es hemi-simétrico con respecto a
dos de sus índices p y q entonces todas sus componentes tendrán un valor de cero para p = q. En
el caso de un tensor de orden dos en su representación matricial, esto es lo que identificamos
como “una diagonal principal puesta a ceros”.

PROBLEMA: Demostrar que los componentes de un tensor hemi-simétrico en sus índices p y


q deben ser iguales a cero para p = q.

La demostración es trivial, y la llevaremos a cabo con un tensor T covariante de orden dos. Si el


tensor es hemisimétrico con respecto a dos de sus índices p y q, entonces por su propia
definición debemos tener:

Tpq = - Tqp
Para el caso p = q tenemos entonces:

Tpp = - Tpp

Pero la única forma en la cual esto puede ser cierto es con (Tpp) = 0. Se concluye que los
componentes de un tensor que es hemi-simétrico en sus índices p y q deben ser iguales a cero
para p = q.

En general, si para un tensor T = (Tmprqs) tenemos que Tmprqs = - Tpmrqs, entonces el tensor
es hemi-simétrico en los índices m y p. Si el tensor es hemi-simétrico con respecto a dos índices
contravariantes cualesquiera o dos índices covariantes cualesquiera, se dice que el tensor es
hemi-simétrico.

Por lo que acabamos de ver arriba, si un tensor T = (Tmprqs) es hemi-simétrico en dos índices
como los índices m y r, entonces haciendo m = r tenemos que (Tmpmqs) = 0 para todas las
combinaciones posibles de los índices restantes.

PROBLEMA: ¿Es hemi-simétrico un tensor covariante de orden dos V = (Vij) en un espacio de


cuatro dimensiones en donde sus componentes adquieren los siguientes valores?:

V11 = 0, V12 = - b, V13 = d, V14 = - c

V21 = b, V22 = 0, V23 = - c, V24 = - d

V31 = - d, V32 = c, V33 = 0, V34 = - b

V41 = c, V42 = d, V43 = b, V44 = 0

Comparando los valores, encontramos que para en todos los casos en los que los dos índices son
iguales los componentes tienen un valor de cero:

V11 = V22 = V33 = V44 = 0

Por otro lado, comparando todas las posibilidades de combinación restantes cuando los índices
son diferentes, todos resultan tener signos opuestos:
V12 = - V21 , V13 = - V31 , V14 = - V41

V23 = - V32 , V24 = - V42

V34 = - V43

Concluímos entonces que el tensor V es un tensor hemi-simétrico.

Aunque este último problema también lo resolvimos aplicando estrictamente la definición sin
recurrir a ayudas visuales, aprovechando en ventaja nuestra el hecho de que el tensor es un
tensor de orden dos podemos acomodar sus componentes en una matriz cuadrada 4x4 en la cual
haciendo a = 0 la hemi-simetría salta a relucir casi de inmediato:

De nueva cuenta, este método visual fracasa al tratar de extenderlo hacia tensores de orden tres
en adelante.

Dado un tensor T = (Tab) cualesquiera, podemos obtener a partir del mismo un tensor
simétrico Ts mediante la siguiente regla sencilla:

Ts = (Ts) = (Tab + Tba)/2

Esta definición se encuentra con la suficiente frecuencia como para darle la siguiente notación
especial en la cual la simetría sobre un par de componentes se denota mediante
paréntesis curvos en los índices de los componentes:

PROBLEMA: A partir de la definición anterior, demostrar que no es posible transformar un


tensor anti-simétrico en un tensor simétrico.
Un tensor anti-simétrico T = (Tab) será aquél para el cual Tab = - Tba. En la definición que se ha
dado:

T(ab) = (Tab + Tba)/2 = (- Tba + Tba)/2 = 0

No es posible, por lo tanto, obtener un tensor simétrico a partir de un tensor anti-simétrico.

Dado un tensor T = (Tab) cualesquiera, podemos obtener a partir del mismo un tensor anti-
simétrico Ta mediante la siguiente regla sencilla:

Ta = (Ta) = (Tab - Tba)/2

Esta definición se encuentra con la suficiente frecuencia como para darle la siguiente notación
especial en la cual la anti-simetría sobre un par de componentes se denota mediante paréntesis
cuadrados en los índices de los componentes:

Como esta forma de obtener un tensor anti-simétrico a partir de un tensor T cualesquiera es a


veces vista con desconfianza por quienes no se toman el tiempo para verificar esta última
aserción, se llevarán a cabo aquí algunos pasos extra para quienes no estén convencidos del
enunciado. Supóngase que la matriz [T] que representa a los componentes del tensor T es la
siguiente:

Entonces, puesto que la operación de invertir los índices p y q equivale matricialmente a


intercambiar los renglones por las columnas, si hacemos esto obteniendo una segunda matriz y
la restamos de la primera obtenemos el siguiente resultado:
Como puede verse, el resultado de la operación de restar Tqp de Tpq nos produce una matriz en la
cual todos los elementos en la diagonal principal de la matriz que corre de la esquina superior
izquierda hasta la esquina inferior derecha han sido reducidos a cero, y con respecto a esta
diagonal principal los elementos opuestos tienen la misma magnitud pero el signo contrario.
Claramente, esta es una matriz anti-simétrica (hemi-simétrica).

PROBLEMA: A partir de la definición anterior que se ha dado para la obtención de un tensor


anti-simétrico, demostrar que no es posible transformar un tensor simétrico en un tensor anti-
simétrico.

Un tensor simétrico T = (Tab) será aquél para el cual Tab = Tba. Usando la definición que se ha
dado arriba para un tensor anti-simétrico:

T[ab] = (Tab - Tba)/2 = (Tba - Tba)/2 = 0

No es posible, por lo tanto, obtener un tensor anti-simétrico a partir de un tensor simétrico.

Tenemos además varios resultados basados en las propiedades ya señaladas que nos pueden ser
de utilidad en la simplificación de los cálculos matemáticos.

PROBLEMA: Demostrar que cualquier tensor puede ser expresado como la suma de dos
tensores, uno de los cuales es simétrico y el otro de los cuales es anti-simétrico (hemi-
simétrico) en un par de índices covariantes (o contravariantes).

Considérese el tensor contravariante T = (Tpq) y considérese la siguiente igualdad aritmética:

Tpq = (Tpq + Tqp)/2 + (Tpq - Tqp)/2


Por la definición dada arriba, el tensor S = (Spq) formado por la siguiente operación de
componentes tensoriales:

S(pq) = (Tpq + Tqp)/2

es un tensor simétrico, o sea:

S = (Spq) = (Sqp)

Por otro lado, vimos también arriba que el tensor A = (Apq) formado por la siguiente operación
de componentes tensoriales:

A[pq] = (Tpq - Tqp)/2

es un tensor anti-simétrico (hemi-simétrico), o sea:

Apq = - Aqp

Entonces, todo tensor T puede ser expresado como la suma de un tensor simétrico S y un tensor
anti-simétrico (hemi-simétrico) A:

T=S+A

Un tensor que sea simétrico bajo un sistema de coordenadas seguirá siendo simétrico bajo
cualquier otro sistema de coordenadas después de haberse llevado a cabo la transformación. Lo
mismo se puede decir de un tensor anti-simétrico. La preservación de la simetría (o de la anti-
simetría) es una propiedad interna del tensor, independiente del sistema de coordenadas que
esté siendo utilizado.

Las convenciones notacionales que se han dado arriba pueden ser anidadas dentro de tensores
de orden mayor, por ejemplo:

T(ab)c = (Tabc + Tbac)/2

Tab[cd]ef = (Tabcdef - Tabdcef )/2


PROBLEMA: Escribir explícitamente en notación de componentes lo que simboliza la
siguiente expresión tensorial compacta:

T(ab)c[de]

Expandiendo primero sobre la parte simétrica:

T(ab)c[de] = (Tabc[de] + Tbac[de])/2

Expandiendo a continuación sobre la parte anti-simétrica (hemi-simétrica) nos produce la


expresión final explícita:

T(ab)c[de] = {Tabc[de] + Tbac[de]}/2

T(ab)c[de] = {(Tabcde - Tabced)/2+ (Tbacde - Tbaced )}/2

T(ab)c[de] = (Tabcde + Tbacde - Tabced- Tbaced )/4

PROBLEMA: Demostrar que el producto interno de un tensor simétrico U = (Uab) = (U(ab))


y de un tensor anti-simétrico V = (Vab) = (V[ab]) es igual a cero.

Llevaremos a cabo la demostración sobre un 3-espacio, expandiendo la doble sumatoria


requerida de acuerdo a la convención de sumación por la presencia de dos pares de índices
repetidos:

En el tercer paso se han destacado de color rojo los componentes del tensor anti-simétrico V que
son iguales a cero cuando ambos índices son iguales, lo cual tiene como consecuencia
desvanecer los términos en donde aparecen. Tras esto, recurrimos a las propiedades de simetría
y hemi-simetría que nos relacionan los componentes internos de cada tensor de la siguiente
manera:

Con esto tenemos entonces:

La generalización a un espacio N-dimensional cualesquiera se lleva a cabo fácilmente


generalizando las razones por las cuales el producto interno de un tensor simétrico y un tensor
anti-simétrico es igual a cero en un 3-espacio.

PROBLEMA: Demuéstrese que si un tensor A = (Apqrst) es simétrico (o hemi-simétrico) con


respecto a sus dos índices p y q en un sistema de coordenadas, entonces permanecerá
simétrico (o hemi-simétrico) con respecto a los mismos índices tras un cambio de coordenadas.

En virtud de que únicamente los índices p y q están involucrados, se llevará a cabo la


demostración sobre un tensor T = (Tpq) con esos dos índices exclusivamente.

Como siempre, la demostración se llevará a cabo recurriendo a la definición formal del tensor.
Suponiendo que el tensor T sea simétrico con respecto a un intercambio de los índices p y q,
entonces Tpq = Tqp. Entonces:

Se concluye que la simetría de un tensor es preservada bajo un cambio de coordenadas.

Y si el tensor es hemi-simétrico con respecto a un intercambio de los índices p y q,


entonces Tpq = - Tqp, con lo cual:
Se concluye que también la hemi-simetría de un tensor es preservada bajo un cambio de
coordenadas.

PROBLEMA: Determínese si una cantidad A(j,k,m) que es una función de las coordenadas
generalizadas xi y se transforma a otro sistema de coordenadas generalizadas x i
de acuerdo con la siguiente regla:

es un tensor. Si lo es, escríbase dicha cantidad en notación tensorial de componentes


identificando el orden y el tipo.

Inspeccionando la transformación de cada componente, podemos ver que la cantidad cumple


con todos los requerimientos de un tensor. En notación tensorial de componentes, esta cantidad
se escribe como el tensor:

A = (Amjk)

tratándose por lo tanto de un tensor de orden tres, contravariante de orden uno y covariante de
orden dos.

PROBLEMA: Determínese si una cantidad B(j,k,l,m) que es una función de las coordenadas
generalizadas xi y se transforma a otro sistema de coordenadas generalizadas x i
de acuerdo con la siguiente regla:

es un tensor. Si lo es, escríbase dicha cantidad en notación tensorial de componentes


identificando el orden y el tipo.
Inspeccionando la transformación de cada componente, podemos ver que la cantidad cumple
con todos los requerimientos de un tensor. En notación tensorial de componentes, esta cantidad
se escribe como el tensor:

B = (Bklmj)

tratándose por lo tanto de un tensor de orden cuatro, contravariante de orden tres y covariante
de orden uno.

PROBLEMA: Determínese si una cantidad T(j,k,m,n) que es una función de las coordenadas
generalizadas xi y se transforma a otro sistema de coordenadas generalizadas x i
de acuerdo con la siguiente regla:

es un tensor. Si lo es, escríbase dicha cantidad en notación tensorial de componentes


identificando el orden y el tipo.

Inspeccionando la transformación de cada componente, podemos ver que la cantidad no es un


tensor puesto que no cumple con todos los requerimientos propios de la definición de un tensor.
A continuación se destaca de color rojo las partes de la transformación que no cumplen con los
requisitos estipulados:

Las operaciones matemáticas que podemos llevar a cabo con tensores, al igual que las
operaciones matemáticas que podemos llevar a cabo con matrices, están limitadas a la suma, la
resta, la multiplicación externa (producto externo), y en el caso de los tensores, la contracción.
No es posible llevar a cabo una “división” entre dos tensores, tal cosa no está definida. Sin
embargo, es posible hacer algo que aunque no constituya una división en sí, se trata de una
aserción de carácter general que en ocasiones resulta útil en el desarrollo de operaciones
tensoriales. Se trata de la ley del cociente, que enunciada brevemente nos dice que si en el
producto interno de una cantidad X con un tensor B obtenemos un tensor C(o sea XB = C),
entonces X debe ser un tensor también.

PROBLEMA: Demostrar que si X(p,q,r) es una cantidad tal que X(p,q,r)Uqnr = 0 para un
tensor arbitrario U = (Uqnr ), entonces se debe tener X(p,q,r) = 0.

Puesto que Uqnr puede ser un tensor arbitrario cualquiera, podemos escoger un componente en
particular de dicho tensor (por ejemplo, el componente para el cual q = 4 y r = 3) que no sea
igual a cero, mientras que todos los demás componentes del tensor pueden ser considerados
iguales a cero en nuestro ejemplo. Entonces:

X(p,4,3)U4n3 = 0

de modo tal que debemos tener necesariamente X(p,4,3)U4n3 = 0, ya que U4n3 no es igual a cero
por hipótesis. Razonando de manera similar, para todas las demás combinaciones posibles de q
y r debemos tener entonces que X(p,q,r) = 0, lo cual concluye la demostración.

PROBLEMA: Una cantidad T(p,q,r) es tal que bajo cierto sistema de coordenadas
generalizadas xi se tiene lo siguiente:

T(p,q,r) Uqsr = Vsp

siendo tanto Uqsr como Vsp tensores. Demuéstrese que también T(p,q,r) es un tensor.

En un sistema transformado de coordenadas x i, tenemos lo siguiente:

T (j,k,l) U kml = Vsp

Entonces, puesto que tanto U = (Uqsr) como V = (Vsp) son tensores, recurriendo a la definición
del tensor debemos tener:
o lo que es lo mismo:

Si llevamos a cabo la multiplicación interna de esto con ∂x n/∂xm, o sea multiplicando por
∂xn/∂xw, y efectuando la contracción w = m, obtenemos entonces lo siguiente:

Aplicando el efecto del delta Kronecker al super-índice s:

Aquí podemos aplicar directamente el resultado obtenido en el problema anterior. Puesto que
Uqnr es un tensor arbitrario cualquiera, entonces lo que tenemos dentro de los paréntesis debe
ser igual a cero:
Llevaremos a cabo ahora una segunda multiplicación interna de lo que tenemos arriba, en este
caso por:

Esto nos produce el siguiente resultado:

o bien, aplicando el efecto del delta Kronecker:

Esta es precisamente la definición de un tensor. Entonces T es un tensor. Esta es la ley del


cociente en acción. Observando el posicionamiento de los índices, podemos ver que la notación
apropiada para T como un tensor de orden tres viene siendo T = (Trpq).

El tensor métrico
La distancia ║PQ║ entre dos puntos P(x1, y1, z1) y Q(x2, y2, z2) especificados en un espacio de
tres dimensiones en coordenadas rectangulares Cartesianas (x,y,z) se obtiene mediante la
aplicacion directa del teorema de Pitágoras en tres dimensiones:

║PQ║² = (x2 - x1)² + (y2 - y1)² + (y2 - y1)²

Esta misma definición se puede extender sin dificultad alguna hacia un espacio de cuatro
dimensiones en el cual por conveniencia notacional usaremos una representación de los
componentes en coordenadas generalizadas (x1, x2, x3, x4) estando el punto P especificado como
P((x1, x2, x3, x4) y estando especificado el punto Q como Q(y1, y2, y3, y4)
║PQ║² = (x1 - y1)² + ( x2 - y2)² + (x3 - y3)² + (x4 - y4)²

Utilizando el símbolo δij de Kronecker y la convención de sumación, podemos expresar esta


distancia en un espacio de cuatro dimensiones de una manera más compacta:

║PQ║² = δijΔxiΔxj

Esta fórmula es válida cuando usamos coordenadas Cartesianas rectangulares en un espacio de


cuatro dimensiones, y la distancia ║PQ║ entre los puntos P y Q es preservada (como el número
escalar que es) bajo una transformación que nos cambia de un marco de referencia S a otro
marco de referencia S'. Pero en otro sistema de coordenadas (por ejemplo, coordenadas
esféricas), la fórmula deja de funcionar en su preservación de la distancia entre dos puntos, y la
distancia entre dos puntos bajo tal sistema no-Cartesiano de coordenadas no es la misma en un
sistema de referencia S y otros sistema de referencia S' en dicho sistema de coordenadas.

La pregunta que nos hacemos ahora es: ¿cómo podemos redefinir la fórmula de la distancia
║PQ║ entre dos puntos en un espacio n-dimensional de modo tal que dicha fórmula sea capaz
de preservar la distancia entre dos puntos al ir de un sistema de referencia S a otro sistema de
referencia S', de modo tal que dicha fórmula general se reduzca al caso ya conocido para las
coordenadas Cartesianas?

La respuesta resulta ser mucho más sencilla de lo que muchos pudieran suponer. Basta con
introducir en la fórmula que ya tenemos para la distancia entre dos puntos un factor que
denominaremos gij con el cual la fórmula queda redefinida de la manera siguiente:

║PQ║ = gijΔxiΔxj

Para el caso específico en el cual estamos utilizando coordenadas Cartesianas, el factor g ij se


reduce al símbolo δij de Kronecker, y representando sus componentes en una matriz cuadrada
4x4 tenemos esencialmente lo que equivale a una matriz unitaria:
y la fórmula para la distancia entre dos puntos P y Q se convierte en lo que ya había sido
señalado anteriormente. Pero para otras distancias medidas en un espacio-tiempo plano, los
componentes de este factor gij pueden cambiar ligeramente. Tal es el caso del espacio-tiempo
plano propio de la Teoría Especial de la Relatividad, en el cual si definimos a la distancia entre
dos eventos de la siguiente manera:

Tenemos entonces el siguiente factor gij que preserva la distancia de un marco de referencia S a
otro marco de referencia S':

Este factor gij, el cual es especificado en su totalidad en un espacio de cuatro dimensiones por 16
componentes, es mejor conocido como el tensor métrico. La distancia ds² sobre la cual está
definido el tensor métrico es conocida ya sea como el elemento de línea y más
frecuentemente como la métrica.

La métrica es todo lo que necesitamos ver para saber si el espacio-tiempo en el que estamos
trabajando es un espacio-tiempo plano propio de la Teoría Especial de la Relatividad o un
espacio-tiempo curvo propio de la Teoría General de la Relatividad.
A continuación tenemos el tensor métrico para describir en coordenadas esféricas (r,θ,φ) el
espacio-tiempo en torno un hoyo (agujero) negro tipo Schwarzschild de masa M:

Podemos ver de inmediato que todas las entradas diagonales de este tensor métrico conocido
también como la métrica de Schwarzschild son diferentes. La entrada que más nos puede
llamar la atención es la entrada que corresponde al segundo renglón y la segunda columna, la
entrada g22, en la cual tenemos a la cantidad:

1/(1 - 2GM/rc²)

No se requiere de mucho esfuerzo para ver que, para cierto valor del radio r dado por:

r = 2GM/c²

tenemos lo que equivale a una singularidad matemática, una división entre cero, algo que nos
estalla en las manos yéndose hasta el infinito. De esto es de lo que tratan precisamente los
agujeros negros en la fábrica del tiempo-espacio curvo, son singularidades matemáticas
incapaces de ser descritas con herramientas de medición finitas.

PROBLEMA: Expresar la métrica Euclideana en coordenadas polares.

La métrica Euclideana:

ds² = (dx)² + (dy)²

expresada en coordenadas polares (r, θ) para las cuales:

x = r sen θ

dx = (r cos θ) (dθ) + (sen θ) (dr)

y = r cos θ
dy = (-r sen θ) (dθ) + (cos θ) (dr)

será:

ds² = [(r cos θ) (dθ) + (sen θ) (dr)]² + [(-r sen θ) (dθ) + (cos θ) (dr)]²

= r² cos² θ dθ² + 2r sen θ cos θ dθ dr + sen² θ dr²


+ r² sen² θ dθ² - 2r sen θ cos θ dθ dr + cos² θ dr²

ds² = (sen² θ + cos² θ) dr² + r²(sen² θ + cos² θ) dθ²

ds² = dr² + r² dθ²

en donde hemos usado la identidad trigonométrica:

sen² θ + cos² θ = 1

Puesto que el elemento de línea puede ser re-escrito como:

ds² = 1·(dr)(dr) + 0·(dr)(dθ) + 0·(dθ)(dr) + r²·(dθ)(dθ)

ds² = grr·(dr)(dr) + grθ·(dr)(dθ)


___+ gθr·(dθ)(dr) + gθθ·(dθ)(dθ)

la representación matricial G de la métrica es la siguiente:

PROBLEMA: Obténgase la métrica Euclideana que corresponde a un elemento de línea


trazado sobre la superficie de un cilíndro.

La métrica Euclideana:

ds² = (dx)² + (dy)² + (dz)²


expresada en coordenadas cilíndricas (r, θ, z):

para las cuales:

x = r cos θ

dx = (-r sen θ) (dθ) + (cos θ) (dr)

y = r sen θ

dy = (r cos θ) (dθ) + (sen θ) (dr)

z=z

dz = dz

será:

ds² = [(-r sen θ) (dθ) + (cos θ) (dr)]²+ [(r cos θ) (dθ) + (sen θ) (dr)]²
+ (dz)²
ds² = r² sen² θ dθ² - 2r sen θ cos θ dθ dr + cos² θ dr²
+ r² cos² θ dθ² + 2r sen θ cos θ dθ dr + sen² θ dr² + dz²

ds² = (sen² θ + cos² θ) dr² + r²(sen² θ + cos² θ) dθ² + dz²

ds² = dr² + r² dθ² + dz²

La métrica Euclideana que corresponde a un elemento de línea trazado sobre la superficie de un


cilíndro corresponde a un elemento para el cual la distancia al eje z (que corresponde al radio
del cilindro es constante), con lo cual dr = 0, y será:

ds² = dr² + r² dθ² + dz²

ds² = r² dθ² + dz²

Puesto que el elemento de línea puede ser re-escrito como:

ds² = r²·(dθ)(dθ) + 0·(dθ)(dz) + 0·(dz)(dθ) + 1·(dz)(dz)

ds² = gθθ·(dθ)(dθ) + gθz·(dθ)(dz)


___+ gzθ·(dz)(dθ) + gzz·(dz)(dz)

la representación matricial G de la métrica es la siguiente:

PROBLEMA: Expresar la métrica Euclideana en coordenadas esféricas.

La métrica Euclideana:

ds² = (dx)² + (dy)² + (dz)²

expresada en coordenadas esféricas (r, φ, θ):


para las cuales:

x = r senθ cosφ

dx = senθ cosφ dr + r cosθ cosφ dθ - r senθ cosφ dφ

y = r senθ senφ

dy = senθ senφ dr + r cosθ senφ dθ + r senθ cosφ dφ

z = r cosθ

dz = cosθ dr - r senθ dθ

será:

ds² = (senθ cosφ dr + r cosθ cosφ dθ - r senθ cosφ dφ)²


+ (senθ senφ dr + r cosθ senφ dθ + r senθ cosφ dφ)²
+ (cosθ dr - r senθ dθ)²

Después de un poco de álgebra laboriosa, encontramos que el elemento de línea en coordenadas


esféricas está dado por:

ds² = dr² + r² dθ² + r² sen²θ dφ²


Puesto que el elemento de línea puede ser re-escrito como:

ds² = 1·(dr)(dr) + 0·(dr)(dθ) + 0·(dr)(dφ)


+ 0·(dθ)(dr) + r²·(dθ)(dθ) + 0·(dθ)(dφ)
+ 0·(dφ)(dr) + + 0·(dφ)(dθ) + r² sen²θ·(dφ)(dφ)

ds² = grr·(dr)(dr) + grθ·(dr)(dθ) + grφ·(dr)(dφ)


+ gθr·(dθ)(dr) + gθθ·(dθ)(dθ) + gθφ·(dθ)(dφ)
+ gφr·(dφ)(dr) + gφθ·(dφ)(dθ) + gφφ·(dφ)(dφ)

la representación matricial G de la métrica es la siguiente:

PROBLEMA: Expresar la métrica Euclideana que corresponde a un elemento de línea


trazado sobre la superficie de una esfera de radio r.

Podemos utilizar en ventaja nuestra la resolución del problema anterior, ya que para un radio
fijo tenemos dr = 0:

ds² = dr² + r² dθ² + r² sen²θ dφ²

ds² = r² dθ² + r² sen²θ dφ²

Puesto que el elemento de línea puede ser re-escrito como:

ds² = r²·(dθ)(dθ) + 0·(dθ)(dφ) + 0·(dφ)(dθ) + r² sen²θ·(dφ)(dφ)


ds² = gθθ·(dθ)(dθ) + gθφ·(dθ)(dφ)
___+ gφθ·(dφ)(dθ) + gφφ·(dφ)(dφ)

la representación matricial G de la métrica es la siguiente:

Hemos visto cómo partiendo de un elemento de línea expresado para el espacio Euclideano de
tres dimensiones en coordenadas rectangulares Cartesianas (x,y,z) de la manera siguiente:

ds² = (dx)² + (dy)² + (dz)²

dicho elemento de línea puede ser puesto dentro de un marco de coordenadas esféricas (r,θ,φ)
como:

ds² = dr² + r² dθ² + r² sen²θ dφ²

Supóngase que estamos interesados en llevar a cabo el procedimiento inverso. Después de


aplicar una transformación, queremos invertir el procedimiento para recuperar lo que teníamos
inicialmente. Si avanzamos con un carro hacia adelante un kilómetro, debe ser posible
retroceder hacia atrás el mismo kilómetro para regresar al sitio en donde estábamos. Si existe
una transformación para estirar una esfera convirtiéndola en un elipsoide, entonces hablando
geométricamente (y matemáticamente también) debe existir una transformación inversa que
nos permita “comprimir” al elipsoide restaurándolo a su forma original de esfera. La aplicación
de un transformación seguida de la operación inversa, dejándonos las cosas tal y como estaban
originalmente, nos debe producir el elemento identidad que representa la ausencia de
modificación alguna.

En el caso del tensor métrico, tenemos lo que se conoce como el tensor métrico conjugado,
simbolizado la mayoría de las veces como g-1, y cuyas componentes en notación tensorial de
componentes se representan como gαβ·. Obsérvese que utilizamos super-índices para
representar las componentes del tensor métrico conjugado. Los super-índices no son
exponentes matemáticos, son simplemente super-índices. La matriz en la cual acomodamos a
los componentes del tensor métrico conjugado se simboliza como G-1:
Si G es la matriz que representa al tensor métrico, y G-1 es la matriz que representa al tensor
métrico conjugado, entonces la operación combinada G -1G nos debe resultar en la matriz
identidad I:

Llevando a cabo el producto matricial del lado izquierdo e igualando con las componentes
correspondientes del lado derecho que sean iguales a 1, en conformidad con la fórmula tensorial
en notación de componentes:

obtenemos lo siguiente para p = q = 1:

g11g11 + g12g21 + g13g31 + g14g41 = 1

Las otras tres relaciones son:

g21g12 + g12g21 + g13g31 + g14g41 = 1

g31g13 + g32g23 + g33g33 + g34g43 = 1

g41g14 + g42g24 + g43g34 + g44g44 = 1

De este modo, al llevarse a cabo el producto tensorial g·g-1 = g-1·g se nos debe producir el tensor
identidad δ, o sea el tensor delta de Kronecker (δij):

g·g-1 = g-1·g = δ
Puesto que toda operación tensorial con tensores de orden dos se puede manejar también con su
representación matricial equivalente, esto nos dá una pista sobre cómo obtener los componentes
del tensor métrico conjugado g-1 a partir de un tensor métrico g: obtenemos la matriz inversa a
partir G a partir de la matriz G formada con los componentes del tensor g, en virtud de que:

G-1G = GG-1 = I

siendo I la matriz identidad.

PROBLEMA: Encontrar tanto el tensor métrico como el tensor métrico conjugado que
corresponden al siguiente elemento de línea que está expresado en coordenadas
generalizadas:

ds² = 5(dx1)² + 3(dx2)² + 4(dx3) - 6(dx1)(dx2) + 4(dx2)(dx3)

Obsérvese que en este elemento de línea tenemos dos términos “cruzados” que tienen que ser
repartidos en dos mitades iguales para poder escribir los componentes del tensor métrico como
los requiere la propiedad de simetría gab = gba. Los componentes del tensor métrico son:

g11 = 5___g22 = 3___g33 = 4

g12 = g21 = - 3

g23 = g32 = 2

g13 = g31 = 0

La representación matricial de este tensor métrico es la siguiente:

Para obtener las componentes del tensor métrico conjugado, tenemos que invertir la matriz G.
Obteniendo dicha inversa por medio de cualquiera de los varios procedimientos matemáticos
disponibles, tenemos entonces:
En notación de componentes, el tensor métrico conjugado es el siguiente:

g11 = 2___g22 = 5___g33 = 3/2

g12 = g21 = 3

g23 = g32 = - 5/2

g13 = g31 = - 3/2

La mayoría de las veces, o prácticamente todas, estaremos trabajando con tensores métricos
cuya representación matricial es diagonal:

Esto nos dá una simplificación enorme en los cálculos requeridos para obtener el tensor métrico
conjugado g-1 a partir del tensor métrico g, tomando en cuenta que el procedimiento de
inversión de matrices, sobre todo cuando se lleva a cabo a mano, no sólo puede ser laborioso
sino que es propenso a equivocaciones.

Efectuando el producto de la matriz diagonal G que representa a un tensor métrico g por la


matriz diagonal inversa G-1 que representa al tensor métrico conjugado g-1 :
Obtenemos de inmediato las siguientes relaciones para los componentes respectivos del tensor
métrico conjugado:

g11 = 1/g11___g22 = 1/g22___g33 = 1/g33___g44 = 1/g44

Estas relaciones frecuentemente se representan como gii = 1/gii. En esta simbolización no se


aplica la convención de sumación para índices repetidos, ya que no hay sumación alguna
involucrada, se trata de componentes individuales para cada valor de i.

PROBLEMA: Utilizando los resultados del problema anterior, determinar el tensor métrico
conjugado para un elemento de línea trazado sobre la superficie de una esfera.

Todo lo que tenemos que hacer es obtener la inversa de la matriz G que corresponde a la
métrica, o sea tenemos que invertir la matriz G por los procedimientos usuales del álgebra
matricial. Aquí podemos usar a nuestro favor el hecho ya señalado arriba: la matriz G es una
matriz diagonal, cuyos únicos elementos diferentes de cero están situados a lo largo de la
diagonal principal, y para obtener la matriz inversa únicamente tenemos que tomar la inversa de
cada elemento correspondiente. Con esto en mente, el tensor métrico conjugado que
corresponde al elemento de línea que habita en la superficie de una esfera (obsérvese que todos
los componentes del tensor métrico conjugado son representados como componentes de un
tensor contravariante, con super-índices):
debe ser el siguiente:

PROBLEMA: Obtener el tensor métrico conjugado en coordenadas esféricas.

Este problema sigue el mismo procedimiento que el problema anterior. Y ya hemos obtenido
previamente la representación matricial de la métrica en coordenadas esféricas. Con todo esto
en mente, el tensor métrico conjugado que corresponde a las coordenadas esféricas (obsérvese
que todos los componentes del tensor métrico conjugado son representados como componentes
de un tensor contravariante, con super-índices):

debe ser el siguiente:

Usando notación de componentes, el producto externo de dos tensores de orden dos A = (Aαβ)
y B = (Bγδ) se puede llevar a cabo directamente como:

AαβBγδ

y el producto interno de los dos tensores se obtiene llevando a cabo la doble contracción
igualando los índices superiores a los índices inferiores sobre dicho producto externo de modo
tal que entre automáticamente en acción la convención de sumación:
Aαβ·Bαβ

Por ningún motivo se debe confundir esta última operación con la operación gpr·grq = δpqque
hemos efectuado arriba, se trata de operaciones completamente diferentes como puede verse
en la simbolización de los índices tanto los de arriba como los de abajo. Una representa una
sola contracción que nos produce un tensor mixto, el tensor delta Kronecker, mientras que la
otra representa una doble contracción que nos resulta en un escalar. Se hace necesario recalcar
esto en virtud de que por los parecidos que hay en la notación esto frecuentemente suele ser
causa de muchas confusiones, equivocaciones y malentendidos entre los principiantes en el
estudio del análisis tensorial.

PROBLEMA: Recurriendo a la notación de componentes y utilizando tanto los componentes


gαβ del tensor métrico g que corresponde a la métrica Euclideana en coordenadas esféricas
como los componentes del tensor métrico conjugado g-1 que corresponde a la misma métrica,
demostrar que el producto

gαβ·gαβ

nos produce una invariante.

La primera expansión de acuerdo a la convención de sumación la podemos llevar a cabo sobre el


índice monigote α produciénse lo siguiente:

gαβ·gαβ = g1β·g1β + g2β·g2β + g3β·g3β

Llevando a cabo la segunda expansión sobre el segundo índice monigote β esto nos produce la
siguiente suma de nueve términos:

gαβ·gαβ =
g11·g11 + g12·g12 + g13·g13
+ g21·g21 + g22·g22 + g23·g23
+ g31·g3β + g32·g32 + g33·g33

La notación numérica ha sido puesta de conformidad con las coordenadas generalizadas. Para
las coordenadas esféricas tenemos 1 = r, 2 = φ, 3 = θ, con lo cual:
gαβ·gαβ =
grr·grr + grθ· grθ + grφ· grφ
+ gθr· gθr + gθθ· gθθ + gθφ· gθφ
+ gφr· gφr + gφθ· gφθ + gφφ·gφφ

Empleando los componentes que obtuvimos en los problemas anteriores:

gαβ·gαβ =
grr·grr + grθ· grθ + grφ· grφ
+ gθr· gθr + gθθ· gθθ + gθφ· gθφ
+ gφr· gφr + gφθ· gφθ + gφφ·gφφ

gαβ·gαβ
= (1)(1) + (0)(0) + (0)(0)
+ (0)(0) + (1/r²)(r²) + (0)(0)
+ (0)(0) + (0)(0) + (1/r² sen² θ)(r² sen² θ)

gαβ·gαβ = 1 + 1 + 1 = 3

Esto nos demuestra que si tomamos el producto tensorial interno del tensor métrico g y de su
conjugado que corresponden a la métrica Euclideana en coordenadas esféricas, el resultado es
un escalar, el número 3, y por lo tanto el producto interno de dos tensores de orden dos es una
invariante.

El problema anterior nos lleva a una relación importante.

PROBLEMA: Demostrar que en un espacio n-dimensional, para un tensor métrico diagonal


en el cual gij = 0 para i ≠ j la doble contracción del tensor métrico g con el tensor métrico
conjugado g-1 nos produce el siguiente resultado:

gαβ·gαβ = n

En este caso se tiene:

gαβ·gαβ = g11·g11 + g22·g22 + g33·g33 + ... + gnn·gnn

gαβ·gαβ = (1/g11)·g11 + (1/g22)·g22 + (1/g33)·g33 + ... + (1/gnn)·gnn


gαβ·gαβ = 1 + 1 + 1 + ... + 1

Para nosotros es importante que el producto interno de dos tensores de orden dos sea una
invariante por el hecho de que los tensores que aparecen en la ecuación fundamental de la
Relatividad General, tanto el tensor de Einstein G como el tensor energía-tensión T son también
tensores de orden dos, son tensores capaces de generar invariantes, si usamos la ayuda tanto del
tensor métrico como del tensor métrico conjugado en las operaciones de cálculo como lo hemos
hecho aquí.

Gimnasia de índices
Con la ayuda de un tensor métrico g = (gαβ) que sea válido dentro de cierto espacio N-
dimensional podemos convertir a un tensor contravariante T = (Ti) de orden 1 en un
tensor covariante del mismo orden T = (Ti) con el simple hecho de tomar el producto interno
del tensor T con el tensor métrico g formando el producto gT = Tg y aplicando la convención de
sumación igualando el índice superior del tensor T con uno de los índices inferiores del tensor
métrico g (para un tensor métrico cuya representación sea una matriz diagonal no importa cuál
de los dos índices se seleccione ya que el resultado será el mismo), un procedimiento que ya
habíamos definido como contracción. La operación de convertir a un tensor del tipo T = (Ti) en
un tensor del tipo T = (Ti) es conocida como bajado de índice(en inglés se le llama index
lowering). Del mismo modo, con la ayuda de un tensor métrico conjugado g-1 = (gαβ) que sea
válido dentro de cierto espacio N-dimensional podemos convertir a un tensor covariante T = (Ti)
de orden 1 en un tensor contravariante del mismo orden T = (Ti) con el simple hecho de tomar
el producto interno del tensor T con el tensor métrico conjugado g-1 formando el producto g-
1 T = Tg-1 y aplicando la convención de sumación. La operación de convertir a un tensor del tipo
(Ti) en un tensor del tipo (Ti) es conocida como subida de índices (en inglés se le llama index
raising).

Para convertir a un tensor del tipo (Ti) en un tensor del tipo (Ti), o sea para bajar el índicedel
tensor, utilizamos un tensor métrico g = (gij) como se muestra a continuación en notación
tensorial de componentes:

gkj Tj = Tk
Obsérvese que al bajar el índice del tensor T con la ayuda del tensor métrico, en virtud de
haberse llevado a cabo una operación de contracción el super-índice j del tensor ha pasado a ser
el sub-índice k. El índice que ha sido bajado siempre toma la letra del otro índice del tensor
métrico que no ha participado en la operación.

Del mismo modo, para convertir a un tensor del tipo (Ti) en un tensor del tipo (Ti), o sea
para subir el índice del tensor, utilizamos el tensor métrico conjugado g-1 = (gij) como se
muestra a continuación:

gkj Tj = Tk

Nuevamente, obsérvese que al subir el índice j con la ayuda del tensor métrico conjugado, en
virtud de haberse llevado a cabo una operación de contracción el sub-índice j del tensor ha
pasado a ser un super-índice k. El índice que ha sido subido siempre toma la letra del otro índice
del tensor métrico conjugado que no ha participado en la operación.

PROBLEMA: Escribir los tensores producidos por las siguientes operaciones:

a) girTr jk

b) Tαμγ gβμ

c) gαμTμβγ

d) gγμTαβμ

e) glsTijk s

f) gαβ gir Tμβrεγ

g) gαβ gδε Tμβε

h) ΛirTjrk

En cada caso, nos fijamos en el índice del tensor métrico g (o del tensor métrico conjugado g-
1 en su caso) que sea igual al índice del tensor T que va a ser subido o bajado, y una vez subido o
bajado deberá utilizar la otra letra que caracterizaba al tensor métrico con la cual se produjo la
operación.

a) En esta operación vamos a subir un índice, el índice r:

girTr jk = girTr jk = Tijk

b) En esta operación vamos a bajar un índice, el índice μ:

Tαμγ gβμ = Tαμγ gβμ = Tα βγ

c) En esta operación vamos a bajar un índice, el índice μ:

gαμTμβγ = gαμTμβγ = Tα β γ

Obsérvese con cuidado cómo el tensor resultante está definido por los sub-índices α y γ así como
por el super-índice β. Sin embargo, lo que importa es la posición relativa de los índices (arriba o
abajo), no su identificador tipográfico.

d) En esta operación vamos a subir un índice, el índice μ:

gγμTαβμ = gγμTαβμ = Tαβγ

e) En esta operación vamos a bajar un índice, el índice s:

glsTijk s = glsTijk s = Tijkl

f) Este problema es una aplicación del tensor métrico g y del tensor métrico conjugado g-1en la
cual utilizamos el tensor métrico g para bajar el índice β del tensor T y en la cual utilizamos el
tensor métrico conjugado g-1 para subir el índice ε del tensor T:

gαβ giε Tμβrεγ = gαβ Tμβirγ = gαβ Tμβirγ = Tμiαrγ

Obsérvese que esta aplicación combinada del tensor métrico con el tensor métrico conjugado no
cambia en lo absoluto el orden del tensor. Aquí empezamos con un tensor de orden cinco y
terminamos con un tensor de orden cinco. Puesto que, generalmente hablando, los índices son
índices monigote en la cual el símbolo utilizado para denotarlos carece de importancia, una
operación combinada como la que hemos llevado a cabo no resulta de gran utilidad.

g) Este problema es una aplicación repetida del tensor métrico g en la cual utilizamos el tensor
métrico para bajar los dos índices β y ε del tensor T:

gαβ gδε Tμβε = gαβ gδε Tμβε = gαβ gδε Tδμβ = gαβ gδε Tδμβ = Tαδμ

Esta operación tomó un tensor contravariante de orden tres, y nos produjo un tensor mixto
covariante de orden dos y contravariante de orden uno. Una operación tensorial de este tipo
puede ser y de hecho resulta ser de gran utilidad en aplicaciones prácticas.

h) En este problema aparece un ligero cambio de notación, sugiriendo que el tensor métrico en
este caso es un tensor especial, el tensor Λ que corresponde a un espacio-tiempo
relativista plano (Lorentziano). Puesto que ésto lo único que hace es especificar las
componentes del tensor que corresponden a dicho 4-espacio, esto no cambia en nada la
naturaleza matemática de las operaciones tensoriales que estamos llevando a cabo.

ΛirTjrk = ΛirTjrk = T j ik

PROBLEMA: En cada uno de los siguientes casos, determinar el tipo de tensor métrico (o
tensores métricos, en caso de que se requieran varios) que necesitamos para llevar a cabo la
conversión requerida:

1) Tαβγδ ⇒ Tβαγδ

2) Tαβγδερλ ⇒ Tαβγδερλ

3) Tαβγδερλ ⇒ Tαβγδερλ

4) Tαβγδερλ⇒ Tαβγδερλ

5) FαβFλβ ⇒ FαβFλβ

6) Fαβρλ Hγδεω ⇒ Fαβρλ Hγδεω

1) En este caso basta con un tensor métrico ordinario g = (gμν):


Tβαγδ = gβνTανγδ

2) En este caso requerimos un tensor métrico conjugado g-1 = (gαβ):

Tαβγδερλ = gενTαβγδνρλ

3) En este caso, puesto que tenemos que subir dos índices, requerimos de dos tensores métricos
conjugados:

Tαβγδερλ = gεμ gρν Tαβγδμνλ = gεμ Tαβγδμνλ gρν

4) En este caso, puesto que tenemos que subir tres índices, requerimos de tres tensores métricos
conjugados, quedando especificadas las operaciones de la siguiente manera:

Tαβγδερλ = gαx gβy gγz Txyzδερλ

5) En este caso requerimos de un solo tensor métrico para bajar el índice α que corresponde al
primer factor Fαβ en el término FαβFλβ:

FαβFλβ = gαν FνβFλβ

6) En este caso necesitamos dos tensores métricos, un tensor métrico para bajar el índice β de F,
y un tensor métrico conjugado para subir el índice ε de H:

Fαβρλ Hγδεω = ( gβμ Fαμρλ )(gεν Hγδνω)

Es muy importante no confundir el uso de un tensor métrico como g para subir (o bajar) índices
con el uso de Λ para llevar a cabo una transformación de un sistema de referencia S a otro
sistema de referencia S’. En este último caso no hay subida ni bajada de índices; si empezamos
con un tensor covariante de orden dos seguiremos con un tensor covariante de orden dos
después de la transformación en la cual empleamos a Λ. Esto lo aclararemos con unos ejemplos.

PROBLEMA: Demostrar que la transformación de Lorentz llevada a cabo sobre un 4-vector


puede ser considerada como una transformación tensorial.

Nuestro punto de partida serán las transformaciones de Lorentz para un movimiento que se
lleva a cabo a lo largo del eje-x común a ambos marcos de referencia S y S’:
x’ = γ(x - Vt) = γx - γVt

t’ = γ(t - Vx/c²) = - (γV/c²) x + γt

Esto lo podemos poner dimensionalmente en las mismas unidades (metros, en el sistema MKS)
de la siguiente manera:

x’ = γ(x - Vt) = γx - γVt

ct’ = γ(t - Vx/c²) = - (γV/c) x + γct

Estas transformaciones actúan sobre un 2-vector que podemos llamar U, convirtiéndolo en otro
2-vector que podemos llamar U, lo cual expresado en coordenadas generalizadas es:

U = (U1, U2) = (x, ct)

U = (U1, U2) = (x’, ct’)

De este modo, la transformación llevada a cabo se puede representar de la siguiente manera:

o de la siguiente manera, empleando coordenadas generalizadas:

Basta con hacer:


para tener a la mano lo que es ni más ni menos una transformación tensorial que cumple con la
definición del tensor:

En este caso empezamos con una transformación generalizada que supone un tensor covariante.
Pero igual podríamos haber empezado con la transformación empleando como punto de partida
un tensor contravariante. Lo importante es mantener una consistencia conforme a lo largo de un
desarrollo un tensor covariante se vaya convirtiendo en contravariante o viceversa.

La misma transformación (con movimiento relativo entre ambos marcos de referencia a lo largo
del eje-x común) extendida a un 4-espacio, el espacio-tiempo de la Teoría Especial de la
Relatividad, es la siguiente en donde se ha hecho la simplificación β = V/c:

Podemos representar cada uno de los componentes de esta matriz Lorentziana con
notación mixta, utilizando un super-índice para designar el renglón al que pertenece el
elemento y un sub-índice para designar a la columna:
A continuación se muestra la manera en la cual se lleva a cabo la transformación de Lorentz
sobre un 4-vector poniéndose como paso intermedio la sumación que es activada en virtud del
índice repetido:

Si en lugar de un 4-vector tenemos un tensor contravariante de orden dos F = (Fαβ), podemos


convertir uno de los índices del tensor de un sistema de referencia S a otro sistema de referencia
S’ de la siguiente manera:

Pero tratándose no de vectores (tensores de orden uno) sino de tensores de orden dos, la
transformación en uno solo de los índices no nos basta para llevar a cabo una transformación
completa, tenemos que transformar los dos índices, lo cual significa que tenemos que emplear
nuevamente a Λ para llevar a cabo una segunda transformación sobre el otro índice:
De este modo, con la ayuda de Λ podemos pasar los componentes del tensor F de un marco de
referencia S a otro marco de referencia S’, y aunque aquí hemos llevado a cabo una
manipulación de índices empleando a Λ como tensor métrico (Lorentziano), el tensor Fsigue
siendo un tensor contravariante de orden dos, tal y como lo esperaríamos de una expresión que
involucra tensores.

PROBLEMA: Suponiendo que tenemos un tensor F = (Fμν) definido en un 4-espacio


Lorentziano, escríbase explícitamente la expresión para llevar a cabo la conversión del
componente F11 del tensor de un marco de referencia S a otro marco de referencia S’.

Llevando a cabo la sumación sobre el primer índice (μ) según la prescripción dada arriba,
obtenemos la suma de cuatro términos:

Llevando a cabo ahora la sumación sobre el segundo índice (ν) tendremos ahora el siguiente
resultado, al expandirse cada término anterior a cuatro términos dando un total de 16 términos:

Una inspección detallada de este resultado nos revela que el componente transformado de
F11 puede ser obtenido mediante las operaciones especificadas por la siguiente fórmula
matricial:

F = ΛFΛT
PROBLEMA: Supóngase que se nos ha proporcionado el siguiente tensor F:

Obténgase el componente F42 del tensor F en el sistema de referencia S’ suponiendo que se le ha


aplicado al tensor F una transformación de Lorentz.

De acuerdo con la definición dada arriba, el componente F42 se obtiene mediante mediante la
siguiente sumatoria doble:

La sumatoria sobre un índice nos produce cuatro términos, y la sumatoria sobre el otro índice
nos produce cuatro términos en cada uno de los cuatro términos que ya teníamos, dándonos un
total de 16 términos. En este caso resultará más ventajoso efectuar evaluaciones con los
componentes del tensor dado primero sobre una sumatoria y después sobre la otra en lugar de
llevar a cabo la expansión de todos los 16 términos dejando la substitución de componentes
hasta el final. Empezaremos con la expansión de la sumatoria sobre el índice μ substituyendo de
inmediato los componentes indicados:

Los componentes de Λ que son iguales a cero se han destacado de color rojo, habiendo tres de
ellos que terminan nulificando tres de los términos de la sumatoria sobre μ. El otro componente
es igual a la unidad, dejándonos un solo término sobre el cual podemos llevar a cabo ahora la
expansión sobre el índice ν:

La substitución de valores nos produce entonces el siguiente resultado:

PROBLEMA: Continuando con el problema anterior, obténganse todos los demás


componentes de dicho tensor F después de que se le ha aplicado una transformación de
Lorentz

Las operaciones matemáticas involucradas en la transformación de Lorentz del tensor F que ya


de por sí pueden ser tediosas se pueden manejar metódicamente en una forma más ordenada
mediante la representación matricial de la transformación que viene siendo:

F = ΛFΛT

En mayor detalle, esto involucra las siguientes operaciones matriciales:

En virtud de la propiedad de asociatividad para la multiplicación de matrices (AB)C = A(BC),


podemos multiplicar las primeras dos matrices y multiplicar la matriz resultante por la tercera
matriz, o podemos multiplicar la segunda y tercera matrices multiplicando el resultado por la
primera matriz, obteniendo en ambos casos el mismo resultado. Multiplicaremos aquí primero
la segunda matriz por la tercera matriz:
La matriz que hemos obtenido la podemos multiplicar ahora por la primera matriz. Los
elementos de la matriz resultante, que a su vez son los componentes del tensor F, son los
siguientes:

F11 = 0___F12 = - E1___F13 = - γ(E2 - βB3)___F14 = - γ(E3 + βB2)

F21 = E1___F22 = 0___F23 = - γ(B3 - βE2)___F24 = γ(B2 + βE3)

F31 = γ(E2 - βB3)___F32 = γ(B3 - βE2)___F33 = 0___F34 = -B1

F41 = γ(E3 + βB2)___F42 = - γ(B2 + βE3)___F43 = B1___F44 = 0

Obsérvese que estos elementos, acomodados en una matriz, revelan que el tensor F es
antisimétrico, al igual que como F lo es.

Puesto que las componentes de F deben ser iguales en forma a las componentes del tensor
original, o sea:

entonces igualando componentes se puede ver que la transformación Lorentz del


tensor Fconvirtiéndolo en un tensor F nos ha producido las siguientes relaciones de
transformación:

E1 = E1___E2 = γ(E2 - βB3)___E3 = γ(E3 + βB2)

B1 = B1___B2 = γ(B2 + βE3)___B3 = γ(B3 - βE2)

Ahora considérese una métrica en la cual el intervalo relativista Lorentziano está definido de la
siguiente manera:

ds² = c² dt² - dx² - dy² - dz²

Entonces, haciendo c = 1 como se acostumbra hacerlo con unidades geometrizadas dándonos:

ds² = dt² - dx² - dy² - dz²

la representación matricial que corresponde al tensor métrico que corresponde a este elemento
de línea es la siguiente:

Esta es precisamente la métrica que utilizamos en un espacio-tiempo plano (Lorentziano) para


subida y bajada de índices en un espacio tiempo Lorentziano. Si queremos subir o bajar índices,
utilizamos a g. Pero si lo que queremos es llevar a cabo una transformación de Lorentz de un 4-
vector o de un tensor pasándolo de un sistema de referencia S a otro sistema de referencia S’,
entonces utilizamos a Λ. Tanto g como Λ tienen cada uno su lugar respectivo.

PROBLEMA: Dado el 4-vector contravariante P = (Pα) = (E/c, px, py, pz), obtener el 4-vector
covariante P = (Pα) empleando el tensor métrico g del espacio-tiempo Lorentziano. Usar el
resultado para obtener PαPα.

La operación requerida para bajar el índice es la siguiente:

Pμ = gμβPβ
Expandiendo la sumatoria sobre el 4-espacio:

Pμ = gμ1P1 + gμ2P2 + gμ3P3 + gμ4P4

Substituyendo valores:

P1 = g11P1 + 0 + 0 + 0 = (1)(E/c) = E/c

P2 = 0 + g22P2 + 0 + 0 = (- 1)(px) = - px

P3 = 0 + 0 + g33P3 + 0 = (- 1)(py) = - py

P4 = 0 + 0 + 0 + g44P4 = (- 1)(pz) = - pz

Con esto tenemos entonces:

(Pα) = (E/c, - px, - py, - pz)

Usando este resultado:

PαPα = P1P1 + P2P2 + P3P3 + P4P4

PαPα = (E/c)(E/c) + (px)(-px) + (py)(-py) + (pz)(- pz)

PαPα = (E/c)² - (px² + py² + pz²)

PαPα = (E/c)² - p·p

PROBLEMA: Usando el tensor métrico g propio del espacio-tiempo Lorentziano, y dado el


siguiente tensor:

(1) Bajar el primer índice (α) obteniendo así el tensor Tαβ y (2) bajar el segundo índice
obteniendo así el tensor Tαβ. (3) ¿Son iguales Tαβ y Tαβ? (4) ¿Cómo se pueden
obtener Tαβ yTαβ de Tαβ mediante operaciones matriciales? (5) Obtener el tensor Tαβ.

Para bajar el primer índice (α) utilizamos la relación:

Tαβ = gαμTμβ

Expandiendo la sumatoria sobre el 4-espacio:

Tαβ = gα1T1β + gα2T2β + gα3T3β + gα4T4β

Para α = 1 y β = 2:

T12 = g11T12 + g12T22 + g13T32 + g14T42 = g11T12 = (1)(b) = b

Para α = 2 y β = 1:

T21 = g21T11 + g22T21 + g23T31 + g24T41 = g22T21 = (-1)(e) = - e

Para α = 2 y β = 3:

T23 = g21T13 + g22T23 + g23T33 + g24T43 = g22T23 = (-1)(g) = - g

Del mismo modo:

T31 = g3μTμ1 = g33T31 = (-1)(i) = - i

T41 = g4μTμ1 = g44T41 = (-1)(m) = - m

Juntando todos los componentes de Tαβ en un arreglo matricial tenemos lo siguiente:

Matricialmente hablando, este resultado puede ser obtenido pre-multiplicando a la matriz que
representa los componentes del tensor T contravariante con la matriz que representa a los
componentes del tensor métrico g:

Para bajar el segundo índice (β) utilizamos la relación:

Tαβ = gμβTαμ

Expandiendo la sumatoria sobre el 4-espacio:

Tαβ = g1βTα1 + g2βTα2 + g3βTα3 + g4βTα4

Para α = 1 y β = 2:

T12 = g12T11 + g22T12 + g32T13 + g42T14 = g22T12 = (-1)(b) = - b

Para α = 2 y β = 1:

T21 = g11T21 + g21T12 + g31T23 + g41T24 = g11T21 = (1)(e) = e

Juntando en un arreglo matricial todos los componentes de T αβ que se van generando con las
sumatorias tenemos lo siguiente:

Matricialmente hablando, este resultado puede ser obtenido post-multiplicando a la matriz que
representa los componentes del tensor T contravariante con la matriz que representa a los
componentes del tensor métrico g:
La primera conclusión firme es que los tensores Tαβ y Tαβ no son iguales pese a que fueron
obtenidos ambos del mismo tensor Tαβ. En ambos casos, vimos que el resultado se puede
obtener de una manera más ordenada (y en cierta forma, más rápida) con la ayuda de
operaciones matriciales. Para bajar el primer índice tuvimos que recurrir a una pre-
multiplicación, mientras que para bajar el segundo índice tuvimos que recurrir a una post-
multiplicación. Esto significa que la operación de descenso de índice se puede obtener mediante
una de las siguientes operaciones matriciales:

[ gαμ][Tμβ] = [Tαβ]

[Tαμ][gμβ] = [Tαβ]

Obsérvese que en ambos casos los índices repetidos de cada matriz deben estar contiguos el uno
al otro (apareados). Esto es lo que nos proporciona la clave para convertir las operaciones
tensoriales de sumatorias en operaciones matriciales. Siendo así, podemos postular que para
obtener un tensor covariante de orden dos a partir de un tensor contravariante de orden dos las
operaciones matriciales que debemos llevar a cabo para bajar ambos índices están especificadas
por el siguiente producto matricial múltiple:

[Tαβ] = [gαμ][Tμν][gνβ]

Llevando a cabo estas operaciones matriciales, obtenemos el siguiente resultado:

Una forma de verificar la integridad de los pasos que se están llevando a cabo en el desarrollo de
una ecuación tensorial cuando en dicha ecuación se está utilizando notación de componentes,
especialmente cuando se está llevando a cabo gimnasia de índices, es la observancia en
el balanceo de los índices simbólicos, lo cual consiste en verificar que el balance de índices
simbólicos del lado izquierdo de una igualdad tensorial coincida con el balance de índices
simbólicos del lado derecho de dicha igualdad. Un ejemplo lo tenemos en la siguiente expresión
tensorial:

En el lado izquierdo tenemos dos índices libres α y β que en un espacio N-dimensional pueden
tomar cualquiera de N valores diferentes. En el lado derecho tenemos dos términos dentro de
los paréntesis rectangulares, siendo el primer término FαλFλβ con un índice monigote λ. Al
llevarse a cabo la contracción del término tensorial provocada por el índice repetido λ que activa
a la convención de sumación, tras la suma desaparece el índice monigote y nos quedan
únicamente los dos super-índices α y β que se corresponden con los índices libres α y β de T αβ.
En este caso, los índices están balanceados. Y en lo que respecta al segundo término, tenemos el
producto de los factores FμλFμλ que con dos índices monigote repetidos (μ y λ) activa una doble
sumatoria tras la cual nos quedan únicamente los dos índices libres superiores del tercer factor,
gαβ, los cuales balancean también a los índices libres α y β de T αβ. La ecuación, en lo que respecta
al balanceo de índices, es correcta.

La verificación del balanceo de índices se puede llevar a cabo inclusive aunque no tengamos la
menor idea del significado del enunciado que está especificando una expresión tensorial, como
en el siguiente caso:

En el lado izquierdo de esta expresión tenemos un sub-índice μ en ∂μ que en combinación con el


super-índice μ en Tμ activa a la convención de sumación al estar repetido el mismo índice, lo
cual elimina dicho índice al llevarse a cabo la sumación implícita. El super-índice numérico 4 en
d4x no es tomado en cuenta para nada al llevarse a cabo el balanceo de índices puesto que no es
un índice libre ni es un índice monigote. Y en el lado derecho tenemos nuevamente como super-
índice a μ que en Tμ activa a la convención de sumación al estar repetido el mismo índice en dS μ,
eliminando también a dicho índice en el lado derecho de la expresión. La ecuación, en lo que
respecta al balanceo de índices, es correcta. Se agregará aquí que ∂ μ se interpreta como ∂/∂xμ
y que d4x se interpreta como el producto cuádruple de elementos diferenciales en las cuatro
coordenadas generalizadas, o sea como (dx1)(dx2)(dx3)(dx4), mientras que la ecuación es la
expresión tensorial del conocido teorema de Gauss generalizado del espacio tridimensional al 4-
espacio.