You are on page 1of 10

II

Lo normal y lo extraordinario
Toda persona normal es, de hecho, solo normal en promedio
Sigmund Freud1
Qu significa ser normal? Tiene sentido decir que alguien con sndrome de Down no
tiene inteligencia normal, o que los gays no son normales, o que un dgito es una
inflacin normal o que se puede ser un suegro normal como dijo el Kun Agero de
Diego Maradona? El uso cotidiano de la palabra normal persona normal,
comportamiento normal, altura normal tiene un origen ligado a las estadsticas y al azar
2
y a un cambio de pensamiento social que ocurre a principios del siglo diecinueve. Por
esos aos se produce una avalancha de registros estadsticos, sobre todo con propsitos
impositivos y militares. Lo interesante es que estos datos revelaban ciertas regularidades
dentro de lo que se supona meramente azaroso, como si hubiera un orden escondido
dentro del azar. De eso se trata este captulo.

Soldados escoseses y astronoma


En un libro publicado en 1846, el matemtico belga Adolphe Quetelet muestra que los
datos de crmenes en distintas zonas de Blgica, Francia y Holanda tenan un asombroso
patrn de regularidad. Uno de los registros llamativos es de la corte francesa, entre 1825
y 1830: el nmero anual de acusados estaba siempre alrededor de 7.100 y el nmero de
condenados alrededor de 4.400. Algo as como que haba una probabilidad del 62% de
que un acusado fuera condenado.3
Otro de los datos famosos de Quetelet es la lista, tomada de una revista mdica4, de
permetros de pecho de 5.378 soldados escoceses. Quetelet los cont y encontr que al
graficar los datos apareca algo como lo de la figura de la izquierda:

En Analysis Terminable and Interminable Yale Univ. Press, 1987, p.22.

Y a una tentacin frecuente de tomar ideas matemticas que se aplican con precisin en cierta regin del
conocimiento y exportarlas hacia territorios de incierta aplicabilidad. La tentacin se origina en el hecho
de que la descripcin matemtica de las probabilidades permite descifrar regularidades dentro del azar, ver
orden dentro de lo que a primera vista percibimos como catico.

Adolphe Quetelet, Sur lhomme et le dveloppement de ses facults, ou Essai de physique sociale. Paris,
1835, vol. 2. pg 29. Notar que el libro dice Ensayo de fsica social!

Satement of the sizes of Men in different countries of Scotland, taken from the Local Militia Edinburgh
medical and surgical journal, Volumen 13, pgina 260 (1817). Disponible gratis en google Books.

Lo que el grfico representa es el nmero de soldados que tienen un cierto permetro de


pecho (redondeado a un nmero entero de pulgadas). Por ejemplo, slo 3 soldados tenan
33 pulgadas de permetro, pero haba 1073 soldados con 39 y 658 soldados con 42. Ahora
bien Por qu es tan famoso este resultado? Porque este tipo de curvas ya haban
aparecido en las teoras matemticas del azar y en mediciones astronmicas. Pero esta era
la primera vez que aparecan en datos humanos.
En 1818, el astrnomo Frederick Bessel, que tena los instrumentos de medicin ms
precisos de la poca public Fundamenta Astronomiae, un libro con un montn de datos
de posiciones de estrellas en el cielo. Ahora bien, cada vez que uno apunta el telescopio
al cielo para medir la posicin de una determinada estrella mide un ngulo ligeramente
distinto a los anteriores, del mismo modo que cada vez que uno se mide el permetro de
pecho puede obtener un dato distinto a los anteriores. La diferencia entre los distintos
resultados es el error de medicin: a veces el telescopio est inclinado un poquito para
aqu, otras un poquito para all, a veces la Tierra misma est ubicada un poquito para
aqu y otro para all. Lo que Bessel hizo es medir muchas veces la posicin misma
estrella y obtuvo los datos que muestro el grfico de la derecha de la figura de arriba. La
curva indica, por ejemplo que 114 mediciones dan alrededor del promedio del ngulo,
pero 53 mediciones difieren entre 0.2 y 0.3 grados del promedio5.
Lo llamativo de los dos resultados es que las dos curvas no slo tienen la misma forma
acampanada sino que tambin son muy parecidas a una curva que ya haba aparecido en
el tratamiento matemtico de los errores azarosos de medicin.
5

Agradezco a Sthephen Stiegler, de la Universidad de Chicago, autor de The History of Statistics, The
Measurement of Uncertainty before 1900 (Harvard University Press, 1986), por referirme a la tabla de los
datos de Bessel, y a los empleados de la seccin Special Collections de la biblioteca de la Universidad de
Michigan por dejarme fotocopiar las pginas de Fundamenta Astronomiae donde estn los datos. Si miran
con cuidado la curva de Bessel (la de la derecha) van a ver que es ms simtrica que la de Quetelet.
Lamentablemente Bessel nos da los datos de las desviaciones absolutas, esto es, el promedio de las
desviaciones hacia ambos lados del promedio. Grafiqu la curva completa para mejor ilustracin.

No existe un instrumento infinitamente preciso; todo aparato de medicin tiene un error


y cada vez que medimos obtenemos un resultado distinto. La magia del tratamiento
matemtico de los errores es poder aproximarnos, a partir de muchas mediciones, al valor
real de lo que queremos medir. En el caso de Bessel es la posicin de su estrella. Pero
mientras Bessel mide muchas veces la misma estrella, Quetelet muestra datos de distintos
soldados, ah no hay un valor real de permetro de pecho. Y sin embargo las curvas son
idnticas. La nica diferencia es que en cada caso la campana podra estar ms o menos
estirada en la direccin horizontal: una campana ms o menos panzona6.
Quetelet argumenta que medir el permetro de pecho de muchos soldados sera como
medir muchas veces el permetro de pecho de un mismo soldado, el soldado normal.
Digamos que mido con una cinta milimetrada el permetro de mi pecho, y repito la misma
medicin muchas veces (no miles, claro). Las mediciones van a dar resultados distintos:
en cada medicin la inclinacin de la cinta es distinta, la presin que hago con la cinta
sobre el pecho es tambin distinta etc. Pero la distribucin de los resultados (y los invito a
que hagan el experimento para verificarlo o refutarlo) va a ser parecida a la de los miles
de soldados: pocos resultados van a indicar un permetro grande o un permetro muy
chico y muchos resultados van a dar un permetro alrededor del permetro real. Ms an,
la forma acampanada de la curva es la misma. Por qu es as? Quetelet da un salto
conceptual cuestionable y propone que la razn es que la naturaleza apunta a una especie
de hombre promedio y que los que estn en los extremos de la campana son
desviaciones azarosas de un cierto ideal. Lo de Quetelet es una novedad filosfica ya
que en lugar de poner el ideal humano en el extremo de lo improbable (los ms cultos son
los menos frecuentes, por ejemplo) lo pone en el medio, donde est el grueso de la
poblacin. Pero las ideas de Quetelet son cuestionables. No hay una razn clara, o
claramente demostrable de que ciertos atributos sigan la distribucin acampanada que
luego se llamara distribucin normal. Ms an, hay otras distribuciones posibles que
bien pueden aparecer en grupos de personas y que sera errneo llamarlas anormales.7
Sin embargo el trmino hombre promedio cautiv la imaginacin popular en 1825 con
una intensidad que persiste hoy.
Propongo entonces algunos experimentos caseros que conducen la famosa distribucin
normal.
Monedas al aire
Tiro una moneda cuatro veces y cuento cuntas caras salieron. En cada tiro hay varios
resultados posibles, que van desde cuatro caras a cuatro cruces, pasando por las
posibilidades intermedias. En notacin tucumana llamemos C a cara y S a cruz (en

Pero si dibujramos una de estas campanas en una tela elstica estirable (o comprimible) en toda
direccin, podramos obtener cualquier otra campana estirando o comprimiendo el dibujo.
7

But it helped create a climate of public awareness of distribution that was to lead to a truly major advance
in statistical methods over the period 1869 to 1925 (Stigler. Op cit, p.219)

Tucumn se dice sello y no cruz) y dibujemos un rbol de posibilidades que muestra


que para cuatro tiros hay 16 resultados posibles:

Ahora invento el siguiente juego: asigno el nmero +1 a cada cara que sale -1 a cada
cruz y luego sumo los nmeros que resultan de cada tiro. Los resultados posibles de la
suma son +4 (si sale CCCC) -4 (si sale SSSS), +2, -2 y 0. Los valores extremos (+4 y 4) son menos probables que los otros ya que cada uno corresponde a una sola de las
posibles secuencias de monedas. En cambio hay cuatro secuencias que dan +2 y -2 y
ocho secuencias que dan 0. Como cada secuencia tiene la misma probabilidad (uno en
16) podemos contabilizar fcilmente la probabilidad de que salga cada una de las sumas
que van de -4 a 4. Y si graficamos el resultado obtenemos el siguiente grfico, una
especie de embrin de la curva acampanada de Gauss, Quetelet y Bessel:

Si tirramos ms monedas el nmero de resultados posibles de la suma va a aumentar y la


curva va aproximndose a la famosa distribucin normal. Por ejemplo, para 18 tiros el
resultado es algo as:

Este experimento muestra que si todas las causas son homogneas, entonces esperamos
una distribucin normal. El Queteletismo es pensar que esa homogeneidad ocurre en
fenmenos sociales y exagerar el protagonismo de la distribucin normal.

La altura de los hijos de Yao Ming y de Diego Buonanotte


Pregunta: los hijos de Yao van a ser ms altos que Yao? Y los hijos de Buonanotte,
van a ser ms bajos que Buonanotte? El primero en hacerse este tipo de preguntas con el
rigor de la estadstica es Francis , una especie de sucesor de Quetelet en lo que respecta a
la aplicacin del azar en las ciencias sociales y en la vida cotidiana. A Galton le
interesaba la herencia y, en particular, el carcter hereditario del talento. Por qu se
preguntaba Galton- los hijos de los genios tienden a ser menos genios que sus padres? Si
bien la genialidad no es muy cuantificable, es cierto que la historia registra familias
enteras de talentos matemticos (como los Bernoullis) o musicales (como los Bachs) y es
incuestionable que dentro de esas familias hay casos individuales que no vuelven a
repetirse, como Jacobo Bernoulli o el gran Juan Sebastin. Pero para hacer la cosa ms
cuantificable, Galton se concentr en la relacin entre la estatura de los hijos y la de sus
padres. Y encontr una interesante regularidad estadstica: los hijos de padres muy altos
tienden a ser ms bajos que sus padres. Y los hijos de padres muy bajos tienden a ser ms
altos que sus padres. La pregunta ahora es Por qu? Por un lado estn las complejidades
de la gentica y el hecho ms o menos obvio de que los hijos de padres altos van a ser
altos y los de padres bajos van a ser bajos. Al menos en general. Pero el punto aqu no es
ese, sino el hecho de que los hijos de los muy altos van a ser en promedio mas bajos que
sus padres. Y al revs con los muy bajos. Y esto no tiene nada que ver con las causas
genticas en s mismas, sino con un crudo efecto estadstico que da lugar a muchos
malentendidos, y que lleva a atribuir la relaciones de causa y efecto donde solo hay un
mudo balance probabilstico.
Para ilustrar esta especie de espejismo lgico (llamado tcnicamente regreso al
promedio o regresin a la media) volvamos al experimento de las monedas al aire.
Digamos que tiro 4 monedas muchas veces y voy anotando los resultados de la suma de
cada tiro en una lista. Como ejemplo muestro una serie que gener con mi computadora:
0,0,-2,-2,2,0,-2,-2,4,-2,4,2,0,0,2,2,0,-2,-2,-2,2,0,2,0,0,0,0,-2,-2,0,0,2,-2,0,2,4,2,0,2

Pocos casos tienen +4 y -4 ya que CCCC y SSSS son tiros improbables. La mayora de
las sumas van a ser 0. Ahora miro la lista y busco un lugar donde sali el +4. Lo mas
probable es que el nmero siguiente (y el anterior!) sean menores que +4. Por qu?
Simplemente porque, en un tiro arbitrario, es muy probable que salga un nmero menor
que el mximo. Y lo mismo si me concentro en el -4: es muy probable que tanto el
nmero siguiente como el anterior sean mayores que -4 y cercanos al promedio. La
confusin frecuente es que hay una relacin causal entre los dos eventos de este tipo
cuando, en realidad, el as llamado regreso al promedio se da en eventos independientes,
que no tienen relacin entre s. Claro que no todos los casos son tan transparentes como
el tiro de las monedas y muchas veces hay que pensar la situacin con cuidado. Y de ah
viene la confusin. Por ejemplo digamos que Fortunata estudia en una universidad en la
que clasifican los exmenes con puntajes de 1 a 100. Fortunata es muy buena estudiante
y siempre saca puntajes altos, casi nunca debajo de 95. Su promedio es 97.5. Un da le
agarr un mareo horrible y se sac un 89. Lo ms probable es que en el examen siguiente
saque una nota mayor que 89. Y si otro da se saca un 100, lo ms probable es que en el
5

examen siguiente se saque un puntaje menor. Por un lado esta la multitud de razones que
determinan la nota (dificultad de la materia, estado de nimo de Fortunata el da del
examen etc.). Por otro la simple regularidad estadstica: en un examen arbitrario lo ms
probable es que Fortunata saque algo cercano a su promedio. Y si en el examen anterior
sac 100 lo ms probable es que en el examen de hoy saque un puntaje ms bajo.
Uno de los ejemplos famosos de falsa atribucin causal que en realidad tienen su origen
en el regreso al promedio es el gafe de Sports Illustrated8: se dice que es mala suerte
para un deportista salir en la tapa de la revista porque despus su rendimiento baja. Y es
cierto, en promedio su rendimiento baja, pero no porque el deportista sali en la tapa. La
lgica es al revs: sali en la tapa porque tuvo un rendimiento excelente, mejor que su
promedio y por es atrajo el inters periodstico. Lo ms probable es que su rendimiento
posterior sea menor, haya o no haya salido en la tapa de la revista. Otro interesante es
citado por Daniel Kahneman, ganador del premio Nobel de economa en 20029: un
instructor de cadetes aeronuticos argumenta que, cmo mtodo de entrenamiento, no es
efectivo alentar al que hizo bien una acrobacia. En cambio, dice el instructor, es ms
eficaz gritarle y amonestar al que hizo una mala maniobra. Su evidencia: prob elogiando
a cadetes despus una muy buena maniobra y cuando la repiten no les sale tan bien. Pero
cuando le grita a cadetes que hicieron una mala maniobra, en la siguiente tiende a salirles
mejor. Por lo tanto, segn el instructor, conviene gritarles. Y de este razonamiento
errneo, Kahneman comenta con lucidez: Como tendemos a recompensar a los que les
va bien y a castigar a los que les va mal, y como hay regresin al promedio, parte de la
condicin humana es que estamos, estadsticamente, castigados por recompensar a los
otros y recompensados por castigarlos.
En su anlisis de la regresin, Galton hace uno de los grandes experimentos mentales
de la historia de la ciencia10. En realidad parte de su experimento es mental y parte es
real. La parte real y concreta es un aparato que que llam quincux11: un tablero con
palitos colocados de manera regular y unas bolitas que se tiran por arriba. Las bolitas
entran al tablero con direcciones variadas (por ms esmero que uno ponga hay una
aleatoriedad en la direccin de cada) y al caer van rebotando de forma azarosa en los
palitos. Luego son colectadas en la parte de abajo y la distribucin que resulta es
aproximadamente la campana de la distribucin normal. En la figura muestro el escaneo
del trabajo de Galton y un quincux casero hecho con alfileres gruesos, gomitas y
mostacillas que caen.

Sports Illustrated es una revista deportiva de circulacin masiva EEUU.


Autobiografa de Daniel Kahneman.
10
Sthephen M. Stiegler, Regression to the mean, historically considered, Statistical Methods in Medical
Research, 6, 103-114 (1997).
11
El nombre quincunx proviene de los sembrados regulares en los que un rbol est rodeado de cuatro
rboles, como los cinco puntos de la cara de un dado en el que sali el cinco. Ver Kunert, J., Montag, A.,
and Pohlmann, S. (2001). The quincunx: history and mathematics. Statistical Papers 42, 143-169. La figura
original de Galton est en Galton, Francis (1889): Natural Inheritance. Macmillan, London. Este libro est
disponible gratis en Gooble Books.
9

La curva que obtuve al tirar las mostacillas no es tan simtrica y homognea como la
terica ya que us un nmero reducido de mostacillas. Adems, los alfileres no estn
ubicados en perfecta simetra y mi quincux no estaba perfectamente nivelado con el piso.
Pero vale la pena el esfuerzo de fabricarse uno y ser testigo de cmo la campana de
Gauss emerge, aproximadamente, en este aparto mecnico. Sumado a esto, Galton le hace
decir ms cosas al quincux. Y aqu viene la parte mental (y sutil) del experimento. Galton
imagina un quinqux dividido en dos partes, con unas maderitas (en la parte A de la
figura) que interrumpen el paso de las bolitas hacia la parte B.

Si uno tira las bolitas igual que antes, es natural esperar que, en la parte A, las bolitas se
acomoden de acuerdo a una distribucin normal, o una campana menos panzona que la
que hubiera ido a la parte B en caso de no haber sido interrumpida. Ahora Dalton
propone sacar una sola de las maderitas de la parte A, digamos la que est marcada con
una flecha en la figura. Lo que va a pasar ahora es que las bolitas de esa columna van a
caer a la parte B formando a su vez una distribucin normal, pero que ahora no est

centrada en la mitad: as como lo que represento con la parte gris en la figura. Si


hubiramos sacado otra de las maderitas tambin tendramos una distribucin normal
similar, pero centrada en otra parte del sector B. Y si sacramos todas las maderitas
tendramos la distribucin normal original! Lo que Galton ilustra en este experimento
mental es que una suma de causas que no son del todo accidentales, tomadas en conjunto,
puede dar lugar a una distribucin normal. Cuando digo no del todo accidental me
refiero a que las bolitas que dan lugar a la parte gris estn hacia el costado derecho de B,
no estn distribuidas alrededor de la mitad. Estas bolitas representaran, por ejemplo, las
personas altas (o de gran permetro de pecho) de una poblacin. Y lo mismo con las
bajas. Y tomadas en conjunto, la distribucin de alturas y permetros es normal. Galton
con su quincux reconcilia la teora de errores segn la cual una acumulacin de
desviaciones accidentales de lugar a una distribucin normal con la herencia que, si bien
contiene desviaciones accidentales tambin tiene obvias correlaciones ya que tendemos a
parecernos a nuestros ancestros.
Las baguettes de Poincar y una pequea comedia de errores (normales)
En una nota de la revista Vogue de 1981, Garca Mrquez revela uno de sus secretos: si
usted escribe que ha visto volar un elefante, nadie lo creer; pero si afirma haber visto
volar cuatrocientos veinticinco, es probable que el pblico lo crea12. La verosimilitud,
parecera decirnos Gabo, est en lo especfico. Quiz ese sea el origen de la confusin en
historia que quiero contarles, y que empieza mientras recorra algunos libros recientes
sobre el azar. En uno de ellos13 se menciona una ancdota protagonizada por el
matemtico francs Henri Poincar. Segn la historia, Poincar compraba todas las
maanas una baguette que, segn el panadero, pesaba un kilo. Poincar las pesaba en su
casa y comprob que los panes en general pesaban menos. Y no se detuvo ah sino que
anot los pesos durante meses hasta comprobar que la distribucin de pesos de las
baguettes era normal pero el centro de la campana, en lugar de estar en un kilo estaba en
950 gramos: el panadero le estaba robando.

12
13

http://www.sololiteratura.com/ggm/marquezvogue.html
El excelente El andar del borracho de Leonard Mlodinov (Crtica, Barcelona, 2008). pp. 173-174.

Poincar se queja a las autoridades y de ah en adelante el panadero le entrega panes de


un kilo (o ms). Pero el matemtico no detiene su balanza y al calcular la nueva
distribucin de pesos de los panes encuentra que ya no es normal sino algo as:

Casi no hay panes ms livianos que un kilo mientras que algunos pesan ms. Conclusin:
el panadero sigue usando la misma receta, con pesos fraudulentos, pero le da a Poincar
los panes ms pesados, seleccionados del costado izquierdo de la distribucin. Poincar
vuelve a denunciar al panadero y las autoridades toman medidas.
La historia me pareci una aplicacin tan maravillosa de las regularidades estadsticas en
la vida cotidiana que quise leer el relato en su versin original, de la pluma del maestro.
Proced como de costumbre: busqu la referencia en los libros y me di con que no
convergan a la fuente sino a otro libro14. Mand un email al autor consultndole. Me
contest de inmediato: como buen acadmico responsable conservaba una caja con
copias de las referencias citadas en su libro. Salvo la de Poincar. Se disculp con
detallada cortesa y record vagamente que a la ancdota la haba visto en una muestra
del museo de ciencias Boston. Mand un mail al museo y me contestaron que en la
muestra titulada Mathematica tenan material sobre la distribucin normal y algunas
citas de Poincar, pero nada sobre ambos. Sorprendido, llam por telfono y conversando
con la curadora Alana Parkes aclaramos la confusin. En efecto haba una muestra en
exhibicin llamada El extrao caso de los panes anormales15, una historieta de veinte
cuadros que transcurre en Alemania cuando, despus de la guerra (no dice cul) se
racionaba el pan. Cada porcin deba pesar 1Kg, pero un profesor de matemticas
descubre el problema y se queja ante Herr panadero aduciendo un error en la balanza.
De ah en adelante la historia es la misma y concluye con el arresto del panadero. Es
probable que el relato sea inventado pero si bien un genrico profesor alemn es a un
elefante volador como Poincar es a cuatrocientos veinticinco Dumbos merece ser
verdadero.

14
15

What are the chances? de Bart K. Holland (John Hopkins University Press, 2002)
The strange case of the abnormal loaves

En el prximo captulo damos un paso ms dentro del jardn probabilstico y empiezo a


delinear la estructura matemtica del clculo de probabilidades. En algunos lugares hay
que ajustarse el cinturn y sacar papel y lpiz.

10

You might also like