You are on page 1of 28

Estadstica

De Wikipedia
La Estadstica es una gran rama de las matemticas que se utiliza para describir, analizar e
interpretar ciertas caractersticas de un conjunto de individuos llamado poblacin. La
Estadstica se divide en dos grandes ramas:

La Estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin,


visualizacin y resumen de datos originados a partir de los fenmenos en estudio.
La Estadstica inferencial, que se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin.

Tabla de contenidos

1 El razonamiento estadstico
2 Definiciones bsicas
3 Ramas
4 Tipos
o 4.1 Importantes contribuidores a la estadstica
5 Vase tambin
6 Bibliografa

El razonamiento estadstico
Todo problema estadstico opera del modo siguiente:

Se plantea un problema en estudio.


Se realiza un muestreo consistente en la recoleccin de datos referentes al fenmeno o
variable que deseamos estudiar.
Se propone un modelo de probabilidad, cuyos parmetros se estiman mediante
estadsticos a partir de los datos de muestreo. Sin embargo se mantiene lo que se
denominan hiptesis sostenidas (que no son sometidas a comprobacin)
Se valida el modelo comparndolo con lo que sucede en la realidad. Se utiliza mtodos
estadsticos conocidos como test de hiptesis y prueba de significacin
Se utiliza el modelo validado para tomar decisiones o predecir acontecimientos
futuros.
Probabilidad
Axiomas de probabilidad
Distribucin de probabilidad
Funcin de probabilidad
Funcin caracterstica
Inferencia bayesiana

Definiciones bsicas

Poblacin: Conjunto de todos los elementos incluidos en cierto estudio estadstico.

Muestra: Subconjunto de la poblacin.

Elemento: Unidad mnima de la que se compone la poblacin.

Ramas
Se distinguen bsicamente dos ramas en la estadstica:

Estadstica clsica
Estadstica bayesiana

La diferencia bsica consiste en que la estadstica clsica utiliza solamente la informacin


provista por la muestra, mientras que la estadstica bayesiana permite utilizar adicionalmente
el conocimiento subjetivo que se tenga.

Tipos
En funcin del rea a la cual se enfoque, se puede considerar:

Estadstica poltica
Estadstica industrial
Estadstica social
Econometra
Bioestadstica
Fsica estadstica
Estadstica cuntica

Estadstica descriptiva
La Estadstica descriptiva es una parte de la Estadstica que se dedica a analizar y
representar los datos. Este anlisis es muy bsico, pero fundamental en todo estudio. Aunque
hay tendencia a generalizar a toda la poblacin las primeras conclusiones obtenidas tras un
anlisis descriptivo, su poder inferencial es mnimo y debera evitarse tal proceder. Otras
ramas de la Estadstica se centran en el contraste de hiptesis y su generalizacin a la
poblacin.
Algunas de las tcnicas empleadas en este primer anlisis de los datos se enumeran ms abajo
en el listado de conceptos bsicos. Bsicamente, se lleva a cabo un estudio calculando una
serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o
dispersan en torno a un valor central.

Tabla de contenidos

1 Metodologa
2 Tabla de representacin de los datos
3 Lista de conceptos bsicos
4 Vase tambin
5 Bibliografa

Metodologa
1.
2.
3.
4.
5.
6.
7.

Seleccin y determinacin de la muestra.


Obtencin de los datos.
Clasificacin y organizacin de los datos.
Anlisis descriptivo de los datos.
Representacin grfica de los datos.
Contraste de hiptesis, si procede.
Conclusiones.

Tabla de representacin de los datos


tpica :

Variable caracterstica o suceso en la primera columna y sus frecuencias y


porcentajes y acumulativas en las sucesivas columnas.

Representacin grfica: en los ejes de coordenadas : eje vertical para la VARIABLE


y eje horizontal para frecuencias.

Todos estos elementos no son opcionales. Las VARIABLES o CARACTERISTICAS o


SUCESOS, con sus correspondientes valores estas siempre presentes, aunque puedes
expresarse como intervalos, tiempos, escalas, etc.
Ejemplos de este tipo de anlisis descriptivo pueden encontrarse en la prensa diaria, en la
parte de informacin econmico-social :
Series de tiempo, grfica de barras, ndices de precios, resultados de una encuesta y ms
elaborado, para ms de una variable, en pirmide de edades, comparativas, etc.
Un ejemplo de Estadstica descriptiva con un esbozo de prediccin o pronstico en
Wikipedia : ver Parla. Otros ejemplos : ndice de precios de consumo, Resultados deportivos,
Accidentes laborales y en general hechos cuantificados en valores absolutos (tal cual), en
porcentajes (%) o en ndices (con un periodo base inicial = 100).

Lista de conceptos bsicos


La siguiente lista recopila unos conceptos bsicos con los que, todo aquel que se pretenda
iniciar en las tcnicas Estadsticas, debera estar familiarizado. Un listado ms amplio puede
obtenerse en Wikipedia http://es.wikipedia.org/wiki/Categora:Estadstica.

anlisis de series temporales -censo -combinatoria --

desviacin estndar -diseo experimental -Distribucin binomial -distribucin normal -distribucin t -encuestas -error estadstico -estadstica inferencial -estadstico -parmetro -grados de libertad -histograma -media -mediana -moda -muestreo -muestra -poblacin
probabilidad -Prueba de chi-cuadrado -regresin estadstica -tabla de frecuencias -variable aleatoria -variable estadstica -varianza

Vase tambin

Teorema de rango de medias.

Estadstica inferencial
La inferencia estadstica es una parte de la Estadstica que comprende los mtodos y
procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de una
pequea parte de la misma (muestra).
La bondad de estas deducciones se mide en trminos probabilsticos, es decir, toda inferencia
se acompaa de su probabilidad de acierto.
La estadstica inferencial comprende:

La Teora de muestras.
La estimacin de parmetros.
El Contraste de hiptesis.
El Diseo experimental.
La Inferencia bayesiana.

Tabla de contenidos

1 Mtodo
o 1.1 Planteamiento del problema
o 1.2 Elaboracin de un modelo
o 1.3 Extraccin de la muestra
o 1.4 Tratamiento de los datos
o 1.5 Estimacin de los parmetros
o 1.6 Contraste de hiptesis
o 1.7 Conclusiones
2 Vase tambin

Mtodo
Un estudio estadstico comprende los siguientes pasos:

Planteamiento del problema


Suele iniciarse con una fijacin de objetivos o algunas preguntas como cul ser la media de
esta poblacin respecto a tal caracterstica?, se parecen estas dos poblaciones?, hay alguna
relacin entre...?
En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las
variables, etc.
Se analizan tambin en este punto los medios de los que se dispone y el procedimiento a
seguir.

Elaboracin de un modelo
Se establece un modelo terico de comportamiento de la variable de estudio. En ocasiones no
es posible disear el modelo hasta realizar un estudio previo.
Los posibles modelos son distribuciones de probabilidad.

Extraccin de la muestra
Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una
pequea parte de la poblacin.

Tratamiento de los datos


En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se
calculan los valores que sern necesarios en pasos posteriores, como la media muestral, la
varianza muestral, proporciones, etc.
Los mtodos de esta etapa estn definidos por la estadstica descriptiva.

Estimacin de los parmetros


Con determinadas tcnicas se realiza una prediccin sobre cules podran ser los parmetros
de la poblacin.

Contraste de hiptesis
Son tcnicas que permiten simplificar el modelo.

Conclusiones
Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden
servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cclico que
permite conocer cada vez mejor la poblacin y caractersticas de estudio.
Obtenido de "http://es.wikipedia.org/wiki/Estad%C3%ADstica_inferencial"

Muestreo

En estadstica existe la nocin de muestreo en una poblacin.

Muestreo: Es el conjunto de tecnicas que nos permite seleccionar muestras


En msica existe la nocin de muestreo sampleo, que consiste en la insercin de un

fragmento sonoro previamente grabado en una nueva composicin musical.


En telecomunicaciones y procesamiento digital de seales, el muestreo es uno de los
pasos para digitalizar una seal analgica, el otro es la codificacin.

Teora de probabilidad
La teora de probabilidad es una teora muy intrincada y desarrollada para describir los
sucesos aleatorios. Las figuras prominentes incluyen matemticos rusos como A. N.
Kolmogorov. Se puede ver la teora de probabilidad de dos puntos de vista: la sin teora de
medidas, o la con teora de medidas. El primer punto de vista es lo que se ensea primero, y
entonces se introduce la teora de medidas. En este artculo se resean los conceptos bsicos
de la probabilidad.

Tabla de contenidos

1 Definicin Clsica
2 Definicin segn la Frecuencia Relativa y Definicin Aximatica
3 Probabilidad Discreta
4 Probabilidad Continua
o 4.1 Funcin de Densidad
5 Probabilidad condicional
6 Combinatoria
o 6.1 Combinaciones
o 6.2 Permutaciones
7 Bibliografa
8 Vase tambin

Definicin Clsica

La probabilidad es la caracterstica de un suceso del que existen razones para creer que se
realizar. Los sucesos tienden a ser una frecuencia relativa del nmero de veces que se realiza
el experimento.
La probabilidad p de aparicin de un suceso S de un total de n casos posibles igualmente
factibles es la razn entre el nmero de ocurrencias h de dicho suceso y el nmero total de
casos posibles n.
p = P{S} = h / n
La probabilidad es un nmero (valor) entre 0 y 1. Cuando el suceso es imposible se dice que
su probabilidad es 0 y se dice que es un suceso cierto cuando siempre tiene que ocurrir y su
probabilidad es 1. La probabilidad de no ocurrencia de un evento est dada por q donde:
q = P{noS} = 1 (h / n)
Simblicamente el espacio de resultados, que normalmente se denota por , es el espacio
que consiste en todos los resultados que son posibles. Los resultados, que se denota por
1,2, etctera, son elementos del espacio .

Definicin segn la Frecuencia Relativa y Definicin


Aximatica
Segn Spiegel (1) la definicin clsica de la probabilidad se define en base a s misma
(igualmente factible es sinnimo de igualmente probable) se define la probabilidad estimada o
emprica basada en la frecuencia relativa de aparicin de un suceso S cuando es muy
grande. La probabilidad de un suceso es una medida que se escribe como
,
y mide con qu frecuencia ocurre algn suceso si se hace algn experimento indefinidamente.
La definicin anterior es complicada de representar matemticamente ya que debiera ser
infinito. Otra manera de definir la probabilidad es de forma axiomtica esto estableciendo las
relaciones o propiedades que existen entre los conceptos y operaciones que la componen. La
probabilidad tiene muchas propiedades importantes, que se muestra en la pgina Axiomas de
probabilidad.

Probabilidad Discreta
Discreta porque la variable slo puede tomar valores enteros y un nmero finito de ellos. Si
una variable X puede tomar una serie de valores discretos X1, X2,...Xk con probabilidades
respectivas p1, p2,...pk, donde p1+p2+...pk=1, se dice que ha sido definida para X una
distribucin de probabilidad discreta.

Probabilidad Continua
Una variable aleatoria es una funcin

que da un valor numrico a cada suceso en .

Funcin de Densidad
La funcin de densidad, o densidad de probabilidad de una variable aleatoria, es una funcin a
partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el
caso de variables aleatorias continuas es la distribucin de probabilidad. En el caso de
variables aleatorias discretas la distribucin de probabilidad se obtiene a travs del sumatorio
de la funcin de densidad.

Probabilidad condicional
Se llama probabilidad condicional a la probabilidad de que un suceso se cumpla habindose
cumplido ya otro. Se nota "probabilidad de A sabiendo que B se ha cumplido" de la siguiente
manera:
pB(A) p(A\B)
Dicha probabilidad se calcular de la siguiente forma:

Combinatoria
La teora combinatoria se aplica de diversas maneras al clculo de probabilidades.

Combinaciones
Permutaciones

Parmetro

En Estadstica, se llama parmetro a un valor representativo de una poblacin, como la


media aritmtica, una proporcin o su desviacin tpica.
En Ciencias de la computacin, un parmetro (Ciencias de la computacin) es una
variable que puede ser recibida por una subrutina.

Hiptesis
El trmino Hiptesis tiene varios usos, aunque el significado sea el mismo: "Afirmacin de la
que se parte".

Hiptesis (Lgica y Matemtica)


Hiptesis (mtodo cientfico)

Prueba de significacin

En estadstica una prueba de significacin es un clculo de probabilidades dentro de los


lmites de confianza dados, de que un valor o una idea no probada sean ciertas respecto a una
o ms poblaciones estadsticas, o que por lo contrario, sean debidas al azar.

Unas pruebas estadsticas

Prueba de Kolmogorov-Smirnov
Prueba de Chi-cuadrado (Prueba de )
t-test (t de Student)

Axiomas de probabilidad
En la teora de probabilidad matemtica se define la probabilidad con los tres axiomas de
Kolmogorov.

Tabla de contenidos

1 Axiomas de Kolmogorov
o 1.1 Primer axioma
o 1.2 Segundo axioma
o 1.3 Tercer axioma

Axiomas de Kolmogorov
Primer axioma
La probabilidad de un suceso A es un nmero real entre 0 y 1.
.

Segundo axioma
Un suceso de la muestra de todos los sucesos o espacio de sucesos
1.

ocurre con probabilidad

.
la probabilidad del espacio muestral es igual a 1: p(S)=1

Tercer axioma
Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de
interseccin vaca dos a dos),
entonces:

Distribucin de probabilidad
En estadstica la distribucin de probabilidad F(x) es una funcin de la probabilidad que
representa los resultados que se van obteniendo en un experimento aleatorio.
Para un nmero dado x, la probabilidad

es:

A F(x) se le denomina funcin de distribucin de probabilidad de la variable X y representa la


probabilidad de que la variable tome el valor desde
hasta x.
Tambin se puede definir como la acumulada de la funcin de densidad de probabilidad, esta
ltima ms comnmente conocida como funcin de densidad
Para dos nmeros reales cualesquiera a y b tal que (a < b), los sucesos

sern mutuamente excluyentes y su suma es el suceso


tenemos entonces que:

por lo que

y finalmente

Por lo tanto una vez conocida la funcin de distribucin F(x) para todos los valores de la
variable aleatoria x conoceremos completamente la distribucin de probabilidad de la
variable.
Como la probabilidad es siempre un nmero positivo, la funcin de distribucin ser una
funcin no decreciente que cumple lo siguiente:

Es decir la probabilidad de todo el espacio muestral es 1 tal y como establece la teora de la


probabilidad y por otra parte:

Es decir la probabilidad del suceso nulo es cero.


Para realizar clculos es ms cmodo conocer las distribucin de probabilidad, para ver una
representacin grfica de la probabilidad es ms prctico el uso de la funcin de densidad.

Tabla de contenidos

1 Distribuciones de variable discreta


o 1.1 Distribuciones de variable discreta ms importantes
2 Distribuciones de variable continua
o 2.1 Distribuciones de variable continua ms importantes
3 Bibliografa

Distribuciones de variable discreta

Distribucin binomial.
Se denomina variable discreta a aquella que slo puede tomar unos determinados valores, el
conjunto de valores que toma X es finito o numerable. En este caso la distribucin de
probabilidad es el sumatorio de la funcin de densidad, por lo que tenemos entonces que:

Y, tal como corresponde a la definicin de distribucin de probabilidad, esta expresin


representa la suma de todas las probabilidades desde
hasta el valor xi.
Una pequea aclaracin: segn muchos autores, en las variables discretas no se denomina
"funcin de densidad" sino "funcin de probabilidad", y se nota PX(x) en vez de fX(x).

Distribuciones de variable discreta ms importantes


Las distribuciones de variable discreta ms importantes son las siguientes:

Distribucin uniforme
Distribucin binomial
Distribucin binomial negativa
Distribucin Poisson
Distribucin geomtrica
Distribucin hipergeomtrica
Distribucin zeta

Distribuciones de variable continua

Distribucin normal.
Se denomina variable continua a aquella que puede tomar cualquiera de los infinitos valores
existentes dentro de un intervalo finito. En el caso de variable continua la distribucin de
probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Distribuciones de variable continua ms importantes


Las distribuciones de variable continua ms importantes son las siguientes:

Distribucin uniforme
Distribucin normal (gaussiana)
Distribucin gamma
Distribucin exponencial
Distribucin Pareto
Distribucin Chi-cuadrado
Distribucin t de Student
Distribucin Laplace
Distribucin beta
Distribucin de Cauchy
Distribucin F de Snedecor

Axiomas de probabilidad
En la teora de probabilidad matemtica se define la probabilidad con los tres axiomas de
Kolmogorov.

Tabla de contenidos

1 Axiomas de Kolmogorov
o 1.1 Primer axioma
o 1.2 Segundo axioma
o 1.3 Tercer axioma

Axiomas de Kolmogorov
Primer axioma

La probabilidad de un suceso A es un nmero real entre 0 y 1.


.

Segundo axioma
Un suceso de la muestra de todos los sucesos o espacio de sucesos
1.

ocurre con probabilidad

.
la probabilidad del espacio muestral es igual a 1: p(S)=1

Tercer axioma
Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de
interseccin vaca dos a dos),
entonces:

Distribucin de probabilidad
En estadstica la distribucin de probabilidad F(x) es una funcin de la probabilidad que
representa los resultados que se van obteniendo en un experimento aleatorio.
Para un nmero dado x, la probabilidad

es:

A F(x) se le denomina funcin de distribucin de probabilidad de la variable X y representa la


probabilidad de que la variable tome el valor desde
hasta x.
Tambin se puede definir como la acumulada de la funcin de densidad de probabilidad, esta
ltima ms comnmente conocida como funcin de densidad
Para dos nmeros reales cualesquiera a y b tal que (a < b), los sucesos

sern mutuamente excluyentes y su suma es el suceso


tenemos entonces que:

por lo que

y finalmente

Por lo tanto una vez conocida la funcin de distribucin F(x) para todos los valores de la
variable aleatoria x conoceremos completamente la distribucin de probabilidad de la
variable.
Como la probabilidad es siempre un nmero positivo, la funcin de distribucin ser una
funcin no decreciente que cumple lo siguiente:

Es decir la probabilidad de todo el espacio muestral es 1 tal y como establece la teora de la


probabilidad y por otra parte:

Es decir la probabilidad del suceso nulo es cero.


Para realizar clculos es ms cmodo conocer las distribucin de probabilidad, para ver una
representacin grfica de la probabilidad es ms prctico el uso de la funcin de densidad.

Tabla de contenidos

1 Distribuciones de variable discreta


o 1.1 Distribuciones de variable discreta ms importantes
2 Distribuciones de variable continua
o 2.1 Distribuciones de variable continua ms importantes
3 Bibliografa

Distribuciones de variable discreta

Distribucin binomial.
Se denomina variable discreta a aquella que slo puede tomar unos determinados valores, el
conjunto de valores que toma X es finito o numerable. En este caso la distribucin de
probabilidad es el sumatorio de la funcin de densidad, por lo que tenemos entonces que:

Y, tal como corresponde a la definicin de distribucin de probabilidad, esta expresin


representa la suma de todas las probabilidades desde
hasta el valor xi.
Una pequea aclaracin: segn muchos autores, en las variables discretas no se denomina
"funcin de densidad" sino "funcin de probabilidad", y se nota PX(x) en vez de fX(x).

Distribuciones de variable discreta ms importantes


Las distribuciones de variable discreta ms importantes son las siguientes:

Distribucin uniforme
Distribucin binomial
Distribucin binomial negativa
Distribucin Poisson
Distribucin geomtrica
Distribucin hipergeomtrica
Distribucin zeta

Distribuciones de variable continua

Distribucin normal.
Se denomina variable continua a aquella que puede tomar cualquiera de los infinitos valores
existentes dentro de un intervalo finito. En el caso de variable continua la distribucin de
probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Distribuciones de variable continua ms importantes


Las distribuciones de variable continua ms importantes son las siguientes:

Distribucin uniforme
Distribucin normal (gaussiana)
Distribucin gamma
Distribucin exponencial
Distribucin Pareto
Distribucin Chi-cuadrado
Distribucin t de Student
Distribucin Laplace
Distribucin beta

Distribucin de Cauchy
Distribucin F de Snedecor

Teorema de Bayes
El teorema de Bayes, descubierto por Thomas Bayes, en la teora de la probabilidad, es el
resultado que da la distribucin de probabilidad condicional de una variable aleatoria A dada
B en trminos de la distribucin de probabilidad condicional de la variable B dada A y la
distribucin de probabilidad marginal de slo A.
Sea A1, A2, ...,An un conjunto de sucesos incompatibles cuya unin es el total y tales que la
probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se
conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene
dada por la expresin:

donde:
P(Ai) son las probabilidades a priori.
P(B | Ai) es la probabilidad de B en la hiptesis Ai.
P(Ai | B) son las probabilidades a posteriori.
Esto se cumple
El teorema de Bayes es vlido en todas las aplicaciones de la teora de la probabilidad. Sin
embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los
seguidores de la estadstica tradicional slo admiten probabilidadades basadas en
experimentos repetibles y que tengan una confirmacin emprica mientras que los llamados
estadisticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces
para indicar como debemos modificar nuestras probabilidades subjetivas cuando recibimos
informacin adicional de un experimento. La estadstica bayesiana est demostrando su
utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y permitir
revisar esas estimaciones en funcin de la evidencia es lo que est abriendo nuevas formas de
hacer conocimiento.

Como observacin, se tiene

Temas relacionados

La paradoja de Raven
La falacia del fiscal
La navaja de Occam

y su demostracin resulta evidente.

Estadstica industrial
La estadstica industrial es la rama de la estadstica que busca implementar los procesos
probabilsticos y estadsticos de anlisis e interpretacin de datos o caractersticas de un
conjunto de elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y en
el control de los procesos industriales y organizacionales.
Pueden distinguirse tres partes:

el estudio de las series temporales y las tcnicas de previsin, y la descripcin de los


pasos necesarios para el establecimiento de un sistema de previsin operativo y
duradero en una empresa;
el anlisis multivariante, necesario para la extraccin de informacin de grandes
cantidades de datos, una de las necesidades ms apremiantes;
el control de calidad y la fiabilidad.

Econometra
La economa naci como ciencia social, tratando de explicar la distribucin de recursos
escasos entre distintos fines posibles.
Por una parte, los economistas han tratado de concebir modelos que explicaran el
comportamiento de sus semejantes en cuanto a la actividad econmica. Por otra parte, ha
habido un afn de tratar de corroborar esos modelos a travs de su cuantificacin matemtica.
En todo ello, los econmetras (economistas cuantitativos) han tratado de emular a las ciencias
matemticas y a las de la naturaleza (fsica, qumica) con mejor o peor resultado a travs del
tiempo. Hay que considerar que tratan con uno de los fenmenos ms complejos que
conocemos, el comportamiento de los humanos.
En la elaboracin de la econometra se unen las matemticas, y la estadstica junto con la
investigacin social y la teora econmica. De hecho este campo ha producido grandes ideas
matemticas y estadstica como la teora de juegos.
El mayor problema con el que se enfrentan los econmetras en su investigacin es la escasez
de datos y los grandes sesgos que habitualmente encuentran en los mismos. An as, su
trabajo contribuye a conocer al menos en parte algunos aspectos del comportamiento
econmico de la humanidad.

Tabla de contenidos

1 Definiciones de Econometra
2 Descripcin somera de la Econometra
3 El mtodo de mnimos cuadrados (Estimacin MCO)
4 Problemas del Mtodo de los Mnimos Cuadrados
5 Lecturas recomendadas
6 Vase tambin

Definiciones de Econometra

Entre las definiciones de econometra que los economistas relevantes han formulado a lo
largo de la historia, podemos destacar las siguientes:
Ragnar Frisch (1930): 'La experiencia ha mostrado que cada uno de estos tres puntos de vista,
el de la estadstica, la teora econmica y las matemticas, es necesario, pero por s mismo no
suficiente para una comprensin real de las relaciones cuantitativas de la vida econmica
moderna. Es la unin de los tres aspectos lo que constituye una herramienta de anlisis
potente. Es la unin lo que constituye la econometra"
Samuelson, Koopmans y Stone (1954): '... el anlisis cuantitativo de fenmenos econmicos
actuales, basado en el desarrollo congruente de teora y observaciones, y relacionado por
mtodos apropiados de inferencia.'
Valavanis (1959): 'El objetivo de la econometra es expresar las teoras econmicas bajo una
forma matemtica a fin de verificarlas por mtodos estadsticos y medir el impacto de una
variable sobre otra, as como predecir acontecimientos futuros y dar consejos de poltica
econmica ante resultados deseables.'
Klein (1962): 'El principal objetivo de la econometra es dar contenido emprico al
razonamiento a priori de la economa.'
Malinvaud (1966): '... aplicacin de las matemticas y mtodo estadstico al estudio de
fenmenos econmicos.'
Christ (1966): 'Produccin de declaraciones de economa cuantitativa que explican el
comportamiento de variables ya observadas, o predicen la conducta de variables an no
observadas.'
Intriligator (1978): 'Rama de la economa que se ocupa de la estimacin emprica de
relaciones econmicas.'
Chow (1983): 'Arte y ciencia de usar mtodos para la medida de relaciones econmicas.'

Descripcin somera de la Econometra


La econometra se ocupa de obtener, apartir del anlisis estadstico y matemtico (mas no de
la teora econmica, como si se usa en las ciencias naturales, ejem. la fsica) de los valores
reales de variables econmicas, los valores que tendran los parmetros de los modelos en los
que esas variables econmicas aparecieran, as como de comprobar el grado de validez de
esos modelos, y ver en qu medida estos modelos pueden usarse para explicar la economa
de un agente econmico (como una empresa o un consumidor), o la de un agregado de
agentes econmicos, como podra ser un sector del mercado, o una zona de un pas, o todo un
pas, o cualquier otra zona econmica; su evolucin en el tiempo (por ejemplo, decir si ha
habido o no cambio estructural), poder predecir futuros valores de la variables, y sugerir
medidas de poltica econmica conforme a objetivos deseados (por ejemplo, para poder
aplicar tcnicas de optimizacin matemtica para racionalizar el uso de recursos dentro de una
empresa, o bien para decidir qu valores debera adoptar la poltica fiscal de un gobierno para
conseguir ciertos niveles de recaudacin impositiva)
Usualmente se usan tcnicas estadsticas diversas para estudiar la economa, pero uno de los
mtodos ms usados es el que se mostrar aqu.

El mtodo de mnimos cuadrados (Estimacin MCO)


Tambin se conoce como Teora de la regresin lineal, y estar ms desarrollado en la parte
estadstica de la enciclopedia, no obstante, aqu daremos una vista general de en qu consiste
la aplicacin del mtodo de mnimos cuadrados.
Se parte de representar las relaciones entre una variable econmica endgena y una o ms
variables exgenas de forma lineal, de la siguiente manera: Y = a(1) + 1X1 + 2X2 + 3X3 + ...
+ nXn.
"Y" es la variable endgena, cuyo valor es determinado por las exgenas, X1 hasta Xn. Cuales
son las variables elegidas depende de la teora econmica que se tenga en mente, y tambin de
anlisis estadsticos y econmicos previos. El objetivo buscado sera obtener los valores de
los parmetros desde a1 hasta n. A menudo este modelo se suele completar aadiendo un
trmino ms a la suma, llamado trmino independiente, que es un parmetro ms a buscar.
As: Y = 0 + 1X1 + 2X2 + 3X3 + ... + nXn.
En el que 0 es una constante, que tambin hay que averiguar. A veces resulta til, por motivos
estadsticos, suponer que siempre hay una constante en el modelo, y contrastar la hiptesis de
si es distinta, o no, de cero para reescribirlo de acuerdo con ello.
Adems, se supone que esta relacin no es del todo determinista, esto es, existir siempre un
cierto grado de error aleatorio (en realidad, se entiendo que encubre a todas aquellas variables
y factores que no se hayan podido incluir en el modelo) que se suele representar aadiendo a
la suma una letra representa una variable aleatoria.
As: Y = 0 + 1X1 + 2X2 + 3X3 + ... + nXn +
Se suele suponer que es una variable aleatoria Normal, con Media cero y Varianza constante
en todas las muestras (aunque sea desconocida).
Se toma una muestra estadstica, que corresponda a observaciones de los valores que hayan
tomado esas variables en distintos momentos del tiempo (o, dependiendo del tipo de modelo,
los valores que hayan tomado en distintas reas o zonas o agentes econmicos a considerar).
Por ejemplo, en un determinado modelo podemos estar interesados en averiguar como la renta
ha dependido de los niveles de precios, de empleo y de tipos de inters a lo largo de los aos
en cierto pas, mientras que en otro podemos estar interesados en ver como, a lo largo de un
mismo ao, ha dependido la renta de distintos pases de esas mismas variables. Por lo que
tendramos que observar, en el primer caso, la renta, niveles de empleo, precios y tipos de
inters del ao 1, lo mismo, pero del ao 2, etctera, para obtener la muestra a lo lagro de
varios aos, mientras que en el segundo caso tendramos que tener en cuenta los valores de
cada uno de los pases para obtener la muestra. Cada una de esas observaciones para cada ao,
o pas, se llamara observacin muestral. Ntese que an se podra hacer un anlisis ms
ambicioso teniendo en cuenta pas y ao.
Una vez tomada la muestra, se aplica un mtodo, que tiene su justificacin matemtica y
estadstica, llamado mtodo de mnimos cuadrados. Este consiste en, bsicamente, minimizar
la suma de los errores (elevados al cuadrado) que se tendran, suponiendo distintos valores
posibles para los parmetros, al estimar los valores de la variable endgena a partir de los de
las variables exgenas en cada una de las observaciones muestrales, usando el modelo

propuesto, y comparar esos valores con los que realmente tom la variable endgena. Los
parmetros que lograran ese mnimo, el de las suma de los errores cuadrticos, se acepta que
son los que estamos buscando, de acuerdo con criterios estadsticos.
Tambin, este mtodo nos proporcionar informacin (en forma de ciertos valores estadsticos
adicionales, que se obtienen adems de los de los parmetros) para ver en qu medida los
valores de los parmetros que hemos obtenido resultan fiables, por ejemplo, para hacer
contrastes de hiptesis, esto es, ver si ciertas suposiciones que se haban hecho acerca del
modelo resultan, o no, ciertas. Se puede usar tambin esta informacin adicional para
comprobar si se pueden prescindir de algunas de esas variables, para ver si es posible que los
valores de los parmetros hayan cambiado con el tiempo (o si los valores de los parmetros
son diferentes en una zona econmica de los de otra, por ejemplo), o para ver en qu grado
son vlidas predicciones a cerca del futuro valor de la variable endgena si se supone que las
variables exgenas adoptarn nuevos valores.

Problemas del Mtodo de los Mnimos Cuadrados


El mtodo de Mnimos Cuadrados adolece de toda una serie de problemas, cuya solucin, en
muchas ocasiones aproximada, ha estado ocupando el trabajo de los investigadores en el
campo de la econometra.
De entrada, el mtodo presupone que la relacin entre las variables es lineal. Para los casos de
no linealidad se recurre, bien a mtodos para obtener una relacin lineal que sea equivalente,
bien a a aproximaciones lineales, o bien a mtodos de optimizacin que absorban la relacin
no lineal para obtener tambin unos valores de los parmetros que minimicen el error
cuadrtico.
Otro supuesto del modelo que no se ha precisado es que la variable aleatoria sea Normal. Esto
es importante de cara a los contrastes de hiptesis. No obstante, para muestras grandes se
supone que la variable se comportar aproximadamente como una normal, por el Teorema del
lmite central.
No obstante, el problema se complica considerablemente, sobre todo a la hora de hacer
contrastes de hiptesis, si se cree que la varianza de dicha variable aleatoria cambia con el
tiempo. Es el fenmeno conocido como Heterocedasticidad. Este fenmeno se puede detectar
con ciertas tcnicas estadsticas. Para resolverlo hay que usar mtodos que intenten estimar el
cambiante valor de la varianza y usar lo obtenido para corregir los valores de la muestra. Esto
nos llevara al mtodo conocido como Mnimos Cuadrados Generalizados. Una versin
ms complicada de este problema es cuando se supone que, adems, no solo cambia la
varianza del error sino que tambin los errores de distintos periodos estn correlacionados, lo
que se llama "Autocorrelacin". Tambin hay mtodos para detectar este problema y para
corregirlo en cierta medida modificando los valores de la muestra, que tambin son parte del
mtodo Mnimos Cuadrados Generalizados.
Otro problema que se da es el de la Multicolinealidad, que generalmente sucede cuando
alguna de las variables endgenas en realidad depende, tambin de forma estadstica, de otra
variable endgena del mismo modelo considerado, lo que introduce un sesgo en la
informacin aportada a la variable exgena y puede hacer que el mtodo de mnimos
cuadrados no se pueda aplicar correctamente. Generalmente la solucin suele ser averiguar
qu variables estn causando la multicolinealidad y reescribir el modelo de acuerdo con ello.

Tambin hay que tener en cuenta que en ciertos modelos puede haber relaciones dinmicas,
esto es, que una variable exgena dependa, adems, de los valores que ella misma y/u otras
variables tomaron en tiempos anteriores. Para resolver estos problemas se estudian lo que se
llama modelos de Series temporales.

Bioestadstica
La bioestadstica, de forma general, es la aplicacin de la estadstica a la biologa y de forma
ms frecuente a la medicina. Debido a que las cuestiones a investigar en biologa y medicina
son de naturaleza muy variada, la bioestadstica ha expandido sus dominios para incluir
cualquier modelo cuantitativo, no slo estadstico, que pueda ser usado para responder a estas
necesidades. La bioestadstica puede ser considerada como una rama, altamente especializada,
de la informtica mdica que puede ser, a su vez, complementada por la bioinformtica.
La aplicacin resulta hoy en da necesaria, en los campos:

salud pblica, que incluye: epidemiologa, nutricin, salud ambiental y en


investigacin de servicios sanitarios.
genmica y poblaciones genticas
medicina
ecologa
bioensayos

Fsica estadstica
La fsica estadstica es una de las ramas fundamentales de la fsica y emplea mtodos
estadsticos para resolver problemas fsicos. Puede describir numerosos campos con una
naturaleza estocstica (reacciones nucleares, sistemas biolgicos, qumicos, neurolgicos,
etc.).
La fsica estadstica emplea metodologa estadsticas y probabilsticas para explicar
situaciones donde la aplicacin de los mtodos usuales de la mecnica clsica y de la
mecnica cuntica seran muy complicados. Por ejemplo, cuando un sistema clsico consiste
en muchsimas partculas utilizar las ecuaciones de movimiento para cada una de ellas es una
tarea que en la prctica es imposible. Ah resulta beneficioso utilizar propiedades estadsticas
para describir el comportamiento de estas partculas y as poder obtener informacin relevante
del sistema. El caso ms simple de esta utilidad es el estudio de gases. En un gas, por ejemplo
de aire, existen 6.02x1023 partculas. Sin embargo, gracias a la estadstica es posible deducir
las leyes macroscpicas de estos gases, las cuales slo dependen de pocas variables (tales
como la presin, el volumen y la temperatura). Este enforque particular para estudiar el
comportamiento de los gases se llama teora cintica.

Campana de Gauss

Campana de Gauss.

Forma tridimensional.
En matemticas, la campana de Gauss es la representacin grfica de la ecuacin
matemtica que corresponde a una distribucin normal. Tiene forma de campana y debe su
nombre al matemtico alemn Carl Friedrich Gauss.

Aplicaciones
Cuando se realizan series de medidas experimentales, algunas de ellas son mayores que la
media y otras menores. Si se representa en el eje horizontal las medidas obtenidas y en el
vertical el nmero de veces que se obtiene cada valor, se obtiene lo que se llama un
histograma de frecuencias.
Si se elimina el error sistemtico, el conjunto de datos obtenido se distribuye de forma
simtrica alrededor de la media, dando una curva en forma de campana.
Muchas variables se distribuyen de esta forma (variables tanto de tipo morfolgico (p.e. la
altura de las personas en una poblacin) como fisiolgicas, sociolgicas, etc.
Constituye otra forma de expresar lo establecido en el Teorema central del lmite: variables
independientes que no siguen necesariamente una distribucin normal s lo hacen para
tamaos suficientemente grandes de la muestra.

Vase tambin

Estadstica
Distribucin normal
Teorema central del lmite
Curva de la baera

Simulacin

Simulacin del caos con ordenador.


Simulacin es la experimentacin con un modelo de una hiptesis de trabajo. La
experimentacin puede ser un trabajo de campo o de laboratorio. El modelo de mtodo usado
para la simulacin seria terico, conceptual o sistmico.
Despus de confirmar la hiptesis podemos ya disear un teorema. Finalmente si este es
admitido puede convertirse en una teora o en una ley.
El modelo terico debe contener los elementos que se precisen para la simulacin. Un
ejemplo con trabajo de laboratorio es un programa de estadstica con ordenador que genere
nmeros aleatorios y que contenga los estadsticos de la media y sus diferentes versiones :
cuadrtica- aritmtica-geomtrica-armnica. Adems debe ser capaz de determinar la
normalidad en trminos de probabilidad de las series generadas. La hiptesis de trabajo es que
la media y sus versiones tambin determinan la normalidad de las series. Es un trabajo
experimental de laboratorio. Si es cierta la hiptesis podemos establecer la secuencia teorema,
teora, ley.
El modelo conceptual desea establecer por un cuestionario y con trabajo de campo, la
importancia de la discriminacin o rechazo en una colectividad y hacerlo por medio de un
cuestionario en forma de una simulacin con una escala de actitud. Despus de ver si la
poblacin es representativa o adecuada, ahora la simulacin es la aplicacin del cuestionario y
el modelo es el cuestionario para confirmar o rechazar la hiptesis de si existe discriminacin
en la poblacin y hacia que grupo de personas y en que cuestiones. Gran parte de las
simulaciones son de este tipo con modelos conceptuales.
El modelo sistmico es mas pretencioso y es un trabajo de laboratorio. Se simula el sistema
social en una de sus representaciones totales. El anlisis de sistemas es una representacin
total. Un plan de desarrollo en el segmento de transportes con un modelo de ecologa humana,
por ejemplo. El nfasis en la teora general de sistemas es lo adecuado en este tipo de
simulaciones. Este mtodo, que es para un Sistema complejo, es sumamente abstracto, no se
limita a la descripcin del sistema, sino que debe incluir en la simulacin las entradas y
salidas de energa y procesos de homeostasis, autopoiesis y retroalimentacin.
Tanto el programa de estadstica, como la escala de actitud, como el sistema total, son
perfectas simulaciones de la realidad y modelizan todos los elementos en sus respectivas
hiptesis de trabajo. Son tambin un microclima y el ambiente o el escenario en los procesos
de simulacin/experimentacin. Otras propiedades que deben contener las simulaciones es
que sean repetibles indefinidamente. Que eviten el efecto de aprendizaje que incita al
encuestador a rellenar el mismo los cuestionarios y que se podr evitar con algn control, que

sean flexibles o mejorables y que no sea invasivo o cambiar la poblacin de las muestras
sucesivas.

Vase tambin

Modelo
Metodologa en las ciencias sociales
Sistema dinmico
Efecto mariposa

Teora de la medida
En matemticas, una medida es una funcin que asigna un nmero, e.g., un "tamao", un
"volumen", o una "probabilidad", a los subconjuntos de un Conjunto dado. El concepto es
importante para el Anlisis matemtico y para la Teora de la probabilidad.
La Teora de la Medida es la rama del Anlisis real que investiga las -lgebras, las medidas,
funciones medibles e Integrales. Es de importancia en Probabilidad y Estadstica.
Vase tambin Integracin de Lebesgue, Medida de Lebesgue

Tabla de contenidos

1 Definiciones formales
2 Propiedades
o 2.1 Monotona
o 2.2 Uniones contables
3 Medidas sigma-finitas
4 Completitud
5 Ejemplos
6 Contraejemplos
7 Generalizaciones
8 Vase tambin

Definiciones formales
Formalmente, una medida es una funcin definida en una -lgebra sobre un conjunto X
con valores en el intervalo real extendido [0, ], que satisfaga las siguientes dos propiedades:

La medida del conjunto vaco es cero: () = 0.


La medida es contablemente aditiva: si E1, E2, E3, ... es
una sucesin contable de conjuntos disjuntos dos a dos
de la -lgebra y E es su unin, entonces (E) es igual
a la suma de las medidas de los Ek; esto es,

La tripla (X, , ) se denomina espacio de medida, y los elementos de se denominan


conjuntos medibles.

Propiedades
Varias propiedades pueden ser deducidas directamente de la definicin.

Monotona
es montona: si E1 y E2 son dos conjuntos medibles, con E1 E2, entonces (E1) (E2).

Uniones contables
Si E1, E2, E3, ... es una sucesin contable de conjuntos medibles, su unin ser tambin
medible (por la definicin de -lgebra), y

Si se tiene adems que En En+1 para todo n, entonces

Intersecciones contables
Si E1, E2, E3, ...es una sucesin contable de conjuntos medibles, y En+1 En para todo n,
entonces la interseccin de los conjuntos En es medible (de nuevo, por la definicin de lgebra); ms an, si al menos uno de los En tiene medida finita, entonces

Esta igualdad no es necesariamente cierta si ninguno de los En tiene medida finita; por
ejemplo, para cada n N, tmese

Todos estos conjuntos tienen medida infinita, de modo que el lmite al lado derecho de la
igualdad es ; sin embargo, su interseccin es vaca y por lo tanto tiene medida 0.

Medidas sigma-finitas
Un espacio de medida (X, , ) se dice finito si (X) es un nmero real finito (en lugar de ).
Y se dice -finito (ledo sigma finito) si X es la unin contable de conjuntos medibles de
medida finita. Un conjunto en un espacio de medida tiene medida -finita si es una unin
contable de conjuntos de medida finita.

Por ejemplo, los nmeros reales con la medida de Lebesgue estndar forman un espacio finito pero no finito. Considrese el intervalo cerrado [k, k+1] para cada entero k; hay una
cantidad contable de tales intervalos, cada uno tiene medida 1, y su unin es la recta real
completa. Alternativamente, tmense los nmeros reales con la medida de conteo, que asigna
a cada conjunto finito de nmeros reales el nmero de puntos en el conjunto. Este espacio de
medida no es -finito, ya que cada conjunto de medida finita contiene finitos puntos, y se
necesitara una cantidad no contable de ellos para cubrir la recta entera. Los espacios de
medida -finita tienen algunas propiedades convenientes; as, la -finitud puede ser
comparada a la separabilidad de los espacios topolgicos.

Completitud
Un conjunto medible S es llamado un conjunto nulo si (S) = 0, y conjunto despreciable si
est contenido en uno nulo. La medida se dice completa si todo conjunto despreciable es
medible (y por lo tanto, nulo tambin).
Una medida puede extenderse a una completa considerando la -lgebra de conjuntos T X
que difieren de un conjunto medible S en un conjunto despreciable; esto es, tal que la
diferencia simtrica T S est contenida en un conjunto nulo. En tal caso se define (T) =
(S).

Ejemplos
A continuacin se listan algunos ejemplos importantes de medidas.

La medida de conteo se define por (S) = nmero de


elementos en S.
La medida de Lebesgue es la nica medida completa,
invariante por translaciones, sobre una -lgebra sobre
R que contenga a los intervalos, y tal que ([0,1]) = 1.
La medida de ngulo circular, que es invariante por
rotaciones.
La medida de Haar para un grupo topolgico
localmente compacto es una generalizacin de la
medida de Lebesgue y tiene una propiedad de unicidad
similar.
La medida cero es la definida mediante (S) = 0 para
todo S.
Todo espacio de probabilidad da lugar a una medida que
toma el valor 1 sobre todo el espacio (y por tanto toma
todos sus valores en el intervalo unitario [0,1]). Tal
medida es denominada medida de probabilidad.

Otras medidas notables son las de Borel, Jordan, y Radon.

Contraejemplos
Contrariamente a la intuicin, no todos los conjuntos son medibles; algunos ejemplos de
conjuntos que no tienen medidas o que resultan en paradojas son el conjunto de Vitali, la
paradoja de Hausdorff, y la paradoja de Banach-Tarski.

Generalizaciones
Para ciertos propsitos, es til tener una "medida" cuyos valores no se restrinjan a los reales
no negativos y el infinito. Por ejemplo, una funcin de conjunto contablemente aditiva con
valores en los nmeros reales (con signo) se llama medida con signo, mientras que tal tipo de
funcin con valores en los nmeros complejos se llama medida compleja. Una medida que
tome valores en un espacio de Banach se llama medida espectral; son usadas a menudo en
anlisis funcional en el teorema espectral. Para distinguir las medidas usuales, con valores
positivos, de las generalizaciones, se habla de medidas positivas.
Otra generalizacin es la medida finitamente aditiva. Es igual que una medida, salvo que en
lugar de requerir aditividad contable, slo se necesita aditividad finita. Histricamente, esta
definicin se us inicialmente, pero no result ser tan til. En general, las medidas finitamente
aditivas estn conectadas con nociones como los lmites de Banach, el dual de L, y la
compactificacin de Stone-ech. Todas stas estn conectadas de alguna forma con el axioma
de eleccin.
El interesante resultado en geometra integral conocido como teorema de Hadwiger establece
que el espacio de funciones de conjunto invariantes por translaciones, finitamente aditivas, no
necesariamente no negativas definidas sobre las uniones finitas de conjuntos compactos y
convexos en Rn consiste (salvo mltiplos escalares) en una "medida" que es "homognea de
grado k" para cada k = 0, 1, 2, ..., n, y combinaciones lineales de esas "medidas". "Homognea
de grado k" significa que "re-escalar" cualquier conjunto por un factor c > 0 multiplica la
"medida" del conjunto por un factor ck. La que es homognea de grado n es el volumen
ordinario n-dimensional. La homognea de grado n-1 es el "volumen de superficie". La
homognea de grado 1 es una funcin misteriosa llamada "anchura media" (en ingls, "mean
width"), un mal nombre. La homognea de grado 0 es la caracterstica de Euler.

Paradoja de Simpson
La paradoja de Simpson (o efecto Yule-Simpson) describe la desaparicin de una asociacin
o comparacin significativa de dos variables cuando los datos son desagregados por grupos.
Tambin referida como el cambio en el sentido de una asociacin entre dos variables
(cuantitativas o cualitativas) cuando se controla el efecto de una tercera variable o variable de
confusin.
Recibe el nombre en honor de Edward Simpson, quien la describi en 1951, aunque fue
previamente descrita por el estadstico britnico G. Udny Yule a inicios de 1900.
La paradoja de Simpson puede ocurrir siempre que los datos que estudiamos estn agregados
(combinados). Si los datos estn combinados, y no desagregados (v.g. por edad, raza, grados,
etc.), el efecto global puede no representar lo que realmente pasa.

Estadstico
Un estadstico es una medida cuantitativa, derivada de un conjunto de datos de una muestra
con el objetivo de estimar o contrastar caractersticas de una poblacin o modelo estadstico.

Estadsticos muestrales
Media muestral
Varianza muestral
Momentos muestrales

Estimacin de parmetros
Estadsticos suficientes
Estimacin puntual

Contraste de hiptesis
Prueba o test 2 (chi-cuadrado)
test t-Student
test F-Snedecor

You might also like