You are on page 1of 36

UNIVERSIDAD ANDINA NESTOR

CACERES VELASQUEZ
FACULTAD DE INGENIERIA DE SISTEMAS

CAP

INGENIERIA EMPRESARIAL E INFORMATICA

TRABAJO DE INVESTIGACION
ESTIMACIN

CURSO: INFERENCIA ESTADISTICA

DOCENTE: DR. MARTINEZ CONCHA CESAR AUGUSTO

SEMESTRE: VI
ALUMNOS: SALAS SUAREZ EDGAR AMERIC0

SILLOCA CONDO VILMA YANETH

BELIZARIO PAREDES NELY MISHEL

AREQUIPA PER
2017
ESTIMACIN

Estimacin (o estimar) es el proceso de encontrar una aproximacin sobre una


medida, lo que se ha de valorar con algn propsito es utilizable incluso si los
datos de entrada pueden estar incompletos, incierto, o inestables. En el mbito
de la estadstica estimacin implica usar el valor de una estadstica derivada de
una muestra para estimar el valor de un parmetro correspondiente a poblacin;
la muestra establece que la informacin puede ser proyectada a travs de
diversos factores, formal o informalmente, son procesos para determinar una
gama muy probablemente y descubrir la informacin que falta. Cuando una
estimacin resulta ser incorrecta, se denomina overestimate si la estimacin
super el resultado real y una subestimacin si la estimacin se qued corto del
resultado real.

La estimacin se realiza mediante el muestreo de frecuencia, (lo que est


contando con algo pequeo nmero de ejemplos), y la proyeccin de ese
nmero en una poblacin ms grande.

Las estimaciones de manera similar se pueden generar mediante la proyeccin


de los resultados de encuestas o encuestas sobre la poblacin total; al hacer una
estimacin, lo ms a menudo es que el objetivo es til para generar un rango de
posibles resultados, y esa cualidad es suficiente para ser til, pero no es
necesario que por lo que es probable que sea incorrecto.

Por ejemplo, al tratar de adivinar el nmero de caramelos contenidos en un


frasco si el cincuenta por ciento eran visibles y el volumen general de la jarra
sobre pareca ser veinte veces tan grande como el recipiente de volumen que
contiene los caramelos visibles, a continuacin un proyecto simple mide que
haba un millar de caramelos en el frasco; tal proyeccin, previsto para recoger el
nico valor que se cree que es ms cercano al valor real se llama una estimacin
puntual.

Sin embargo el punto de estimacin es probable que sea incorrecto, debido a


que el tamao de la muestra (en este caso, el nmero de caramelos son
visibles), es un nmero demasiado pequeo para estar seguro de que no que
contienen anomalas que difieren de la poblacin en su conjunto; este concepto
es correspondiente a una estimacin de intervalo que captura una gama mucho
ms amplia de posibilidades, pero es demasiado amplio para ser til.

Usando redondeo para estimar sumas y diferencias

Supongamos que debes sumar una serie de nmeros. Puedes redondear cada
sumando a la centena ms cercana para estimar la suma.
Ejemplo:
Estimar la suma 1,472 + 398 + 772 + 164 redondeando cada nmero a la
centena ms cercana.

TIPOS ESTIMACIONES Y CARACTERISTICAS

ESTIMACION

En estadstica se llama estimacin al conjunto de tcnicas que permiten dar un


valor aproximado de un parmetro de una poblacin a partir de los datos
proporcionados por una muestra.

En su versin ms simple, una estimacin de la media de una determinada


caracterstica de una poblacin de tamao N sera la media de esa misma
caracterstica para una muestra de tamao n.

ESTIMADOR

Un estimador de un parmetro poblacional es una funcin de los datos


mustrales. En pocas palabras, es una frmula que depende de los valores
obtenidos de una muestra, para realizar estimaciones.

Por ejemplo, un estimador de la media poblacional, , sera la media muestral


segn la siguiente frmula:

Donde (x1, x2, , xn) sera el conjunto de de datos de la muestra.


En el ejemplo se habla de una estimacin puntual. Sin embargo, el estimador es
una variable aleatoria que asigna a cada valor de la funcin su probabilidad de
aparicin, esto es, la probabilidad de la muestra de la que se extrae.

1. ESTIMACION PUNTUAL

Consiste en la estimacin del valor del parmetro mediante un slo valor,


obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla
media de un determinado grupo de individuos, puede extraerse una muestra y
ofrecer como estimacin puntual la talla media de los individuos de la muestra.

Estimar puede tener dos significados interesantes. Significa querer e inferir.


Desde luego, el primer significado es ms trascendente. Pero no tiene ningn
peso en la estadstica, disciplina que no se ocupa de los asuntos del amor. El
segundo significado es el importante aqu. Una estimacin estadstica es un
proceso mediante el que establecemos qu valor debe tener un parmetro segn
deducciones que realizamos a partir de estadsticos. En otras palabras, estimar
es establecer conclusiones sobre caractersticas poblacionales a partir de
resultados mustrales.

Vamos a ver dos tipos de estimaciones: puntual y por intervalo. La segunda es la


ms natural. Y vers que forma parte habitual de nuestro imaginario como
personas sin necesidad de una formacin estadstica. La primera, la estimacin
puntual, es la ms sencilla y, por ese motivo, vamos a comenzar por ella. Ocurre,
adems, que la estimacin por intervalo surge, poco ms o menos, de construir
un intervalo de posibles valores alrededor de la estimacin puntual.

La estimacin puntual consiste en atribuir un valor (la estimacin) al parmetro


poblacional. Si la muestra es representativa de la poblacin, podemos esperar que los
estadsticos calculados en las muestras tengan valores semejantes a los parmetros
poblacionales, y la estimacin consiste en asignar los valores de los estadsticos
muestrales a los parmetros poblacionales. Los estadsticos con que obtenemos las
estimaciones se denominan estimadores.

Ejemplo

Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone
de 50 puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el
estimador), es igual a 5.6 y atribuimos este valor (la estimacin) a la Media del curso
completo.

Resumiendo:
Podemos utilizar como estimadores de la Media de la poblacin otros estadsticos de
tendencia central como la Moda o la Mediana, pero NO todos los estimadores son
apropiados. Los estimadores deben satisfacer ciertos requisitos, y por esta razn,
interesa conocer sus propiedades a fin de utilizar los que sean adecuados segn las
circunstancias de la estimacin.

MTODOS:
1. mtodo de los momentos

Consiste en igualar momentos poblacionales a momentos mustrales. Deberemos tener


tantas igualdades como parmetros a estimar.

2. mtodo de mxima verosimilitud

Consiste en tomar como valor del parmetro aquel que maximice la probabilidad de que
ocurra la muestra observada

En trminos probabilsticos podramos hablar de que la verosimilitud es la probabilidad


de que ocurra o se d una determinada muestra si es cierta la estimacin que hemos
efectuado o el estimador que hemos planteado.

Evidentemente , la mxima verosimilitud , ser aquel estimador o estimacin que nos


arroja mayor credibilidad .En situacin formal tendramos :

Un estimador mximo-verosmil es el que se obtiene maximizando la funcin de


verosimilitud (likelihood) de la muestra

Que es la funcin de probabilidad (densidad o cuanta) que asigna la probabilidad de


que se obtenga una muestra dependiendo del (o de los) parmetro(s) " " pero
considerada como funcin de . Si la distribucin de la poblacin es tal que su
densidad depende de uno o ms parmetros , la probabilidad (densidad) de
cada realizacin muestral xi

(con i=1,2,..,n) ser:

y, a partir de aqu podremos obtener la funcin de


verosimilitud de la muestra

Si el muestreo es simple:

por ser independientes cada una de las realizaciones muestrales.

El estimador que maximice

ser el estimador mximo-verosmil (E.M.V.) Y ser aquel valor/expresin para


el que se verifique la derivada :

Si lo planteado fuera EMV de varios parmetros

las expresiones seran. .

Debido a que la funcin de verosimilitud es a fin de cuentas una funcin de


probabilidad ,ser una funcin definida no negativa y por lo tanto alcanzar su mximo
en los mismos puntos que su logaritmo . Por esta razn suele maximizarse

en lugar de la propia funcin de verosimilitud . Suele hacerse esto en todos aquellos


casos en los que la funcin de verosimilitud depende de funciones exponenciales.
ejemplo 1

Obtener el E.M.V. del parmetro de una distribucin de Poisson


Para una muestra de tamao n tendremos que la funcin de de verosimilitud
ser:

Maximizar L ser equivalente a maximizar el numerador de L

si llamamos L' a dicho numerador y tomamos logaritmos tendremos que es

tomando logaritmos

maximizando dicho logaritmo :

luego el estimador mximo verosmil de


CARACTERSTICAS ESTIMADORES

1. Sesgo. Se dice que un estimador es insesgado si la Media de la distribucin del


estimador es igual al parmetro.

Un sesgo es una tendencia constante. En un ejemplo clsico, solemos afirmar que las
escopetas de feria estn diseadas para errar, para desviarse. Si esa desviacin es fija,
es decir, si esa desviacin es una tendencia a errar hacia un sentido concreto, entonces
hablamos de sesgo. Si no es fija, entonces se trata de una variacin aleatoria. Observa la
figura 1. El objetivo es dar al centro de la diana. El rea de disparos A muestra una
variacin aleatoria, pero sin sesgo pues apunta correctamente alrededor del objetivo. El
rea B muestra un sesgo claro: todos los disparos dan en un mismo punto y ese punto no
es el centro de la diana, estamos errando. El rea C ejemplifica una mezcla de ambos:
existe sesgo y variacin aleatoria, puesto que los disparos impactan en un rea con cierta
dispersin aleatoria pero concentradas en torno a un punto desplazado del objetivo.

Estimadores insesgados son la Media muestral (estimador de la Media de la poblacin) y


la Varianza (estimador de la Varianza de la poblacin):

Ejemplo

En una poblacin de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un
muestreo aleatorio (nmero de muestras= 10000, tamao de las muestras= 100) y hallan
que la Media de las Medias muestrales es igual a 5.09, (la media poblacional y la media
de las medias muestrales coinciden). En cambio, la Mediana de la poblacin es igual a 5 y
la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un
estimador sesgado.

La Varianza es un estimador sesgado.

Ejemplo: La Media de las Varianzas obtenidas con la Varianza


en un muestreo de 1000 muestras (n=25) en que la Varianza de la poblacin es igual
a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la
Cuasivarianza

la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de
la poblacin ya que la Cuasivarianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parmetro cuanto


mayor es n (tamao de la muestra).

Algunos estimadores consistentes son:

Ejemplo

En una poblacin de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres
muestreos aleatorios (nmero de muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo
valor que la Media de la poblacin.
3) Eficiencia. Diremos que un estimador es ms eficiente que otro si la Varianza de la
distribucin muestral del estimador es menor a la del otro estimador. Cuanto menor es la
eficiencia, menor es la confianza de que el estadstico obtenido en la muestra aproxime al
parmetro poblacional.

Ejemplo

La Varianza de la distribucin muestral de la Media en un muestreo aleatorio (nmero de


muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribucin de
Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que
la Media es un estimador ms eficiente que la Mediana).

Los estimadores siempre suministran dispersin aleatoria. Como sabemos del


monogrfico sobre muestreo, el conjunto de todas las muestras de un mismo
diseo que provienen de una misma poblacin suministran valores diferentes.
Esta circunstancia indica que existe una variacin aleatoria con la que hay que
vivir porque es inevitable. Pero todava sera peor. Es posible que el estimador
escogido tenga sesgo, es decir, que no solo est variando alrededor de un punto,
sino que el punto sobre el que vara no es el valor poblacional, verdadero u
objetivo de nuestro inters. Esto si es evitable. As que los estimadores que
utilizamos intentamos que sean insesgados, es decir, que carezcan de sesgo.

El recurso que utilizamos para ello es el valor esperado, es decir, la media


aritmtica de la distribucin muestral del estimador. Ya lo viste en el monogrfico
sobre muestreo. El valor esperado es, como dice la expresin, el valor que
esperamos. Cabe elegir un estimador tal que el valor esperado coincida con el
parmetro. Esto ocurre si utilizamos la media aritmtica de la muestra como
estimador de la media aritmtica de la poblacin, pues E(X ) = . Tambin ocurre
con las proporciones, pues E(p) = . Pero no ocurre as con la varianza (y, por
tanto, tampoco con la desviacin tipo) pues E(S 2 ) 2 . Esto ya lo hemos
abordado en el monogrfico sobre muestreo. Lo que hacemos entonces es
escoge otro estimador. En el muestreo aleatorio simple donde las poblaciones son
de gran tamao, es la cuasivarianza el estadstico escogido como estimador de la
varianza poblacional, pues E(S 2 )= 2 , es decir, la cuasivarianza es un
estimador insesgado de la varianza poblacional.

TOTALES
Adems de medias, proporciones y variaciones, un parmetro habitual es el total.
Llamamos total a una frecuencia absoluta calculada en la poblacin. Por ejemplo,
podemos tener inters en conocer cuntas personas votarn al partido HH en las
prximas elecciones o cuntos cigarrillos van a consumirse en el mes de abril.
Para responder, utilizamos un recurso indirecto que parte de una estimacin
previa, bien sea de una media aritmtica o de una proporcin. Supongamos que
la poblacin que nos interesa cuenta con un milln de habitantes.

Hemos trabajado con una muestra de 200. De los que 38 dicen que votarn al
partido HH. Esto significa 38/200*100=19%. Una estimacin puntual establece
que el 19% de la poblacin votar a HH. Como hay un milln de habitantes,
entonces, hablamos de 1,000,000*19/100=190,000 personas. Supongamos
tambin que se fuman 50 cigarrillos por trmino medio cada mes. Si ese es el
valor de la media aritmtica de la muestra, la estimacin puntual afirmar que en
la poblacin se fumarn 50 cigarrillos por persona durante el mes de abril, por
trmino medio. Como hay un milln de habitantes, el mes de abril ver
consumidos 50 millones de cigarrillos. As pues, en la estimacin de totales no
realizamos un camino alternativo especfico sino que ampliamos la estimacin
realizada previamente, sea de una proporcin o de una media.
2. ESTIMACIN POR INTERVALOS

Un estimado puntual, por ser un slo nmero, no proporciona por s mismo


informacin alguna sobre la precisin y confiabilidad de la estimacin.

Por ejemplo, imagine que se usa la media de una muestra x para estimar
(estimador puntual) la resistencia real a la ruptura de toallas de papel de cierta
marca y suponga que x= 9322.7.

Debido a la variabilidad de la muestra, casi nunca se tendr el caso de que = . El


estimador puntual nada dice sobre lo cercano que esta de . Una alternativa para
reportar el valor del parmetro que se est estimando es calcular un intervalo de
valores factibles, es decir un lmite de confianza o mite de confianza o intervalo de
confianza intervalo de confianza (IC).

La estimacin por intervalos consiste en establecer el intervalo de valores donde es ms


probable se encuentre el parmetro. La obtencin del intervalo se basa en las siguientes
consideraciones:

a) Si conocemos la distribucin muestral del estimador podemos obtener las


probabilidades de ocurrencia de los estadsticos muestrales.

b) Si conociramos el valor del parmetro poblacional, podramos establecer la


probabilidad de que el estimador se halle dentro de los intervalos de la distribucin
muestral.

c) El problema es que el parmetro poblacional es desconocido, y por ello el intervalo se


establece alrededor del estimador. Si repetimos el muestreo un gran nmero de veces y
definimos un intervalo alrededor de cada valor del estadstico muestral, el parmetro se
sita dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una poblacin que sigue la distribucin
Normal, y resulta:

La distribucin de las Medias muestrales aproxima al modelo Normal:


En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviacin Tpica de la distribucin muestral
son los valores cuya funcin de distribucin es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribucin Normal estandarizada o de funciones en
aplicaciones informticas como Excel). Seguidamente generamos una muestra de la
poblacin y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo
alrededor de la Media muestral, el parmetro poblacional (5.1) est incluido dentro de sus
lmites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa


razn, la distancia desde m a la Media muestral es la misma que va de la Media muestral
a m. En consecuencia, si hacemos un muestreo con un nmero grande de muestras
observamos que el 95% de las veces (aproximadamente) el valor de la Media de la
poblacin (m) se encuentra dentro del intervalo definido alrededor de cada uno de los
valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro
de alguno de los intervalos de confianza es del 95%, y es denominado nivel de
confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle


dentro del intervalo sea igual al 99%, la expresin anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviacin Tpica de la distribucin muestral
en las tablas de la distribucin Normal estandarizada o de funciones en aplicaciones
informticas como Excel), y son los valores cuya funcin de probabilidad es igual a 0.995
y 0.005 respectivamente).

Ejemplo

La siguiente imagen muestra la distribucin de las Medias muestrales obtenidas de


100000 muestras aleatorias y los intervalos alrededor de cada una de las Medias
obtenidas de diez de las muestras:

donde ls y le simbolizan los lmites superior e inferior del intervalo de confianza al 95%.

Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parmetro dentro sus lmites.

INTERVALO DE CONFIANZA:
El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde
es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una
determinada certeza o nivel de confianza.

Se calcula siempre seleccionando primero un nivel de confianza nivel de


confianza, que es una medida del grado de confiabilidad en el intervalo. Entonces,
en el ejemplo anterior, si queremos un nivel de confianza de 95% diramos que es
posible tener cualquier valor de m entre 9162.5 y 9482.9.

Un nivel de confianza de 95% implica que 95% de las muestras dara lugar a un
intervalo que incluye m o cualquier otro parmetro que se est estimando, y slo
5% de las muestras producir un intervalo errneo. Cuanto mayor sea el nivel de
confianza podremos creer que el valor del parmetro que se estima est dentro
del intervalo

VARIABILIDAD DEL PARMETRO:


Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la
literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el
tamao de la muestra que prescienden de este aspecto. Habitualmente se usa
como medida de esta variabilidad la desviacin tpica poblacional y se denota .

ERROR DE LA ESTIMACIN:

Es una medida de su precisin que se corresponde con la amplitud del intervalo


de confianza. Cuanta ms precisin se desee en la estimacin de un parmetro,
ms estrecho deber ser el intervalo de confianza y, por tanto, menor el error, y
ms sujetos debern incluirse en la muestra estudiada. Llamaremos a esta
precisin E, segn la frmula E = 2 - 1.

NIVEL DE CONFIANZA

Es la probabilidad de que el verdadero valor del parmetro estimado en la


poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se
denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-
)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se
corresponden con valores de 0,05 y 0,01, respectivamente.
Valor

Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de


fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de
confianza (1-). Por ejemplo, en una estimacin con un nivel de confianza del
95%, el valor es (10095)/100 = 0,05.

Valor crtico

Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin


que deja a su derecha un rea igual a /2, siendo 1- el nivel de confianza.
Normalmente los valores crticos estn tabulados o pueden calcularse en funcin
de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de
media 0 y desviacin tpica 1, el valor crtico para = 0,05 se calculara del
siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms
aproximado), bajo la columna rea; se observa que se corresponde con 0,64.
Entonces Z/2 = 0,64. Si la media o desviacin tpica de la distribucin normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t=(X-)/
para su clculo.

Con estas definiciones, si tras la extraccin de una muestra se dice que 3 es una
estimacin de la media con un margen de error de 0,6 y un nivel de confianza del
99%, podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen
restando y sumando, respectivamente, la mitad del error, para obtener el intervalo
de confianza segn las definiciones dadas.

Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del
intervalo de confianza, tenemos tambin una mayor probabilidad de xito en
nuestra estimacin, es decir, un mayor nivel de confianza.
Estimacin por intervalos de una poblacin

En el mbito de la estadstica estimacin implica usar el valor de una estadstica


derivada de una muestra para estimar el valor de un parmetro correspondiente a
una poblacin

Es la estimacin de un parmetro de la poblacin dado por dos nmeros entre los


cuales se puede considerar que se encuentra el parmetro. Las estimaciones de
intervalo indican la precisin de una estimacin y son, por lo tanto, preferibles a
las estimaciones puntuales.

Para realizar los clculos de la estimacin de intervalos del parmetro o


proporcin de una poblacin se aplica la siguiente formula:

= / .SE

DONDE:

IC = intervalo de confianza

P = proporcin

/2 = margen de error

(1)
SE = error estndar = =

EJEMPLO:

En una escuela se toma una muestra de 50 estudiantes donde los estudiantes se


someten a una prueba de conocimientos de los cuales 40 alumnos aprobaron el
examen. Cul es el estimado de intervalo para la proporcin poblacional para un
nivel de confianza 95%?

IC = P /2 .SE

nivel de /2
confianza

90% 1.645

95% 1.96
o Hallando la proporcin :

P= 40/50 = 0.8 = .8

o Reemplazando:

IC = P /2 .SE

.8(1.8)
IC = .8 1.96 50

IC = .8 .11 (.8 - .11 = .69) ;(.8 + .11 = 91)

IC = (.69, .91)

o Interpretacin:

Hay un 95% de confianza de que la proporcin de la poblacin que aprobara el


examen esta entre 69% y 91%.

LA MEDIA O MEDIA ARITMETICA

La media aritmtica es la medida de tendencia central ms conocida, familiar a


todos

Nosotros y de mayor uso, tambin es fcil de calcular, ya sea de datos no


tabulados

(Datos simples) como de datos tabulados (datos agrupados).

La media aritmtica es el valor promedio de las muestras y es independiente de


las amplitudes de los intervalos. Se simboliza como X y se encuentra slo para
variables cuantitativas. Se encuentra sumando todos los valores y dividiendo por
el nmero total de datos.

MEDIA ARITMTICA SIMPLE

La media aritmtica es el valor obtenido sumando todas las observaciones y


dividiendo
el total por el nmero de observaciones que hay en el grupo.

La media resume en un valor las caractersticas de una variable teniendo en


cuenta

todos los casos. Solamente puede utilizarse con variables cuantitativas.

En la media aritmtica simple cada una de los datos como un punto media o
marca de

clase.

Se determina mediante la aplicacin de la siguiente frmula

DONDE:

x = media aritmtica

Yi = Representa los valores de la variable o valores a promediar

= Es la letra griega sigma, y se lee suma o sumatoria

N = Es el nmero total de casos o nmero de valores a promediarse.

EJEMPLO 1:

En un partido de baloncesto, se tiene la siguiente anotacin en los jugadores de


un equipo: 0, 2, 4, 5, 8, 8, 10, 15, 38.

Calcular la media de anotacin del equipo.

o Aplicando la frmula:


=
N
0 + 2 + 4 + 5 + 8 + 8 + 10 + 38 90
X= = = 10
9 9
o interpretacin:

La media de anotacin del equipo es 10

EJEMPLO 2:

Cul fue el ingreso medio diario de un comerciante durante la ltima semana?

Da de semana Ingreso diario

Lunes 75

Martes 225

mircoles 175

Jueves 300

Viernes 180

Sbado 400

total 1355

X = 75+225+175+300+180+400 = 1355

N=6

o aplicando la frmula:

1
=
N
1355
= = 225.83
6
o interpretacin:

Es como si el comerciante hubiera vendido diariamente, de lunes a sbado


.225.83.

MEDIA ARITMTICA PONDERADA

Es cuando se asigna ciertos coeficientes significacin, pero importancia, etc. a los


datos

de una determinada actividad.

Ejercicio clsico de ponderacin son los llamados coeficientes que se le asigna a


ciertos

exmenes.

Se determina mediante la aplicacin de la siguiente frmula:

.
=

Dnde:

x = media aritmtica

= Es la letra griega sigma, y se lee suma o sumatoria

yi = Representa los valores de la variable o valores a promediar

ni = Frecuencia

N = Es el nmero total de casos o nmero de valores a promediarse.

EJEMPLO:
Notas Yi Coeficiente ni ni.Yi

Promedio anual 14 01 14

Examen escrito 12 02 24

Examen oral 08 03 24

N=6 ni.Yi=62

o aplicando la frmula:

.
=
N
62
= = 10.33
6

Inconvenientes de su uso:

Este parmetro, aun teniendo mltiples propiedades que aconsejan su uso en

Situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila


en

Funcin de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta Sobremanera la dispersin, de


modo que

cuanto menos homogneos sean los datos, menos informacin proporciona.


Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la
misma media.

EJEMPLO:
Consideren un equipo de baloncesto con cinco jugadores de igual estatura, 1,95
m, evidentemente, tendra una estatura media de 1,95 m, valor que representa
fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de
estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por
ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95
m, valor que no representa a casi ninguno de sus componentes.

En el clculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen ms peso que los valores cercanos a
cero.

Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto


directivo que gane 1.000.000 de tiene tanto peso como el de diez empleados
"normales" que ganen 1.000 . Es decir, se ve muy afectada por valores
extremos.

No se puede determinar si en una distribucin de frecuencias hay


intervalos de

clase abiertos.

EJEMPLO:

En una empresa hay 5 trabajadores que ganan Q.200; 4 que ganan Q.250; 8 que
ganan Q.175 y 3 que ganan Q.300. Cul es el promedio de salarios de la
empresa?

SALARIO yi NUMERO DE TOTAL ni Yi


TRABAJADORES ni
200 5 1000

250 4 1000

175 8 1400

300 3 900

N=20 ni Yi = 4300

APLICANDO LA FORMULA:

.
=
N

(5x200) + (4x250) + (8175) + (3300)


=
20

4300
=
20

= 215

RESPUESTA: El promedio de salarios de la empresa es de Q.215.

Propiedad principal de la media aritmtica

La suma algebraica de todos los desvos de un conjunto de datos con respecto a


su media aritmtica es igual a cero (0).

EJEMPLO:
1.- Determinar la suma algebraica de los desvos de los nmeros 3, 6, 9, 10, 12
con respecto a su media aritmtica.

Yi d =n-x

3 3-8=-5

6 6-8= -2 -7

9 9-8=1

10 10-8=2

12 12-8=4+7

Yi=40 (Yi-x)=-7+7=0

1 3 + 6 + 9 + 10 + 12 40
= = = =8
N 5 5

INTERVALOS PARA LA MEDIA:

Indica entre que posibles valores se mover o desplazara el promedio o media


poblacional

Se calcula mediante la siguiente expresin:


= /

DONDE:
X = media muestral

S = desviacin estndar

n = tamao de la muestra

EJEMPLO:

la media y la desviacin estndar mustrales para todos los pesos de llenado de


las 100 cajas son X = 12.5 y S = 0.1. Encuentre un intervalo del 95% de confianza
para la media de pesos de la caja.

X = 12.05

S = 0.1

n = 100
95%
Confianza = 95% confianza = 100% = 0.95

Calculando nivel de significancia ; = 1- 0.95 = 0.05 0.05/2 = 0.025

/2 = 1.96 (tabla de distribucin normal)

o Reemplazando:
S
1 = X /2

0.1
1 = 12.05 1.96
100

1 = 12.05 0.0196

1 = (12.03 ; 13.07)

o Interpretacin:

Se concluye que con una confianza del 95%, la, media de llenado de las cajas
esta entre 12.03 y 12.07 kg
VARIANZAS POBLACIONALES

VARIANZA

La varianza es una medida de qu tan disperso es un conjunto de datos. Si la


varianza es pequea significa que los valores de conjunto estn bastante
agrupados. Si la varianza es grande, significa que los nmeros estn ms
dispersos. En estadstica, este concepto tiene muchos usos.

La varianza tambin es muy til para crear modelos estadsticos., ya que una
varianza pequea puede ser un indicio de que estas ajustando demasiado los
datos.

Cuando se contrasta la hiptesis de igualdad de medias de dos poblaciones o


cuando se realiza un anlisis de la varianza (ANOVA) es fundamental decidir si
puede aceptarse que las muestras independientes provienen de poblaciones con
la misma varianza. Este problema se resuelve a partir del anlisis exploratorio que
proporciona los diagramas de caja y el estadstico del contraste de Levene.

Si la altura de las 'cajas' y los 'bigotes' correspondientes a los diagramas de caja


de cada una de las muestras son aproximadamente iguales, se tiene un indicio de
que posiblemente las muestras provienen de poblaciones con igual varianza.

Como complemento numrico al grfico se realiza la prueba de Levene que


calcula un estadstico que mide la diferencia entre las varianzas y la probabilidad
de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales
de los grupos sean iguales. Las hiptesis del contraste son:
La secuencia es:

Analizar
Estadsticos Descriptivos
Explorar

En el cuadro de dilogo se indica la variable de inters 'Dependiente' y la variable


que define los grupos 'Factores'. En Grficos se debe activar la opcin Estimacin
de potencia.

El contraste de Levene se realiza por defecto cuando se contrasta la diferencia de


dos o ms medias.

EJEMPLO:

Ejemplo 1.

Para la variable Coste de la encuesta Enctran.sav contrastar si existe


diferencia significativa entre las varianzas del coste en transporte de los
alumnos que viven en Barcelona y de los que viven fuera.

En el ejemplo 3 del epgrafe Diferencia de medidas poblacionales se


trataba de verificar si exista una diferencia significativa entre el coste
esperado en transporte de los alumnos que viven en Barcelona y el de
los que viven fuera. En este caso es fundamental probar si las varianzas
de ambos grupos pueden considerarse o no iguales, ya que de este
supuesto depende que se deba escoger uno u otro de los dos
estadsticos de prueba que aparecen en el cuadro de resultados del
contraste.

Los resultados que se obtuvieron fueron los siguientes:

Como puede verse, bajo la hiptesis nula de varianzas iguales el


estadstico de Levene (F) toma el valor 37,671. Este valor es
suficientemente grande como para rechazar la hiptesis nula para
cualquier nivel de significacin. Si se observan los correpondientes
diagramas de caja:

Se ve claramente que la variabilidad del coste en el grupo de los


residentes en Barcelona es menor que en el de los no residentes.

Ejemplo 2.

Con referencia a la encuesta Enctrans.sav se quiere comprobar si la


distribucin del Peso es o no ms homognea (presenta menor
varianza) en el grupo de las mujeres que en el de los hombres.

Las hiptesis que se quieren contrastar

son:

La secuencia es Analizar > Estadsticos Descriptivos > Explorar.

Una vez seleccionadas las variables (Dependiente: Peso y Factor:


Gnero) con el botn Grficos se abre el cuadro de dilogo
correspondiente en el cual se activa la opcin Estimacin de potencia.

En el cuadro Descriptivos que aparece en el visor de resultados se


observa que la varianza correspondiente al grupo de mujeres es 76,368
y la de los hombres es 97,613. El contraste de Levene permite decidir si
esta diferencia puede considerarse significativa o bien es debida
nicamente al azar del muestreo.
El diagrama de caja (Box-Plot) pone de manifiesto que el recorrido del
50% de las observaciones centrales de la variable peso en el grupo de
mujeres es algo mayor que en el grupo de hombres; pero, por otra parte,
en este segundo grupo hay 4 casos outliers o extremos que si se tienen
en cuenta determinan un recorrido total de la distribucin mayor en este
grupo. En consecuencia, esta primera aproximacin grfica, no permite
llegar a ninguna conclusin.
El estadstico F de la prueba de Levene (basndose en la media como
valor central) es igual a 0,214, que a una cola presenta un nivel de
significacin crtico igual a 0,644. sto significa que no puede
rechazarse la hiptesis nula para los niveles de significacin habituales
y, por lo tanto, concluimos que la diferencia de varianzas muestrales no
es significativa.
CONCLUSION:

La estimacion nos permite encontrar una aproximacionsobre una


medida derivada a partir de una muestra poblacional correspondiente
en el ambito de la estadistica

El proceso de estimacion se puede realizar mediante estimacion


puntual y estimacion por intervalos aplicando formulas de manera
eficiente para obtener resultados adecuados

Por otro lado la varianza es una medida per permite determinar que tan
disperso es un conjunto de datos dentro de la muestra en el ambito de
la estadistica.
ANALISIS CRTICO:

Este trabajo nos ayuda a dar valores a los parmetros estadsticos para aprender a
emplearlos de manera ptima en inferencia estadstica para luego ponerlo en prctica en
la recoleccin e interpretacin de datos agrupados y no agrupados
BIBLIOGRAFIA

Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). 8.


Estimacin. Estadstica matemtica con aplicaciones (6 edicin). Cengage
Learning Editores. p. 364. ISBN 9706861947.
Johnson RA, Bhattacharyya GK. Statistics: principles and methods. Hoboken,
N.J:Willey; cop 2010, 6th ed., international students d.
Lind, D.; Mason, R.; Marchal, W. (2001): Estadstica para Administracin y
Economa. Ed. Irwin McGraw-Hill.F.
Kvanli, A. (2000) Introduction to Business Statistics South-Western.
Johnson, R. (1996): Elementary Statistics. Ed. Duxbury.
Levin, R.; Rubin, D. (1996): Estadstica para Administradores. Ed. Prentice Hall.
Farber, E. (1995): A Guide to Minitab. Ed. McGraw-Hill
M.R. Spiegel; J. Schiller; R. A. Srinivasan (2007). 9. Anlisis de la varianza.
Probabilidad y Estadstica [Schaum's Outline of Theory and Problems of Probability
and Statistics]. Schaum (2 edicin). Mxico D.F.: McGraw-Hill. pp. 335-371. ISBN
978-970-10-4231-1.
Anderson, D.; Sweeney, D.; Williams, T. 1999. Estadstica para administracin y
economa.Mxico D.F.: International Thomson Editores, S.A. de C.V. 909 p

You might also like