You are on page 1of 49

Estadstica

[GUIA DE APUNTES TERICOS]


Material preparado para la Universidad Nacional de Lujn, para las carreras de Licenciatura en
Administracin y Contador Pblico, por el Docente Carlos Jara con la colaboracin de Camila Soley y Valeria
Delgado.
Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Contenido
Introduccin a la Estadstica ................................................................................................................................. 5
La Estadstica se divide en dos grandes ramas: ............................................................................................ 5
Tipos de estudios segn como se recopilan los datos:................................................................................. 5
Fuentes de Informacin Estadstica.............................................................................................................. 6
Definiciones .................................................................................................................................................. 6
Escalas de medicin...................................................................................................................................... 6
Clasificacin de las variables ........................................................................................................................ 6
La estadstica descriptiva ...................................................................................................................................... 7
Medidas de tendencia central: ..................................................................................................................... 7
Medidas de dispersin: ................................................................................................................................ 7
Medidas de posicin:.................................................................................................................................... 8
Medidas de Forma ........................................................................................................................................ 8
Formas de analizar la informacin ................................................................................................................... 9
Probabilidad........................................................................................................................................................ 10
Definiciones .................................................................................................................................................... 10
Definiciones de Probabilidad .......................................................................................................................... 10
Definicin clsica o de Laplace: .................................................................................................................. 10
Definicin relativa o emprica:.................................................................................................................... 10
Definicin subjetiva: ................................................................................................................................... 11
Definicin axiomtica: ................................................................................................................................ 11
Probabilidad total ........................................................................................................................................... 11
Sucesos Mutuamente Excluyentes ................................................................................................................. 11
Probabilidad Marginal .................................................................................................................................... 11
Probabilidad Conjunta .................................................................................................................................... 12
Probabilidad condicional: ............................................................................................................................... 12
Variable Aleatoria ............................................................................................................................................... 13
Definicin........................................................................................................................................................ 13
Ejemplo: ...................................................................................................................................................... 13
1) Variable Aleatoria Discreta ......................................................................................................................... 13
Esperanza matemtica ............................................................................................................................... 14
Esperanza matemtica de una Variable Aleatoria Discreta ....................................................................... 14
Variancia ..................................................................................................................................................... 14
2) Variable Aleatoria Continua ....................................................................................................................... 15
Distribuciones de Probabilidad........................................................................................................................... 16
1) Distribuciones Discretas Probabilidad ........................................................................................................ 16
1.a. Distribucin Binomial........................................................................................................................... 16
1. b. Distribucin de Poisson ...................................................................................................................... 17

Comisin 40. Segundo cuatrimestre 2016 Pgina 2 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

2) Distribucin Continua de Probabilidad ...................................................................................................... 17


Distribucin Normal.................................................................................................................................... 17
Distribucin en el muestreo ............................................................................................................................... 19
Definicin del Teorema Central del Lmite (TCL) ........................................................................................ 20
Propiedades de los Estimadores................................................................................................................. 22
Mtodos para hallar los estimadores: ........................................................................................................ 22
Estimacin por Intervalo de Confianza........................................................................................................... 24
Error de Estimacin ........................................................................................................................................ 25
Distribucin t de Student................................................................................................................................ 25
Intervalo de Confianza para la proporcin ..................................................................................................... 26
Prueba de Hiptesis............................................................................................................................................ 27
1) Planteo de las hiptesis: ..................................................................................................................... 27
2) Definicin del alfa () ......................................................................................................................... 28
3) Definicin del estadstico ................................................................................................................... 28
4) Regla de decisin ................................................................................................................................ 28
5) Clculo del valor del estadstico y decisin de Rechazar o No Rechazar. .......................................... 28
P Valor ............................................................................................................................................................ 29
Reglas de Decisin comparadas: .................................................................................................................... 30
Definicin del Estadstico en funcin a la informacin: ................................................................................. 30
Prueba de Independencia 2 ............................................................................................................................... 31
Ejemplo: ...................................................................................................................................................... 31
Prueba de Homogeneidad 2 .............................................................................................................................. 34
Nmeros ndices ................................................................................................................................................. 35
Definicin y utilidad ........................................................................................................................................ 35
Caractersticas ................................................................................................................................................ 35
Utilizacin de los nmeros ndices ................................................................................................................. 35
Simbologa ...................................................................................................................................................... 36
a) ndice Simple: ......................................................................................................................................... 36
b) ndice Simple de Eslabn: ....................................................................................................................... 37
c) ndice Simple de Cadena:........................................................................................................................ 37
d) ndice Agregado:..................................................................................................................................... 37
e) ndice Agregado de promedios: ............................................................................................................. 38
ndices Agregados Ponderados ...................................................................................................................... 38
a) ndice Ponderado Agregado: .................................................................................................................. 38
b) ndice de Laspeyres: ............................................................................................................................... 39
c) ndice de Paasche: .................................................................................................................................. 39
El efecto de la inflacin en los precios ........................................................................................................... 39
Variacin porcentual: ................................................................................................................................. 40

Comisin 40. Segundo cuatrimestre 2016 Pgina 3 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Indexacin o Inflacin:................................................................................................................................ 40
Desindexacin o Deflacin: ........................................................................................................................ 40
Regresin ............................................................................................................................................................ 41
Mtodos para hallar la Recta de Regresin.................................................................................................... 42
1) Validacin del modelo de regresin ....................................................................................................... 43
2) Funcin de Regresin e interpretacin de los coeficientes. .................................................................. 44
3) Significatividad de los coeficientes:........................................................................................................ 44
3.a Prueba de Hiptesis .............................................................................................................................. 44
3.b Intervalo de Confianza:......................................................................................................................... 45
3.c P Value: ................................................................................................................................................. 46
Significatividad de 1 para el ejemplo: ...................................................................................................... 46
4) Coeficiente de Determinacin R2 .......................................................................................................... 47
5) Coeficiente de Correlacin ..................................................................................................................... 47
6) Estimacin y Error de Estimacin ........................................................................................................... 48
Anlisis de series de tiempo ........................................................................................................................... 49

Comisin 40. Segundo cuatrimestre 2016 Pgina 4 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Introduccin a la Estadstica

La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada caracterstica
en una poblacin, diagramando instrumentos para la recoleccin de los datos, recogiendo los mismos,
organizndolos en tablas, representndolos grficamente y analizndolos para sacar conclusiones de
dicha poblacin.
Es una ciencia transversal a todo el resto de las otras ciencias porque su rea de incumbencia es el anlisis
de informacin que las mismas generan en sus diferentes estudios.
Econometra: Es la rama de la Economa que usa modelos matemticos y estadsticos para
predecir sobre sistemas econmicos.
Psicometra: se encarga del conjunto de mtodos, tcnicas y teoras implicadas en medir y
cuantificar las variables psicolgicas del psiquismo humano.
Biometra: Reconocimiento nico de humanos basado en rasgos conductuales o fsicos.
Control de Calidad: El control de calidad consiste en la implantacin de programas, mecanismos,
herramientas y/o tcnicas en una empresa para la mejora de la calidad de sus productos, servicios
y productividad.

La Estadstica se divide en dos grandes ramas:


Estadstica Descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a
partir de los fenmenos de estudio.
Estadstica Inferencial: Son los mtodos que posibilitan la estimacin de las caractersticas de
poblaciones, a partir de muestras aleatorias de las unidades que la componen, incluye la toma de
decisin estadstica de hiptesis planteadas sobre la base de la teora de las probabilidades
aplicadas a las muestras aleatorias.
La Estadstica Inferencial busca:
Estimar caractersticas poblacionales
Probar Hiptesis formuladas sobre la poblacin
Construir modelos estadsticos y efectuar predicciones.

Tipos de estudios segn como se recopilan los datos:


Estudios Observacionales o descriptivos: El proceso que se observa no est siendo controlado.
Observacin pasiva. Los datos existen sin necesidad de intervencin del investigador. Confusin
de efectos.
Los datos se obtienen por muestras.
Unidad muestral o individuo.
Tratamientos no asignados aleatoriamente.

Estudios Experimentales o manipulativos: El investigador asigna activamente un tratamiento a


los individuos a fin de observar la respuesta. Hay una intervencin. Los datos son generados por
accin del investigador. Los experimentos bien diseados y analizados proveen fuerte evidencia
sobre el efecto de los tratamientos.
Los datos se obtienen por experimentos.
Unidad experimental o individuo.
Tratamientos asignados aleatoriamente a las unidades experimentales.

Comisin 40. Segundo cuatrimestre 2016 Pgina 5 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Fuentes de Informacin Estadstica

Fuentes primarias: aquellas en las que los se obtienen directamente de las unidades originales o
iniciales (personas, empresas, organismos, etc) sin pasar previamente por ninguna entidad o persona
encargada de la obtencin, procesamiento y/o divulgacin.
Fuentes secundarias: las que no cumplen la condicin anterior, es decir, los datos se obtienen de
informes, publicaciones, registros, efectuados por otras entidades.

Definiciones

Poblacin: Coleccin o conjunto de individuos, objetos o eventos, definidos en el tiempo y en el


espacio, cuyas propiedades se analizarn. La misma no se refiere exclusivamente a una coleccin
de personas, sino tambin pueden ser animales, objetos fabricados, sean estos tangibles o
intangibles.
Muestra: Un subconjunto de la poblacin. Existen diversos mtodos para la extraccin de una
muestra en la cual la aleatoriedad de la misma es una condicin deseable dentro de la estadstica.
Unidad de Anlisis: cada una de las unidades que en su conjunto conforman la poblacin.
Variable (o variable de respuesta): Una caracterstica de inters acerca de cada elemento individual
de una poblacin o muestra.
Valor de datos: El valor de la variable asociado con un elemento de una poblacin o muestra. Este
valor puede ser un nmero, una palabra o un smbolo.
Parmetro: Valor numrico que resume todos los datos de una poblacin entera.
Estimacin: Valor numrico que resume los datos muestrales.

Escalas de medicin
Nominal: es una etiqueta o un nombre que identifica un atributo de un elemento, solo pueden
clasificarse en categoras sin poder establecerse un orden entre los mismos Ejemplo: Sexo, profesin,
marca de un auto, nmero de telfono, etc.
Ordinal: los datos muestran las propiedades de los datos nominales y adems tiene sentido el
orden o jerarqua de los datos. Cada grupo o categora se denomina con un nombre o nmero de forma
arbitraria, es decir, que se etiqueta en funcin de los deseos o conveniencia del investigador. Este nivel
de medicin es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

Intervalo: Los datos de intervalo siempre son numricos, permiten determinar la diferencia entre
puntos a lo largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores, ms
la suma y la resta. En estas variables el punto cero de la escala es arbitrario y no significa ausencia de
valor. EJ: temperatura, las calificaciones, la fecha, el CI, etc.
Razn: Estas variables nombran orden, presentan intervalos iguales y el cero significa ausencia de
la caracterstica. La presencia del cero permite realizar todo tipo de operaciones sobre las mismas. Ej: el
ingreso, la velocidad, el peso, la altura.

Clasificacin de las variables


Cualitativa: Sus valores se asocian a una cualidad del elemento analizado.
Nominal: no pueden ordenarse jerrquicamente
Ordinal: Pueden ordenarse jerrquicamente.

Comisin 40. Segundo cuatrimestre 2016 Pgina 6 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Cuantitativa: Sus valores son numricos.


Discreta: Son nmeros enteros donde, entre dos valores consecutivos de la variable, no
existen posibles valores
Continua: entre dos valores consecutivos, una mayor precisin permite obtener un valor
intermedio.

La estadstica descriptiva
Es la rama de las matemticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo,
edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano,
etc.) con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Esta descripcin
se realiza a travs de tablas, grficos y calculo de diferentes medidas para poder, de forma clara, precisa
y rpida, caracterizar y comprender los elementos analizados.

A travs de la simbologa utilizada, se hace la distincin de si los datos analizados corresponden a una
poblacin o a una muestra.
Poblacin: para denotar que la medida calculada corresponde a una poblacin, se utilizan
maysculas y letras griegas.
Muestra: se utilizan letras minsculas y del alfabeto latino.

Medida Poblacin Muestra

Promedio (mu) x

Proporcin (pi) p

Desvo (sigma) S
Estndar

Medidas de tendencia central:


Son valores numricos que ubican, en cierto sentido, el centro de un conjunto de datos.
Promedio: es la media de los datos
Modo: Es el valor de la variable con mayor frecuencia, es decir, el que ms se repite. Requiere
que la informacin este agrupada para su clara visualizacin.
Mediana: Es el valor de variable que separa la cantidad de datos, por encima y por debajo de ella,
en dos partes iguales. Requiere que los datos estn ordenados para un correcto clculo.

Medidas de dispersin:
Describen la variabilidad o dispersin de los datos. Los datos estrechamente agrupados presentan baja
variabilidad y los datos dispersos poseen valores grandes, cuando todos los datos son iguales entre s, la
variabilidad es cero y esta no tiene un lmite superior.
Rango: Diferencia entre el mximo y el mnimo.
Varianza: promedio de los desvos al cuadrado entre cada valor y la media del grupo.
Desvo Estndar: raz cuadrada de la varianza.

Comisin 40. Segundo cuatrimestre 2016 Pgina 7 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Coeficiente de variacin: No tiene unidades y se expresa en porcentajes, es una medida de


variabilidad relativa ya que mide la proporcin que representa el desvo respecto de la media.

Medidas de posicin:
Se usan para describir la posicin que un valor especfico posee en relacin con el resto de los datos
cuando estn los mismos ordenados.
Percentil: Valores de la variable que dividen un conjunto de datos en 100 subconjuntos de igual
tamao.
Se pueden realizar otro tipo de divisiones del conjunto de datos.
Deciles: Se divide en 10 subconjuntos iguales con el 10% de los datos cada uno. El decil 5
corresponde a la mediana.
Cuartiles: Se divide en 4 subconjuntos iguales con el 25% de los datos en cada uno. El cuartil 2
corresponde a la mediana.
Rango Intercuartlico: Diferencia entre el primer y el tercer cuartil.

Medidas de Forma
Asimetra: forma de la distribucin de los datos a ambos lados de la media.
Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima
del valor de la media aritmtica. Dato que las mayores frecuencias de datos se encuentran
para valores pequeos de la variable, la Moda se ubica en esta zona y la mediana, 50% de los
datos aparece rpidamente; la media, debido a la presencia de algunos valores grandes, se
mueve mas hacia la derecha ya que es sensible a los valores extremos.
La curva es simtrica cuando se distribuyen aproximadamente la misma cantidad de valores
en ambos lados de la media. Este tipo de distribucin de los datos tiene la caracterstica que
el Modo, la Media y la Mediana toman exactamente el mismo valor que corresponde al
mximo de la curva.
Y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los
valores menores que la media. Sucede lo contrario que con la asimetra positiva, la media, por
valores extremos pequeos en este caso, se encuentra ms a la izquierda que la mediana y la
moda.

Comisin 40. Segundo cuatrimestre 2016 Pgina 8 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Formas de analizar la informacin

Datos sin agrupar: es la forma en general en la cual la informacin se presenta, si bien permite su
anlisis, la visualizacin de la informacin, presentada de esta forma, no es clara. Con los datos
presentados de esta forma, rpidamente, se dificulta el clculo del modo o la mediana. El anlisis
de los datos, a travs de planillas de clculo, permite obtener todas las medidas de forma exacta.

3 4 5 6 1 2 3 4 5 7
Datos agrupados: en funcin a los diferentes valores que toma la variable, se la ordena y se realiza
el conteo de las observaciones para cada uno de estos valores. Con la informacin presentada de
esta forma, todas las medidas son ms fciles de calcular y el anlisis no pierde exactitud.

N de orificios 0 1 2 3 4 5 6 7 8 9
N de listones 12 38 28 16 13 11 9 7 5 1

Datos agrupados en intervalos: se utiliza por lo general para variables cuantitativas continuas
donde existen muchos valores observados y, en funcin al tamao de la muestra, puede ser nico
o poseer muy pocas repeticiones. Para esto se determina un lmite inferior y uno superior para
cada intervalo, rango en el cual se cuentan las observaciones que pertenecen al mismo. La
caracterstica fundamental de este tipo de agrupacin es que permite una mayor claridad de la
observacin analizada pero todas las medidas calculadas pierden exactitud. Esto sucede ya que
conocemos cuantas observaciones pertenecen al rango pero no sabemos exactamente qu
valor tiene cada observacin individual, por esto, es necesario la creacin de una medida auxiliar
para cada intervalo llamado Punto Medio o Marca de Clase, que es el valor promedio de
intervalo. Para nuestro ejemplo lo puntos medios (PM) son 22.5 {(25+20)/2}; 27.50 {(30+25)/2},
etc.

Intervalos 20 x < 25 25 x < 30 30 x < 35 35 x < 40 40 x < 45


fi 2 4 5 3 1

Para determinar la cantidad de intervalos se utilizan diferentes frmulas que brindan una aproximacin,
la claridad de la presentacin es la regla ms importante.
Frmula de Sturguess: I = 1 + 3.32 * log ( n).
Frmula de la raz: I = raiz(n).

http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-distribucion-curtosis-asimetria.html
Clases 1, 2 y 3 Estadstica Lic Hugo Delfino y Lic Susana Filippini.
Estadstica para Administracin y Negocios Anderson
Sistemas de Informacin Estadstica Apuntes de la catedra Lic Norberto Rodriguez

Comisin 40. Segundo cuatrimestre 2016 Pgina 9 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Probabilidad

A travs de la historia, se busc formular modelos matemticos, de tipo determinsticos o probabilsticos,


para determinar el comportamiento de ciertos fenmenos observables, en forma precisa, en el futuro.
Modelo determinstico: siempre que el experimento sea realizado en las mismas condiciones, el
resultado obtenido ser el mismo. Ejemplo: disparar un proyectil.
Modelo probabilstico: siempre que realice el experimento bajo las mismas condiciones, el resultado
podr ser diferente de entre todos los resultados posibles. Ejemplo: sacar cara o ceca de una
lanzamiento de una moneda.

Definiciones
Experimento Aleatorio: Es un experimento que, pudiendo repetirse indefinidamente en similares
condiciones cada oportunidad, puede presentar distintos resultados.
Espacio muestral: Es el conjunto de todos los resultados posibles de un experimento aleatorio.
E1 = se lanza una moneda y puede salir (cara, ceca).
E2 = se lanza una moneda cuatro veces y se observan la cantidad de caras (0, 1, 2, 3, 4).
E3 = tirar un dado hasta que salga un uno (0,. . 10,. . 123. . .).
E4= temperatura horario del prximo mes.
En E1 y E2, el espacio muestral es finito.
En E3, el espacio muestral es infinito numerable.
En E4, el espacio muestral es infinito no numerable.

Sucesos: Es un subconjunto del espacio muestral.


Suceso cierto: es aquel que siempre ocurre
Suceso imposible: es aquel que nunca puede ocurrir.

Definiciones de Probabilidad

Definicin clsica o de Laplace:


La probabilidad de que se presente un suceso es igual al nmero de casos favorables al mismo, dividido el
nmero total de casos posibles, siempre y cuando stos sean simtricos. Ambos nmeros de casos son
conocidos a priori.

Definicin relativa o emprica:


A veces no conocemos a priori la cantidad de casos posibles o favorables, por lo que repetimos la prueba o
experimento muchas veces y observamos en cuantas oportunidades se dio el suceso A de inters, por
ejemplo: artculos fallados.
Esto permite calcular la frecuencia relativa que, cuando el nmero de pruebas tiende a infinito, la frecuencia
relativa tiende a la probabilidad del suceso.

Comisin 40. Segundo cuatrimestre 2016 Pgina 10 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

En smbolos:

Definicin subjetiva:
La repeticin de un experimento bajo las mismas condiciones es la base para las interpretaciones clsica y de
frecuencia relativa de la probabilidad.
Sucede a veces que la interpretacin de la probabilidad no puede tener su fundamento en la frecuencia de
ocurrencia. La probabilidad se interpreta como el grado de creencia 0 de conviccin con respecto a la
ocurrencia de una afirmacin. En este contexto, la probabilidad representa un juicio personal acerca de un
fenmeno impredecible.
Definicin axiomtica:
Sea S el espacio muestral y E cualquier evento de este, se llamara funcin de probabilidad sobre el espacio
muestral S a P(E) si satisface los siguientes axiomas:
P (E) 0 La probabilidad de un suceso es mayor o igual a cero
P (S) = 1 La probabilidad del espacio muestral es igual a uno
Si A B = P ( A B ) = P (A) + P (B)

Probabilidad total
Dados dos sucesos A y B, la probabilidad de aparicin de alguno de los dos sucesos est dada por:
P(AB)=P(AB)=P(A)+P(B)-P(AB)

Sucesos Mutuamente Excluyentes


Dos sucesos, A y B, son mutuamente excluyentes si A y B son conjuntos disjuntos (separados), es decir A B
= , entonces A y B nunca pueden aparecer juntos.

Probabilidad Marginal
Probabilidad de que se solamente un suceso A.

Comisin 40. Segundo cuatrimestre 2016 Pgina 11 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Probabilidad Conjunta
Dados los sucesos A y B, la probabilidad de aparicin de ambos sucesos estar dada por:
P(AyB)=P(AB)=P(A).P(B/A)=P(B).P(A/B)

Dos sucesos A y B son independientes, cuando, pudindose dar un conjunto, la aparicin de uno de ellos no
condiciona la aparicin del otro, si probabilidad se define como:
P ( A B ) = P ( A ) * P (B )

Probabilidad condicional:
Dados dos sucesos A y B, la probabilidad de aparicin de A habiendo ya ocurrido B est dada por P ( A / B ) .
En forma anloga, la P ( B / A ) indica la probabilidad de que ocurra el suceso B dado que A ya sucedi.
P (A / B ) = P ( A B ) / P ( B ) y P (B / A ) = P (A B ) / P ( A )

Al saber que uno de los sucesos ya ocurri, el espacio muestral esta acotado por la probabilidad de este
suceso ocurrido, en el grafico, la P(A).

Teoria de las Probabilidades Apuntes de Clases Elida Bione

Comisin 40. Segundo cuatrimestre 2016 Pgina 12 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Variable Aleatoria
Definicin
Sea E un experimento aleatorio y S su espacio muestral asociado. Una funcin X que asigna a cada uno de los
elementos de S puntos sobre la recta de los reales. X es una variable aleatoria.
X es aleatoria porque involucra la probabilidad de los resultados del espacio muestral y X es una funcin
definida de manera que transforma todos los resultados posibles del espacio muestral en cantidades
numricas.

Ejemplo:
Se tiran dos monedas y se considera el nmero de caras que aparecen
S = { ss, cs, sc, cc}
X=nmero de caras
X(ss)=0 X(sc)=1
X(cs)=1 X(cc)=2

El espacio Rx es el conjunto de todos los valores posibles de X


y se llama recorrido o campo de variacin de la variable
aleatoria X.
Rx = {0, 1, 2} = 0<=X=<2

1) Variable Aleatoria Discreta

Se dice que una variable aleatoria es discreta si el nmero de valores que puede tomar es contable. Entonces,
entre dos valores consecutivos de una variable aleatoria discreta, no hay ningn nmero que pertenezca al
recorrido de la variable.
A cada valor de Xi se le asigna un valor de probabilidad pi que indica la probabilidad de que la variable X tome
determinado valor.
El conjunto {pi} se denomina funcin de probabilidad puntual si cumple con dos condiciones:
1) cualquier probabilidad calculada es no negativa y menor o igual que uno.
2) Condicin de cierre: la suma de las probabilidades en todo el recorrido de la variable es igual a uno.
El conjunto de pares {xi , pi} se denomina distribucin de probabilidad de X.
Ejemplo:
Se tiran cuatro monedas al aire y se cuentan el nmero de caras
X= nmero de caras en 4 tiradas Recorrido de X=0, 1, 2, 3, 4
La distribucin de probabilidad est dada en la siguiente tabla de frecuencias

X 0 1 2 3 4
P (X) 1/16 4/16 6/16 4/16 1/16

Comisin 40. Segundo cuatrimestre 2016 Pgina 13 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

La funcin de probabilidad discreta se representa 0.4


mediante un grafica de barras o bastones,
recordemos que esta separacin entre las barras 0.3
denota la calidad de la variable de ser discreta.
0.2

0.1

0
0 1 2 3 4

La probabilidad que X tome un valor determinado est dada por la informacin suministrada en la tabla.
P (X=0) = 1/16 o P (X=2) = 6/16
La probabilidad que X tome ms de un valor determinado, estar dado por la sumatoria de las probabilidades
individuales de los puntos de inters.
P (0 X 2) = P (X=0) + P (X=1) + P (X=2) = 1/16 + 4/16 + 6/16 = 11/16.

Esperanza matemtica
La esperanza es un parmetro de la distribucin. Es una medida de tendencia central.
La esperanza E(x) no es un resultado que esperaramos cuando X se observa slo una vez. Representa la
cantidad media que se "espera" de xitos como resultado de un experimento aleatorio cuando la probabilidad
de cada suceso se mantiene constante y el experimento se repite un elevado nmero de veces.

Esperanza matemtica de una Variable Aleatoria Discreta


Se define la esperanza matemtica de una variable discreta como la sumatoria de cada valor de la variable por
la probabilidad de ocurrencia.

E ( X ) x * p( x) 32 /16 2caras X P(X) X * P(X)


0 1/16 0
En promedio, por cada 4 tiradas de una moneda, se 1 4/16 4/16
esperan dos caras. 2 6/16 12/16
3 4/16 12/16
4 1/16 4/16

Variancia
Mide la dispersin cuadrtica entre el valor de la variable y su esperanza matemtica1.
V ( x) 2 [ x E ( x)]* P( x)
V ( x y ) V ( x) V ( y ) 2Cov( x, y ) Si X e Y son variables independientes, la Cov(x,y)=0
V ( x y ) V ( x) V ( y ) 2Cov( x, y )

1
el mtodo matemtica tiene parecidos al utilizado en Descriptiva pero el concepto entre media y esperanza
difieren entre si

Comisin 40. Segundo cuatrimestre 2016 Pgina 14 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Una frmula ms sencilla de trabajo est dada por V ( x) 2 x 2 * P( x) E 2 ( x)

X P(X) X * P(X) X2*P(X)


V ( x) 80 /16 2 1cara
2 2 2
0 1/16 0 0
1 4/16 4/16 4/16
La diferencia promedio entre el nmero de caras y 2 6/16 12/16 24/16
su promedio es de 1 cara 3 4/16 12/16 36/16
4 1/16 4/16 16/16

2) Variable Aleatoria Continua

Dado que la variable es continua, no nos es posible calcular la probabilidad para un valor sino que es necesario
calcular reas entre dos puntos.
Sea X una V.A.C:
La probabilidad puntual es cero: P( X x0 ) 0
b
La probabilidad de un intervalo P(a X b) f ( x)* dx
Esta dada por la integral entre los puntos: a
b
Su esperanza est dada por : E ( x) x * f ( x)dx
a

Su variancia est dada por V ( x) x 2 * f ( x)dx E 2 ( x)

Comisin 40. Segundo cuatrimestre 2016 Pgina 15 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Distribuciones de Probabilidad

Hasta ahora hemos realizado el clculo de las probabilidades a partir del concepto de calcular todas las formas
posibles que puede darse el experimento (casos posibles) y calcular la cantidad, dentro de los casos posibles,
que satisfacen la condicin impuesta (casos favorables).
Dentro del estudio de la probabilidad, existen diferentes algoritmos matemticos, que satisfacen las
condiciones de:
1) Cualquier probabilidad calculada es no negativa y menor o igual que uno.
2) La suma de las probabilidades en todo el recorrido de la variable es igual a uno (condicin de cierre).
y por lo tanto nos permiten denominarlos funciones de probabilidad. Y, si la variable bajo estudio satisface
condiciones propias de la distribucin, permiten calcular la probabilidad del suceso a partir de la aplicacin del
algoritmo.

1) Distribuciones Discretas Probabilidad

1.a. Distribucin Binomial


Si la variable bajo estudio cumple con estas condiciones:
- Dado un experimento aleatorio E que puede presentar dos resultados posibles, xito (A) y Fracaso (),
mutuamente excluyentes.
- Se realizan n repeticiones independientes entre s del experimento.
- El experimento se hace con reposicin, es decir, en cada repeticin, las condiciones previas son
siempre las mismas, esto permite que la probabilidad de A sea constante, es decir, no cambie.
Entonces:
- Se define la variable X como el nmero de veces que aparece el suceso A (xito) en las n repeticiones
independientes del experimento
- X es una V.A.D que toma valores entre 0 (que el suceso no se de) y n (que ocurra en todos los
experimentos.
Siendo los parmetros de la distribucin: n = nmero de veces que se repite el experimento
p = probabilidad de xito o probabilidad a priori

Se representa como: x ~ Bi (n;p)


Puede calcularse la probabilidad puntual del suceso a travs del siguiente algoritmo.

n
- P( x) * p x0 * q n x0 donde:
x0
x: valor de la variable
p: probabilidad de xito
q: probabilidad de fracaso
La probabilidad acumulada estar dada por:

n
x2
P( x1 X x2 ) * p xi * q n xi
x1 x0

Comisin 40. Segundo cuatrimestre 2016 Pgina 16 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

1. b. Distribucin de Poisson
Si la variable bajo estudio cumple con estas condiciones:
- Sea X el nmero de veces que aparece el suceso A en un continuo de espacio/tiempo (km, das, etc)
- X es una V.A.D que vara entre 0 (nunca aparece el suceso) e infinito.
Se define el parmetro de la distribucin (lambda) como el promedio de veces que aparece el suceso A
en dicho continuo de espacio/tiempo.
Se representa como: x Po( )
e * x
Probabilidad puntual P( x)
x!
x2
e * xi
Probabilidad acumulada P ( x1 X x2 )
x1 xi !

2) Distribucin Continua de Probabilidad

Distribucin Normal
En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a
una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada
en fenmenos reales.
La grfica de su funcin de densidad tiene una forma
acampanada y es simtrica respecto de un
determinado parmetro estadstico. Esta curva se conoce
como campana de Gauss y es el grfico de una funcin
gaussiana.
La importancia de esta distribucin radica en que
permite modelar numerosos fenmenos naturales, sociales
y psicolgicos.

La funcin normal tiene las siguientes caractersticas:


- Es simtrica respecto al eje x=
- Es asinttica al eje x para y=0
- Presenta su mximo en
- Un cambio en el valor de produce un desplazamiento a la izquierda o la derecha
- Un cambio en el valor de produce una curva ms o menos apuntalada.
x 2
1 1/2*( )
Su funcin de densidad de probabilidad est dada por: f ( x)

- e
2
Donde x: es una variable aleatoria continua entre - e
2, y e son constantes
y son los parmetros

Simbologa x N ( , 2 )

Comisin 40. Segundo cuatrimestre 2016 Pgina 17 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

La funcin de densidad, como est, no es posible integrarla lo que impide el clculo de probabilidades. Es
por ello que se realiza una sustitucin z=(x-)/ con lo cual se obtiene la denominada Normal
Estandarizada
A partir del clculo se define la Z como cantidad de desvos estndar que existen entre la variable (X) y
el parmetro (), es una distancia entre los valores, ya no medida en su unidad original, sino que esta
medida como una cantidad de desvos entre los puntos.
Una vez obtenida la Z, podremos, a travs de la tablas de probabilidad, encontrar la/las probabilidades
de inters. A diferencia de las otras distribuciones donde se hallaba directamente las probabilidades, ac
es necesario previamente pasar los datos a la Z y luego si a las probabilidades.

Teora de las probabilidades Apuntes de Ctedra Lic. Elida Bione.

Comisin 40. Segundo cuatrimestre 2016 Pgina 18 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Distribucin en el muestreo

En funcin a lo que sabemos de los temas anteriores, el anlisis de la informacin extrada de la poblacin nos
permite hallar diversas medidas (media, mediana, proporcin, varianza) que poseen la caracterstica de ser
parmetros, es decir, valores nicos y que definen a esta poblacin.
Resulta que, en el trabajo de campo de una situacin real, la mayora de las veces el relevamiento de toda la
poblacin bajo estudio resulta muy difcil o imposible de ser realizado.
Uno de los relevamientos ms conocidos es el censo de poblacin, se realiza cada 10 aos pero la tarea de
preparacin, realizacin y anlisis de la informacin dura aos, involucra miles de personas y millones de pesos,
por lo que solo un organismo nacional est capacitado para hacerlo.
En otros casos, el estudio de la poblacin resulta imposible, por ejemplo en una lnea de produccin donde se
producen miles de unidades por da, realizar el control de la calidad del producto llevara muchsimo tiempo y
en algunos casos, este control involucra la destruccin del producto.
Por estas razones y muchas ms, la estadstica nos brinda la posibilidad de realizar este mismo anlisis pero a
una muestra de la poblacin, un subconjunto de la misma, si la muestra cumple con las condiciones de
seleccin (probabilstica) y el tamao adecuado, esta tendr similares caractersticas que la poblacin total.
Pero no todas son virtudes respecto de la muestra, si bien podemos analizar una cantidad menor de unidades,
con la ventaja que ello implica, cada muestra distinta que extraigamos arrojara, cada una, una medida resumen
distinta (promedio, varianza, proporcin, etc.).
Cul de esas medidas resumen halladas en cada muestra es la correcta?

Esta caracterstica de la muestra donde cada una arroja sus propias medidas resumen hace que, lo que en la
poblacin era un estudio de una variable aleatoria que arroja un parmetro, pase a ser en la muestra el estudio
de una variable aleatoria que arroja una medida resumen que sigue siendo una variable aleatoria, por lo cual,
la pregunta anterior an sigue sin respuesta.
Para comenzar a responder esta pregunta, la estadstica nos brinda tres herramientas fundamentales: La ley
de los grandes nmeros (LGN, el Teorema Central del Limite (TCL) y el Teorema de Tchevycheff

Teorema de Tchevycheff

En trminos sencillos ofrece una cota inferior a la probabilidad de que el valor de una variable
aleatoria con varianza finita est a una cierta distancia de su esperanza matemtica. Es cada vez menos
probable que ocurra que X tome un valor mas alejado de la esperanza ().

Ley de los Grandes Nmeros (LGN) Ley fuerte P ( =) = 1 si n

Comisin 40. Segundo cuatrimestre 2016 Pgina 19 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Ley dbil P ( = < ) = 1 si n

La LGN (ley dbil) nos dice que, si X es una variable aleatoria independiente e idnticamente distribuida (IID),
cuando el tamao de la muestra tiende a infinito, el promedio muestral tiende al parmetro .
En palabras ms sencillas, mientras ms grande es la muestra, ms cerca est el promedio muestral del
promedio de la poblacin.
Teorema Central del Lmite
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.28
Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
Funcin de densidad 0.18
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.40
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil 0.21
Versin Estudiantil
0.14 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
0.30 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.09 Versin Estudiantil
0.14 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.20Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.05Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.07 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.10
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Estudiantil
Estudiantil Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil 0.00Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
0.00 4.54 9.07 13.61 18.14
Versin Estudiantil
0.00 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.00 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.00 3.00 6.00 9.00
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
12.00
Versin Estudiantil Variable -2.07 1.46 5.00 8.54 12.07
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
VersinEstudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil

Distribucin Exponencial Distribucin Beta Distribucin Normal


Ac tenemos tres distribuciones continuas muy diferentes entre s, aplicables a variables distintas:
La primera de ella puede aplicarse al tiempo de vida de un producto antes de su falla Ejemplo:
electrodomsticos.
La segunda se aplica al tiempo de reparacin de un motor de auto o avin.
La tercera al peso de las personas o la altura.

Definicin del Teorema Central del Lmite (TCL)


Si se tiene una variable aleatoria IID, de una poblacin cualquiera con promedio y variancia 2, de
la cual se extraen muestras de tamao n con las cuales se construyen estimadores lineales, el
Teorema Central de Lmite (TCL) expresa y demuestra que si la muestra es suficientemente grande
(tericamente tiende a infinito), este estimador tiende a distribuirse normalmente con una media
que es el promedio poblacional original y una variancia 2/n ( x N ( , 2 / n) ) multiplicada por
el factor de correccin para poblaciones finitas (N-n)/(N-1)

Analicemos por partes esta definicin del TCL:

Comisin 40. Segundo cuatrimestre 2016 Pgina 20 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Si se tiene una variable aleatoria IID, de una poblacin cualquiera. . : IID significa Independiente e
Idnticamente Distribuido, esto significa que todas las observaciones son independientes entre s y
todas corresponden a la misma variable observada, es decir pertenecen a la misma poblacin. Algo
que no dice explcitamente es que el TCL se aplica a cualquier distribucin de una poblacin, aun
aquella que es desconocida.
con promedio y variancia 2 para tener promedio y varianza, la variable es cuantitativa.
se construyen estimadores lineales los estimadores lineales que vamos a utilizar son el
promedio, proporcin, diferencia de promedios, diferencia de proporciones.

Estos estimadores son variables aleatorias y las mismas poseen una distribucin de probabilidad
conocida, la normal, con parmetros Media = y Varianza = 2/n. A diferencia de los ejercicios vistos
anteriormente con la normal, la variable ahora pasa a ser el promedio ( ) y por esto, la varianza es
dividida por el tamao de la muestra (n).

~N (; 2 /n) si n

Pensemos esto utilizando el sentido comn y un ejemplo: trabajamos en una empresa donde tenemos 100
empleados con edades entre 20 y 60 aos. Si sacramos muchas muestras de tamao 2 y calculramos el
promedio, seguramente cada promedio muestral seran muy distinto entre s, nos encontraramos con valores
muy grandes, valores muy chicos. En definitiva, estos promedios de muestras de tamao 2 tendra una enorme
variabilidad.
En la otra punta, si tomamos muestras de tamao 95, es decir, tomamos casi toda la poblacin, nos dara que
el promedio va estar muy cerca del parmetro ya que solo dejamos afuera cinco personas y los sucesivos
promedios muestrales daran valores muy similares entre s, cuestin que indica poca dispersin entre los
promedios muestrales.
Desde el TCL esto se ve en la expresin de la varianza del promedio (2 /n) que disminuye a medida que
aumenta el tamao de la muestra. Como dijimos, esto se da porque los promedios de cada muestra son muy
similares entre s.

Datos muestrales
Distribucion de las medias muestrales mu=10; sigma=20; n=4
para distintos tamaos de muestra mu=10; sigma=20; n=16
mu=10; sigma=20; n=100

0.2

0.16
densidad

0.12

0.08

0.04

0
-40 -20 0 20 40 60
x

Comisin 40. Segundo cuatrimestre 2016 Pgina 21 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Estas herramientas, el TCL y la Ley de los Grandes Nmeros (LGN), junto con el teorema de Tchevycheff, nos
permiten entrar en la estadstica Inferencial, es decir, estimar una caracterstica de la poblacin a travs de la
informacin provista por la muestra.
Para realizar esto necesitamos una herramienta ms que es comenzar a distinguir, a travs de la notacin
utilizada, si los datos corresponden a una poblacin o a una muestra, esto tiene una razn de ser:

Parmetro Estimador
=xi = xi
N n
=(x-)
2 2
S= (x- )2
N n -1
=A/N P= a/n

La frmula o algoritmo matemtico aplicado a la muestra debe cumplir una serie de condiciones o propiedades
que le brindan la caracterstica fundamental de ser un estimador.
En tanto y en cuanto cumple estas condiciones, podremos hacer estadstica Inferencial, es decir, a travs de
una muestra y con la aplicacin del estimador, podremos estimar un valor de la poblacin.
Propiedades de los Estimadores
Las propiedades que nos permitirn considerarlos ESTIMADORES son:
Insesgadez: E () = Si pudiramos tomar todas las muestras posibles de tamao n y a ellas calcularles
el promedio, suponiendo que cada promedio es equiprobable, el promedio de promedios muestrales
es igual al promedio poblacional.

Consistencia: lim [( ) < ] = 1 A medida que el tamao de la muestra tiende a infinito,



el estimador tiende al parmetro poblacional.

Suficiencia: El estimador utiliza toda la informacin brindada por los datos de la muestra.
Eficiencia: El estimador posee varianza mnima.
Mtodos para hallar los estimadores:
Mxima Verosimilitud
Momentos
Bayesiano.
Entonces:
Estimador: algoritmo que cumple las condiciones previamente mencionadas. Se construye con los
valores correspondientes a los elementos que integran una muestra y que, como su nombre lo
indica, sirven para obtener estimaciones del correspondiente valor poblacional o parmetro
desconocido que se intenta estimar o verificar.
Estimacin: resultado aplicado a la muestra.
Estimacin Puntual: se calcula el valor de inters a partir de la muestra para estimar el parmetro.

Comisin 40. Segundo cuatrimestre 2016 Pgina 22 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Comisin 40. Segundo cuatrimestre 2016 Pgina 23 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Estimacin por Intervalo de Confianza

Dado que el estimador es variable, no puede decirse con exactitud cul es el valor del parmetro. Pero al
conocerse su distribucin puede armarse un intervalo o rango de valores que, con un determinado nivel de
confianza, se espera que contenga al parmetro.

P (Li < < Ls)= 1 -

Li: lmite Inferior


Ls: Lmite Superior.
1 : Nivel de Confianza

P(- Z (1-/2) Z Z (1-/2))= 1- Siendo -


Z=
/
P(- Z (1-/2) Z (1-/2))= 1-
/
P(- Z (1-/2) * / Z (1-/2) * /)= 1-

P( Z (1-/2) * / + Z (1-/2) * /)= 1- Intervalo de Probabilidad

Una vez que otorgamos valores, en base a la muestra, al


intervalo de probabilidad, este deja de serlo y pasa a ser
un intervalo de confianza.
Si se valora por ejemplo: P (80 320) =0,95
Con la nica muestra que poseemos, armamos los limites
inferiores (LI) y superiores (LS), donde la probabilidad es de
0 (no lo contiene) o 1 (lo contiene) que contenga al
parmetro, es decir, entre 80 y 320 est o no el parmetro.
El hecho de solo tener una muestra hace que el intervalo
sea de confianza.
Con una confianza de 0,95 se espera que el intervalo (80; 320) contenga el verdadero valor del parmetro.
Si extrajramos muchas muestras, como se ve en la grfica, 95 de cada 100 intervalos se espera que contenga
a . En el caso del grfico, estn marcados en rojo los cuatro intervalos de confianza que no contienen al
parmetro.

Comisin 40. Segundo cuatrimestre 2016 Pgina 24 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Error de Estimacin

Se denomina error de estimacin a la distancia que existe entre el promedio muestral y cada uno de los
limites (Superior e Inferior) del Intervalo de Confianza, en definitiva el error de estimacin es el trmino que
se suma para hallar el lmite superior y el mismo valor se resta para hallar el lmite inferior.
Determinantes:
1. Nivel de confianza
2. Desvo (depende del muestreo). e = Z1-/2 * /
3. n
De la frmula el Error se deduce la del tamao de muestra para un Muestreo Aleatorio Simple (MAS).
Error de Estimacin:
e = Z1-/2 * /
Elevando ambos miembros al cuadrado se obtiene: Siempre se usa Z para el clculo del n

e2 = Z2 1-/2 * 2 /
Y luego, despejando n, queda:

2
= (Z2 1-/2 * 2) / e

El error de estimacin tiene tres condicionantes:


a) Cuando el nivel de confianza (Z) aumenta, el error de estimacin ser mayor lo que implica una
menor precisin ya que, los valores posibles son mucho ms.
b) Cuando la varianza aumenta, el error de estimacin aumenta.
c) Cuando el tamao de la muestra (n) aumenta, el error de estimacin disminuye logrando ms
precisin.

Distribucin t de Student

Sucede muchas veces que no se posee informacin respecto al valor de la varianza poblacional, la misma se
dice es desconocida, por lo que nos vemos en la obligacin de calcular la varianza a partir de los datos de la
muestra con la que estamos trabajando, as como el promedio es una variable aleatoria por cambiar de
muestra en muestra, tambin lo es la varianza muestral (S2 ) y la frmula sufre una pequea variacin ya que
cambia la distribucin usada para su clculo.

P( t(n-1; 1-/2) * S/ + t(n-1; 1-/2) * S /)= 1-

La Distribucin t de Student tiene como parmetros, los grados de libertad que son la cantidad de datos menos
1 (n-1) y el nivel de confianza.
Una caracterstica importante de la distribucin t, es que a medida que n tiende a infinito, esta distribucin se
aproxima asintticamente a la distribucin normal, en trminos prcticos, si debiramos usar la distribucin t
para una muestra superior a 120 (n>), podramos, con un mnimo de error, utilizar la tabla z.

Comisin 40. Segundo cuatrimestre 2016 Pgina 25 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Intervalo de Confianza para la proporcin

Proporcin= x/n Varianza Binomial= V(x)= n *p* q


Entonces V(x/n)= (n*p *q) / n2
Simplificando obtenemos: V(x/n)= (p *q) / n

Entonces D(x/n) =

As el intervalo de Confianza para la proporcin es:


P(p Z (1-/2) * p + Z (1-/2) * )= 1-

Y el tamao de la muestra:

= (Z2 1-/2 * p*q) / e2

Comisin 40. Segundo cuatrimestre 2016 Pgina 26 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Prueba de Hiptesis
La Prueba de Hiptesis es un procedimiento mediante el cual se pone a prueba una suposicin sobre algn
parmetro (, , etc.) comparndolo con un valor extrado de una muestra.
El procedimiento tiene 5 pasos que se detallan a continuacin:
1) Planteo de la H0 y H1 en funcin al estudio de inters.
2) Definicin del nivel de error : este valor lo define el investigador.
3) Definicin del estadstico de prueba asociado al tipo de valor bajo estudio.
4) Regla de Decisin: grfica en la cual se define la cola de la prueba y la zona de decisin en funcin al
valor crtico de tabla asociado al nivel de error.
5) Clculo del valor del estadstico y decisin de Rechazar o No Rechazar.

1) Planteo de las hiptesis:


La prueba de hiptesis se realiza a travs del planteo de dos hiptesis:
- H0 o Hiptesis Nula.
- H1 o Hiptesis Alternativa.
Ambas se construyen en base al valor poblacional conocido y son contrarias entre s.
H0 supone que la situacin no ha sufrido ningn cambio, mantenindose iguales las condiciones
previas existentes.
H1 Recoge el cambio postulado a partir de la duda planteada.
La decisin final siempre se toma en base a la H0
Pasos para el planteo:
- Plantear H0) =. Algo (no cambio)
- Plantear H1) <. Algo (Recoge la duda)
- Dado que las hiptesis en su conjunto deben cumplir la condicin de exhaustividad, es decir, entre
ambas hiptesis contemplar todos los valores posibles de la variable (entre - y +), se corrige la
H0:
H0) algo (no cambio)
H1) <algo (recoge la duda o suposicin de cambio)

La duda planteada en H1 marca cuales son los valores de inters, para determinar la cola de la prueba de
hiptesis, es decir en que se sector de la curva estar el error () designado para el estudio y esto permite
delimitar las zonas de rechazo y de no rechazo de H0.
-Si suponemos que hubo una disminucin del valor poblacional, H1 ser menor que y la prueba ser cola
izquierda
-Si suponemos que hubo un aumento del valor poblacional, H1 ser mayor que y la prueba ser cola derecha.
-Si suponemos que el valor poblacional debe tomar un valor especifico, igual que, H1 ser distinta y la
prueba tendr en error distribuido en partes iguales a ambos lados de la curva.

Comisin 40. Segundo cuatrimestre 2016 Pgina 27 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

2) Definicin del alfa ()


Este valor es definido por el investigador y permitir encontrar los valores crticos asociados a la distribucin
utilizada y con esta construir, en la grfica, las zonas de rechazo y de no rechazo
La zona de rechazo abarca, desde el crtico delimitado por el alfa, hacia el extremo de la curva, si es cola
izquierda ser hacia -, si es derecha ser hacia y si es bilateral, tendr dos zonas de rechazo con la mitad
del alfa a cada lado.

3) Definicin del estadstico


En funcin a la hiptesis nula y a los parmetros puestos a prueba, es el estadstico de prueba a utilizar, una
caracterstica que podemos utilizar es que, por lo general, denominamos al estadstico de prueba con el
nombre de la distribucin a utilizar, es decir, si el estadstico se llama t ser porque usamos la t de Student,
si se llama Z es porque usamos la normal estandarizada.
A este estadstico lo denotaremos con el subndice n para denotar que es el valor del estadstico de prueba
y al valor crtico lo denotaremos con un subndice c.

4) Regla de decisin

Prueba de Cola Izquierda Prueba Bilateral Prueba de Cola Derecha


H0) H0) = H0)
H1) < H1) H1) >

Donde: 1-: Nivel de Confianza. : error Zc: Z crtico


La regla de decisin en el grfico de la curva de distribucin asociada la cual posee:
a) Segn sea la cola, marcaremos la zona donde se encuentra la confianza (1-) y el error ().
b) Esta zona est delimitada por el valor critico hallado en la tabla de distribucin correspondiente y en
funcin a los parmetros de esta.
c) Marcadas las zonas, llamaremos, segn corresponde, a la zona de rechazo y la zona de no rechazo.
d) Por ltimo, marcaremos el valor que toma el estadstico de prueba.

5) Clculo del valor del estadstico y decisin de Rechazar o No Rechazar.


Supongamos ahora que probamos una media:
Dado que siempre van a existir diferencias entre el valor muestral y el poblacional, a partir de un nivel de
confianza (1-), se define el Z Crtico (Zc) o, lo que es lo mismo, cantidad mxima de Z (distancia en trminos
de Z) de diferencia permitidos entre los valores y ( es el valor supuesto).
Si la distancia entre y es mayor que la permitida, el Zn, el valor que surge de reemplazar los valores para
calcular el estadistico, cae en Zona de Rechazo, esto indica que se Rechaza H0 y se puede decir que la muestra
no es responsable de la variacin, por lo tanto el parmetro sufri cambios en la direccin determinada en la
H1 (>, <, o ).

Comisin 40. Segundo cuatrimestre 2016 Pgina 28 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Si la distancia entre y es menor al Z crtico No se rechaza H0 y se dice que las diferencias entre estos valores
son responsabilidad de la muestra.
Rechazo H0: dada la muestra y el nivel de confianza seleccionado se Rechaza H0, por lo tanto (variable) ha
sufrido un .(el cambio aumento/disminucin-). Las diferencias entre y son significativas. El termino
significativo, de una forma mas coloquial, quiere decir que hay mucha diferencia con lo planteado en la
H0. El mucho o poco esta cuantificado por el valor critico.
No Rechazo H0: dada la muestra y el nivel de confianza seleccionado no se Rechaza H0, por lo tanto
(variable) no ha sufrido cambios. Las diferencias entre y no son significativas.
Al trabajar con un nivel de confianza, implica que tambien tenemos un nivel de error, es decir, podemos tomar
una decision equivocada con la muestra trabajada, en funcion a como es la hipotesis nula y la decision tomada,
se construye la siguiente tabla.
- La Hipotesis nula tiene dos posibles respuestas: es verdadera o falsa.
- La decisin tomada tiene dos alternativas: Rechazo o No Rechazo.
Hipotesis Nula
Verdadera Falsa
Hipotesis 1-
Rechazo
Nula
No 1-
Rechazo

Decisiones Acertadas Decisiones Erroneas

P(No R H0/V) = 1- (verdadero Positivo) P(R H0/V) = Error tipo I


P(R H0/F) = 1 - (verdadero Negativo) P(No R H0/F) = Error tipo II

El error que se puede cometer est asociado directamente a la decisin tomada en la prueba de hiptesis:
- Si rechazo la Hipotesis Nula, solo puedo estar cometiendo Error tipo I y no otro.
- Si No rechazo Hipotesis Nula, solo puedo estar cometiendo error tipo II y no otro.
La palabra puedo es importante ya que implica un riesgo, no implica la certeza de cometer error ni que no
existe posibilidad de cometerlo.

P Valor
P Valor, PV o P Value, se define como la probabilidad debajo de la curva, acumulada, de obtener un resultado
tanto o ms extremo del estadstico de la prueba calculado, suponiendo H0 Cierta.
Zc: Z crtico que surge de la tabla en funcin a
la confianza y define las regiones de Rechazo
y No Rechazo.

Zn: estadstico de prueba.

Probabilidad de un valor ms extremo


que el estadistico.

Comisin 40. Segundo cuatrimestre 2016 Pgina 29 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Reglas de Decisin comparadas:


Decision Rechazo H0 No Rechazo H0
Uso de estadistico (distancias) |Zn|>|Zc| |Zn|<|Zc|
Uso de probabilidades Pv < Pv >
Uso del IC IC no contiene al parmetro IC contiene al parmetro

Definicin del Estadstico en funcin a la informacin:

Comisin 40. Segundo cuatrimestre 2016 Pgina 30 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Hasta el momento, los anlisis de pruebas de hiptesis que realizamos han tenido la caracterstica de
realizarse sobre medidas de resumen de una muestra (media, proporcin) basadas en variables cuantitativas
dejando de lado un grupo importante dentro de cualquier estudio que lo conforman las variables
cualitativas. Para el anlisis de este tipo de variables y utilizando tablas de contingencia donde se relacionan
dos de ellas, existe una distribucin de probabilidad, denominada Chi-cuadrado, que permite contrastar
diferentes hiptesis sobre las variables introducidas en la tabla de contingencia. Tengamos en cuenta que la
tabla de contingencia tambin puede incluir variables cuantitativas.

Prueba de Independencia 2
En la unidad de probabilidad examinamos si dos sucesos eran independientes o no, lo que implicaba que, si
bien pueden darse simultneamente, la presencia de uno de ellos no condiciona la presencia del otro. Ahora
lo que haremos es extender el anlisis a todos los sucesos de las variables involucradas.
En esta prueba estamos interesados en determinar si dos cualidades o variables referidas a individuos de una
poblacin estn relacionadas. Por ejemplo: sexo y nivel educativo. Buscamos ver la relacin existente entre
dos variables medidas a una misma poblacin.
Por ser una prueba de hiptesis, debemos seguir la misma metodologa que se aprendi anteriormente.

Ejemplo:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una muestra
aleatoria simple de 100 jvenes, con los siguientes resultados:
Sin depresin Con depresin Total
Deportista 38 9 47
No deportista 31 22 53
Total 69 31 100

Tenemos en este caso dos variables (Depresin y Deportista) donde cada una de ellas tiene dos categoras.
1) Definir las hiptesis:
H0) ij = i * j las variables analizadas son independientes entre s.
H1) ij i * j las variables analizadas no son independientes entre s.
Lo que en realidad hacemos es extender la propiedad vista en probabilidad que se limitaba a dos sucesos
particulares a todos los sucesos posibles.
2) Error =0.05
O E
2
3) Estadstico de Prueba
2

E
Donde: 2 es el nombre del estadstico y la distribucin utilizada.
O: cada uno de los valores observados en la tabla de contingencia
E: valor terico que debera tener la celda suponiendo que las variables son independientes.
El estadstico se construye como la sumatoria de las diferencias entre lo observado y el valor que debera tomar
suponiendo la independencia.

4) Regla de decisin

Comisin 40. Segundo cuatrimestre 2016 Pgina 31 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

5,823

2c=3.84

Zona de no rechazo Zona de rechazo

Para buscar el valor crtico debemos saber que, al igual que la distribucin t de Student, la distribucin Chi
tiene como parmetro los grados de libertad. En esta prueba los GL se definen como:
Grados de Libertad = (Filas-1)*(Columnas-1)
Entonces: GL = (F-1)*(C-1) = (2-1) * (2-1) = 1
Esto determina, dado los marginales, la cantidad de celdas que pueden tomar cualquier valor, es decir, una
sola celda toma cualquier valor y el resto de las celdas toman un valor particular ya que deben ajustar a los
totales.
En funcin al nivel de confianza (0.95 o 95%) y los GL de la tabla de contingencia, buscamos el critico.
Entonces: 2c = 2(1-; GL) = 2(0,95; 1) = 3,84

5) Clculo y decisin:

Para construir la tabla de valores esperados, aplicamos la propiedad de independencia tomando como datos
las cantidades marginales para calcular las cantidades conjuntas.
Podremos luego verificar que la sumatoria de las conjuntas no cambio los marginales.
Sin depresin Con depresin Total
Deportista 69*47/100=32.43 31*47/100=14.57 47
No deportista 69*53/100=36.57 31*53/100=16.43 53
Total 69 31 100

Comisin 40. Segundo cuatrimestre 2016 Pgina 32 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Una vez armada la segunda tabla, procedemos a armar la tercera donde calculamos las diferencias para cada
celda y sumamos todos los valores (0.957 + 2.129 + 0.848 + 1.888 = 5.823) el cual nos da el estadstico de
prueba. Como vemos en el grfico, el valor del estadstico cae en la zona roja definida como la zona de
rechazo.
Sin depresin Con depresin Total
Deportista (38 - 32.43)2 = 0.957 (9 14.57)2 = 2.129
32.43 14.57
No deportista (31 - 36.57)2 =0.848 (22 16.43)2 =1.888
36.57 16.43
Total 5.823

Dado que 2n = 5,823 > 2c = 3.84, entonces rechazo la H0, las variables Depresin y deportista no son
independientes.

Comisin 40. Segundo cuatrimestre 2016 Pgina 33 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Prueba de Homogeneidad 2
Utilizando la misma distribucin podemos realizar la prueba de homogeneidad. Si bien la tabla de contingencia,
en su presentacin de los datos, es igual a la utilizada en la prueba de independencia, ac consideramos que
una de las dos variables bajo estudio es controlada por el investigador lo que produce que, o los totales filas
o los totales columnas tienen valores predeterminados. Con esto buscamos analizar si las proporciones entre
las categoras de la variable no controlada son las mismas para cada variable controlada.
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al distribuidor
que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3
distribuidores que nos sirven el producto comprobando el nmero de defectuosos en cada lote. La siguiente
tabla muestra el nmero de defectuosos en para cada uno de los distribuidores.
Componentes Componentes Total
Defectuosos correctos
Distribuidor 1 16 94 100
Distribuidor 2 24 76 100
Distribuidor 3 9 81 100
Total 49 251 300

En este caso queremos analizar si las muestras de cada distribuidor (variable controlada en fila) poseen las
mismas proporciones de componentes defectuosos y correctos (variable no controlada en columna), es
decir, si pertenecen a la misma poblacin.
1) Definir las hiptesis

H0) 1j = 2j = 3j las i-muestras tienen la misma proporcin (pertenecen a la misma poblacin)


H1) Alguna proporcin es distinta, por lo tanto surgen de distintas poblaciones.
Dado que la variable controlada esta en fila, los subndices de las hiptesis nula se plantean de la forma 1j,
esto quiere decir la proporcin j de la fila 1 es igual a la proporcin j de la fila 2 que es igual . . . .
Si la variable controlada estuviera en columnas, el subndice seria i1, i2, i3 . . . .
2) Error =0.05
3) Estadstico de Prueba O E
2

E
Los pasos 4 y 5 son similares a las de la prueba de independencia solamente cambia la decisin tomada ya que
la prueba de hiptesis, en la H0, hace otra suposicin.

Comisin 40. Segundo cuatrimestre 2016 Pgina 34 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Nmeros ndices

Definicin y utilidad
El nmero ndice nos permite valorar de forma ms clara y rpida la evolucin en el tiempo o en el espacio de
variables numricas que refieren a muy diferentes aspectos de la realidad.
- En cunto se increment la produccin?
- En cunto variaron los salarios en el ltimo ao?
- Cunto crecieron las ventas desde la implementacin de la promocin?
- Qu zona tuvo un mayor incremento de ventas?
- Los salarios perdieron contra la inflacin?

La comparacin relativa de los cambios de los valores de la variable que nos da el numero ndice, sea este
cambio a travs del tiempo o del espacio, generalmente brinda al analista una idea ms precisa de la magnitud
de tales cambios que la comparacin en trminos absolutos.

Decir que la produccin aumento en 15% en el ltimo trimestre brinda ms informacin que decir que se
produjeron 850 ms de piezas.

Caractersticas
Cada ndice es una cifra relativa, usualmente porcentual, que expresa una medicin (precios o
cantidades) de un artculo (ndice simple) o ms frecuentemente de un conjunto de artculos (ndice
agregado) con relacin a otro periodo, antes o posterior, denominado base.
Todo ndice carece de unidad de medida al ser el cociente entre valores medidas en la misma unidad
de medida.
Son series temporales, es decir, varan en el tiempo o pueden variar en el espacio.
Son indicadores de tipo comparativos, es decir, su significacin depende de la comparacin entre los
valores de la misma serie.
La base corresponde al periodo, arbitrariamente elegido, en el cual al ndice se le adjudica el valor
I0=100.

Utilizacin de los nmeros ndices


1) Indicador de la evolucin de un proceso de precios o cantidades en el tiempo o en el espacio.
2) Indexacin o Inflacin de precios.
3) Desindexacin o Deflacin de precios.
4) Pronosticacin.
5) Determinacin de la estructura porcentual de la variable precios o de la variable cantidad de un
conjunto de bienes.

Comisin 40. Segundo cuatrimestre 2016 Pgina 35 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Simbologa
El subndice t nos indica el periodo que estamos analizando o periodo de inters.
El subndice 0 nos indica el periodo que tomamos como base para el anlisis o periodo base.
El subndice t-k nos indica un periodo que esta hacia atrs k periodos respecto del periodo t de
inters.
El subndice t +k nos indica un periodo hacia adelante k periodos respecto del periodo t de inters.

En base a la siguiente informacin suministrada por la empresa Solrac SA, vamos a realizar un anlisis
calculando diferentes nmeros ndices.
Se calcularan todos los ndices tomando el mismo periodo de inters y base para poder hacer una comparacin
de los mismos.
Periodo Ao 2012 Ao 2013 Ao 2014 Ao 2015
Producto Precio Cantidad Precio Cantidad Precio Cantidad Precio Cantidad
Led 32 4500 210 5200 230 6300 240 8400 260
Notebook 9000 160 9800 150 10800 170 13000 190
Garantas 150 50 200 80 300 100 400 120

a) ndice Simple:
Este ndice se construye para mostrar las variacin de una sola variable referidos al un valor llamado periodo
base.

PT
I P (T / 0) *100 donde P nos dice que es un ndice de precios, para el periodo T, tomando como
P0
base el periodo 0.

Calcule el ndice precios 2015 tomando como base el periodo 2012.


8400
I P (2015 / 2012) *100 186.66
4500

Comisin 40. Segundo cuatrimestre 2016 Pgina 36 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

b) ndice Simple de Eslabn:


Este ndice mide los cambios relativos, de una sola variable, entre periodos sucesivos .La base en este ndice
siempre es el periodo anterior.

PI
I EP ( I / I 1) *100
PI 1
Calcule los ndices de Eslabn entre 2012 y 2015
P2015 8400
I EP (2015 / 2014) *100 *100 133.33
P2014 6300
P2014 6300
I EP (2014 / 2013) *100 *100 121.15
P2013 5200
P2013 5200
I EP (2013 / 2012) *100 *100 115.55
P2012 4500

c) ndice Simple de Cadena:


A partir de los ndices de eslabn, que calculan variacin entre periodos sucesivos, se construye en ndice de
cadena que arroja como resultado el ndice simple entre el periodo t y el periodo 0.

I EP ( I / I 1) I EP ( I 1/ I 2) I EP ( I 2 / I 3)
I CP ( I / 0) * * *100
100 100 100
133.33 121.15 115.55
I CP (2015 / 2012) * * *100 186.66
100 100 100

d) ndice Agregado:
Es las suma de las magnitudes (precio, cantidad, etc) de las variables consideradas (Led, notebook, seguro,
etc.) entre el periodo de inters t y el periodo base 0.

xit
I AP ( I / 0) *100
xi 0
(8400 13000 400) 21800
I AP (2015 / 2012) *100 *100 159.70
(4500 9000 150) 13650

Comisin 40. Segundo cuatrimestre 2016 Pgina 37 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

e) ndice Agregado de promedios:


En el ndice agregado calculado anteriormente vemos que, tanto el numerador como el numerador surge por
la simple sumas de los precios, esto produce que las variaciones de las magnitudes ms grandes (precio
notebook=13000) tenga mucho ms relevancia que los precios de magnitud pequea(precio seguro=400), esto
genera una distorsin en el ndice, ya que, tienen mas relevancia las diferencias nominales, (la notebook paso
de 9000 a 13000 y el seguro de 150 a 400) que las diferencias porcentuales (la notebook aumento 44% y el
seguro 166%).

xit

xi 0
I PP ( I / 0) *100
n
8400 13000 400
( )
(1.8666 1.4444 2.6666)
I PP (2015 / 2012) 4500 9000 150 *100 *100 199.25 Vemos
3 3
como la variacin de los seguros, de menor magnitud pero con mayor variacin porcentual, tiene, en la
suma, un mayor impacto ahora que en el ndice agregado.

ndices Agregados Ponderados


Construir un ndice con un sola variable a veces puede ser engaoso ya que , dentro de la empresa, las
cantidades que se venden pueden ser disimiles y esto produce que, una variacin grande de un ndice de
precios no tenga correlato en los niveles de ventas. Esto sucede por ejemplo, si tenemos un producto que
sufri un aumento de precios grande en comparacin al resto, pero que esto causo que las cantidades vendidas
desciendan a cero. El ndice de precios dar muy alto pero se hace necesario ver tambin la influencia que
poseen las cantidades vendidas.
a) ndice Ponderado Agregado:
Por ser agregado tiene en cuenta las varias magnitudes (precios) y esta ponderada por otra variable
(cantidades). La primera magnitud indica que tipo de ndice es (precio o cantidad) y la segunda indica la
ponderacin (precio o cantidad).
( Pit * Qit )
IPA( I / 0) *100 nos indica un ndice de precios
( Pi 0 * Qi 0 )
(Qit * Pit )
IPA( I / 0) *100 nos indica un ndice de cantidades
(Qi 0 * Pi 0* )
(8400*260 13000*190 400*120) 4702000
IPA(2015 / 2012) *100 *100 196.53
(4500*210 9000*160 150*50) 2392500
Este ndice tambin denominado ndice de Valor ya que involucra para el mismo periodo precios y cantidades.
Posee la desventaja que, al tomar las cantidades de dos periodos diferentes, no podemos establecer
claramente si las variaciones del ndice se deben a variaciones en el precio o variaciones en la cantidad.

Comisin 40. Segundo cuatrimestre 2016 Pgina 38 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

b) ndice de Laspeyres:
Este ndice agregado tiene la caracterstica principal de tomar las cantidades nicamente del periodo base,
permitiendo de esta forma que las variaciones del mismo sea exclusivamente debido a las variaciones de
precios, es el ndice que se utiliza para la construccin del ndice de Precios al Consumidor (IPC).
( Pit * Qi 0 )
IPL( I / 0) *100
( Pi 0 * Qi 0* )
(8400* 210 13000*160 400*50) 3864000
IPL(2015 / 2012) *100 *100 161.50
(4500* 210 9000*160 150*50) 2392500
La desventaja es que, con paso del tiempo, hay en la gente cambios de gustos, modas o necesidades que
producen variaciones en las cantidades demandadas o el surgimiento de nuevos productos que no son tenidos
en cuenta.
c) ndice de Paasche:
Opera de la misma forma que el ndice de Laspeyres pero con la diferencia que las cantidades utilizadas en
este caso corresponden a las del periodo de inters, esto mantiene mas actualizado el ndice al tomar en
cuenta los factores que Laspeyres dejaba de lado.
( Pit * Qit )
IPP( I / 0) *100
( Pi 0 * Qit* )
(8400* 210 13000*160 400*50) 4702000
IPP(2015 / 2012) *100 *100 162.49
(4500* 210 9000*160 150*50) 2898000
La desventaja de este ndice es que obliga a una continua actualizacin de las cantidades utilizadas y esto
implica que puede haber diferencias entre los periodos de la serie, generando ruido en el ndice de precios.

El efecto de la inflacin en los precios


Los ndices de precios buscan justamente estudiar las variaciones que sufren los mismos a travs del tiempo.
Estos cambios pueden deberse a factores endgenos (reduccin de costos, cambios de materiales, mejoras
tecnolgicas, etc) pero tambin pueden deberse a factores exgenos donde, el de mayor relevancia, es el
efecto de la inflacin.
Las variaciones que esto genera en los precios hace que, en un perodo extenso de tiempo, estos no sean
posibles de ser comparados.
Para subsanar este defecto que poseen los precios corrientes, precios nominales del bien o servicio al
momento de la compra, se hace necesario eliminar el efecto de la inflacin acumulada entre los precios a
comparar, de modo de obtener lo que se denomina precios constantes.
La ventaja de la obtencin de precios constantes es que de esta forma si son comparables los mismos a pesar
de corresponder a distintos momentos y la tcnica nos permite obtener este tipo de precios para cualquier
periodo dentro de la serie, sin ser necesariamente alguno de los periodos comparados o de los varios de la
serie que la componen.
Para realiza esta actualizacin de los precios, es necesario un ndice de precios, en general, se utiliza el IPC
que justamente esta creado para recoger la variacin de precios, inflacin, de los bienes y servicios.

Comisin 40. Segundo cuatrimestre 2016 Pgina 39 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Variacin porcentual:
Podemos establecer cul es la variacin porcentual de dos valores correspondientes a la misma variable, sea
esta variacin debida por el paso del tiempo o de los productos diferentes al mismo momento.
It
%(t / t k ) ( 1) *100
It k
Esta frmula nos permite calcular la variacin porcentual de un ndice (I), aunque puede ser tambin un precio,
entre dos periodos distintos donde existen k periodos entre ellos.
Utilizando los datos del ndice de eslabn, analizaremos la variacin entre 2015 y 2013
133.33
%(2015 / 2013) ( 1) *100 15.38%
115.55

O tambin podemos calcular la variacin entre 2015 y 2013 del precio de la notebook.
13000
%(2015 / 2013) ( 1) *100 32.65%
9800
Indexacin o Inflacin:
La indexacin es la inclusin en un precio o ndice, de las variaciones causadas por la inflacin, en general, en
todas las economas, la indexacin de precios genera un aumento de los mismos a medida que pasa el tiempo.
Esta frmula tiene semejanzas con las vistas en matemtica financiera de inters, donde %(t / t k ) es la
variacin que hubo entre los periodos bajo estudio, tengamos en cuenta que el incremento no debe expresarse
como porcentaje.
Pt Pt k *(1 (t / t k ))

P2015 P2013 *(1 0.3265) 9800*1.3265 13000


Lo que hacemos con este mtodo es adelantar en el tiempo, a un solo periodo determinado, el o los
precios que se desean comparar.

Desindexacin o Deflacin:
Es inverso a la indexacin, lo que hacemos por este mtodo es llevar los precios de inters hacia un periodo
alejado en el tiempo, es decir, pasamos el precio P(t) al periodo P(t-k). Esta frmula surge de operar
matemticamente la formula anterior.
Para esto construimos el ndice de precios (It) de las notebook entre 2015 y 2013 donde 2013 toma valor 100
por ser el periodo base.
13000
I 2015/2013 *100 132.65
9800
It k I 100
Pt k Pt * P2013 P2015 * 2013 P2013 13000* P2013 9800
It I 2015 132.65

Fuente: Nmeros ndices Apuntes del Lic Norberto Rodriguez


Estadstica aplicada en las Ciencias Sociales y Humanas - Nio

Comisin 40. Segundo cuatrimestre 2016 Pgina 40 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Regresin

Este anlisis est relacionado con el estudio de la dependencia de una variable a la cual denominamos Y, con
una o varias que buscan explicarla, denominada variable independiente o denotada como X con el objetivo de
estimar y/o predecir el valor de la variable Y en trminos de valores conocidos de X.

Dado que todas las variables con la que estamos trabajando, incluida la dependiente (Y), son variables
aleatorias, no podremos hacer nunca una prediccin exacta debido a la existencia de diferentes factores, como
ser errores de medicin o incluso otras variables que no desconocemos o no podemos medir de forma clara,
es decir, la recta de regresin presentara siempre diferencias con las observaciones pero trataremos que estas
sean mnimas.

La eleccin de a cul de las variables llamaremos X y cual ser Y, es decir la causalidad, depende de
consideraciones tericas previas asociadas al estudio. Por ejemplo, un estudio que relacione la lluvia con el
rendimiento de una cosecha de soja dir que la causalidad est dada por la lluvia (X) que influye en el
rendimiento (Y) y no viceversa.

Cualquier tipo de anlisis depende de la disponibilidad de informacin adecuada, esto vuelve esencial analizar
la naturaleza, fuentes y limitaciones de la informacin con que se puede contar al realizar un estudio.

Existen tres tipos de datos:


1- Series de corte transversal: los datos de corte transversal registran, en un momento determinado, una
variable o variables que difieren entre las unidades de anlisis o grupos.
2- Series de corte longitudinal o temporal: Para una variable en particular, se realiza una medicin por
cada periodo de tiempo, se busca que esta medicin sea equi-espaciada en el tiempo.
3- Datos de panel: Es la combinacin entre serie de tiempo y corte transversal.

Nosotros analizaremos datos de corte transversal y brevemente nos ocuparemos de datos de series de tiempo.

El estudio de Regresin se divide en dos partes:

Anlisis de la Regresin: es decir, establecer la funcin matemtica que permite relacionar las variables bajo
estudio en funcin a cul es la variable dependiente (Y) y cual/cules sern las independientes (X).

Anlisis de la Correlacin: donde se estudia la fuerza y grado de asociacin lineal entre las variables. Este
anlisis no hace distincin a travs de la causalidad.

Una vez definida la relacin se procede a realizar un grfico de dispersin, aqu los datos se muestran como un
conjunto de puntos, donde cada punto x determina la posicin en el eje horizontal (x) y el valor de la otra
variable determinado por la posicin en el eje vertical (y).

Esta relacin entre las variables y en funcin al grfico de dispersin nos permitir definir una funcin
matemtica que para nuestro caso ser Yi=0 + 1 Xi + ui . Esta funcin se denomina Modelo de Regresin
Poblacional (FRP) donde:
0 es la ordenada al origen
1 es la pendiente de la recta
ui es el error de estimacin, esto se produce porque las variables son aleatorias
Estos coeficientes se estimaran con los datos muestrales, lo cual nos va a permitir definir la Funcin de
Regresin Muestral i=b0 + b1 Xi

Comisin 40. Segundo cuatrimestre 2016 Pgina 41 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Mtodos para hallar la Recta de Regresin


Existen diversos mtodos para hallar los estimadores b0 y b1 entre los que podemos sealar:
Mnimos cuadrados ordinarios.
Mximos Verosimilitud.
Momentos.
Bayesianos.
El mtodo que usaremos nosotros es el primero, Mnimos Cuadrados Ordinarios. El principio fundamental de
este mtodo es que busca aquellos valores de los coeficientes que permiten hallar una recta que tenga la
caracterstica fundamental de pasar lo ms cerca posible de todas las observaciones simultneamente, en
trminos matemticos, hace mnimos los errores (e) que son las distancias entre las observaciones (y) y la recta
de regresin hallada (y).
Mnimas diferencias entre la observacin (yi) y la estimacin
ei2= ( yi - y)2 = Mnimo.
(y)

GRAFICO DE DISPERSION

y=0 + 1 Xi

X: variable Independiente o Explicativa.


Y: variable Dependiente o Explicada.
Observaciones.
Error: distancia entre la observacin
y la recta de regresin.

El procedimiento no es complejo pero requiere conocimientos de matemtica, el mnimo se halla haciendo las
derivadas primeras parciales respecto a 0 y 1, luego se iguala a cero la funcin y se despejan los valores que
permiten el clculo de los coeficientes, ser necesario luego hacer la derivada segunda que permite verificar
que los valores son positivos lo que indica un mnimo.

No es de nuestro inters la derivacin de las funciones que permiten el clculo del coeficiente ya que muchos
software pueden realizar este procedimiento de manera rpida y sencilla. El inters consiste en poder
interpretar de manera clara, toda la informacin que se nos brinda, la cual nos servir para una toma de
decisin fundamentada.
Una vez definida la variable dependiente (Y) y la variable independiente (X), podemos proceder a realizar al
anlisis de la informacin, para lo cual presentamos el siguiente caso a modo de ejemplo.
El Gerente de Produccin de la empresa Cisa SA propuso hace un tiempo una fuerte inversin en capacitacin
de los empleados y desea realizar una evaluacin de esta inversin, supone que existe una relacin lineal entre
la inversin y la cantidad de unidades producidas por la empresa para lo cual analiza 15 observaciones
semanales:
X: Inversin en capacitacin (en miles de pesos).
Y: nmero de piezas producidas.

Comisin 40. Segundo cuatrimestre 2016 Pgina 42 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Abajo presentamos una salida de regresin tpica de planilla de clculo:

Resumen

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
Tabla de Bondad de Ajuste
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937
Error tpico 1,15109
Observaciones 15

ANLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 85,47482 85,47482 64,50862 2,14128E-06 Tabla ANOVA
Residuos 13 17,22518 1,32501
Total 14 102,7

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95% Tabla de
Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358 11,30779 Coeficientes
Inv en Capacit 0,39209 0,04882 8,03173 0,00000 0,28662 0,49755 parciales

La misma se compone de tres tablas:


Tabla de Bondad de Ajuste: tiene diferentes coeficientes que nos permitirn establecer que tan bueno
es el ajuste entre las variables analizadas. Dentro del anlisis, es la tercer tabla que se mira.
Tabla ANOVA (ANalisys Of VAriance): A travs de la descomposicin de la varianza, permite la
validacin del modelo postulado, es decir, definir si existe relacin o no entre las variables. Por esto,
es la primera tabla a analizar.
Tabla de Coeficientes parciales: Brinda informacin sobre los coeficientes 0 y 1, es la segunda tabla
que se analiza.

El anlisis de la informacin obtenida se realiza a travs de los siguientes pasos:

1) Validacin del modelo de regresin


El primer anlisis que se realiza es verificar la suposicin que todos los coeficientes betas introducidos en el
modelo, sin tener en cuenta el 0 (ordenada al origen) son, simultneamente, iguales a cero.
En trminos ms sencillos, de verificarse esto, implicara que ninguna de las variables (X1, X2,. . Xn) tienen
relacin con la variable dependiente (Y) y anula todo el anlisis posterior de la regresin.
Este anlisis excede los conocimientos necesarios para este curso pero solo diremos que, dado que estamos
en el caso particular de una regresin simple (es decir, donde hay una sola variable independiente, por una
propiedad matemtica), este anlisis podemos hacerlo a travs del anlisis de significatividad de 1.
Esto lo podemos hacer ya que, en este caso particular, el Estadstico t de la variable X (Tabla de Coeficientes
parciales, Fila Inv en Capacit, Columna Estadstico t = 8.03173) es la raz del estadstico F (Tabla Anova, Fila
Regresin , columna F) y si P-valor son iguales, estadstico usado para la validacin del modelo. Como
ambos P-Value son similares, podemos concluir que el modelo es vlido y 1 es distinto de cero por lo cual
existe una pendiente.

Comisin 40. Segundo cuatrimestre 2016 Pgina 43 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

2) Funcin de Regresin e interpretacin de los coeficientes.


A partir de la salida y con la tabla de coeficientes parciales, podemos escribir nuestra Funcin de Regresin.
Para esto debemos saber que cada fila de informacin corresponde a cada coeficiente. La primera llamada
intercepcin brinda informacin de b0 y la segunda Inv en Capacit brinda informacin sobre b1.
Los coeficientes necesarios para escribir la funcin en trminos del problema estn ubicados en la columna
coeficientes.
b0= 5,99568 b1= 0,39209 => y= b0 + b1 * xi => y= 5,99568 + 0,39209 * xi

Interpretacin de los coeficientes


General Aplicada
b0 Valor de y ser de (b0) unidades cuando X=0 El nmero de piezas ser de 5,99568 (b0)
(ordenada al origen) cuando la inversin sea de $0. (x=0)
b1 Cuando X aumenta en una unidad, Y se Por cada incremento de inversin en Mil pesos
incrementa/disminuye en 1 unidades (unidad de x), el nmero de piezas (y) se
(pendiente) incrementa en 0,39209 unidades (b1).

La interpretacin de los coeficientes no solo implica reemplazar X e Y de la interpretacin general por las
variables analizadas, sino tambin utilizar la escala de medicin de la variable, en nuestro caso, la inversin
esta expresada en miles de pesos.

3) Significatividad de los coeficientes:


Determinados valores de los coeficientes pueden no ser tiles para el estudio que se realiza.
El ms comn (y que Excel realiza por defecto) es que los coeficientes sean iguales a cero (0).
Si 0= 0 implica que la recta de regresin pasa por el origen de coordenadas (x=0; y=0). Esto es
esperable en algunos anlisis (por ejemplo: retorno de la inversin: cuando la inversin es 0, el retorno
sobre la inversin es 0).
Si 1= 0 implica que la recta de regresin es una constante igual a b0. Desde el punto de vista de la
regresin, implica falta de relacin entre las variables seleccionadas (X e Y) y la regresin debe ser
desechada, recordemos que esta segunda conclusin est relacionada con la prueba F, la cual, en
regresin simple, arroja los mismos resultados que la prueba sobre t del coeficiente.

Hay tres mtodos para verificar esta situacin:


3.a Prueba de Hiptesis

a. H0) k=0 (el es igual a 0)


H1) k0
b. =0,05

c. tn= (bk- k)/Sbk

Donde: bk: coeficiente de la regresin k= valor en H0 Sbk= desvo de bk

Comisin 40. Segundo cuatrimestre 2016 Pgina 44 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

- Si |tn|<|tc| No Rechazo H0
- Si |tn|>|tc| Rechazo H0
Para el caso de los betas, las hiptesis siempre sern iguales contra distinto ya que el valor que nos interesa
probar es cero, cada coeficiente es probado individualmente, en funcin a sus datos y los resultados hallados
son totalmente independientes a los que podamos obtener de las pruebas de los otros coeficientes.
Como tn>tc Rechazo H0 (que =1), por lo tanto existe relacin entre las variables.

3.b Intervalo de Confianza:


As como vimos en las unidades anteriores el tema de Intervalo de Confianza para la media o una proporcin,
tambin puede realizarse este mismo procedimiento para armar un Intervalo de Confianza de b0 y b1 y las
mismas conclusiones pueden obtenerse a partir de la obtencin del mismo.
El intervalo de confianza permite decidir rpidamente sobre cualquier valor supuesto respecto a un beta
seleccionado.
Para armar el intervalo de confianza es necesario:
- El valor de la estimacin obtenido a partir de la muestra, ejemplo b1
- El valor t de tabla surgido a partir de los parmetros, el nivel de error y los grados de libertad que
surgen del tamao de la muestra menos dos (n-2)
- El desvo estndar de la estimacin.
b1 t(n-2,1-/2)*Sb1
- Si el intervalo contiene al parmetro bajo prueba, no se rechaza H0.
- Si el intervalo NO contiene al parmetro bajo prueba, se rechaza H0.
Con los datos del ejemplo: b1=0,39209
t( n 2;1 /2) = t (13;0.975)=2,160
S(b1)=0,0482 (en la salida, columna error tpico, fila Inv en Capac)
0,39209 +/- 2,160 * 0,0482 = LS = 0,49755 (columna Superior 95%)
LI = 0,28662 (columna inferior 95%)
Con este intervalo podemos probar si 1 = 1, como el IC no lo contiene, rechazamos que 1 pueda valer cero,
con la muestra y el nivel de confianza seleccionado.
Si probamos que 1 = 0,4, en este caso el IC lo contiene.

Comisin 40. Segundo cuatrimestre 2016 Pgina 45 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

3.c P Value:
Si Pv > No rechazo H0 y Si Pv < Rechazo H0.

La regla del PV permite tomar una decisin rpidamente al cambiar el error con el que trabajamos
Para el coeficiente 0 (ordenada al origen):
- Si se rechaza H0, b0 es distinto de cero, por lo tanto la recta de regresin no pasa por el origen de
coordenadas (x=0; y=0).
- Si no se rechaza H0, b0 es igual a cero, por lo tanto la recta de regresin pasa por el origen de
coordenadas (x=0; y=0).

Para el coeficiente 1 (pendiente):


- Si se rechaza la H0, 1 es distinto de cero por lo tanto la recta de regresin tiene pendiente y
existe relacin entre las variables.
- Si no se rechaza la H0, 1 es igual a cero, por lo tanto la recta de regresin NO TIENE pendiente y
no puede decirse que exista relacin entre las variables.

Significatividad de 1 para el ejemplo:


Para esta prueba necesitamos: b1 = 0,39209
1 = 0 (supuesto de la hiptesis nula)
S(b1) = 0,04882 (Columna error tpico)

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%


b0 Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358 11,30779
b1 Inv en Capacit 0,39209 0,04882 8,03173 0,00000 0,28662 0,49755

Sbk tn Pv Limite inf Limite Sup


Estadistico
Desvo P valor Intervalo de Confianza
de Prueba

Realizamos los pasos conocidos de la prueba de hiptesis:


1. H0) 1=0
H1) 10
2. =0,05
3. tn= (b1- 1)/Sb1=
tn= (0,39209- 0)/0,04882= 8,03173

Este valor lo comparamos con un valor terico de la tabla t de Student con (n-2) grados de libertad, para
nuestro caso (15-2)=13 y 0.975 (Confianza de 0.95 para una prueba bilateral), el t critico es 2,160.

tc: t(n-2; 1-/2)= t(15-2; 1- 0,05/2)= t(13;0,975)= 2,160


El valor del estadstico ya est calculado, lo vemos en la columna estadstico t y para b1 su valor es de: tn=b1-
1 / S(b1) tn= (0,39209 0) / 0,04882 tn=8,03173

Comisin 40. Segundo cuatrimestre 2016 Pgina 46 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Estadstico t Intervalo de confianza P - value


|tn|>|tc| = (0,28662; 0,49755) Pv=0,00000 < =0,05
|8,03173|>|2,160| No contiene al Cero (0)
Rechazo H0 Rechazo H0 Rechazo H0

Vemos que los tres mtodos utilizados llegan a la misma conclusin.


Se rechaza la H0, la recta de regresin tiene pendiente. Puede decirse que existe relacin entre la inversin en
capacitacin y la cantidad de piezas producidas.

4) Coeficiente de Determinacin R2
0 R2 1
Mide el porcentaje de la variacin de Y que es explicada por la X.

Var. Total = Var. no explicada + Var. explicada.


)2
(Y- )2 = ( Y - Y - )2
+ (Y

R2= V. Explicada x 100= % de variacin de Y


V. Total explicada por x

EnResumen
el Ejemplo:

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937
Error tpico 1,15109
Observaciones 15

R2=ANLISIS
el 83,22% de la variacin de la produccin de piezas esta explicada por la inversin en capacitacin.
DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
5)Regresin
Coeficiente de Correlacin
1 85,47482 85,47482 64,50862 2,14128E-06
Mide la fuerza13y el sentido
Residuos 17,22518 de la relacin
1,32501 lineal entre las variables.
-1 r 1:
Total 14 102,7

- El valor absoluto mide la fuerza de la relacin: si se aproxima a 1 es fuerte; cercano a 0 es muy


Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%
dbil o casi no existe relacin
Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358 11,30779
Para el
Inv en Capacit sentido, se
0,39209 toma el signo
0,04882 de b1. 0,00000
8,03173 Positivo: Relacin0,49755
0,28662 directamente proporcional
Negativo: Relacin inversamente proporcional.
En el Ejemplo:

Comisin 40. Segundo cuatrimestre 2016 Pgina 47 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica
Resumen

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
r= 0,91229:
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937 Cercano a 1: Relacin Fuerte.
Error tpico 1,15109 signo + (por el signo de b1): Relacin directa.
Observaciones 15

ANLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
6)Regresin
Estimacin y Error 1 de Estimacin
85,47482 85,47482 64,50862 2,14128E-06
Si Residuos
bien desde el punto13de vista de la matemtica
17,22518 1,32501 podemos realizar una estimacin otorgando solamente un
valor
Totala la X, debemos tener
14 en cuenta
102,7 que ciertas caractersticas debe cumplir este valor para que la prediccin
sea confiable, un valor de X que no haya pertenecido a las observaciones o un valor de X que este alejado
Coeficientes
dentro del grfico Error tpico
de dispersin Estadstico
de las t Probabilidad
observaciones hace Inferior
que la 95% Superior 95%
estimacin comience a perder confiabilidad
Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358
y mientras ms se acente este comportamiento, menor ser la confiabilidad. 11,30779
Inv en Capacit 0,39209 0,04882 8,03173 0,00000 0,28662 0,49755
Estimacin: Valor que toma la dependiente (Y) al otorgar un valor a X
Error de estimacin: Diferencia entre un valor observado y un valor estimado en funcin a X0.

Error
e= Y- = b0 + b1* X
siendo Estimacin Y

Se toman los valores (X; Y) para una observacin:


En el ejemplo:
= 5,99568 + 0,39209 * xi
Para X= 20:
y= 5,99568 + 0,39209 * 20
= 13,84
Con una inversin de $20 mil, se estima que se obtendrn 13,84 piezas producidas.
Pero si al invertir $20000, la cantidad de piezas producidas (o sea, la observacin) es de Y=15:

e= Y-
e= 15 13,84
e=1,16 Se subestimo (se estim de menos de lo observado) en 1,16 unidades.

Si en cambio, para una inversin de $20000, se observara una produccin de Y=10



e= Y- =>
e= 10 13,84
e=-3,84 se sobre estimo (se estim ms de lo observado) en 3,84 unidades.

Comisin 40. Segundo cuatrimestre 2016 Pgina 48 de 49


Carreras: Lic. en Administracin y Contador Pblico Asignatura: Estadstica

Anlisis de series de tiempo

Como dijimos anteriormente, podemos realizar anlisis de regresin sobre datos en series de tiempo donde la
caracterstica principal en que tenemos una observacin para cada periodo y esperamos que la distancia entre
cada periodo sea siempre la misma. Si analizamos las ventas mensuales, tendremos, para cada mes del ao,
una observacin y no podremos tener saltos bimestrales o trimestrales en la misma serie.
Si bien el anlisis de serie de tiempo es muy extenso, nosotros solo analizaremos datos temporales donde la
variable explicativa es el tiempo, con esto trataremos de predecir como es el comportamiento de la variable
dependiente con el paso del tiempo.
El anlisis de serie de tiempo posee otras caractersticas, muchos productos poseen lo que se denomina
estacionalidad, esto es, el producto posee fuertes variaciones, claras y predecibles, en su comportamiento por
la influencia clara del momento en el ao en que se estudia y este comportamiento se repite a lo largo de los
aos, un ejemplo es la venta de helados y gaseosas que tiene un pico durante el verano y desciende durante
el invierno. La presencia de estacionalidad en el producto hace necesario un estudio adicional a la recta de
regresin con el objetivo de capturar estas variaciones, pero esto excede los objetivos de la materia.
El anlisis de serie de tiempo, para nosotros, es muy similar al visto anteriormente, solo cambia la
interpretacin del 1 y la interpretacin de la estimacin.
1: por el aumento de un periodo de tiempo (mes, dia, semana, etc), la variable Y aumentara en 1 unidades.
Respecto a cmo realizar el anlisis, los periodos bajo estudio sern numerados, tomando el primer periodo
observado, cualquiera sea, el valor 1, el segundo periodo valdr 2 y as sucesivamente hasta n.
Para su interpretacin ms clara deberemos realizar el paso inverso, es decir, ver a que periodo corresponde
cada nmero y para la prediccin deberemos ver que valor toma en la serie en periodo solicitado.
Si tenemos datos mensuales del ao 2015, Enero de 2015 valdr, para realizar la regresin 1, febrero valdr 2
y diciembre valdr 12, si queremos realizar una prediccin de Marzo de 2016, este periodo ser el nmero 15,
valor que ser introducido en la funcin de regresin.

Comisin 40. Segundo cuatrimestre 2016 Pgina 49 de 49

You might also like