Professional Documents
Culture Documents
Contenido
Introduccin a la Estadstica ................................................................................................................................. 5
La Estadstica se divide en dos grandes ramas: ............................................................................................ 5
Tipos de estudios segn como se recopilan los datos:................................................................................. 5
Fuentes de Informacin Estadstica.............................................................................................................. 6
Definiciones .................................................................................................................................................. 6
Escalas de medicin...................................................................................................................................... 6
Clasificacin de las variables ........................................................................................................................ 6
La estadstica descriptiva ...................................................................................................................................... 7
Medidas de tendencia central: ..................................................................................................................... 7
Medidas de dispersin: ................................................................................................................................ 7
Medidas de posicin:.................................................................................................................................... 8
Medidas de Forma ........................................................................................................................................ 8
Formas de analizar la informacin ................................................................................................................... 9
Probabilidad........................................................................................................................................................ 10
Definiciones .................................................................................................................................................... 10
Definiciones de Probabilidad .......................................................................................................................... 10
Definicin clsica o de Laplace: .................................................................................................................. 10
Definicin relativa o emprica:.................................................................................................................... 10
Definicin subjetiva: ................................................................................................................................... 11
Definicin axiomtica: ................................................................................................................................ 11
Probabilidad total ........................................................................................................................................... 11
Sucesos Mutuamente Excluyentes ................................................................................................................. 11
Probabilidad Marginal .................................................................................................................................... 11
Probabilidad Conjunta .................................................................................................................................... 12
Probabilidad condicional: ............................................................................................................................... 12
Variable Aleatoria ............................................................................................................................................... 13
Definicin........................................................................................................................................................ 13
Ejemplo: ...................................................................................................................................................... 13
1) Variable Aleatoria Discreta ......................................................................................................................... 13
Esperanza matemtica ............................................................................................................................... 14
Esperanza matemtica de una Variable Aleatoria Discreta ....................................................................... 14
Variancia ..................................................................................................................................................... 14
2) Variable Aleatoria Continua ....................................................................................................................... 15
Distribuciones de Probabilidad........................................................................................................................... 16
1) Distribuciones Discretas Probabilidad ........................................................................................................ 16
1.a. Distribucin Binomial........................................................................................................................... 16
1. b. Distribucin de Poisson ...................................................................................................................... 17
Indexacin o Inflacin:................................................................................................................................ 40
Desindexacin o Deflacin: ........................................................................................................................ 40
Regresin ............................................................................................................................................................ 41
Mtodos para hallar la Recta de Regresin.................................................................................................... 42
1) Validacin del modelo de regresin ....................................................................................................... 43
2) Funcin de Regresin e interpretacin de los coeficientes. .................................................................. 44
3) Significatividad de los coeficientes:........................................................................................................ 44
3.a Prueba de Hiptesis .............................................................................................................................. 44
3.b Intervalo de Confianza:......................................................................................................................... 45
3.c P Value: ................................................................................................................................................. 46
Significatividad de 1 para el ejemplo: ...................................................................................................... 46
4) Coeficiente de Determinacin R2 .......................................................................................................... 47
5) Coeficiente de Correlacin ..................................................................................................................... 47
6) Estimacin y Error de Estimacin ........................................................................................................... 48
Anlisis de series de tiempo ........................................................................................................................... 49
Introduccin a la Estadstica
La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada caracterstica
en una poblacin, diagramando instrumentos para la recoleccin de los datos, recogiendo los mismos,
organizndolos en tablas, representndolos grficamente y analizndolos para sacar conclusiones de
dicha poblacin.
Es una ciencia transversal a todo el resto de las otras ciencias porque su rea de incumbencia es el anlisis
de informacin que las mismas generan en sus diferentes estudios.
Econometra: Es la rama de la Economa que usa modelos matemticos y estadsticos para
predecir sobre sistemas econmicos.
Psicometra: se encarga del conjunto de mtodos, tcnicas y teoras implicadas en medir y
cuantificar las variables psicolgicas del psiquismo humano.
Biometra: Reconocimiento nico de humanos basado en rasgos conductuales o fsicos.
Control de Calidad: El control de calidad consiste en la implantacin de programas, mecanismos,
herramientas y/o tcnicas en una empresa para la mejora de la calidad de sus productos, servicios
y productividad.
Fuentes primarias: aquellas en las que los se obtienen directamente de las unidades originales o
iniciales (personas, empresas, organismos, etc) sin pasar previamente por ninguna entidad o persona
encargada de la obtencin, procesamiento y/o divulgacin.
Fuentes secundarias: las que no cumplen la condicin anterior, es decir, los datos se obtienen de
informes, publicaciones, registros, efectuados por otras entidades.
Definiciones
Escalas de medicin
Nominal: es una etiqueta o un nombre que identifica un atributo de un elemento, solo pueden
clasificarse en categoras sin poder establecerse un orden entre los mismos Ejemplo: Sexo, profesin,
marca de un auto, nmero de telfono, etc.
Ordinal: los datos muestran las propiedades de los datos nominales y adems tiene sentido el
orden o jerarqua de los datos. Cada grupo o categora se denomina con un nombre o nmero de forma
arbitraria, es decir, que se etiqueta en funcin de los deseos o conveniencia del investigador. Este nivel
de medicin es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.
Intervalo: Los datos de intervalo siempre son numricos, permiten determinar la diferencia entre
puntos a lo largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores, ms
la suma y la resta. En estas variables el punto cero de la escala es arbitrario y no significa ausencia de
valor. EJ: temperatura, las calificaciones, la fecha, el CI, etc.
Razn: Estas variables nombran orden, presentan intervalos iguales y el cero significa ausencia de
la caracterstica. La presencia del cero permite realizar todo tipo de operaciones sobre las mismas. Ej: el
ingreso, la velocidad, el peso, la altura.
La estadstica descriptiva
Es la rama de las matemticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo,
edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano,
etc.) con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Esta descripcin
se realiza a travs de tablas, grficos y calculo de diferentes medidas para poder, de forma clara, precisa
y rpida, caracterizar y comprender los elementos analizados.
A travs de la simbologa utilizada, se hace la distincin de si los datos analizados corresponden a una
poblacin o a una muestra.
Poblacin: para denotar que la medida calculada corresponde a una poblacin, se utilizan
maysculas y letras griegas.
Muestra: se utilizan letras minsculas y del alfabeto latino.
Promedio (mu) x
Proporcin (pi) p
Desvo (sigma) S
Estndar
Medidas de dispersin:
Describen la variabilidad o dispersin de los datos. Los datos estrechamente agrupados presentan baja
variabilidad y los datos dispersos poseen valores grandes, cuando todos los datos son iguales entre s, la
variabilidad es cero y esta no tiene un lmite superior.
Rango: Diferencia entre el mximo y el mnimo.
Varianza: promedio de los desvos al cuadrado entre cada valor y la media del grupo.
Desvo Estndar: raz cuadrada de la varianza.
Medidas de posicin:
Se usan para describir la posicin que un valor especfico posee en relacin con el resto de los datos
cuando estn los mismos ordenados.
Percentil: Valores de la variable que dividen un conjunto de datos en 100 subconjuntos de igual
tamao.
Se pueden realizar otro tipo de divisiones del conjunto de datos.
Deciles: Se divide en 10 subconjuntos iguales con el 10% de los datos cada uno. El decil 5
corresponde a la mediana.
Cuartiles: Se divide en 4 subconjuntos iguales con el 25% de los datos en cada uno. El cuartil 2
corresponde a la mediana.
Rango Intercuartlico: Diferencia entre el primer y el tercer cuartil.
Medidas de Forma
Asimetra: forma de la distribucin de los datos a ambos lados de la media.
Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima
del valor de la media aritmtica. Dato que las mayores frecuencias de datos se encuentran
para valores pequeos de la variable, la Moda se ubica en esta zona y la mediana, 50% de los
datos aparece rpidamente; la media, debido a la presencia de algunos valores grandes, se
mueve mas hacia la derecha ya que es sensible a los valores extremos.
La curva es simtrica cuando se distribuyen aproximadamente la misma cantidad de valores
en ambos lados de la media. Este tipo de distribucin de los datos tiene la caracterstica que
el Modo, la Media y la Mediana toman exactamente el mismo valor que corresponde al
mximo de la curva.
Y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los
valores menores que la media. Sucede lo contrario que con la asimetra positiva, la media, por
valores extremos pequeos en este caso, se encuentra ms a la izquierda que la mediana y la
moda.
Datos sin agrupar: es la forma en general en la cual la informacin se presenta, si bien permite su
anlisis, la visualizacin de la informacin, presentada de esta forma, no es clara. Con los datos
presentados de esta forma, rpidamente, se dificulta el clculo del modo o la mediana. El anlisis
de los datos, a travs de planillas de clculo, permite obtener todas las medidas de forma exacta.
3 4 5 6 1 2 3 4 5 7
Datos agrupados: en funcin a los diferentes valores que toma la variable, se la ordena y se realiza
el conteo de las observaciones para cada uno de estos valores. Con la informacin presentada de
esta forma, todas las medidas son ms fciles de calcular y el anlisis no pierde exactitud.
N de orificios 0 1 2 3 4 5 6 7 8 9
N de listones 12 38 28 16 13 11 9 7 5 1
Datos agrupados en intervalos: se utiliza por lo general para variables cuantitativas continuas
donde existen muchos valores observados y, en funcin al tamao de la muestra, puede ser nico
o poseer muy pocas repeticiones. Para esto se determina un lmite inferior y uno superior para
cada intervalo, rango en el cual se cuentan las observaciones que pertenecen al mismo. La
caracterstica fundamental de este tipo de agrupacin es que permite una mayor claridad de la
observacin analizada pero todas las medidas calculadas pierden exactitud. Esto sucede ya que
conocemos cuantas observaciones pertenecen al rango pero no sabemos exactamente qu
valor tiene cada observacin individual, por esto, es necesario la creacin de una medida auxiliar
para cada intervalo llamado Punto Medio o Marca de Clase, que es el valor promedio de
intervalo. Para nuestro ejemplo lo puntos medios (PM) son 22.5 {(25+20)/2}; 27.50 {(30+25)/2},
etc.
Para determinar la cantidad de intervalos se utilizan diferentes frmulas que brindan una aproximacin,
la claridad de la presentacin es la regla ms importante.
Frmula de Sturguess: I = 1 + 3.32 * log ( n).
Frmula de la raz: I = raiz(n).
http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-distribucion-curtosis-asimetria.html
Clases 1, 2 y 3 Estadstica Lic Hugo Delfino y Lic Susana Filippini.
Estadstica para Administracin y Negocios Anderson
Sistemas de Informacin Estadstica Apuntes de la catedra Lic Norberto Rodriguez
Probabilidad
Definiciones
Experimento Aleatorio: Es un experimento que, pudiendo repetirse indefinidamente en similares
condiciones cada oportunidad, puede presentar distintos resultados.
Espacio muestral: Es el conjunto de todos los resultados posibles de un experimento aleatorio.
E1 = se lanza una moneda y puede salir (cara, ceca).
E2 = se lanza una moneda cuatro veces y se observan la cantidad de caras (0, 1, 2, 3, 4).
E3 = tirar un dado hasta que salga un uno (0,. . 10,. . 123. . .).
E4= temperatura horario del prximo mes.
En E1 y E2, el espacio muestral es finito.
En E3, el espacio muestral es infinito numerable.
En E4, el espacio muestral es infinito no numerable.
Definiciones de Probabilidad
En smbolos:
Definicin subjetiva:
La repeticin de un experimento bajo las mismas condiciones es la base para las interpretaciones clsica y de
frecuencia relativa de la probabilidad.
Sucede a veces que la interpretacin de la probabilidad no puede tener su fundamento en la frecuencia de
ocurrencia. La probabilidad se interpreta como el grado de creencia 0 de conviccin con respecto a la
ocurrencia de una afirmacin. En este contexto, la probabilidad representa un juicio personal acerca de un
fenmeno impredecible.
Definicin axiomtica:
Sea S el espacio muestral y E cualquier evento de este, se llamara funcin de probabilidad sobre el espacio
muestral S a P(E) si satisface los siguientes axiomas:
P (E) 0 La probabilidad de un suceso es mayor o igual a cero
P (S) = 1 La probabilidad del espacio muestral es igual a uno
Si A B = P ( A B ) = P (A) + P (B)
Probabilidad total
Dados dos sucesos A y B, la probabilidad de aparicin de alguno de los dos sucesos est dada por:
P(AB)=P(AB)=P(A)+P(B)-P(AB)
Probabilidad Marginal
Probabilidad de que se solamente un suceso A.
Probabilidad Conjunta
Dados los sucesos A y B, la probabilidad de aparicin de ambos sucesos estar dada por:
P(AyB)=P(AB)=P(A).P(B/A)=P(B).P(A/B)
Dos sucesos A y B son independientes, cuando, pudindose dar un conjunto, la aparicin de uno de ellos no
condiciona la aparicin del otro, si probabilidad se define como:
P ( A B ) = P ( A ) * P (B )
Probabilidad condicional:
Dados dos sucesos A y B, la probabilidad de aparicin de A habiendo ya ocurrido B est dada por P ( A / B ) .
En forma anloga, la P ( B / A ) indica la probabilidad de que ocurra el suceso B dado que A ya sucedi.
P (A / B ) = P ( A B ) / P ( B ) y P (B / A ) = P (A B ) / P ( A )
Al saber que uno de los sucesos ya ocurri, el espacio muestral esta acotado por la probabilidad de este
suceso ocurrido, en el grafico, la P(A).
Variable Aleatoria
Definicin
Sea E un experimento aleatorio y S su espacio muestral asociado. Una funcin X que asigna a cada uno de los
elementos de S puntos sobre la recta de los reales. X es una variable aleatoria.
X es aleatoria porque involucra la probabilidad de los resultados del espacio muestral y X es una funcin
definida de manera que transforma todos los resultados posibles del espacio muestral en cantidades
numricas.
Ejemplo:
Se tiran dos monedas y se considera el nmero de caras que aparecen
S = { ss, cs, sc, cc}
X=nmero de caras
X(ss)=0 X(sc)=1
X(cs)=1 X(cc)=2
Se dice que una variable aleatoria es discreta si el nmero de valores que puede tomar es contable. Entonces,
entre dos valores consecutivos de una variable aleatoria discreta, no hay ningn nmero que pertenezca al
recorrido de la variable.
A cada valor de Xi se le asigna un valor de probabilidad pi que indica la probabilidad de que la variable X tome
determinado valor.
El conjunto {pi} se denomina funcin de probabilidad puntual si cumple con dos condiciones:
1) cualquier probabilidad calculada es no negativa y menor o igual que uno.
2) Condicin de cierre: la suma de las probabilidades en todo el recorrido de la variable es igual a uno.
El conjunto de pares {xi , pi} se denomina distribucin de probabilidad de X.
Ejemplo:
Se tiran cuatro monedas al aire y se cuentan el nmero de caras
X= nmero de caras en 4 tiradas Recorrido de X=0, 1, 2, 3, 4
La distribucin de probabilidad est dada en la siguiente tabla de frecuencias
X 0 1 2 3 4
P (X) 1/16 4/16 6/16 4/16 1/16
0.1
0
0 1 2 3 4
La probabilidad que X tome un valor determinado est dada por la informacin suministrada en la tabla.
P (X=0) = 1/16 o P (X=2) = 6/16
La probabilidad que X tome ms de un valor determinado, estar dado por la sumatoria de las probabilidades
individuales de los puntos de inters.
P (0 X 2) = P (X=0) + P (X=1) + P (X=2) = 1/16 + 4/16 + 6/16 = 11/16.
Esperanza matemtica
La esperanza es un parmetro de la distribucin. Es una medida de tendencia central.
La esperanza E(x) no es un resultado que esperaramos cuando X se observa slo una vez. Representa la
cantidad media que se "espera" de xitos como resultado de un experimento aleatorio cuando la probabilidad
de cada suceso se mantiene constante y el experimento se repite un elevado nmero de veces.
Variancia
Mide la dispersin cuadrtica entre el valor de la variable y su esperanza matemtica1.
V ( x) 2 [ x E ( x)]* P( x)
V ( x y ) V ( x) V ( y ) 2Cov( x, y ) Si X e Y son variables independientes, la Cov(x,y)=0
V ( x y ) V ( x) V ( y ) 2Cov( x, y )
1
el mtodo matemtica tiene parecidos al utilizado en Descriptiva pero el concepto entre media y esperanza
difieren entre si
Dado que la variable es continua, no nos es posible calcular la probabilidad para un valor sino que es necesario
calcular reas entre dos puntos.
Sea X una V.A.C:
La probabilidad puntual es cero: P( X x0 ) 0
b
La probabilidad de un intervalo P(a X b) f ( x)* dx
Esta dada por la integral entre los puntos: a
b
Su esperanza est dada por : E ( x) x * f ( x)dx
a
Distribuciones de Probabilidad
Hasta ahora hemos realizado el clculo de las probabilidades a partir del concepto de calcular todas las formas
posibles que puede darse el experimento (casos posibles) y calcular la cantidad, dentro de los casos posibles,
que satisfacen la condicin impuesta (casos favorables).
Dentro del estudio de la probabilidad, existen diferentes algoritmos matemticos, que satisfacen las
condiciones de:
1) Cualquier probabilidad calculada es no negativa y menor o igual que uno.
2) La suma de las probabilidades en todo el recorrido de la variable es igual a uno (condicin de cierre).
y por lo tanto nos permiten denominarlos funciones de probabilidad. Y, si la variable bajo estudio satisface
condiciones propias de la distribucin, permiten calcular la probabilidad del suceso a partir de la aplicacin del
algoritmo.
n
- P( x) * p x0 * q n x0 donde:
x0
x: valor de la variable
p: probabilidad de xito
q: probabilidad de fracaso
La probabilidad acumulada estar dada por:
n
x2
P( x1 X x2 ) * p xi * q n xi
x1 x0
1. b. Distribucin de Poisson
Si la variable bajo estudio cumple con estas condiciones:
- Sea X el nmero de veces que aparece el suceso A en un continuo de espacio/tiempo (km, das, etc)
- X es una V.A.D que vara entre 0 (nunca aparece el suceso) e infinito.
Se define el parmetro de la distribucin (lambda) como el promedio de veces que aparece el suceso A
en dicho continuo de espacio/tiempo.
Se representa como: x Po( )
e * x
Probabilidad puntual P( x)
x!
x2
e * xi
Probabilidad acumulada P ( x1 X x2 )
x1 xi !
Distribucin Normal
En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a
una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada
en fenmenos reales.
La grfica de su funcin de densidad tiene una forma
acampanada y es simtrica respecto de un
determinado parmetro estadstico. Esta curva se conoce
como campana de Gauss y es el grfico de una funcin
gaussiana.
La importancia de esta distribucin radica en que
permite modelar numerosos fenmenos naturales, sociales
y psicolgicos.
Simbologa x N ( , 2 )
La funcin de densidad, como est, no es posible integrarla lo que impide el clculo de probabilidades. Es
por ello que se realiza una sustitucin z=(x-)/ con lo cual se obtiene la denominada Normal
Estandarizada
A partir del clculo se define la Z como cantidad de desvos estndar que existen entre la variable (X) y
el parmetro (), es una distancia entre los valores, ya no medida en su unidad original, sino que esta
medida como una cantidad de desvos entre los puntos.
Una vez obtenida la Z, podremos, a travs de la tablas de probabilidad, encontrar la/las probabilidades
de inters. A diferencia de las otras distribuciones donde se hallaba directamente las probabilidades, ac
es necesario previamente pasar los datos a la Z y luego si a las probabilidades.
Distribucin en el muestreo
En funcin a lo que sabemos de los temas anteriores, el anlisis de la informacin extrada de la poblacin nos
permite hallar diversas medidas (media, mediana, proporcin, varianza) que poseen la caracterstica de ser
parmetros, es decir, valores nicos y que definen a esta poblacin.
Resulta que, en el trabajo de campo de una situacin real, la mayora de las veces el relevamiento de toda la
poblacin bajo estudio resulta muy difcil o imposible de ser realizado.
Uno de los relevamientos ms conocidos es el censo de poblacin, se realiza cada 10 aos pero la tarea de
preparacin, realizacin y anlisis de la informacin dura aos, involucra miles de personas y millones de pesos,
por lo que solo un organismo nacional est capacitado para hacerlo.
En otros casos, el estudio de la poblacin resulta imposible, por ejemplo en una lnea de produccin donde se
producen miles de unidades por da, realizar el control de la calidad del producto llevara muchsimo tiempo y
en algunos casos, este control involucra la destruccin del producto.
Por estas razones y muchas ms, la estadstica nos brinda la posibilidad de realizar este mismo anlisis pero a
una muestra de la poblacin, un subconjunto de la misma, si la muestra cumple con las condiciones de
seleccin (probabilstica) y el tamao adecuado, esta tendr similares caractersticas que la poblacin total.
Pero no todas son virtudes respecto de la muestra, si bien podemos analizar una cantidad menor de unidades,
con la ventaja que ello implica, cada muestra distinta que extraigamos arrojara, cada una, una medida resumen
distinta (promedio, varianza, proporcin, etc.).
Cul de esas medidas resumen halladas en cada muestra es la correcta?
Esta caracterstica de la muestra donde cada una arroja sus propias medidas resumen hace que, lo que en la
poblacin era un estudio de una variable aleatoria que arroja un parmetro, pase a ser en la muestra el estudio
de una variable aleatoria que arroja una medida resumen que sigue siendo una variable aleatoria, por lo cual,
la pregunta anterior an sigue sin respuesta.
Para comenzar a responder esta pregunta, la estadstica nos brinda tres herramientas fundamentales: La ley
de los grandes nmeros (LGN, el Teorema Central del Limite (TCL) y el Teorema de Tchevycheff
Teorema de Tchevycheff
En trminos sencillos ofrece una cota inferior a la probabilidad de que el valor de una variable
aleatoria con varianza finita est a una cierta distancia de su esperanza matemtica. Es cada vez menos
probable que ocurra que X tome un valor mas alejado de la esperanza ().
La LGN (ley dbil) nos dice que, si X es una variable aleatoria independiente e idnticamente distribuida (IID),
cuando el tamao de la muestra tiende a infinito, el promedio muestral tiende al parmetro .
En palabras ms sencillas, mientras ms grande es la muestra, ms cerca est el promedio muestral del
promedio de la poblacin.
Teorema Central del Lmite
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.28
Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
Funcin de densidad 0.18
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.40
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil 0.21
Versin Estudiantil
0.14 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
0.30 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.09 Versin Estudiantil
0.14 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.20Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.05Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.07 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.10
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Estudiantil
Estudiantil Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil 0.00Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil
0.00 4.54 9.07 13.61 18.14
Versin Estudiantil
0.00 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil VersinEstudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.00 Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0.00 3.00 6.00 9.00
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
12.00
Versin Estudiantil Variable -2.07 1.46 5.00 8.54 12.07
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
Versin Estudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin
VersinEstudiantil
Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Si se tiene una variable aleatoria IID, de una poblacin cualquiera. . : IID significa Independiente e
Idnticamente Distribuido, esto significa que todas las observaciones son independientes entre s y
todas corresponden a la misma variable observada, es decir pertenecen a la misma poblacin. Algo
que no dice explcitamente es que el TCL se aplica a cualquier distribucin de una poblacin, aun
aquella que es desconocida.
con promedio y variancia 2 para tener promedio y varianza, la variable es cuantitativa.
se construyen estimadores lineales los estimadores lineales que vamos a utilizar son el
promedio, proporcin, diferencia de promedios, diferencia de proporciones.
Estos estimadores son variables aleatorias y las mismas poseen una distribucin de probabilidad
conocida, la normal, con parmetros Media = y Varianza = 2/n. A diferencia de los ejercicios vistos
anteriormente con la normal, la variable ahora pasa a ser el promedio ( ) y por esto, la varianza es
dividida por el tamao de la muestra (n).
~N (; 2 /n) si n
Pensemos esto utilizando el sentido comn y un ejemplo: trabajamos en una empresa donde tenemos 100
empleados con edades entre 20 y 60 aos. Si sacramos muchas muestras de tamao 2 y calculramos el
promedio, seguramente cada promedio muestral seran muy distinto entre s, nos encontraramos con valores
muy grandes, valores muy chicos. En definitiva, estos promedios de muestras de tamao 2 tendra una enorme
variabilidad.
En la otra punta, si tomamos muestras de tamao 95, es decir, tomamos casi toda la poblacin, nos dara que
el promedio va estar muy cerca del parmetro ya que solo dejamos afuera cinco personas y los sucesivos
promedios muestrales daran valores muy similares entre s, cuestin que indica poca dispersin entre los
promedios muestrales.
Desde el TCL esto se ve en la expresin de la varianza del promedio (2 /n) que disminuye a medida que
aumenta el tamao de la muestra. Como dijimos, esto se da porque los promedios de cada muestra son muy
similares entre s.
Datos muestrales
Distribucion de las medias muestrales mu=10; sigma=20; n=4
para distintos tamaos de muestra mu=10; sigma=20; n=16
mu=10; sigma=20; n=100
0.2
0.16
densidad
0.12
0.08
0.04
0
-40 -20 0 20 40 60
x
Estas herramientas, el TCL y la Ley de los Grandes Nmeros (LGN), junto con el teorema de Tchevycheff, nos
permiten entrar en la estadstica Inferencial, es decir, estimar una caracterstica de la poblacin a travs de la
informacin provista por la muestra.
Para realizar esto necesitamos una herramienta ms que es comenzar a distinguir, a travs de la notacin
utilizada, si los datos corresponden a una poblacin o a una muestra, esto tiene una razn de ser:
Parmetro Estimador
=xi = xi
N n
=(x-)
2 2
S= (x- )2
N n -1
=A/N P= a/n
La frmula o algoritmo matemtico aplicado a la muestra debe cumplir una serie de condiciones o propiedades
que le brindan la caracterstica fundamental de ser un estimador.
En tanto y en cuanto cumple estas condiciones, podremos hacer estadstica Inferencial, es decir, a travs de
una muestra y con la aplicacin del estimador, podremos estimar un valor de la poblacin.
Propiedades de los Estimadores
Las propiedades que nos permitirn considerarlos ESTIMADORES son:
Insesgadez: E () = Si pudiramos tomar todas las muestras posibles de tamao n y a ellas calcularles
el promedio, suponiendo que cada promedio es equiprobable, el promedio de promedios muestrales
es igual al promedio poblacional.
Suficiencia: El estimador utiliza toda la informacin brindada por los datos de la muestra.
Eficiencia: El estimador posee varianza mnima.
Mtodos para hallar los estimadores:
Mxima Verosimilitud
Momentos
Bayesiano.
Entonces:
Estimador: algoritmo que cumple las condiciones previamente mencionadas. Se construye con los
valores correspondientes a los elementos que integran una muestra y que, como su nombre lo
indica, sirven para obtener estimaciones del correspondiente valor poblacional o parmetro
desconocido que se intenta estimar o verificar.
Estimacin: resultado aplicado a la muestra.
Estimacin Puntual: se calcula el valor de inters a partir de la muestra para estimar el parmetro.
Dado que el estimador es variable, no puede decirse con exactitud cul es el valor del parmetro. Pero al
conocerse su distribucin puede armarse un intervalo o rango de valores que, con un determinado nivel de
confianza, se espera que contenga al parmetro.
Error de Estimacin
Se denomina error de estimacin a la distancia que existe entre el promedio muestral y cada uno de los
limites (Superior e Inferior) del Intervalo de Confianza, en definitiva el error de estimacin es el trmino que
se suma para hallar el lmite superior y el mismo valor se resta para hallar el lmite inferior.
Determinantes:
1. Nivel de confianza
2. Desvo (depende del muestreo). e = Z1-/2 * /
3. n
De la frmula el Error se deduce la del tamao de muestra para un Muestreo Aleatorio Simple (MAS).
Error de Estimacin:
e = Z1-/2 * /
Elevando ambos miembros al cuadrado se obtiene: Siempre se usa Z para el clculo del n
e2 = Z2 1-/2 * 2 /
Y luego, despejando n, queda:
2
= (Z2 1-/2 * 2) / e
Distribucin t de Student
Sucede muchas veces que no se posee informacin respecto al valor de la varianza poblacional, la misma se
dice es desconocida, por lo que nos vemos en la obligacin de calcular la varianza a partir de los datos de la
muestra con la que estamos trabajando, as como el promedio es una variable aleatoria por cambiar de
muestra en muestra, tambin lo es la varianza muestral (S2 ) y la frmula sufre una pequea variacin ya que
cambia la distribucin usada para su clculo.
La Distribucin t de Student tiene como parmetros, los grados de libertad que son la cantidad de datos menos
1 (n-1) y el nivel de confianza.
Una caracterstica importante de la distribucin t, es que a medida que n tiende a infinito, esta distribucin se
aproxima asintticamente a la distribucin normal, en trminos prcticos, si debiramos usar la distribucin t
para una muestra superior a 120 (n>), podramos, con un mnimo de error, utilizar la tabla z.
P(p Z (1-/2) * p + Z (1-/2) * )= 1-
Y el tamao de la muestra:
Prueba de Hiptesis
La Prueba de Hiptesis es un procedimiento mediante el cual se pone a prueba una suposicin sobre algn
parmetro (, , etc.) comparndolo con un valor extrado de una muestra.
El procedimiento tiene 5 pasos que se detallan a continuacin:
1) Planteo de la H0 y H1 en funcin al estudio de inters.
2) Definicin del nivel de error : este valor lo define el investigador.
3) Definicin del estadstico de prueba asociado al tipo de valor bajo estudio.
4) Regla de Decisin: grfica en la cual se define la cola de la prueba y la zona de decisin en funcin al
valor crtico de tabla asociado al nivel de error.
5) Clculo del valor del estadstico y decisin de Rechazar o No Rechazar.
La duda planteada en H1 marca cuales son los valores de inters, para determinar la cola de la prueba de
hiptesis, es decir en que se sector de la curva estar el error () designado para el estudio y esto permite
delimitar las zonas de rechazo y de no rechazo de H0.
-Si suponemos que hubo una disminucin del valor poblacional, H1 ser menor que y la prueba ser cola
izquierda
-Si suponemos que hubo un aumento del valor poblacional, H1 ser mayor que y la prueba ser cola derecha.
-Si suponemos que el valor poblacional debe tomar un valor especifico, igual que, H1 ser distinta y la
prueba tendr en error distribuido en partes iguales a ambos lados de la curva.
4) Regla de decisin
Si la distancia entre y es menor al Z crtico No se rechaza H0 y se dice que las diferencias entre estos valores
son responsabilidad de la muestra.
Rechazo H0: dada la muestra y el nivel de confianza seleccionado se Rechaza H0, por lo tanto (variable) ha
sufrido un .(el cambio aumento/disminucin-). Las diferencias entre y son significativas. El termino
significativo, de una forma mas coloquial, quiere decir que hay mucha diferencia con lo planteado en la
H0. El mucho o poco esta cuantificado por el valor critico.
No Rechazo H0: dada la muestra y el nivel de confianza seleccionado no se Rechaza H0, por lo tanto
(variable) no ha sufrido cambios. Las diferencias entre y no son significativas.
Al trabajar con un nivel de confianza, implica que tambien tenemos un nivel de error, es decir, podemos tomar
una decision equivocada con la muestra trabajada, en funcion a como es la hipotesis nula y la decision tomada,
se construye la siguiente tabla.
- La Hipotesis nula tiene dos posibles respuestas: es verdadera o falsa.
- La decisin tomada tiene dos alternativas: Rechazo o No Rechazo.
Hipotesis Nula
Verdadera Falsa
Hipotesis 1-
Rechazo
Nula
No 1-
Rechazo
El error que se puede cometer est asociado directamente a la decisin tomada en la prueba de hiptesis:
- Si rechazo la Hipotesis Nula, solo puedo estar cometiendo Error tipo I y no otro.
- Si No rechazo Hipotesis Nula, solo puedo estar cometiendo error tipo II y no otro.
La palabra puedo es importante ya que implica un riesgo, no implica la certeza de cometer error ni que no
existe posibilidad de cometerlo.
P Valor
P Valor, PV o P Value, se define como la probabilidad debajo de la curva, acumulada, de obtener un resultado
tanto o ms extremo del estadstico de la prueba calculado, suponiendo H0 Cierta.
Zc: Z crtico que surge de la tabla en funcin a
la confianza y define las regiones de Rechazo
y No Rechazo.
Hasta el momento, los anlisis de pruebas de hiptesis que realizamos han tenido la caracterstica de
realizarse sobre medidas de resumen de una muestra (media, proporcin) basadas en variables cuantitativas
dejando de lado un grupo importante dentro de cualquier estudio que lo conforman las variables
cualitativas. Para el anlisis de este tipo de variables y utilizando tablas de contingencia donde se relacionan
dos de ellas, existe una distribucin de probabilidad, denominada Chi-cuadrado, que permite contrastar
diferentes hiptesis sobre las variables introducidas en la tabla de contingencia. Tengamos en cuenta que la
tabla de contingencia tambin puede incluir variables cuantitativas.
Prueba de Independencia 2
En la unidad de probabilidad examinamos si dos sucesos eran independientes o no, lo que implicaba que, si
bien pueden darse simultneamente, la presencia de uno de ellos no condiciona la presencia del otro. Ahora
lo que haremos es extender el anlisis a todos los sucesos de las variables involucradas.
En esta prueba estamos interesados en determinar si dos cualidades o variables referidas a individuos de una
poblacin estn relacionadas. Por ejemplo: sexo y nivel educativo. Buscamos ver la relacin existente entre
dos variables medidas a una misma poblacin.
Por ser una prueba de hiptesis, debemos seguir la misma metodologa que se aprendi anteriormente.
Ejemplo:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una muestra
aleatoria simple de 100 jvenes, con los siguientes resultados:
Sin depresin Con depresin Total
Deportista 38 9 47
No deportista 31 22 53
Total 69 31 100
Tenemos en este caso dos variables (Depresin y Deportista) donde cada una de ellas tiene dos categoras.
1) Definir las hiptesis:
H0) ij = i * j las variables analizadas son independientes entre s.
H1) ij i * j las variables analizadas no son independientes entre s.
Lo que en realidad hacemos es extender la propiedad vista en probabilidad que se limitaba a dos sucesos
particulares a todos los sucesos posibles.
2) Error =0.05
O E
2
3) Estadstico de Prueba
2
E
Donde: 2 es el nombre del estadstico y la distribucin utilizada.
O: cada uno de los valores observados en la tabla de contingencia
E: valor terico que debera tener la celda suponiendo que las variables son independientes.
El estadstico se construye como la sumatoria de las diferencias entre lo observado y el valor que debera tomar
suponiendo la independencia.
4) Regla de decisin
5,823
2c=3.84
Para buscar el valor crtico debemos saber que, al igual que la distribucin t de Student, la distribucin Chi
tiene como parmetro los grados de libertad. En esta prueba los GL se definen como:
Grados de Libertad = (Filas-1)*(Columnas-1)
Entonces: GL = (F-1)*(C-1) = (2-1) * (2-1) = 1
Esto determina, dado los marginales, la cantidad de celdas que pueden tomar cualquier valor, es decir, una
sola celda toma cualquier valor y el resto de las celdas toman un valor particular ya que deben ajustar a los
totales.
En funcin al nivel de confianza (0.95 o 95%) y los GL de la tabla de contingencia, buscamos el critico.
Entonces: 2c = 2(1-; GL) = 2(0,95; 1) = 3,84
5) Clculo y decisin:
Para construir la tabla de valores esperados, aplicamos la propiedad de independencia tomando como datos
las cantidades marginales para calcular las cantidades conjuntas.
Podremos luego verificar que la sumatoria de las conjuntas no cambio los marginales.
Sin depresin Con depresin Total
Deportista 69*47/100=32.43 31*47/100=14.57 47
No deportista 69*53/100=36.57 31*53/100=16.43 53
Total 69 31 100
Una vez armada la segunda tabla, procedemos a armar la tercera donde calculamos las diferencias para cada
celda y sumamos todos los valores (0.957 + 2.129 + 0.848 + 1.888 = 5.823) el cual nos da el estadstico de
prueba. Como vemos en el grfico, el valor del estadstico cae en la zona roja definida como la zona de
rechazo.
Sin depresin Con depresin Total
Deportista (38 - 32.43)2 = 0.957 (9 14.57)2 = 2.129
32.43 14.57
No deportista (31 - 36.57)2 =0.848 (22 16.43)2 =1.888
36.57 16.43
Total 5.823
Dado que 2n = 5,823 > 2c = 3.84, entonces rechazo la H0, las variables Depresin y deportista no son
independientes.
Prueba de Homogeneidad 2
Utilizando la misma distribucin podemos realizar la prueba de homogeneidad. Si bien la tabla de contingencia,
en su presentacin de los datos, es igual a la utilizada en la prueba de independencia, ac consideramos que
una de las dos variables bajo estudio es controlada por el investigador lo que produce que, o los totales filas
o los totales columnas tienen valores predeterminados. Con esto buscamos analizar si las proporciones entre
las categoras de la variable no controlada son las mismas para cada variable controlada.
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al distribuidor
que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3
distribuidores que nos sirven el producto comprobando el nmero de defectuosos en cada lote. La siguiente
tabla muestra el nmero de defectuosos en para cada uno de los distribuidores.
Componentes Componentes Total
Defectuosos correctos
Distribuidor 1 16 94 100
Distribuidor 2 24 76 100
Distribuidor 3 9 81 100
Total 49 251 300
En este caso queremos analizar si las muestras de cada distribuidor (variable controlada en fila) poseen las
mismas proporciones de componentes defectuosos y correctos (variable no controlada en columna), es
decir, si pertenecen a la misma poblacin.
1) Definir las hiptesis
E
Los pasos 4 y 5 son similares a las de la prueba de independencia solamente cambia la decisin tomada ya que
la prueba de hiptesis, en la H0, hace otra suposicin.
Nmeros ndices
Definicin y utilidad
El nmero ndice nos permite valorar de forma ms clara y rpida la evolucin en el tiempo o en el espacio de
variables numricas que refieren a muy diferentes aspectos de la realidad.
- En cunto se increment la produccin?
- En cunto variaron los salarios en el ltimo ao?
- Cunto crecieron las ventas desde la implementacin de la promocin?
- Qu zona tuvo un mayor incremento de ventas?
- Los salarios perdieron contra la inflacin?
La comparacin relativa de los cambios de los valores de la variable que nos da el numero ndice, sea este
cambio a travs del tiempo o del espacio, generalmente brinda al analista una idea ms precisa de la magnitud
de tales cambios que la comparacin en trminos absolutos.
Decir que la produccin aumento en 15% en el ltimo trimestre brinda ms informacin que decir que se
produjeron 850 ms de piezas.
Caractersticas
Cada ndice es una cifra relativa, usualmente porcentual, que expresa una medicin (precios o
cantidades) de un artculo (ndice simple) o ms frecuentemente de un conjunto de artculos (ndice
agregado) con relacin a otro periodo, antes o posterior, denominado base.
Todo ndice carece de unidad de medida al ser el cociente entre valores medidas en la misma unidad
de medida.
Son series temporales, es decir, varan en el tiempo o pueden variar en el espacio.
Son indicadores de tipo comparativos, es decir, su significacin depende de la comparacin entre los
valores de la misma serie.
La base corresponde al periodo, arbitrariamente elegido, en el cual al ndice se le adjudica el valor
I0=100.
Simbologa
El subndice t nos indica el periodo que estamos analizando o periodo de inters.
El subndice 0 nos indica el periodo que tomamos como base para el anlisis o periodo base.
El subndice t-k nos indica un periodo que esta hacia atrs k periodos respecto del periodo t de
inters.
El subndice t +k nos indica un periodo hacia adelante k periodos respecto del periodo t de inters.
En base a la siguiente informacin suministrada por la empresa Solrac SA, vamos a realizar un anlisis
calculando diferentes nmeros ndices.
Se calcularan todos los ndices tomando el mismo periodo de inters y base para poder hacer una comparacin
de los mismos.
Periodo Ao 2012 Ao 2013 Ao 2014 Ao 2015
Producto Precio Cantidad Precio Cantidad Precio Cantidad Precio Cantidad
Led 32 4500 210 5200 230 6300 240 8400 260
Notebook 9000 160 9800 150 10800 170 13000 190
Garantas 150 50 200 80 300 100 400 120
a) ndice Simple:
Este ndice se construye para mostrar las variacin de una sola variable referidos al un valor llamado periodo
base.
PT
I P (T / 0) *100 donde P nos dice que es un ndice de precios, para el periodo T, tomando como
P0
base el periodo 0.
PI
I EP ( I / I 1) *100
PI 1
Calcule los ndices de Eslabn entre 2012 y 2015
P2015 8400
I EP (2015 / 2014) *100 *100 133.33
P2014 6300
P2014 6300
I EP (2014 / 2013) *100 *100 121.15
P2013 5200
P2013 5200
I EP (2013 / 2012) *100 *100 115.55
P2012 4500
I EP ( I / I 1) I EP ( I 1/ I 2) I EP ( I 2 / I 3)
I CP ( I / 0) * * *100
100 100 100
133.33 121.15 115.55
I CP (2015 / 2012) * * *100 186.66
100 100 100
d) ndice Agregado:
Es las suma de las magnitudes (precio, cantidad, etc) de las variables consideradas (Led, notebook, seguro,
etc.) entre el periodo de inters t y el periodo base 0.
xit
I AP ( I / 0) *100
xi 0
(8400 13000 400) 21800
I AP (2015 / 2012) *100 *100 159.70
(4500 9000 150) 13650
xit
xi 0
I PP ( I / 0) *100
n
8400 13000 400
( )
(1.8666 1.4444 2.6666)
I PP (2015 / 2012) 4500 9000 150 *100 *100 199.25 Vemos
3 3
como la variacin de los seguros, de menor magnitud pero con mayor variacin porcentual, tiene, en la
suma, un mayor impacto ahora que en el ndice agregado.
b) ndice de Laspeyres:
Este ndice agregado tiene la caracterstica principal de tomar las cantidades nicamente del periodo base,
permitiendo de esta forma que las variaciones del mismo sea exclusivamente debido a las variaciones de
precios, es el ndice que se utiliza para la construccin del ndice de Precios al Consumidor (IPC).
( Pit * Qi 0 )
IPL( I / 0) *100
( Pi 0 * Qi 0* )
(8400* 210 13000*160 400*50) 3864000
IPL(2015 / 2012) *100 *100 161.50
(4500* 210 9000*160 150*50) 2392500
La desventaja es que, con paso del tiempo, hay en la gente cambios de gustos, modas o necesidades que
producen variaciones en las cantidades demandadas o el surgimiento de nuevos productos que no son tenidos
en cuenta.
c) ndice de Paasche:
Opera de la misma forma que el ndice de Laspeyres pero con la diferencia que las cantidades utilizadas en
este caso corresponden a las del periodo de inters, esto mantiene mas actualizado el ndice al tomar en
cuenta los factores que Laspeyres dejaba de lado.
( Pit * Qit )
IPP( I / 0) *100
( Pi 0 * Qit* )
(8400* 210 13000*160 400*50) 4702000
IPP(2015 / 2012) *100 *100 162.49
(4500* 210 9000*160 150*50) 2898000
La desventaja de este ndice es que obliga a una continua actualizacin de las cantidades utilizadas y esto
implica que puede haber diferencias entre los periodos de la serie, generando ruido en el ndice de precios.
Variacin porcentual:
Podemos establecer cul es la variacin porcentual de dos valores correspondientes a la misma variable, sea
esta variacin debida por el paso del tiempo o de los productos diferentes al mismo momento.
It
%(t / t k ) ( 1) *100
It k
Esta frmula nos permite calcular la variacin porcentual de un ndice (I), aunque puede ser tambin un precio,
entre dos periodos distintos donde existen k periodos entre ellos.
Utilizando los datos del ndice de eslabn, analizaremos la variacin entre 2015 y 2013
133.33
%(2015 / 2013) ( 1) *100 15.38%
115.55
O tambin podemos calcular la variacin entre 2015 y 2013 del precio de la notebook.
13000
%(2015 / 2013) ( 1) *100 32.65%
9800
Indexacin o Inflacin:
La indexacin es la inclusin en un precio o ndice, de las variaciones causadas por la inflacin, en general, en
todas las economas, la indexacin de precios genera un aumento de los mismos a medida que pasa el tiempo.
Esta frmula tiene semejanzas con las vistas en matemtica financiera de inters, donde %(t / t k ) es la
variacin que hubo entre los periodos bajo estudio, tengamos en cuenta que el incremento no debe expresarse
como porcentaje.
Pt Pt k *(1 (t / t k ))
Desindexacin o Deflacin:
Es inverso a la indexacin, lo que hacemos por este mtodo es llevar los precios de inters hacia un periodo
alejado en el tiempo, es decir, pasamos el precio P(t) al periodo P(t-k). Esta frmula surge de operar
matemticamente la formula anterior.
Para esto construimos el ndice de precios (It) de las notebook entre 2015 y 2013 donde 2013 toma valor 100
por ser el periodo base.
13000
I 2015/2013 *100 132.65
9800
It k I 100
Pt k Pt * P2013 P2015 * 2013 P2013 13000* P2013 9800
It I 2015 132.65
Regresin
Este anlisis est relacionado con el estudio de la dependencia de una variable a la cual denominamos Y, con
una o varias que buscan explicarla, denominada variable independiente o denotada como X con el objetivo de
estimar y/o predecir el valor de la variable Y en trminos de valores conocidos de X.
Dado que todas las variables con la que estamos trabajando, incluida la dependiente (Y), son variables
aleatorias, no podremos hacer nunca una prediccin exacta debido a la existencia de diferentes factores, como
ser errores de medicin o incluso otras variables que no desconocemos o no podemos medir de forma clara,
es decir, la recta de regresin presentara siempre diferencias con las observaciones pero trataremos que estas
sean mnimas.
La eleccin de a cul de las variables llamaremos X y cual ser Y, es decir la causalidad, depende de
consideraciones tericas previas asociadas al estudio. Por ejemplo, un estudio que relacione la lluvia con el
rendimiento de una cosecha de soja dir que la causalidad est dada por la lluvia (X) que influye en el
rendimiento (Y) y no viceversa.
Cualquier tipo de anlisis depende de la disponibilidad de informacin adecuada, esto vuelve esencial analizar
la naturaleza, fuentes y limitaciones de la informacin con que se puede contar al realizar un estudio.
Nosotros analizaremos datos de corte transversal y brevemente nos ocuparemos de datos de series de tiempo.
Anlisis de la Regresin: es decir, establecer la funcin matemtica que permite relacionar las variables bajo
estudio en funcin a cul es la variable dependiente (Y) y cual/cules sern las independientes (X).
Anlisis de la Correlacin: donde se estudia la fuerza y grado de asociacin lineal entre las variables. Este
anlisis no hace distincin a travs de la causalidad.
Una vez definida la relacin se procede a realizar un grfico de dispersin, aqu los datos se muestran como un
conjunto de puntos, donde cada punto x determina la posicin en el eje horizontal (x) y el valor de la otra
variable determinado por la posicin en el eje vertical (y).
Esta relacin entre las variables y en funcin al grfico de dispersin nos permitir definir una funcin
matemtica que para nuestro caso ser Yi=0 + 1 Xi + ui . Esta funcin se denomina Modelo de Regresin
Poblacional (FRP) donde:
0 es la ordenada al origen
1 es la pendiente de la recta
ui es el error de estimacin, esto se produce porque las variables son aleatorias
Estos coeficientes se estimaran con los datos muestrales, lo cual nos va a permitir definir la Funcin de
Regresin Muestral i=b0 + b1 Xi
GRAFICO DE DISPERSION
y=0 + 1 Xi
El procedimiento no es complejo pero requiere conocimientos de matemtica, el mnimo se halla haciendo las
derivadas primeras parciales respecto a 0 y 1, luego se iguala a cero la funcin y se despejan los valores que
permiten el clculo de los coeficientes, ser necesario luego hacer la derivada segunda que permite verificar
que los valores son positivos lo que indica un mnimo.
No es de nuestro inters la derivacin de las funciones que permiten el clculo del coeficiente ya que muchos
software pueden realizar este procedimiento de manera rpida y sencilla. El inters consiste en poder
interpretar de manera clara, toda la informacin que se nos brinda, la cual nos servir para una toma de
decisin fundamentada.
Una vez definida la variable dependiente (Y) y la variable independiente (X), podemos proceder a realizar al
anlisis de la informacin, para lo cual presentamos el siguiente caso a modo de ejemplo.
El Gerente de Produccin de la empresa Cisa SA propuso hace un tiempo una fuerte inversin en capacitacin
de los empleados y desea realizar una evaluacin de esta inversin, supone que existe una relacin lineal entre
la inversin y la cantidad de unidades producidas por la empresa para lo cual analiza 15 observaciones
semanales:
X: Inversin en capacitacin (en miles de pesos).
Y: nmero de piezas producidas.
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
Tabla de Bondad de Ajuste
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937
Error tpico 1,15109
Observaciones 15
ANLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 85,47482 85,47482 64,50862 2,14128E-06 Tabla ANOVA
Residuos 13 17,22518 1,32501
Total 14 102,7
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95% Tabla de
Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358 11,30779 Coeficientes
Inv en Capacit 0,39209 0,04882 8,03173 0,00000 0,28662 0,49755 parciales
La interpretacin de los coeficientes no solo implica reemplazar X e Y de la interpretacin general por las
variables analizadas, sino tambin utilizar la escala de medicin de la variable, en nuestro caso, la inversin
esta expresada en miles de pesos.
- Si |tn|<|tc| No Rechazo H0
- Si |tn|>|tc| Rechazo H0
Para el caso de los betas, las hiptesis siempre sern iguales contra distinto ya que el valor que nos interesa
probar es cero, cada coeficiente es probado individualmente, en funcin a sus datos y los resultados hallados
son totalmente independientes a los que podamos obtener de las pruebas de los otros coeficientes.
Como tn>tc Rechazo H0 (que =1), por lo tanto existe relacin entre las variables.
3.c P Value:
Si Pv > No rechazo H0 y Si Pv < Rechazo H0.
La regla del PV permite tomar una decisin rpidamente al cambiar el error con el que trabajamos
Para el coeficiente 0 (ordenada al origen):
- Si se rechaza H0, b0 es distinto de cero, por lo tanto la recta de regresin no pasa por el origen de
coordenadas (x=0; y=0).
- Si no se rechaza H0, b0 es igual a cero, por lo tanto la recta de regresin pasa por el origen de
coordenadas (x=0; y=0).
Este valor lo comparamos con un valor terico de la tabla t de Student con (n-2) grados de libertad, para
nuestro caso (15-2)=13 y 0.975 (Confianza de 0.95 para una prueba bilateral), el t critico es 2,160.
4) Coeficiente de Determinacin R2
0 R2 1
Mide el porcentaje de la variacin de Y que es explicada por la X.
EnResumen
el Ejemplo:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937
Error tpico 1,15109
Observaciones 15
R2=ANLISIS
el 83,22% de la variacin de la produccin de piezas esta explicada por la inversin en capacitacin.
DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
5)Regresin
Coeficiente de Correlacin
1 85,47482 85,47482 64,50862 2,14128E-06
Mide la fuerza13y el sentido
Residuos 17,22518 de la relacin
1,32501 lineal entre las variables.
-1 r 1:
Total 14 102,7
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,91229
r= 0,91229:
Coeficiente de determinacin R^2 0,83228
R^2 ajustado 0,81937 Cercano a 1: Relacin Fuerte.
Error tpico 1,15109 signo + (por el signo de b1): Relacin directa.
Observaciones 15
ANLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crtico
libertad cuadrados cuadrados F de F
6)Regresin
Estimacin y Error 1 de Estimacin
85,47482 85,47482 64,50862 2,14128E-06
Si Residuos
bien desde el punto13de vista de la matemtica
17,22518 1,32501 podemos realizar una estimacin otorgando solamente un
valor
Totala la X, debemos tener
14 en cuenta
102,7 que ciertas caractersticas debe cumplir este valor para que la prediccin
sea confiable, un valor de X que no haya pertenecido a las observaciones o un valor de X que este alejado
Coeficientes
dentro del grfico Error tpico
de dispersin Estadstico
de las t Probabilidad
observaciones hace Inferior
que la 95% Superior 95%
estimacin comience a perder confiabilidad
Intercepcin 5,99568 2,45889 2,43837 0,02986 0,68358
y mientras ms se acente este comportamiento, menor ser la confiabilidad. 11,30779
Inv en Capacit 0,39209 0,04882 8,03173 0,00000 0,28662 0,49755
Estimacin: Valor que toma la dependiente (Y) al otorgar un valor a X
Error de estimacin: Diferencia entre un valor observado y un valor estimado en funcin a X0.
Error
e= Y- = b0 + b1* X
siendo Estimacin Y
Como dijimos anteriormente, podemos realizar anlisis de regresin sobre datos en series de tiempo donde la
caracterstica principal en que tenemos una observacin para cada periodo y esperamos que la distancia entre
cada periodo sea siempre la misma. Si analizamos las ventas mensuales, tendremos, para cada mes del ao,
una observacin y no podremos tener saltos bimestrales o trimestrales en la misma serie.
Si bien el anlisis de serie de tiempo es muy extenso, nosotros solo analizaremos datos temporales donde la
variable explicativa es el tiempo, con esto trataremos de predecir como es el comportamiento de la variable
dependiente con el paso del tiempo.
El anlisis de serie de tiempo posee otras caractersticas, muchos productos poseen lo que se denomina
estacionalidad, esto es, el producto posee fuertes variaciones, claras y predecibles, en su comportamiento por
la influencia clara del momento en el ao en que se estudia y este comportamiento se repite a lo largo de los
aos, un ejemplo es la venta de helados y gaseosas que tiene un pico durante el verano y desciende durante
el invierno. La presencia de estacionalidad en el producto hace necesario un estudio adicional a la recta de
regresin con el objetivo de capturar estas variaciones, pero esto excede los objetivos de la materia.
El anlisis de serie de tiempo, para nosotros, es muy similar al visto anteriormente, solo cambia la
interpretacin del 1 y la interpretacin de la estimacin.
1: por el aumento de un periodo de tiempo (mes, dia, semana, etc), la variable Y aumentara en 1 unidades.
Respecto a cmo realizar el anlisis, los periodos bajo estudio sern numerados, tomando el primer periodo
observado, cualquiera sea, el valor 1, el segundo periodo valdr 2 y as sucesivamente hasta n.
Para su interpretacin ms clara deberemos realizar el paso inverso, es decir, ver a que periodo corresponde
cada nmero y para la prediccin deberemos ver que valor toma en la serie en periodo solicitado.
Si tenemos datos mensuales del ao 2015, Enero de 2015 valdr, para realizar la regresin 1, febrero valdr 2
y diciembre valdr 12, si queremos realizar una prediccin de Marzo de 2016, este periodo ser el nmero 15,
valor que ser introducido en la funcin de regresin.