Professional Documents
Culture Documents
1.-Fundamentos Estadsticos:
Introduccin:
Desde hace siglos, la aplicacin de registros e instrumentos para estudiar una determinada poblacin
han sido utilizados por diversas naciones, tales como: roma, Egipto, china, entre otros. De all viene el
origen de la estadstica, la cual antes de ser una ciencia fue implementada por jefes de gobierno para
llevar los registros de datos numricos, de la poblacin de los nacimientos, y las disfunciones
ocurridas en uno o varios aos.
Definicin:
La estadstica es considerada como una coleccin de hechos numricos expresados en trminos de
una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. Tambin podemos
considerarla como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de muestra.
Importancia:
La Estadstica Econmica tiene sus antecedentes en el siglo XVII y su mximo exponente fue William
Petty quin es considerado por Carlos Marx como el creador de esta ciencia sin olvidar a Gregory
King que tambin realiz clculos aproximados de los ndices econmicos sociales de esta ciencia.
Funcin:
La principal funcin de la estadstica es la recoleccin, recopilacin e interpretacin de datos para
llevar los registros de datos numricos, de la poblacin de los nacimientos, y las disfunciones
ocurridas en uno o varios aos aplicadas en las diferentes ramas de la ciencia como en salud,
economa ,etc.
Tipos:
La estadstica descriptiva o de ductiva, se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos
pueden ser resumidos numrica o grficamente.
La estadstica inferencial o inductiva, se dedica a la generacin de los modelos, inferencias
y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e
incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la poblacin de estudio.
Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones. Una poblacin es un conjunto de elementos que presentan una
caracterstica comn.
Ejemplo:
Los miembros del Colegio de Ingenieros del Estado Peruano.
Muestra:
Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla. Una muestra es
una coleccin de algunos elementos de la poblacin, pero no de todos". "Una muestra debe ser
definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra
solo podrn referirse a la poblacin en referencia.
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Peruano.
Variable y tipos:
Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo se llama variable
estadstica.
Variables cualitativas:
Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que
se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos
atributos. Las variables cualitativas pueden ser ordinales y nominales.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una
escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por
ejemplo, leve, moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de
orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas:
Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas
adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores especficos que la variable pueda asumir. Un ejemplo es el nmero de hijos.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisin del
aparato medidor, en teora permiten que siempre exista un valor entre dos cualesquiera.
B.-LA ENCUESTA.
Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra representativa de la
poblacin o instituciones, con el fin de conocer estados de opinin o hechos especficos.
Ventajas y Desventajas
Ventajas
1. Bajo costo
2. Informacin ms exacta (mejor calidad) que la del Censo debido al menor nmero de
empadronadores
permite
capacitarlos
mejor
y
ms
selectivamente.
3. Es posible introducir mtodos cientficos objetivos de medicin para corregir errores.
4. Mayor rapidez en la obtencin de resultados.
5. Tcnica ms utilizada y que permite obtener informacin de casi cualquier tipo de poblacin.
6. Permite obtener informacin sobre hechos pasados de los encuestados.
Desventajas
El planeamiento y ejecucin de la investigacin suele ser ms complejo que si se realizara por censo.
1. Requiere para su diseo de profesionales con buenos conocimientos de teora y habilidad en su
aplicacin.
C.-LA OBSERVACIN:
consiste
en
observar
a
las
personas
cuando
efectan
su
trabajo.
Como tcnica de investigacin, la observacin tiene amplia aceptacin cientfica. Los socilogos,
siclogos e ingenieros industriales utilizan extensamente sta tcnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros de la organizacin. "Ver es creer! Observar
las operaciones la proporciona el analista hechos que no podra obtener de otra forma.
D.-SESIONES DE GRUPO.
Es una de las formas de los estudios cualitativos en el que se rene a un grupo de personas para
indagar acerca de actitudes y reacciones frente a un producto, servicio, concepto, publicidad, idea o
empaque.
Sin embargo, las sesiones de grupo tienen desventajas. El entrevistador tiene poco control sobre el
grupo y en ocasiones se pierde tiempo en asuntos de poca trascendencia.
4.-Tcnicas de muestreo:
Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y
el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin
Muestreo probabilstico
Forman parte de este tipo de muestreo, todos aquellos mtodos para los que puede calcular la
probabilidad de extraccin de cualquiera de las muestras posibles
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego
hay que calcular una constante, que se denomina coeficiente de elevacin K= N/n; donde N es el
tamao del universo y n el tamao de la muestra. Determinar en qu fecha se producir la primera
extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah en adelante tomar uno de
cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del
fenmeno.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos
estratos se le asignara una cuota que determinara el nmero de miembros del mismo que
compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una
de las tcnicas de seleccin ms usadas en la prctica.
B.-Etapas:
A.-ETAPA DE PLANEAMIENTO O PREPARACIN:
Comprende la justificacin del estudio, determinar los objetivos y variables, identificar las fuentes de
informacin, determinar el mbito, preparar el plan de ejecucin.
A.1.- Relacin dela estadstica con el mtodo cientfico:
Se relaciona por lo siguiente:
A.2.-Planeamiento de la investigacin:
El diseo de la investigacin o estudio se concibe en un plan o proyecto, cuyo contenido depende del
tipo de investigacin a llevar a cavo. Debemos de tener en cuenta los siguientes puntos.
6.-Graficos estadsticos:
Los principales grficos estadsticos son:
Grafico de de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de
tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisasse colocan los valores de la
variable, y sobre eleje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha
dado el siguiente resultado:
Grupo
sanguneo
fi
AB
9
20
Grficos circular:
Se utiliza para representar datos cualitativos, ordinales y discretos para su elaboracin se utiliza la
circunferencia.
fi
Fi
Ejemplo:
[50, 60)
55
Diagrama de frecuencias:
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
105
63
[110, 120)
115
65
65
Histograma de frecuencias:
Se usa para representar las distribuciones de frecuencia absolutas o relativas de datos
cuantitativos continuos agrupados en clases. Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente)
obtenidas por un grupo de 50 alumnos.
fi
hi
[0, 5)
15
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Polgono de frecuencias:
S e obtiene uniendo los puntos medios de las bases superiores de los rectngulos en el histograma
de frecuencias absolutas o relativas.
Hor
a
Temperat
ura
12
12
14
15
11
18
12
21
10
24
Ejemplo
7.-TABLAS DE FRECUENCIA:
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos
estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio
estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee
suma o sumatoria.
Frecuencia relativa:
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero
total de datos.
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34,
33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda
hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi
Recuento
fi
Fi
ni
Ni
2
7
0.03
2
0.03
2
2
8
II
0.06
5
0.09
7
2
9
0.19
4
0.29
0
3
0
16
0.22
6
0.51
6
e) Mediana.
f) Moda.
A.-MODA
La moda se refiere al dato ms repetido, el valor de la variable con mayor absoluta. En cierto sentido
la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se
lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas,
expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario
obtener un valor concreto de la variable, se recurre a la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El
nmero que ms se repite es 5, entonces la moda es 5.
Siendo
la frecuencia absoluta del intervalo modal y
intervalos anterior y posterior, respectivamente.
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase vienen dadas por la
siguiente tabla (debajo):
Calificaciones
Nmero de alumnos
Propiedades
Sus principales propiedades son:
Clculo sencillo.
Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el
parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos,
por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes
de determinado sector social. Esto se conoce informalmente como "retrato robot". 3
Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones
mustrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del
nmero de intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).
B.-Mediana
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que
stos estn ordenados de menor a mayor.Por ejemplo, la mediana del nmero de hijos de un conjunto
de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una
vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:
En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo
que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los siguientes:
Nmero de alumnos
Ejemplo (N par)
Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase vienen dadas por la
siguiente tabla.
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y
basndonos en la frmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 <
19 < N19
Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el
decimonoveno y el vigsimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta
el vigsimo octavo)
Con lo que Me = (5+6)/2 = 5,5 puntos.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:
Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando
alguno de ellos no est acotado.
Ejemplo
Para una muestra (8, 7, 6, 9, 4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un
rango de:
El rango se obtiene dividiendo el nmero mayor con el menor de los datos estadsticos
B.-Medio rango o Rango medio:
El medio rango o rango medio de un conjunto de valores numricos es la media del mayor y menor
valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En
consecuencia, el medio rango es:
Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor
Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:
C.-Varianza:
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:
Propiedades
La varianza es siempre positiva o 0:
[1
]
Si a los datos de la distribucin los multiplicamos una constante, la varianza queda multiplicada
por el cuadrado de esa constante.
Propiedad distributiva:
cov
D.-Desviacin tpica:
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar
ese problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar,
que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos
estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su
inicial de su nominacin en ingls.
Desviacin tpica muestral
-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]
x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.
-->stdev(x)
ans = 4.716311
-->
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego
con el comando stdev se hallar la desviacin tpica.
E.-Covarianza:
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn
relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido
calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra " ".
Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas
utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao
muestral (n pares de puntuaciones, n-1 en su forma insesgada).
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de
las dos expresiones siguientes:
Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor
valor Max= 8. El medio rango resolvindolo mediante la Correspondiente frmula sera:
Propiedades
Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est
muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin.
Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un
modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser
creciente.
Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un
modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es
decreciente.es
Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra.
Simtrica.- Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los
datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una
curva normal en forma de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o
tambin conocida como de Laplace (1749-1827).Tambin se dice que una distribucin es simtrica
cuando su media aritmtica, su mediana y su moda son iguales, en smbolos Md=Mo
Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la minora de los datos est en la
parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia
la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la
izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor
de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la
moda, en smbolos
MEDIDAS DE ASIMETRA:
Donde:
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
Nota:
El Coeficiente de Pearson vara entre -3 y 3
Si As < 0? la distribucin ser asimtrica negativa.
Si As = 0? la distribucin ser simtrica.
Si As > 0? la distribucin ser asimtrica positiva.
Nota:
La Medida de Bowley vara entre -1 y 1
Si As < 0? la distribucin ser asimtrica negativa.
Si As = 0? la distribucin ser simtrica.
Si As > 0? la distribucin ser asimtrica positiva.
Medida de Fisher
Donde:
= cada uno de los valores;
n = nmero de datos;
= media aritmtica;
f = frecuencia absoluta
= cubo de la desviacin estndar poblacional;
Xm = marca de clase
Nota:
Si As < 0 ?Indica que existe presencia de la minora de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativa
Si As = 0? la distribucin ser simtrica
Si As > 0? Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente
distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Calculando la media aritmtica se obtiene:
12
12
12
15
17
-166,375
-15,625
-15,625
12
0,125
12
0,125
12
0,125
15
42,875
17
166,375
Total
12
B.-CURTOSIS O APUNTAMIENTO:
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin
normal, es decir, mide cun puntiaguda es una distribucin.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la regin central de la
distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.
MEDIDAS DE CURTOSIS
Medida de Fisher
Donde:
= cada uno de los valores;
n = nmero de datos;
= media aritmtica;
= Cudruplo de la desviacin estndar poblacional;
f = frecuencia absoluta; xm = marca de clase
Nota:
Si a < 3 ? la distribucin es platictica
Si a = 3 ? la distribucin es normal o mesocrtica
Si a > 3 ? la distribucin es leptocrtica
Medida basada en Cuartiles y Percentiles
915,0625
39,0625
39,0625
12
0,0625
12
0,0625
12
0,0625
15
150,0625
17
915,0625
Total
2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
12 12 12 15 17