Professional Documents
Culture Documents
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Organización de la información
Presentación de datos
El título de la tabla: La tabla se explicará por si misma por tanto se debe dar
suficiente información en el título, es decir, el título debe ser conciso y completo puesto que
es una descripción del contenido. Para que un título sea completo, éste debe responder a
cuatro preguntas claves: ¿Qué? Qué se estudia, es decir, cuál es la población que se está
estudiando?; ¿Cómo?, es decir, ¿cómo se clasifican los datos en la tabla, o sea, de acuerdo a
qué características?; ¿Dónde?, es decir, a qué institución o lugar geográfico pertenecen los
datos?; ¿Cuándo?, es decir, el período de tiempo o fecha en la que se realizó la
investigación.
1
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Cuerpo de la tabla: son las casillas o celdas en donde se consignan los datos.
2. Distribuciones de frecuencias
¿Qué es una distribución de frecuencias?
Se dice también que una distribución de frecuencias es una primera forma de resumir la
información.
3. Representaciones gráficas
La mayoría son figuras geométricas que se utilizan para visualizar el comportamiento o la
tendencia de la variable (s) de estudio.
2
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
DISTRIBUCIÓN DE FRECUENCIAS
Decíamos que una distribución de frecuencias es la organización de los datos en intervalos de clase,
mutuamente excluyentes y colectivamente exhaustivos. Ejemplo. La tabla Nº 2.6
Para presentar las observaciones correspondientes a una variable discreta o continua en forma de
una distribución de frecuencias debemos proceder de la siguiente manera:
a) Determinar el rango o recorrido, éste se define como la distancia entre el dato máximo y
el dato mínimo. Se denota por R.
b) Determinar el número el número de intervalos a considerar. En principio, ni pocos ni
demasiados intervalos. Si hay demasiados intervalos el resumen no tiene grandes
ventajas respecto de los datos a procesar. Si se consideran pocos, se sintetiza demasiado
de manera que se pierde gran cantidad de información. Una regla que se usa para
determinar el número de intervalos a considerar, se conoce con el nombre de regla de
Sturges, que consiste en calcular k
k = 1 + 3.322log N
c) Se determina la amplitud del intervalo, para ello se divide el rango o recorrido entre k, y
de esa manera obtenemos la longitud de cada intervalo.
d) Se calculan los límites inferior y superior de cada intervalo de clase.
3
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Ejemplo:
Un investigador social desea determinar en la comunidad “X”, el número de horas semanales que
dedican los niños menores de 6 años de edad, a ver televisión. Una muestra de 25 años, arrojó los
siguientes resultados (en número de horas semanales).
10 19 25 19 26
16 19 27 27 25
23 22 17 12 20
15 21 23 26 14
18 25 23 24 21
4
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Representaciones Gráficas
2. Polígono de frecuencias
También es un gráfico que se utiliza para representar la distribución de frecuencias
absolutas o relativas simples. Consiste en un gráfico que se obtiene uniendo los puntos
hallados, mediante el par de valores de marca de clase y frecuencia correspondiente. Para
5
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
fines del gráfico se hace necesario incrementar un intervalo de clase en cada extremo, con
frecuencias cero.
3. Ojivas
Son gráficos que se utilizan para representar las frecuencias acumuladas absolutas o
relativas, y consiste en un gráfico lineal que nos permite observar la cantidad de elementos
que quedan por encima o por debajo de determinados valores.
Ejercicios:
6
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
2. Los siguientes datos corresponden al número de viajes que realizan por día, 80 personas
encuestadas, para ir y regresar de su centro de trabajo:
3 6 5 7 4 4 3 6 7 4 5 4 4
5 4 3 4 3 5 6 6 4 4 5 7 4
6 2 5 7 6 3 2 5 4 4 6 5 6
5 6 4 5 2 5 3 6 2 2 3 3 5
3 5 4 2 6 3 3 3 6 5 7 4 5
4 2 3 4 2 3 6 5 4 5 5 5 4
7
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
a) Construir una tabla de frecuencias
b) Analizar los datos agrupados.
Resumen de la Información
Las distribuciones de frecuencias y las tablas estadísticas son una primera forma de resumir la
información para hacer un análisis preliminar, pero no es suficiente. Se trata ahora de sustituir a
toda la serie de datos o distribución de frecuencias por unos pocos índices. Para elegir a esos índices
o parámetros debemos considerar tres aspectos básicos, y ellos son: la localización o ubicación,
dispersión o variación, y la forma, de la distribución
Población I Población II
µ1 µ2 X
Fig. Nº 1
8
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
σ1 σ2
µ1 µ2 X
Fig. Nº 2
Fig. Nº 3
9
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
A este conjunto de medidas de resumen se les conoce como medidas de tendencia central, porque
tienden a ubicarse en el centro de la distribución. Estas medidas son: la media aritmética, mediana,
moda, media geométrica y también podemos considerar a las medidas de posición conocidos con el
nombre de percentiles
Media aritmética
Es la medida de tendencia central más conocida y de mayor uso, comúnmente la llaman promedio
aritmético o simplemente promedio, pero todas las tendencia central son promedios. Se define como
la suma de todas las observaciones dividida entre el número de observaciones, es decir,
x
X i
Ejemplo 1
X =
X i
41.91
8.398 mg / g
n 5
10
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Ejemplo 2
Se dispone del tiempo de vida (en meses) de dos especies de pájaros en cautiverio:
Especie A
Xi (meses) : 34 36 37 39 40 41 42 43 59
Especie B
Xi (meses) : 35 36 39 41 39 43 45 44 46 45
Se observa que la especie A tiene menor esperanza de vida en cautiverio. No olvide que la media
aritmética tiene la misma unidad de medida como la tienen las observaciones individuales.
Observaciones
11
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
La Mediana
Cálculo de la mediana
Observaciones
12
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
La Moda
La moda o modo de un conjunto de observaciones se define como la observación que ocurre con
mayor frecuencia. Tal vez es mejor definir a la moda como una medición de mayor concentración.
En algunas distribuciones de frecuencia puede haber más de uno de esos puntos de mayor
concentración (moda), sin embargo esos puntos pueden no tener la misma frecuencia. Así por
ejemplo, una muestra consiste de los siguientes datos en mm.
4, 4, 5, 7,7, 8, 8, 9, 9, 9, 9, 10, 11, 12, 12, 12, 12, 12, 13, 13, 14.
La Media Geométrica
Es otra medida de tendencia central, no se usa tan a menudo como las anteriores. En general se usa
cuando los datos están medidos en una escala logarítmica. Se emplea en microbiología para calcular
títulos desilusión promedio y para promediar cantidades en forma de progresiones y tasas de
crecimiento.
La media geométrica cuyo símbolo que utilizaremos es X g se define como la raíz enésima del
producto de las observaciones positivas. En símbolos:
Xg = n ( x1 )( x2 ).......( xn )
13
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Las siguientes recomendaciones para elegir la medida de tendencia central más adecuada:
14
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Varianza
( xi X ) 2
s2 = n 1
15
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
y de la especie B es s B2 = 12.96 meses2. Con estos resultados deducimos que hay menor dispersión
en los datos del tiempo de vida correspondiente a la especie B comparada con la especie A, y por lo
tanto su media aritmética (tiempo medio de vida) será mejor representativa. Además, en la especie
A existe un valor atípico que es el dato 79 meses, es por eso que la varianza aumenta.
s s 2 (x i X )2
n 1
En el ejemplo del tiempo de vida en cautiverio de las dos especies, las correspondientes
desviaciones estándar son:
16
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Se define como la relación por cociente entre la desviación estándar y la media aritmética,
expresado en porcentaje, es decir:
s
C.V . 100%
x
Como, tanto s como x están expresadas en las mismas unidades de medida, el C.V. resulta un
indicador adimensional. Además expresa qué tanto por ciento es la desviación estándar de la media
aritmética.
Ejemplo 1
En un grupo de personas, el peso promedio fue de 145 libras con una desviación estándar de 7
libras; la estatura promedio fue 67 pulgadas con desviación estándar de 5 pulgadas. La pregunta es:
¿en cuál característica el grupo es más variable (heterogéneo)?. En este caso no podemos comparar
paso y estatura (características expresadas en diferentes unidades de medida). Para dar respuesta a
la pregunta calculamos el coeficiente de variación:
Peso Estatura
7 5
C.V. = 4.8% C.V. = 7.5%
145 67
17
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Ejemplo 2
Consideremos las siguientes muestras de los pesos de hombres de 25 años y de niños de 11 años
Peso (Kg)
Muestra Media Desviación
Aritmética Estándar
Hombres 66 4.5
Mujeres 36 4.5
Si observamos las desviaciones estándar, aparentemente los dos grupos tienen la misma dispersión
o variabilidad en peso, sin embargo:
4.5
C.VHombres = (100) 6.82%
66
4.5
C.VNiños = (100) 12.5%
36
Los pesos de los niños son relativamente más variables (heterogéneos) que los pesos de los adultos.
Cuartiles
La mediana de una distribución divide los datos en dos partes iguales.
18
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
También es posible dividir los datos en más de dos partes. Cuando se divide un conjunto ordenado
de datos en cuatro partes iguales, los puntos de división se conocen como cuartiles y los
representamos por Q1, Q2 y Q3
Recorrido Intercuartílico
RIQ Q3 Q1
Es la medida de dispersión que muy poco se usa porque no usa toda la información proporcionada
por la muestra para calcular su valor, por lo tanto puede inducir a error. Se define como la
diferencia entre el máximo y el mínimo valor de la distribución de datos.
R X max X min
Forma de la distribución
Una vez iniciado el análisis estadístico de sinterización de la información, para lo cual hemos
estudiado las medidas de posición y dispersión de la distribución de una variable, necesitamos
conocer más sobre el comportamiento de la misma. No podemos basar nuestras conclusiones
únicamente en expresiones que vengan dadas en términos de medidas de posición y dispersión. Si
bien intentamos globalizar el comportamiento del colectivo que sea objeto de nuestro estudio,
19
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
para lo cual las medidas de posición son nuestro mejor instrumento, no debemos proceder a una
intrepretación que implique un comportamiento de todos los elementos del colectivo
uniformemente constante e igual a la medida de posición en cuestión con un error dado por la
correspondiente medida de dispersión. Este error o disparidad se hace más ostensible al analizar
la representación gráfica de la distribución. Pues bien, las medidas de forma de una distribución
se basan en su representación grafica, sin llegar a realizar la misma.
Las medidas de asimetría tienen como finalidad el elaborar un indicador que permita establecer el
grado de simetría (o asimetría) que presenta una distribución, sin necesidad de llevar a cabo su
representación grafica.
Tomando la normal como referencia, diremos que una distribución puede ser mas apuntada que la
normal (es decir, leptocurtica) o menos apuntada (es decir, platicúrtica).
20
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
A continuación se definen las medidas de asimetría más comunes, entre las que destacan las
siguientes:
Coeficiente de asimetría de Fisher: Ahora se intenta buscar una medida que recoja la simetría o
asimetría de una distribución. Si la distribución es simétrica, el eje de simetría de su representación
grafica será una recta paralela al eje de ordenadas, que pasa por el punto cuya abscisa es la media
aritmética. Por ello, cuando la distribución es asimétrica, referiremos los valores de la distribución a
este promedio. Si una distribución es simétrica. existe el mismo numero de valores a la derecha que
a la izquierda de x , y por tanto el mismo número de desviaciones con signo positivo que con signo
negativo, siendo la suma de desviaciones positivas igual a la suma de las negativas. Podemos partir.
pues, de las desviaciones (xi- x ) elevadas a una potencia impar para no perder los signos de las
desviaciones.
Lo más sencillo sería tomar como medida de asimetría el promedio de estas desviaciones, elevadas
a la potencia impar más simple (que es tres), es decir, tomaríamos como medida de asimetría el
momento de orden tres centrado en la media. Pero, de hacer esto, esta medida vendría expresada en
las mismas unidades que las de la variable. pero elevadas al cubo, por lo que no es invariante ante
un cambio de escala. Para conseguir un indicador adimensional, debemos dividir la expresión
anterior por una cantidad que venga en sus mismas unidades de medida. Esta cantidad es el cubo de
la desviación típica, obteniéndose así el coeficiente de asimetría de R. A. Fisher, cuya expresión es:
k
1
m3 N
(x j x ) 3 ni
g1 i 1
3
1 k
3/ 2
N
i 1
( x j x ) ni
2
21
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Coeficiente de asimetría de Fisher estandarizado: Para N >150 el coeficiente de asimetría es
asintóticamente normal de media cero y varianza 6/N. Este hecho nos lleva a considerar el
coeficiente de asimetría estandarizado cuya expresión es:
g1
gs
6
N
Ap 3( x - Me)
22
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Una vez presentadas las medidas de asimetría, a continuación se definen las medidas de curtosis
más comunes, entre las que destacan las siguientes:
= m 4 / 4 - 3, su valor será cero para la distribución normal. Por ello, como coeficiente de
apuntamiento o curtosis se utiliza la expresión:
k
1
m4 N
(x j x ) 4 ni
g2 3 i 1
3
4 1 k
2
N
(x
i 1
j x ) 2 ni
g2
g ks
6
N
23
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Curso: Estadística con aplicaciones de Excel Prof: Willer David Chanduví Puicón
Valores extremos
24