Professional Documents
Culture Documents
Y GRÁFICOS
Tablas
Estadística Gráficos
Medidas
descriptivas
Organización de datos
Cualitativos Tablas de
(Nominales, frecuencias
ordinales) simples
Tablas de
distribución de Tablas de
frecuencias Frecuencia
simples
Cuantitativos
Tablas por
intervalos
Elementos de una Tablas con datos
categóricos
Procedimiento:
1. Determinar el rango de los datos (R=dato mayor – dato
menor)
2. Determinar el número de clases
1. Se puede extraer la raíz cuadrada del número de datos
(este se aplica para un número de datos menor a 150
2. Utilizar el criterio propuesto por Ryan en 1982.
3. Obtener el tamaño del intervalo o amplitud de clase
Ti= Rango/Número de clases
4. Formar la tabla de frecuencias similar a las tablas de
frecuencias simples donde cada categoría, ahora es una
clase o intervalo.
Criterio de Ryan 1982 para el número
de clases en un conjunto de datos
8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
Procedimiento
1. Obtener el rango R=37-8=29
2. Determinar el número de intervalos Ni= 5 clases según el
criterio de Ryan
3. Tamaño del intervalo Ti=29/5=5.8≈6
4. La tabla quedaría como
Clases o Intervalos Frecuencia
8 - 13 2
8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
14 - 19 5
20 - 25 11
26 - 31 2
32 - 37 2
Total 22
Otros ejemplos
En el primer día de clases del semestre pasado se preguntó a 50
estudiantes acerca del tiempo requerido para desplazarse de su
casa a la universidad (redondeando a 5 minutos). Los datos
resultantes son los siguientes:
20 20 30 25 20 25 30 15 10 40
35 25 15 25 25 40 25 30 5 25
25 30 15 20 45 25 35 25 10 10
15 20 20 20 20 25 20 20 15 20
5 20 20 10 5 20 30 10 25 15
Tabla de frecuencia
Pareto
Histograma
Ojiva
Desarrollo
Cuantitativos
Cajas y bigotes
Puntos
Tallos y hojas
Elementos de un gráfico
Gráfico de Barras
FIG U R A 1 .3
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%
C
23.3%
Ventajas Desventajas
El gráfico se recomienda para datos de tipo nominal y ordinal Se uso esta restringido
Se puede utilizar para comparar dos grupos de datos a datos cualitativos
Fácil elaboración
65.0%
FIG U R A 1 .4
Gráfica de barras para el
ejemplo 1.3 250
Frecuencia 200
150
100
50
0
A B C D
Calificación
Gráfico de Barras: Elaboración
Procedimiento
Se parte de una tabla de frecuencias simples
Se traza una línea horizontal, se divide de acuerdo a las categorías de los datos
(clases), la amplitud de esta división es arbitraria, dado que no se tiene una escala
Se traza un rectángulo, que se represente la frecuencia para cada una de las
categorías.
Los rectángulos no deben compartir los límites
Al finalizar los rectángulos, se escribe la frecuencia
Gráfico de Barras: Ejemplo
C
23.3%
B
65.0%
Gráfico circular, pastel o sectores
Procedimiento
Se parte de una tabla de frecuencias relativas
Se calculan los grados que le corresponde a cada sector. Multiplicando la frecuencia relativa por
3600
Se puede colocar los grados en forma acumulada, para evitar errores en el trazo.
Se traza el radio vertical superior del círculo
A partir del radio vertical superior, se traza los ángulos, con base a los grados asignados para
cada sector, en sentido opuesto a las manecillas del reloj.
Divida la circunferencia en sectores, se debe colocar a cada uno, la información que representa;
así como, el porcentaje que ocupa.
Preferentemente, se ilumina con color diferente, cada categoría representada.
Gráfico circular: Ejemplo
Tabla 3.7: Tabla de frecuencias porcentuales
Calificación Frecuencia (fi) Frecuencia Frecuencia
relativa (fr) porcentual (f%)
A 4 4/25=0.16 0.16x100=16%
B 7 7/25=0.28 0.28x100=28%
C 9 9/25=0.36 0.36x100=36%
D 3 3/25=0.12 0.12x100=12%
F 2 2/25=0.08 0.08x100=8%
Total 25 1 100%
8% F
16% A
8% 16%
D
12% A 12%
B
C
28% D B
28%
F
36% C
36%
Gráfico de líneas
Ventajas Desventajas
Facilidad en su elaboración Se necesita invertir gran
Fácil interpretación cantidad de tiempo para
tener completa la gráfica
Incorpora el tiempo como parte fundamental de la gráfica
Fácilmente puede comparar resultados entre las categorías No es conveniente cuando se
Los datos pueden ser nominales tienen mas de 5 categorías
50
45
40
35
30 cadidato #1
25 candidato #2
20 candidato #3
ninguno de ellos
15
10
5
0
1a 2a 3a 4a 5a
Gráfico de líneas
Procedimiento
Se parte de una tabla que incorpore el tiempo.
Se traza una línea horizontal, en la que se graficará respecto al tiempo
Se traza una línea vertical, en donde se exprese la frecuencia porcentual
Se divide la línea del tiempo, de acuerdo al número de cortes que se generaron
Las frecuencias porcentuales, se grafican sobre la línea horizontal en forma
perpendicular respecto al tiempo.
Se unen los puntos de cada categoría
Gráfico de líneas: Ejemplo
10
8 Pedro
Título del eje
Andres
6
Maria
4 Jose
Diana
2
0
bim 1 bim 2 bim 3 bim 4 bim 5
Diagrama de Pareto
Ventajas Desventaja
Proporciona una jerarquía de las categorías Se necesitan más de 40 datos para
tener una buena gráfica
Permite claridad en el momento de tomar decisiones Los resultados están basados en una
buena categorización
Los datos pueden ser nominales
Diagrama de Pareto
Procedimiento
Selecciona las categorías del problema
Determina el periodo de tiempo para el estudio
Reúne la información, Frecuencia porcentual y frecuencia acumulada porcentual
Construye una gráfica de barras ordenando las barras por frecuencias de manera
descendente.
Traza dos líneas perpendiculares, del lado izquierdo se establecerá la frecuencia
porcentual y del lado derecho la frecuencia porcentual acumulada
Se grafican las frecuencias acumuladas, usando puntos en dirección de cada categoría
Se unen los puntos graficados mediante una línea.
Diagrama de Pareto: Ejemplo
Causas f% F%
F. Pobre recepción 20 73
C. La antena es débil 12 85
Fácil de elaborar
Gráfico de puntos
Elaboración
Se ubican los valores extremos, es decir, el dato máximo y dato mínimo
Se traza el eje de las abscisas, que contenga a los valores extremos
Cada valor de los datos, se ubica sobre el eje(x), colocando un punto
(puede ser cualquier otra figura, triángulo, cuadrado)
Si existe uno o más valores iguales, estos se colocan por encima
Gráfico de tallos y hojas
Ventajas Desventajas
La gráfica presenta el número total de datos que Se complica la elaboración con
la compone conjuntos de datos cuantitativos
Permite una organización de los datos continuos
Febrero 20 35
Ventas durante dos años
Marzo 15 25
90
Abril 25 35 80
70
Mayo 28 40 60
50
Junio 29 45 40
30
Julio 26 40 20
10
Agosto 23 35
0
Septiembre 17 32
Octubre 21 33
Vendidos en 1998 Vendidos en 1999
Noviembre 25 40
Diciembre 30 50
Pictogramas
Gráfico radiales
Gráficos de áreas
Representación de datos
Media
Medidas de
tendencia central Mediana
Moda
Varianza
Medidas de
variabilidad Desviación estándar
Coeficiente de variabilidad
Medidas numéricas
Deciles
Medidas de
posición Cuartiles
Percentiles
Asimetría
Medidas de forma
Curtósis
Medidas de Tendencia Central
Media Aritmética
La media es la medida central más conocida y
utilizada. Se dice que es el valor más representativo
de un conjunto de dato
n N n N
åx i åx i åfx i i åx f i i
x= i=1
m= i=1
x= i=1
m= i=1
n N n N
Media para datos no agrupados Media para datos agrupados
Medidas de Tendencia Central
Media Aritmética
Medidas de Tendencia Central
Mediana
La mediana (Me), es otra medida d tendencia central
que a diferencia de la media no se ve afectada por
valores extremos.
La mediana es el valor que divide el conjunto de
datos en dos partes iguales.
Me= Xn+1 Cuando n es impar
æn ö
2
ç - å 1÷
f
Xn + Xn Me= l inf + ç 2 ÷a
+1
Me= 2 2 Cuando n par ç fm ÷
2 è ø
n Número dedatos
DM =
å x -x
i
DM =
å x -xf
i i
n n
Medidas de Dispersión
Varianza
Media aritmética de las desviaciones de la media
elevadas al cuadrado.
n 2 n 2
å( x i -x ) å( x i -x ) fi
S2 = i=1
S2 = i=1
n n
N 2 N 2
å( x i - m) å( x i - m ) fi
s2 = i=1
s2 = i=1
N N
Medidas de Dispersión
Varianza
Medidas de Dispersión
Desviación estándar
Raíz cuadrada de la varianza.
n 2 n 2
å( x i -x ) å( x i -x ) fi
i=1 i=1
S= S=
n n
N 2 N 2
å( x i - m) å( x i - m ) fi
s = i=1
s = i=1
N N
Medidas de Dispersión
Coeficiente de Variación
El coeficiente de variación muestra la dispersión de forma
relativa, o en forma porcentual, y el resultado es
adimensional. Permite hacer la comparación entre dos
conjuntos de datos sin importar las unidades de medida
(escala de medición)
s s
CV = CV =
m x
s s
CV = x100 CV = x 100
m x
Medidas de posición (o de orden)
Cuartiles, Deciles y Percentiles
Para formalizar el proceso de cálculo, suponga que Lp
representa la ubicación de cierto percentil que se
busca. De esta manera, si quiere encontrar el
trigésimo tercer percentil, utilizaría L33, y si buscara la
mediana, el percentil 50o, entonces L50. El número de
observaciones es n; así que, si desea localizar la
mediana, su posición se encuentra en (n + 1)/2, o
podría escribir esta expresión como (n + 1)(P/100),
en la que P representa el percentil que busca
Medidas de posición (o de orden)
Cuartiles, Deciles y Percentiles
P
L p = ( n+1)
100
Medidas de posición (o de orden)
P
L p = ( n+1)
100
Medidas de Forma
El Sesgo (Asimetría)
En Estadística llamamos sesgo, al grado de asimetría
que presentan algunas distribuciones de frecuencia.
m3 x- Mo x- Me
sesgo = sesgo = sesgo =
s3 s s
å ( x - x)
3
m= 3
n
å ( x- x) f
3
m=
3
n
Medidas de Forma
Curtosis
La curtosis mide el grado de apuntalamiento que
presentan las distribuciones de frecuencia
comparándolas con la curva normal .
m4
k= 2
-3
(m2 )
å ( x - x) å ( x - x)
2 2
LEPTOCURTICA SI K>0
m= m=
2
n
2
n MESOCURTICA SI K=0
( x - x) å ( x - x) PLATICURTICA SI K<0
4
å
4
m =
4
m =
4
n n
Medidas de Forma
Curtosis
A) Leptocurtica
B) Mesocurtica
C) Platicurtica
Gráfico de caja y bigotes
El gráfico de caja permite identificar punto
candidatos a ser atípicos y la simetría de la
distribución. Para realizar la gráfica se deben
seguir los pasos siguientes:
a) Identificar los cuartiles Q1, Q2 y Q3, que sirven
para delimitar la caja en la gráfica.
b) La mediana se dibuja como una línea dentro de la
caja.
c) El eje inferior se dibuja para visualizar la
separación que hay entre Q1 y X(1).
Gráfico de caja y bigotes
d) El eje superior indica la separación entre Q3 y X(n).
e) Se calculan los valores adyacentes superior e
inferior, y la distancia intercuartílica(RI).
RI = Q3 - Q1 (distancia intercuartílica)
Se define como valor adyacente superior como
VAS=Q 3 +1.5RI
m = máx { xi ; xi £ VAS}
Se define como valor adyacente inferior como
VAI=Q1 -1.5RI
M = min { xi ; xi ³ VAI }
Gráfico de caja y bigotes
: Máximo
.
Q3+1.5RI
m
Q3
RI=Q3-Q1 R=Máximo-Mínimo
Mediana=Q2
= X(n)-X(1)
Q1
M
. Q1-1.5RI
.
. Mínimo
Gráfico de caja y bigotes
Análisis descriptivo Bivariado
Tablas de contingencia bidimensionales
Análisis descriptivo Bivariado
Tablas de contingencia bidimensionales
Tablas bidimensionales para dos
variables cualitativas
Tablas bidimensionales para una variable
cualitativa y una variable discreta
Tablas bidimensionales para variables
cuantitativas