You are on page 1of 87

DESCRIPCIÓN DE DATOS: TABLAS

Y GRÁFICOS

M.C. Lucio Díaz González


Introducción
Introducción
La interpretación de las investigaciones científicas en las
diversas disciplinas del quehacer humano depende en gran
parte de los métodos estadísticos. Así, la Estadística nos
proporciona métodos gráficos, numéricos y tabulares para
organizar y resumir datos, para luego usar dicha información
y sacar conclusiones.

Los primeros pasos del proceso son la organización y el


resumen de los datos. El resumen de los datos puede hacerse
tabular, numérica y gráficamente.
Organización de datos

Para organizar y resumir un conjunto de datos, la Estadística se


apoya en tres herramientas indispensables:

Tablas

Estadística Gráficos

Medidas
descriptivas
Organización de datos

Cualitativos Tablas de
(Nominales, frecuencias
ordinales) simples

Tablas de
distribución de Tablas de
frecuencias Frecuencia
simples
Cuantitativos
Tablas por
intervalos
Elementos de una Tablas con datos
categóricos

Los elementos que deben considerarse en una tabla o un gráfico


son:

1. Número de la tabla o cuadro


2. Titulo: Se describe mediante un nombre, los datos y la tabla.
Por ejemplo, Peso de estudiantes
3. Encabezamiento o conceptos: en la tabla debe presentar los
encabezados y nombre de las categorías, con sus
respectivas frecuencias.
4. Fuente: Descripción al pié de la tabla, indicando fecha y la
fuente de los datos.
Tablas con datos categóricos

Para construir un atabla de frecuencias para datos categóricos


tenemos que:
1. En la primera columna se colocan las categorías o clases
2. En la segunda columna se coloca la frecuencia de cada una
de las categorías (número de veces que aparece la
categoría).
Ejemplo de tablas de frecuencia para
datos categóricos

Construir la tabla de frecuencias, con los datos de la variable


“tipo de transporte que usan los estudiantes para trasladarse a
la escuela” , los datos son: A, E, F, D, B, F, E, F, C, E, F, F, E, F, C, B,
F, D, E, F, F, E, F, D, F, E, F, F, D, A, E, B, E, C, F, E, F, F, E, C, D, E, F, D,
C, E, F, F, D, B.
Clase o Categoría Frecuencia
A = Bicicleta 2
B = Carro propio 4
C = Taxi 5
D = Caminando 7
E = Autobús 13
F = Combi 19
Total 50
Ejemplo de tablas de frecuencia para
datos categóricos (ordinal)

Construir la tabla de frecuencias, con los datos de la variable


“tipo de transporte que usan los estudiantes para trasladarse a
la escuela” , los datos son: N, P, B, S, L, G, B, L, S, N, B, L, P, S, B, P,
B, S, B, S, B, L, B, L, S, L, G, B, P, S, B, L, B, L, S, B, L, S, L, B, B, L, B, L,
N, B, G, S, B, L .
Clase o Categoría Frecuencia (fi)
N = Ninguna 2
P = Primaria 5
S = Secundaria 10
B = Bachillerato 17
L = Licenciatura 13
G = Posgrado 3
Total 50
Tipos de Frecuencias
 Frecuencia absoluta: La frecuencia absoluta se
obtiene contando el número de veces que aparece
cada categoría.

Frecuencia absoluta( f ) = número total deaparececada categoría


Tipos de Frecuencias
 Frecuencia relativa: La frecuencia relativa se
obtiene dividiendo la frecuencia de clase o
frecuencia absoluta entre la suma total de todas las
frecuencias.
Frecuencia declase
Frecuencia relativa( fr ) =
suma detodaslas frecuencias
Otras frecuencias
 Frecuencia porcentual: La frecuencia porcentual se
obtiene multiplicando la frecuencia relativa por
100 y se agrega el símbolo de porciento.
Frecuencia porcentual( f% ) = (Frecuencia relativa ( fr ) x100)%
Tabla 3.7: Tabla de frecuencias porcentuales
Calificación Frecuencia (f) Frecuencia Frecuencia
relativa (fr) porcentual (f%)
A 4 4/25=0.16 0.16x100=16%
B 7 7/25=0.28 0.28x100=28%
C 9 9/25=0.36 0.36x100=36%
D 3 3/25=0.12 0.12x100=12%
F 2 2/25=0.08 0.08x100=8%
Total 25 1 100%
Otras frecuencias
 Frecuencias Acumuladas (F): La frecuencia
acumulada de una clase es la suma de las
frecuencias para esa clase y todas las clases
previas
Tabla de frecuencias para datos
numéricos

Cuando se tiene datos de este tipo, se pueden organizar y


presentar en una tabla de frecuencias simples , o en una tabla
de frecuencias con clases o intervalos.

La construcción de estas tablas de frecuencia, dependerá de la


cantidad de datos, del rango y del tipo de datos numéricos que
se tenga.

Generalmente se elaboran tablas de frecuencias simple, cuando


son datos numéricos discretos, y el rango es menor o igual a 12 y
cuando son datos continuos, se recomienda no excederse de 12
clases.
Tablas de frecuencia con intervalos de
clases

Procedimiento:
1. Determinar el rango de los datos (R=dato mayor – dato
menor)
2. Determinar el número de clases
1. Se puede extraer la raíz cuadrada del número de datos
(este se aplica para un número de datos menor a 150
2. Utilizar el criterio propuesto por Ryan en 1982.
3. Obtener el tamaño del intervalo o amplitud de clase
Ti= Rango/Número de clases
4. Formar la tabla de frecuencias similar a las tablas de
frecuencias simples donde cada categoría, ahora es una
clase o intervalo.
Criterio de Ryan 1982 para el número
de clases en un conjunto de datos

Número de datos No. de Clases


8 a 16 4
17 a 32 5
33 a 64 6
65 a 128 7
129 a 256 8
257 a 512 9
513 a 1024 10
Tablas de frecuencia con intervalos de
clases para datos discretos

Si el número de datos discretos son pocos valores distintos, se


utiliza una tabla de frecuencias simples.
Si el número de datos discretos con mucho valores distinto, se
emplea una tabla de frecuencia por intervalos.
Otros ejemplos
Se utilizó un contador Geiger electrónico para contar el número
de emisiones radiactivas en un periodo de 10 segundos. El
experimento fue repetido 22 veces, obteniéndose las cuentas
siguientes:

8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
Procedimiento
1. Obtener el rango R=37-8=29
2. Determinar el número de intervalos Ni= 5 clases según el
criterio de Ryan
3. Tamaño del intervalo Ti=29/5=5.8≈6
4. La tabla quedaría como
Clases o Intervalos Frecuencia
8 - 13 2
8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
14 - 19 5
20 - 25 11
26 - 31 2
32 - 37 2
Total 22
Otros ejemplos
En el primer día de clases del semestre pasado se preguntó a 50
estudiantes acerca del tiempo requerido para desplazarse de su
casa a la universidad (redondeando a 5 minutos). Los datos
resultantes son los siguientes:
20 20 30 25 20 25 30 15 10 40
35 25 15 25 25 40 25 30 5 25
25 30 15 20 45 25 35 25 10 10
15 20 20 20 20 25 20 20 15 20
5 20 20 10 5 20 30 10 25 15
Tabla de frecuencia

Valor o categoría Frecuencia


20 20 30 25 20 25 30 15 10 40 5 3
35 25 15 25 25 40 25 30 5 25 10 5
25 30 15 20 45 25 35 25 10 10
15 20 20 20 20 25 20 20 15 20 15 6
5 20 20 10 5 20 30 10 25 15 20 14
25 12
30 5
35 2
40 2
45 1
Consideraciones para construir una
tabla de frecuencias por intervalos
1. Cada clase debe tener la misma amplitud
2. Las clases se deben establecer sin traslape
3. Para la construcción se deben considerar entre 5 y
12 intervalos (pero no necesariamente)
4. Cuando la variable es continua los intervalos
deben abarcar todos los posibles valores.
Clasificación de las gráficas
Barras

Pastel o circular o sectores


Cualitativos (Nominales,
ordinales) Líneas

Pareto

Histograma

Gráficos Polígono de frecuencias

Ojiva

Desarrollo
Cuantitativos

Cajas y bigotes

Puntos

Tallos y hojas
Elementos de un gráfico

Los elementos que deben considerarse en un gráfico son:

1. Titulo: Se describe mediante un nombre, los datos y el tipo de


gráfica o la tabla. Por ejemplo, Peso de estudiantes
2. Contenido/Gráfico: si es gráfico debe presentar la escala de
valores para los datos, en el caso de una tabla se debe
colocar las categorías y sus respectivas frecuencias.
3. Fuente: Descripción al pié de la gráfica o tabla, indicando
fecha y la fuente de los datos.
presentación es irrelevante.

Gráfico de Barras
FIG U R A 1 .3
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%

C
23.3%

Ventajas Desventajas
El gráfico se recomienda para datos de tipo nominal y ordinal Se uso esta restringido
Se puede utilizar para comparar dos grupos de datos a datos cualitativos

Identifica los valores con mayor frecuencia


B

Fácil elaboración
65.0%

FIG U R A 1 .4
Gráfica de barras para el
ejemplo 1.3 250

Frecuencia 200

150

100

50

0
A B C D
Calificación
Gráfico de Barras: Elaboración
Procedimiento
Se parte de una tabla de frecuencias simples
Se traza una línea horizontal, se divide de acuerdo a las categorías de los datos
(clases), la amplitud de esta división es arbitraria, dado que no se tiene una escala
Se traza un rectángulo, que se represente la frecuencia para cada una de las
categorías.
Los rectángulos no deben compartir los límites
Al finalizar los rectángulos, se escribe la frecuencia
Gráfico de Barras: Ejemplo

Clase o Categoría Frecuencia


A = Bicicleta 2
B = Carro propio 4
C = Taxi 5
D = Caminando 7
E = Autobús 13 Gráfico tipo de transporte
20
F = Combi 19 18
16
Total 50 14
12
10
8
6 Frecuencia
4
2
0
TA B LA 1 .2 C á lc u lo s p a r a la g r á fi c a d e p a s t e l d e l e je m p lo 1

Gráfico circular, pastel o sectores Calificación


A
Frecuencia
35
Frecuencia relativa
35/400 .09
Porcentaje
9%
B 260 260/400 .65 65%
C 93 93/400 .23 23%
D 12 12/400 .03 3%
Ventajas Total Desventajas
400 1.00 100%

Se utiliza para graficar las frecuencias porcentuales


No es recomendable para muchas
El impacto visual de estas dos gráficas es un poco diferen
categorías
Permite visualizar el todo que es dividido
para en
mostrar las relaciones de las partes con respecto al
categorías usa para destacar la cantidad real o frecuencia para cada c
en este ejemplo son “calificaciones” ordenadas (A, B, C,
Fácil de interpretar Se tiene problemas en graficar, si la
dar las barras de la gráfica para cambiar su forma. En una
diferencia
presentación
entre las frecuencias de las
es irrelevante.
Puede ser utilizado para datos cuantitativos si están
categorías es pequeña
agrupados en tablas de frecuencias simples
FIG U R A 1 .3
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%

C
23.3%

B
65.0%
Gráfico circular, pastel o sectores
Procedimiento
Se parte de una tabla de frecuencias relativas
Se calculan los grados que le corresponde a cada sector. Multiplicando la frecuencia relativa por
3600
Se puede colocar los grados en forma acumulada, para evitar errores en el trazo.
Se traza el radio vertical superior del círculo
A partir del radio vertical superior, se traza los ángulos, con base a los grados asignados para
cada sector, en sentido opuesto a las manecillas del reloj.
Divida la circunferencia en sectores, se debe colocar a cada uno, la información que representa;
así como, el porcentaje que ocupa.
Preferentemente, se ilumina con color diferente, cada categoría representada.
Gráfico circular: Ejemplo
Tabla 3.7: Tabla de frecuencias porcentuales
Calificación Frecuencia (fi) Frecuencia Frecuencia
relativa (fr) porcentual (f%)
A 4 4/25=0.16 0.16x100=16%
B 7 7/25=0.28 0.28x100=28%
C 9 9/25=0.36 0.36x100=36%
D 3 3/25=0.12 0.12x100=12%
F 2 2/25=0.08 0.08x100=8%
Total 25 1 100%

Calificaciones de los alumnos Calificaciones de los alumnos

8% F
16% A
8% 16%
D
12% A 12%
B
C
28% D B
28%
F
36% C
36%
Gráfico de líneas
Ventajas Desventajas
Facilidad en su elaboración Se necesita invertir gran
Fácil interpretación cantidad de tiempo para
tener completa la gráfica
Incorpora el tiempo como parte fundamental de la gráfica
Fácilmente puede comparar resultados entre las categorías No es conveniente cuando se
Los datos pueden ser nominales tienen mas de 5 categorías
50
45
40
35
30 cadidato #1
25 candidato #2

20 candidato #3
ninguno de ellos
15
10
5
0
1a 2a 3a 4a 5a
Gráfico de líneas
Procedimiento
Se parte de una tabla que incorpore el tiempo.
Se traza una línea horizontal, en la que se graficará respecto al tiempo
Se traza una línea vertical, en donde se exprese la frecuencia porcentual
Se divide la línea del tiempo, de acuerdo al número de cortes que se generaron
Las frecuencias porcentuales, se grafican sobre la línea horizontal en forma
perpendicular respecto al tiempo.
Se unen los puntos de cada categoría
Gráfico de líneas: Ejemplo

Evaluaciones bim 1 bim 2 bim 3 bim 4 bim 5


Pedro 7 8 9 8 9
Andres 10 7 5 8 9
Maria 6 7 8 9 7
Jose 7 8 10 9 7
Diana 9 7 5 7 9

Evaluaciones por trimestre


12

10

8 Pedro
Título del eje

Andres
6
Maria
4 Jose
Diana
2

0
bim 1 bim 2 bim 3 bim 4 bim 5
Diagrama de Pareto
Ventajas Desventaja
Proporciona una jerarquía de las categorías Se necesitan más de 40 datos para
tener una buena gráfica
Permite claridad en el momento de tomar decisiones Los resultados están basados en una
buena categorización
Los datos pueden ser nominales
Diagrama de Pareto
Procedimiento
Selecciona las categorías del problema
Determina el periodo de tiempo para el estudio
Reúne la información, Frecuencia porcentual y frecuencia acumulada porcentual
Construye una gráfica de barras ordenando las barras por frecuencias de manera
descendente.
Traza dos líneas perpendiculares, del lado izquierdo se establecerá la frecuencia
porcentual y del lado derecho la frecuencia porcentual acumulada
Se grafican las frecuencias acumuladas, usando puntos en dirección de cada categoría
Se unen los puntos graficados mediante una línea.
Diagrama de Pareto: Ejemplo
Causas f% F%

D. Poco tiempo de duración de la batería 53 53

F. Pobre recepción 20 73

C. La antena es débil 12 85

E. Planta poco clara 7 92

A. Sonido de timbre débil 5 97

B. Poco espacio entre los números 3 100


Gráfico de pareto
110
100
90
80
70
60
50
40
30
20
10
0
D. Poco F. Pobre C. La antena E. Planta poco A. Sonido de B. Poco
tiempo de recepción es débil clara timbre débil espacio entre
duración de los números
la batería
Gráficos para datos cuantitativos
Gráfico de puntos
Ventajas Desventajas
Excelente para pocos datos continuos Se complica cuando tenemos más
Muestra la agrupación natural de los datos de 20 datos

Fácil de elaborar
Gráfico de puntos
Elaboración
Se ubican los valores extremos, es decir, el dato máximo y dato mínimo
Se traza el eje de las abscisas, que contenga a los valores extremos
Cada valor de los datos, se ubica sobre el eje(x), colocando un punto
(puede ser cualquier otra figura, triángulo, cuadrado)
Si existe uno o más valores iguales, estos se colocan por encima
Gráfico de tallos y hojas
Ventajas Desventajas
La gráfica presenta el número total de datos que Se complica la elaboración con
la compone conjuntos de datos cuantitativos
Permite una organización de los datos continuos

Excelente para pocos datos discretos


Gráfico de tallos y hojas
Elaboración
Se analiza el conjunto de datos y se determina que valores pueden ser los tallos. Los
dígitos a la izquierda de la cifra, son los candidatos ideales, ya que, en un conjunto de
datos, esos valores son repetitivos.
Se divide mediante una línea horizontal los tallos de las hojas, tallos lado izquierdo,
hojas lado derecho.
La hija será el último dígito de la cifra. Cada hoja corresponde a un tallo, de tal
manera que al unir el tallo con una de sus hojas, formen una cifra del conjunto de
datos.
Las hojas se escriben de izquierda a derecha en el renglón del tallo que le
corresponda.
Una vez que se tienen el gráfico con los tallos y hojas, se recomienda escribir la
frecuencia de hojas que corresponden a cada tallo, en una columna a la izquierda.
Para la presentación final, las hojas se ordenan de menor a mayor para cada tallo.
Histograma
Ventajas Desventajas
Es ideal cuando tenemos un gran número de datos Cuando la longitud de clase
cuantitativos no es la adecuada, el
Muestra si existe simetría en la gráfica histograma no aporta
información confiable.
Se puede observar, si los datos tienden a acumularse
alrededor de un valor o están separados
Permite observar, si existen valores aislados
Histograma
Elaboración
La elaboración de un histograma parte de una tabla de frecuencias por intervalos
Se divide el eje de las abscisas de acuerdo a los límites reales de clase
Se traza un rectángulo por cada clase o intervalo, con altura igual a la frecuencia
seleccionada.
Polígono de frecuencias
Elaboración
La elaboración de los polígonos parte de una tabla de frecuencias
Se traza sobre el eje de las abscisas, los puntos medios de cada intervalo de clase.
Se grafica un punto sobre el plano por cada clase, con coordenadas, punto medio de clase en el eje(x) y
frecuencia para el eje (y)
Se unen los puntos graficados mediante líneas.
Para cerrar el polígono, se unen los extremos de la gráfica, con un punto medio antes y un punto medio
después.
Se colocan los elementos, que proporcionen información suficiente, para la interpretación de los datos.
Gráfica de Ojiva
Ventajas
Permite visualizar información adicional de las tablas de frecuencia.
Identifica de manera gráfica los cuartiles y deciles de un conjunto de datos
Gráfica de Ojiva
Elaboración
La elaboración de la ojiva parte de una tabla de frecuencias acumuladas
Se trazan los limites reales, sobre el eje x
Se localiza el punto en el plano por cada clase, con coordenadas, limites real
de clase y la frecuencia acumulada (absoluta, relativa y porcentual) para el
eje (y).
Se unen los puntos graficados mediante líneas
El primer punto se une con el límite real inferior de la primer clase.
Gráfico de desarrollo
Ventajas Desventajas
Permite incorporar el tiempo como parte de la gráfica No es conveniente utilizarla, para
comparar más de 5 conjuntos de
Permite visualizar el comportamiento por unidad de tiempo
datos
Es fácil de elaborar
La interpretación es sencilla Se necesita la inversión de
tiempo, para tener completa la
Se conserva las unidades originales del conjunto de datos
gráfica
Permite comparar dos o mas conjuntos de datos. Las unidades
deben ser las mismas
Gráfico de desarrollo
Elaboración
Se traza una línea horizontal, en la que se graficará respecto al tiempo
Se traza una línea vertical, donde se exprese las unidades originales de los datos
Se divide la línea del tiempo, de acuerdo a las unidades de tiempo. Ejemplo año, mes o día
Las unidades de los datos, se grafican sobre la línea horizontal en forma perpendicular, para
cada unidad de tiempo
Se unen los puntos del conjunto de datos
Gráfico de desarrollo: ejemplo
Mes Vendidos Vendidos en
en 1998 1999
Enero 23 30

Febrero 20 35
Ventas durante dos años
Marzo 15 25
90

Abril 25 35 80
70
Mayo 28 40 60
50
Junio 29 45 40
30
Julio 26 40 20
10
Agosto 23 35
0

Septiembre 17 32

Octubre 21 33
Vendidos en 1998 Vendidos en 1999
Noviembre 25 40

Diciembre 30 50
Pictogramas
Gráfico radiales
Gráficos de áreas
Representación de datos
Media
Medidas de
tendencia central Mediana

Moda

Varianza
Medidas de
variabilidad Desviación estándar

Coeficiente de variabilidad

Medidas numéricas
Deciles
Medidas de
posición Cuartiles

Percentiles

Asimetría
Medidas de forma
Curtósis
Medidas de Tendencia Central

 Media Aritmética
La media es la medida central más conocida y
utilizada. Se dice que es el valor más representativo
de un conjunto de dato
n N n N

åx i åx i åfx i i åx f i i

x= i=1
m= i=1
x= i=1
m= i=1
n N n N
Media para datos no agrupados Media para datos agrupados
Medidas de Tendencia Central
 Media Aritmética
Medidas de Tendencia Central
 Mediana
La mediana (Me), es otra medida d tendencia central
que a diferencia de la media no se ve afectada por
valores extremos.
La mediana es el valor que divide el conjunto de
datos en dos partes iguales.
Me= Xn+1 Cuando n es impar
æn ö
2
ç - å 1÷
f
Xn + Xn Me= l inf + ç 2 ÷a
+1
Me= 2 2 Cuando n par ç fm ÷
2 è ø

Mediana para datos no agrupados Mediana para datos agrupados


Medidas de Tendencia Central
 Mediana para datos agrupados
Notación
l inf límitereal inferior dela clasemediana

n Número dedatos

åf 1 Suma de frefuenciasabsolutas, hasta una claseantesdela clasemediana

fm Frecuencia absoluta dela clasemediana

a Longitud declaseo anchura declase


Medidas de Tendencia Central
 Moda (Mo) es otra de las medidas de tendencia
central, ésta a diferencia de la media y la mediana
puede ser aplicada tanto a datos cualitativos como
cuantitativos.
Moda para datos no agrupados
 La moda de un conjunto de datos se define como el
valor que se repite con mayor frecuencia.

Moda para datos agrupados: Tablas de Frec. simples


 Si los datos son discretos y las clases corresponden a
cada valor del conjunto, la moda corresponde al valor
de la clase que contiene la mayor frecuencia.
Medidas de Tendencia Central
Moda para datos agrupados: Distribuciones de Frec.
con intervalos
 Si los datos se encuentran agrupados en
distribuciones por intervalos, la moda corresponde
al punto medio o marca de clase que contiene la
mayor frecuencia.
l inf Límiteinferior dela clasemod al
æ D1 ö D1 Exceso de frecuencia dela clasemodal, respecto a la clase anterior
Mo = l inf + ç ÷a
è D1 + D 2 ø D 2 Exceso de frecuencia dela clasemodal, respecto a la clase siguiente
a Amplitud declase
Medidas de Dispersión
 Rango
La medida más simple de dispersión es el Rango.
Representa la diferencia entre los valores máximo y
mínimo de un conjunto de datos.

R= valor máximo(xmax )- valor mínimo(xmin )


Medidas de Dispersión
 Desviación Media (DM)
Es la media aritmética de los valores absolutos de las
desviaciones con respecto a la media aritmética.

DM =
å x -x
i
DM =
å x -xf
i i

n n
Medidas de Dispersión
 Varianza
Media aritmética de las desviaciones de la media
elevadas al cuadrado.
n 2 n 2

å( x i -x ) å( x i -x ) fi
S2 = i=1
S2 = i=1
n n

N 2 N 2

å( x i - m) å( x i - m ) fi
s2 = i=1
s2 = i=1
N N
Medidas de Dispersión
 Varianza
Medidas de Dispersión
 Desviación estándar
Raíz cuadrada de la varianza.

n 2 n 2

å( x i -x ) å( x i -x ) fi
i=1 i=1
S= S=
n n

N 2 N 2

å( x i - m) å( x i - m ) fi
s = i=1
s = i=1
N N
Medidas de Dispersión
 Coeficiente de Variación
El coeficiente de variación muestra la dispersión de forma
relativa, o en forma porcentual, y el resultado es
adimensional. Permite hacer la comparación entre dos
conjuntos de datos sin importar las unidades de medida
(escala de medición)

s s
CV = CV =
m x

s s
CV = x100 CV = x 100
m x
Medidas de posición (o de orden)
 Cuartiles, Deciles y Percentiles
Para formalizar el proceso de cálculo, suponga que Lp
representa la ubicación de cierto percentil que se
busca. De esta manera, si quiere encontrar el
trigésimo tercer percentil, utilizaría L33, y si buscara la
mediana, el percentil 50o, entonces L50. El número de
observaciones es n; así que, si desea localizar la
mediana, su posición se encuentra en (n + 1)/2, o
podría escribir esta expresión como (n + 1)(P/100),
en la que P representa el percentil que busca
Medidas de posición (o de orden)
 Cuartiles, Deciles y Percentiles

P
L p = ( n+1)
100
Medidas de posición (o de orden)
P
L p = ( n+1)
100
Medidas de Forma
 El Sesgo (Asimetría)
En Estadística llamamos sesgo, al grado de asimetría
que presentan algunas distribuciones de frecuencia.
m3 x- Mo x- Me
sesgo = sesgo = sesgo =
s3 s s

å ( x - x)
3

m= 3
n

å ( x- x) f
3

m=
3
n
Medidas de Forma
 Curtosis
La curtosis mide el grado de apuntalamiento que
presentan las distribuciones de frecuencia
comparándolas con la curva normal .
m4
k= 2
-3
(m2 )

å ( x - x) å ( x - x)
2 2
LEPTOCURTICA SI K>0
m= m=
2
n
2
n MESOCURTICA SI K=0
( x - x) å ( x - x) PLATICURTICA SI K<0
4
å
4

m =
4
m =
4
n n
Medidas de Forma
 Curtosis
A) Leptocurtica
B) Mesocurtica
C) Platicurtica
Gráfico de caja y bigotes
 El gráfico de caja permite identificar punto
candidatos a ser atípicos y la simetría de la
distribución. Para realizar la gráfica se deben
seguir los pasos siguientes:
a) Identificar los cuartiles Q1, Q2 y Q3, que sirven
para delimitar la caja en la gráfica.
b) La mediana se dibuja como una línea dentro de la
caja.
c) El eje inferior se dibuja para visualizar la
separación que hay entre Q1 y X(1).
Gráfico de caja y bigotes
d) El eje superior indica la separación entre Q3 y X(n).
e) Se calculan los valores adyacentes superior e
inferior, y la distancia intercuartílica(RI).
RI = Q3 - Q1 (distancia intercuartílica)
Se define como valor adyacente superior como
VAS=Q 3 +1.5RI
m = máx { xi ; xi £ VAS}
Se define como valor adyacente inferior como
VAI=Q1 -1.5RI
M = min { xi ; xi ³ VAI }
Gráfico de caja y bigotes
: Máximo
.
Q3+1.5RI
m

Q3

RI=Q3-Q1 R=Máximo-Mínimo
Mediana=Q2
= X(n)-X(1)
Q1

M
. Q1-1.5RI
.
. Mínimo
Gráfico de caja y bigotes
Análisis descriptivo Bivariado
Tablas de contingencia bidimensionales
Análisis descriptivo Bivariado
Tablas de contingencia bidimensionales
Tablas bidimensionales para dos
variables cualitativas
Tablas bidimensionales para una variable
cualitativa y una variable discreta
Tablas bidimensionales para variables
cuantitativas

Cuando se desea construir la tabla de frecuencias para


dos variables de naturaleza cuantitativa, se hace
necesario de acuerdo con el interés del investigador
plantear previamente los intervalos de clase. Se
representan con Ai y Bj los correspondientes intervalos
y la estructura de las frecuencias absolutas y relativas
conjuntas son similares a la ya presentada para el caso
de dos variables cualitativas.
Tablas bidimensionales para variables
cuantitativas

(<102 ptos.) (>=102 ptos.)


Representaciones gráficas de datos tabulados
en tablas de contingencia bidimensionales
(dos variables cualitativas)
Representaciones gráficas de datos tabulados
en tablas de contingencia bidimensionales
(dos variables cualitativas)
Una variable cualitativa y una variable
cuantitativa discreta
Una variable cualitativa y una variable
cuantitativa discreta
Dos variables cuantitativas
categorizadas
Dos variables cuantitativas
categorizadas

You might also like