You are on page 1of 47

PROBABILIDAD Y

ESTADISTICA

GRAFICOS
ESTADISTICOS
Gilberth Pesantes Caldern
Definicin de Grfico Estadstico
En estadstica denominamos grficos a aquellas imgenes que, combinando la
utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un
sistema De referencia (coordenadas), permiten presentar informacin cuantitativa.

El grfico es la representacin de la
informacin estadstica, con el fin de
obtener una impresin visual global
del material presentado, que facilite
su rpida comprensin.

La utilidad De los grficos es doble,


ya que pueden servir no slo como
sustituto a las tablas, sino que
tambin constituyen el medio ms
efectivo no slo para describir y
resumir la informacin, sino tambin
para analizarla.
Partes de un Grfico
Al igual que las tablas estadsticas, los grficos estadsticos deben tener un
ttulo y una explicacin de QUE, DONDE y CUANDO se obtuvo la
informacin.

PARTES DE UN GRFICO

El ttulo principal
Ttulo secundario o subttulo
El grfico propiamente dicho
Fuente
Las notas explicativas
Interpretacin

Fuente: Enaho 2002-IV trimestre.


Elaboracin: Centro de Investigacin de Enaho
Clases de Grficos

Barras

Pictogramas Circular

Bidimensionales Grficos Lneas

Ojivas Histogramas

Polgono de frecuencias
Clases de Grficos
Barras Llamado tambin grfico de columnas
Es un tipo de grfico estadstico que se utiliza
Circular para variables cualitativas y discretas.
En el eje X se sitan:
Lneas Las modalidades de la variable cualitativa.
Los valores de la variable cualitativa discreta.
Histogramas
y sobre ellos se levantan barras cuya altura sea
Polgono de frecuencias proporcional a sus frecuencias.

Ojivas
Bidimensionales

Pictogramas
Clases de Grficos
Barras
Circular Llamado tambin grfico de sectores
Es un grfico empleado fundamentalmente para
Lneas variables cualitativas. Las modalidades se
representan en un crculo dividido en sectores.
Histogramas
La amplitud de cada sector, en grados, se
Polgono de frecuencias obtiene multiplicando la frecuencia relativa de
cada modalidad o valor por 360.
Ojivas
Bidimensionales

Pictogramas
Clases de Grficos
Barras
Circular
Lneas Muy utilizado en series temporales
Normalmente usados para estudiar la evolucin
Histogramas de uno o varios fenmenos a lo largo del tiempo.
Esta ltima variable (t) se representa en el eje
Polgono de frecuencias horizontal, mientras que los datos estudiados se
miden con referencia al eje vertical.
Ojivas
Bidimensionales

Pictogramas
Clases de Grficos
Barras
Circular
Lneas

Histogramas Llamado tambin rectngulos apilados


Se utiliza con variables continuas, o agrupadas
Polgono de frecuencias en intervalos, representando en el eje X los
intervalos de clase y levantando rectngulos de
Ojivas base la longitud de los distintos intervalos y de
altura tal que el rea sea proporcional a las
Bidimensionales
frecuencias representadas.
Pictogramas
Clases de Grficos
Barras
Circular
Lneas

Histogramas

Polgono de frecuencias Se construye sobre un histograma


Es una lnea poligonal que une los vrtices
Ojivas superiores de las barras de un diagrama de
barras, o los puntos medios de las bases
Bidimensionales superiores de los rectngulos de un histograma.
Pictogramas
Clases de Grficos
Barras
Circular
Lneas

Histogramas

Polgono de frecuencias
Llamado tambin polgono de frecuencias acumuladas
Ojivas
Una ojiva es la representacin de las
Bidimensionales frecuencias acumuladas de un conjunto de
datos cuantitativos. Se puede hacer tanto con
Pictogramas los datos agrupados en intervalos o con los
datos sin agrupar.
Clases de Grficos
Distribucin de los hogares en el rea urbana segn su

Barras
percepcin del nivel de vida de los hogares de su
localidad y nivel de pobreza

Circular 70.0%
66.0% 65.2% 68.3%

60.0%

Lneas 50.0%
40.0%
Mejor
29.5% 29.1% Est igual
30.0%
25.4%
Empeor
Histogramas 20.0%
4.6% 5.6% 6.2%
10.0%

Polgono de frecuencias
0.0%
Pobre Pobre no No pobre
extremo extremo

Ojivas
Bidimensionales Aplicado para Tablas de doble entrada
Permiten representar las series de datos en dos
Pictogramas dimensiones o sea los valores se representan
alineados en dos ejes perpendiculares: el eje
horizontal X y el eje vertical Y. Son
aplicaciones estadsticas al estudio en conjunto
de dos variables cualitativas
Clases de Grficos
Barras
Circular
Lneas

Histogramas

Polgono de frecuencias

Ojivas
Bidimensionales

Pictogramas Son grficos similares a los grficos de barras


Son grficos con dibujos alusivos al carcter
que se est estudiando y cuyo tamao es
proporcional a la frecuencia que representan
dicha frecuencia se suele representar. Se usan
para lograr el inters masivo del pblico.
Pirmides de Poblacin

Cuando se realizan representaciones


correspondientes a edades de
poblacin, cambiamos el eje Y por el
eje X para obtener las llamadas
pirmides de poblacin , que no son
ms que 2 histogramas a izquierda y
derecha, para hombres y mujeres.

La pirmide de poblacin nos permite


estudiar la estructura demogrfica de la
poblacin en un momento concreto. Cada
barra representa a los distintos grupos de
poblacin y nos indica la frecuencia con
que podemos encontrar personas de esas
caractersticas concretas.
Cartogramas
Son grficos realizados sobre mapas, en los que aparecen indicados sobre las
distintas zonas cantidades o colores de acuerdo con el carcter que representan.
Diagrama de Tallos y Hojas
Ventajas:
Es ms fcil de construir a mano.
Facilita el ordenamiento de los datos.
Permite ver la distribucin de los datos dentro de cada intervalo como patrones
dentro de los datos.

El diagrama de tallos y hojas es otra forma de representacin visual de una serie de


valores, conformados por lo menos de dos dgitos.
Para su construccin los nmeros se dividen en dos partes, una llamada de tallo,
formada por uno o ms dgitos principales y la otra la hoja, que contiene el resto de
los dgitos.
Ejemplo: Trace un diagrama de tallo y hoja para los siguientes datos.
70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72
GRAFICO DE CAJAS Y BIGOTES
(BOXPLOT)

GRFICOS DE
CONTROL DE CALIDAD
DIAGRAMA DE CAUSA Y EFECTO

DIAGRAMA DE PARETO
PROBABILIDAD Y
ESTADISTICA

MEDIDAS DE TENDENCIA
CENTRAL Y DE POSICION

Gilberth Pesantes Caldern


Qu son medidas de tendencia central?
Se denominan tambin medidas de
centralizacin, son aquellos valores
numricos en torno a los cuales se agrupan,
en mayor medida, los valores de una
variable e indican el centro de la
distribucin de los datos. Es el valor
representativo de estos.
Al estudiar la informacin estadstica de los
histogramas y polgonos de frecuencias, se
puso en evidencia que:

Algunos de estos valores son mas comunes que otros, adems se observ una clara
agrupacin de los valores mas frecuentes, haciendo que las curvas representativas
adquieran formas de campana.
Por lo general, la mayor frecuencia esta en al parte central de las grficas, de aqu que
deriva el nombre de medidas de tendencia central.
Tipos de Medidas de Centralizacin

1 Media Aritmtica

2 Moda

3 Mediana

4 Cuartiles

5 Deciles y Percentiles
1. Media Aritmtica para datos no
agrupados
Se define como el centro de gravedad de la distribucin estadstica de una variable.
Esla medida de posicin mas utilizada debido a que en forma emprica la hemos
utilizado cuando determinamos el promedio aritmtico de calificaciones semestrales;
tambin se le conoce con el nombre de valor medio.
Nos sirve para determinar el promedio matemtico de un conjunto de datos, y posee
como caractersticas la unicidad, facilidad de clculo y la influencia negativa que
ejercen los valores extremos en su determinacin. Su formula de clculo es:


i 1
Xi
X1 X 2 ........... X n
X
n n
1.1.Observaciones sobre
la Media Aritmtica

La media se puede hallar slo para variables cuantitativas.


La media es independiente de las amplitudes de los intervalos.
La media es muy sensible a las puntuaciones extremas.

La media no se puede calcular si hay un intervalo o clase abierto (con una


amplitud indeterminada)
La media es un estadstico suficiente porque usa toda la informacin de la
muestra.
2. LA MODA PARA DATOS NO
AGRUPADOS
Es una medida de tendencia central que es poco usada porque puede no existir y muy a
menudo puede no ser un valor nico. La moda se define como el valor que ocurre con
mayor frecuencia en un conjunto de datos, si existe un solo valor mximo decimos que es
unimodal, si tiene dos o mas valores con la misma frecuencia mxima decimos que el
conjunto es bimodal, trimodal, etc. Se representa por las letras Mo.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


2.1.Observaciones sobre la moda

La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de


intervalos, y relativa).
La moda tiene la ventaja de no ser afectada por valores extremos.
Al igual que la mediana, puede ser calculada en distribuciones con intervalos
abiertos.

En muchas series de datos no hay moda porque ningn valor aparece ms de una
vez.
No es un estadstico aceptable porque puede variar ampliamente de una muestra a
otra.
3. MEDIANA PARA DATOS NO
AGRUPADOS
Se define como el valor de la variable que divide la distribucin en dos partes
iguales. Es decir, el 50% de los datos es menor o igual a l y el restante 50% es
mayor o igual a l. Se denota Me
3. Calculo de la Mediana
para datos no agrupados

La mediana (Me) de un conjunto de datos x1,x2,,xn, es el valor xi que se encuentra en


el punto medio o centro, cuando se ordenan los valores de menor a mayor. Es el valor que
divide al conjunto ordenado de datos, en dos subconjuntos con la misma cantidad de
elementos.

Paso 1.- Ordenar de menor a mayor los valores xi del conjunto de datos
individuales, i = 1,2,,n
Paso 2.- Identificar si n es impar o par
3.2.Observaciones sobre la Mediana

Se puede utilizar para datos cualitativos ordinales y para datos cuantitativos


La mediana no est influenciada por los valores extremos ya que su
determinacin se apoya en los valores centrales de la variable

Se puede utilizar cuando la distribucin de frecuencias tiene clases abiertas, a


menos que la mediana caiga en una de las clases abiertas
No es un estadstico suficiente ya que no aprovecha toda la informacin de la
muestra, pero es un parmetro bueno para representar el valor tpico de una
poblacin.
COMPARACIN ENTRE LA MEDIA
MEDIANA Y LA MODA
Las distribuciones simtricas tienen el mismo valor para la media, la mediana y la
moda.
En una distribucin con sesgo positivo, la moda se halla en el punto ms alto de la
distribucin, la mediana est hacia la derecha de la moda y la media ms a la
derecha. Es decir Mo < Me < x
En una distribucin con sesgo negativo, la moda es el punto ms alto, la mediana
est a la izquierda de la moda y la media est a la izquierda de la mediana. Es
decir, x < Me < Mo

Cuando la poblacin tiene una distribucin sesgada, con frecuencia la mediana


resulta ser la mejor medida de posicin, debido a que est siempre entre la media
y la moda. La mediana no se ve altamente influida por la frecuencia de aparicin
de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de
valores extremos como la media.
4. Media Aritmtica para datos agrupados

Se utilizar cuando los datos estn distribuidos en una tabla de frecuencias.


Luego se calcula la media aritmtica aplicando la formula:

n Donde:

n y i i
ni = frecuencia absoluta

x i 1 yi = Marca de clase
n n = nmero de observaciones
5. Moda para datos agrupados

Cuando se trabajan con tablas de frecuencias de intervalos, la formula para


calcular la moda es:
1
M o LI c j
2 1
Donde:
LI : Lmite inferior de la clase modal
cj: Amplitud del intervalo de la clase modal
n : nmero total de observaciones o datos
1= nj nj-1 y 2= nj nj+1
nj-1: Frecuencia absoluta anterior a la clase modal.
nj+1: Frecuencia absoluta posterior a la clase modal.
6. Mediana para datos agrupados
Cuando se trabajan con tablas de frecuencias de intervalos, la formula para
calcular la mediana es:
n
2 N j 1
Me LI c j
N
j N j 1

Donde:
LI : Lmite inferior de la clase mediana
cj: Amplitud del intervalo de la clase mediana
n : nmero total de observaciones o datos
Nj : Frecuencia acumulada de la clase mediana
Nj-1:Frecuencia acumulada anterior de la clase mediana.
6. Mediana para datos agrupados
Cuando se trabajan con tablas de frecuencias de intervalos, la formula para
calcular la mediana es:

n
2 N j 1
Me LI c j
N
j N j 1

Donde:
LI : Lmite inferior de la clase mediana
cj: Amplitud del intervalo de la clase mediana
n : nmero total de observaciones o datos
Nj : Frecuencia acumulada de la clase mediana
Nj-1:Frecuencia acumulada anterior de la clase mediana.
7. Cuartiles
Son estadgrafos que dividen a una distribucin de frecuencias en cuatro
porciones iguales o intervalos. Se representan por Q1 Q2 Q3.

nk
4 N j 1
Qk LI c j k 1, 2, 3
N
j N j 1

Donde:

LI : Lmite inferior de la clase cuartil


cJ : Amplitud del intervalo de la clase cuartil
n : nmero total de observaciones o datos
N j : Frecuencia acumulada de la clase cuartil
N j 1 :Frecuencia acumulada anterior de la clase cuartil
k : k-simo cuartil
8. Deciles
Son 9 nmeros que dividen a los datos en 10 pares iguales, cada uno con el 10% de los
datos

nk
10 N j 1
Dk LI c j k 1, 2, 3, ...9

N
j N j 1

Donde:
LI : Lmite inferior de la clase decil
cJ : Amplitud del intervalo de la clase decil
n : nmero total de observaciones o datos
N j : Frecuencia acumulada de la clase decil
N j 1 :Frecuencia acumulada anterior de la clase decil
k : k-simo decil
9. Percentiles
Son 99 nmeros que dividen a los datos en 100 partes iguales, cada uno con el
1% de los datos

nk
100 N j 1
Pk LI c j k 1, 2, 3, ...99
N
j N j 1

Donde:
LI : Lmite inferior de la clase percentil
cJ : Amplitud del intervalo de la clase percentil
n : nmero total de observaciones o datos
N j : Frecuencia acumulada de la clase percentil
N j 1 :Frecuencia acumulada anterior de la clase percentil
k : k-simo percentil
PROBABILIDAD Y
ESTADISTICA

MEDIDAS DE
DISPERSION

Gilberth Pesantes Caldern


CONCEPTO

Las medidas de dispersin miden el grado de cercana o lejana de las


puntuaciones respecto a la media
Permiten describir el grado de homogeneidad / heterogeneidad de la
distribucin de una variable.
La idea de dispersin se relaciona con la mayor o menor concentracin de los
datos en torno a un valor central.
Ejemplo
Al tomar las temperaturas en una regin A durante A B
diferentes pocas del ao y a distintas horas del da, se
registraron los datos que se muestran en la columna A ; 19.3 -3
por su parte, las de otra regin diferente B, son las de la 20 0
columna B . 20.2 6
Al obtener la media, en ambos casos result que la
temperatura promedio fue de 20.68, cuya interpretacin 20.4 22
podra ser que en torno, alrededor o cerca a 20.68 fluctan 21 31.5
los dems valores. 21.3 34
Como puede verse, eso es bastante aproximado para los
21.3 36
datos de la columna A, no as para los de la B. Los
datos ms alejados en A son 19.3 y 22, que realmente 22 39
estn prximos a 20.68; en cambio, los datos ms alejados
Promedio: 20.69 20.69
en B son -3 y 39, que estn muy distantes del promedio.

Por qu si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los
valores que estn a su alrededor?.
La respuesta est en que no se ha tomado en cuenta la dispersin, es decir, la manera en que
se disgregan los datos respecto de la media, pues en A casi no se dispersan mientras que
en B s, .Cabra decir que el conjunto de datos A es bastante compacto mientras que el
B es muy dilatado.
PRINCIPALES MEDIDAS DE DISPERSIN

Distinguimos entre medidas


de dispersin absolutas, que
no son comparables entre
diferentes muestras y las
relativas que nos permitirn
comparar varias muestras. Medidas de Dispersin absolutas
Las mas comunes son: 1. El Rango
2. La Varianza
3. La Desviacin Estndar

Medidas de Dispersin Relativas


4. El Coeficiente de Variacin.
1. RANGO O RECORRIDO
El rango es la diferencia entre los datos mayor y menor del conjunto. Tambin se le
suele llamar recorrido . En un conjunto de datos, mientras mayor sea el rango,
mayor ser su dispersin y, a la inversa, mientras menor sea su rango, menor su
dispersin.. Su frmula es:

R X max X min

Ejemplo1: para una serie de datos de carcter cuantitativo como es la estatura tal y
como:
x1 = 185, x2 = 165, x3 = 170, x4 = 182, x5 = 155

De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo
que es lo mismo: R = 185-155 = 30.
2. Varianza para datos no agrupados
La Varianza es un valor numrico que cuantifica el grado de dispersin de los valores
de una variable respecto a su media aritmtica.

Xi X
N


2
i 1
X i nX
2

Varianza s 2

n1 n1

La varianza es el promedio de los cuadrados de los desvos respecto a la media


aritmtica
3. Desviacin Estndar para datos no agrupados
Es la medida de dispersin ms utilizada. En su clculo intervienen todas las
observaciones. Se lo define como la raz cuadrada de la Varianza.

Desviacin Estndar

xi x
n

s i 1
i
x 2
nx 2

n1 n1
Ejemplo
Desviaciones Estandar para Nios y Adultos en
Equipos de Basketball
4. VARIANZA Y DESVIACIN ESTNDAR PARA
DATOS AGRUPADOS
Se utilizan cuando los datos estn agrupados en una tabla de distribucin de
frecuencias. Su formulas de clculo son:

VARIANZA

m m

ni xi x i i
2
n x 2
nx 2

Varianza s 2 i 1
i 1
n1 n1

Desv.estandar s s 2
Observaciones
Dadas dos poblaciones existe mayor dispersin en aquella que posee
mayor varianza que equivales a mayor desvo estndar.
Se interpreta que menor dispersin implica mayor concentracin de los
datos alrededor de la media aritmtica, obteniendo o logrando mayor
precisin en el tratamiento de la informacin.
Teniendo en cuenta las observaciones anteriores en los procedimientos y
mtodos estadsticos se buscar minimizar varianzas.

(Xi u)2
(Xi u)2

(Xi u)2
X (Xi u)2

(Xi u)2
5. COEFICIENTE DE VARIACIN
Mide la dispersin en los datos con relacin a la media .Es ms til cuando se trata de
hacer comparaciones entre muestras. No tiene unidades de medida.
Siempre se expresa en porcentajes, no en trminos de la unidad de medida de los datos
estudiados
S
C.V .% 100
Muestral x

Poblacional
C.V .% 100

OBSERVACIN:
1. Al realizar comparaciones entre dos variables, el C.V. mas pequeo ser el que tenga menor
dispersin relativa.
2. Un C.V. mayor a 0.3 30% indica un alto grado de dispersin y pequea representatividad de
la media, pero cuanto menor sea a 30% la media ser mas representativa.
No camines delante de m por que no puedo seguirte; no camines detrs de m por
que no puedo guiarte; camina junto a m y simplemente se mi amigo

You might also like