You are on page 1of 35

LICEO NAVAL CAPITÁN DE CORBETA

MANUEL CLAVERO

ESTADÍSTICA
DESCRIPTIVA
Jose Gonzales Villanueva
Profesor de Matemática

clavero_matematica_gonzales@yahoo.es

www.mate-clavero.blogspot.com
¿Por qué hay que conocer la
Estadística y quiénes la utilizan?
• Está presente en todas las áreas del
saber humano. Lo utilizan médicos,
banqueros, deportistas, amas de
casa.
• Es una herramienta fundamental en
la investigación.
• Permite realizar una buena toma de
decisiones.
Definición
• La Estadística es una ciencia con base
matemática que utiliza instrumentos
para recoger datos, presentarlos,
ordenarlos y analizarlos para obtener
información útil que permita inferir
conclusiones y garantice una buena
toma de decisiones.
Subdivisión de la Estadística

ESTADÍSTICA

ESTADÍSTICA ESTADÍSTICA TEORÍA DE


DESCRIPTIVA INFERENCIA DECISIONES
Términos usados en
Estadística
Organización y Presentación
de datos
• Cuando se realiza la recopilación , se
obtiene una gran cantidad de datos.
•Clasificados
deben
DATOS •Ordenados
ser
•Presentados

en

Tablas •Comprensión
para
y •Descripción
facilitar
Gráficos •Análisis
Presentación de datos
no agrupados
• Ejemplo 1: Los sueldos mensuales de 60 empleados de la
empresa Metro de Ventanilla, son los siguientes

440 560 335 587 613 400 424 466 565 393

453 650 407 376 470 560 321 500 528 526

570 430 618 537 409 600 550 432 591 428

440 340 558 460 560 607 382 67 512 492

450 530 501 471 660 470 364 634 580 450

574 500 462 380 518 480 625 507 645 382

Datos no agrupados
Presentación de datos
agrupados
• Ejemplo 2: Número de alumnos de tercer grado de
secundaria matriculados el presente año 2008 en cada
sección
Nº de
Sección
alumnos
A 30
B 34
C 32
D 36
E 30
F 31
G 35
h 32

Datos agrupados en una


tabla sin intervalos
Presentación de datos
agrupados
• Ejemplo 3: Distribución de 150 habitantes de la unidad
vecinal Santa Rosa según estatura

Estatura (cm.) Frecuencia


[1,00 - 1,10> 13
[1,10 - 1,20> 15
[1,20 - 1,30> 15
[1,30 - 1,40> 14
[1,40 - 1,50> 18
[1,50 - 1,60> 16
[1,60 - 1,70> 15
[1,70 - 1,80> 15
[1,80 - 1,90> 14
[1,90 - 2,00> 15

Datos agrupados en una


tabla con intervalos
Construcción de una
distribución de frecuencias
1. Nos fijamos en el número de datos (n)

2. Buscamos el dato mínimo y máximo y


calculamos el rango (r)
r = máx. - mín.

3. Determinamos el número de intervalos (m)


m = 1 + 3,3 log(n)

4. Verificamos la amplitud del intervalo (c)


c = r/m
Construcción de una
distribución de frecuencias
• Ejemplo 4: La siguiente tabla muestra los gastos semanales de
80 trabajadores de una compañía agrupados en intervalos

Frecuencia
Frecuencia Frecuencia Frecuencia
Marca Frecuencia Frecuencia relativa
Intervalos absoluta relativa relativa
de clase absoluta relativa acumulada
acumulada acumulada porcentual
porcentual

[Li - Ls> xi fi Fi hi Hi hi x 100% Hi x 100%

[100 -200> 150 5 5 0.0625 0.0625 6.25 6.25

[200 - 300> 250 7 12 0.0875 0.15 8.75 15

[300 - 400> 350 28 40 0.35 0.5 35 50

[400 - 500> 450 17 57 0.2125 0.7125 21.25 71.25

[500 - 600> 550 18 75 0.225 0.9375 22.5 93.75

[700 - 800> 650 5 80 0.0625 1 6.25 100

Total 80 1 100
Gráficos Estadísticos
Histograma Polígono

Pastel Barras
Reducción de Datos
Medidas de
Resumen

De Posición De Dispersión De Deformación De Apuntamiento


o o o o
Tendencia Central Variabilidad Asimetría Kurtosis

Media Rango Simetría Platikúrtica

Mediana Varianza Asimetría Positiva Mesokúrtica

Moda Desviación Estándar Asimetría Negativa Leptokúrtica


¡¡¡ Ganaste un viaje !!!

Playa Bávaro Playa Tambor


Punta Cana Punta Arenas
República Dominicana Costa Rica
Gráfico de temperaturas
registradas el año 2008
40
35
Temperatura (ºC)

30
25
20
15
10
5
0
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

Playa Tambor Playa Bavaro

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

Playa Tambor 15 20 20 25 30 32 38 35 20 25 15 10
Playa Bavaro 20 24 22 30 25 30 35 35 33 30 22 15
Surge la pregunta

¿Qué playa es más calurosa?


Nº de personas que visitan mensualmente
el Parque de las Leyendas

Mes Nº de Mes Nº de
personas personas
Enero 154250 Julio 325415

Febrero 187234 Agosto 245615

Marzo 102435 Setiembre 254611

Abril 123543 Octubre 182568

Mayo 154757 Noviembre 142510

Junio 243518 Diciembre 132534


Medidas de Posición o
Tendencia Central
• Son valores numéricos en torno a los
cuales se agrupan los valores de una
variable estadística.
La Media (X)

es
el valor de la variable que indica
el promedio de todos los datos
trabajados

Se calcula

PARA DATOS PARA DATOS


NO AGRUPADOS AGRUPADOS

n n

∑X i
X + X + ... + Xn ∑Xf i i
X1 f1 + X2 f2 +...+ Xn fn
X= i =1
= 1 2 X= i =1
=
n n n n

Donde:
n : es el número de datos trabajados
X1,X2,…: En los Datos No Agrupados son los valores de la variable y en los
Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …
f : es la frecuencia absoluta.
Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Sean los puntajes obtenidos Dada la siguiente tabla de
en 5 exámenes de Aritmética: distribución de frecuencias,
15 ; 12 ; 13 ; 15 ; 20 calcular la media aritmética
Determinar la nota media
[Li - Ls> xi fi xi x fi

30 - 38 34 4 136
15 + 12 + 13 + 15 + 20 75
X= = = 15 38 - 46 42 6 252
5 5 46 - 54 50 3 150
54 - 62 58 3 174
62 - 70 66 4 264
70 - 78 74 5 370
25 1346

1346
X= = 53,84
25
La Mediana (Me)

es
el valor de la variable que divide
al total de observaciones en dos
partes de igual tamaño

Se calcula

PARA DATOS PARA DATOS


NO AGRUPADOS AGRUPADOS

n 
 − F
Ordenando de menor a mayor y eligiendo
el central. Si no hubiese un dato central,
Me = Li +   ×C
entonces será igual a la media de los dos 2
valores centrales f

Donde:
Li : es el límite inferior del intervalo mediano
n : es el número de datos trabajados
F : es la frecuencia absoluta acumulada del intervalo anterior al intervalo
mediano
f : es la frecuencia absoluta del intervalo mediano
C : es el tamaño de la amplitud del intervalo
Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Sean los puntajes obtenidos Dada la siguiente tabla de
en 5 exámenes de Aritmética: distribución de frecuencias,
15 ; 12 ; 13 ; 15 ; 20 calcular la mediana
Determinar la mediana [Li - Ls> xi fi Fi
30 - 38 34 4 4
Ordenar datos: 38 - 46 42 6 10
46 - 54 50 3 13

12 ; 13 ; 15 ; 15 ; 20 54 - 62 58 3 16
62 - 70 66 4 20
70 - 78 74 5 25
Me = 15 25

Datos

n/2= 12.5 f = 3

Li = 46 C = 8
F = 10 Me = 52.67
La Moda (Mo)

es
el dato que más se repite
o la mayor frecuencia de un
conjunto de datos

Se calcula

PARA DATOS PARA DATOS


NO AGRUPADOS AGRUPADOS

Se toma el dato que más se repite


 d1 
Si fuesen dos valores diferentes,
Mo = Li +   × C
 d1 + d2 
se habla de bimodal, de ser tres,
sería trimodal

Donde:
Li : es el límite inferior del intervalo modal
d1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato anterior.
d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato posterior.
C : es el tamaño de la amplitud del intervalo
Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Sean los puntajes obtenidos Dada la siguiente tabla de
en 5 exámenes de Aritmética: distribución de frecuencias,
15 ; 12 ; 13 ; 15 ; 20 calcular la mediana
Determinar la moda
[Li - Ls> xi fi
30 - 38 34 4
Conteo:
38 - 46 42 6
12  1 vez
46 - 54 50 3
13  1 vez 54 - 62 58 3
15  2 veces 62 - 70 66 4

20  1 vez 70 - 78 74 5
25

Mo = 15 Datos

fMo = 6 Li = 38

fi-1 = 4 d1 = 2

fi+1 = 3 d2 = 3

C= 8 Mo = 41.20
COMPARACIÓN DE MEDIA,
MEDIANA Y MODA
Media Mediana Moda
Toma en cuenta No toma en cuenta los Es la que más
todos los valores valores extremos fácilmente se
de la variable determina, puesto que
Es útil cuando la tabla de la podemos obtener
Es fácil de frecuencias no presenta por inspección
interpretar los valores del extremo
Ventajas inferior del 1er intervalo y Cuando la
del extremo superior del distribución es casi
ultimo intervalo simétrica se puede
utilizar:
Moda = 3Me- 2X

Se ve influenciada Requiere de un Pueden haber


por los valores ordenamiento previo de muchas modas o
Desventa
extremos datos que sería difícil sin ninguna
jas un ordenador
Ejemplo Demostrativo 1
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 141, 11, 14, 12, 10, 10, 12, 11, 14

Media Mediana Moda


24,7 12 12
Vemos que:
La media se ve afectada por el valor extremo 141.
Ejemplo Demostrativo 2
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 15, 11, 14, 13, 10, 20, 17

Media Mediana Moda


14 13,5 amodal
Vemos que:
Al no haber ningún valor que se repita, no hay
moda , por lo tanto el sistema es amodal
Posiciones relativas de la
Media, la Mediana y la Moda.
En casos en que la distribución de frecuencias es poco asimétrica se
cumple la siguiente relación empírica

Media – Moda = 3(media- mediana)

De acuerdo a la simetría o asimetría de la distribución de frecuencias


se cumple lo siguiente
Ejemplo
Ejemplo demostrativo 1
En un estudio sobre comprensión de lectura en
inglés hecho a 100 personas la menor nota fue de
40 puntos y la mayor, de 180. Para la distribución
de frecuencias se usaron siete intervalos de igual
longitud y las frecuencias de los intervalos fueron
respectivamente: 19, 20, 25, 15, 10, 6 y 5.

1.Construye la distribución de frecuencias con sus intervalos,


marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda
1. Distribución de frecuencias
Frecuencia
Frecuencia Frecuencia Frecuencia
Marca de Frecuencia Frecuencia relativa
7 Intervalos clase absoluta
absoluta
acumulada
relativa
relativa
acumulada
relativa
porcentual
acumulada
porcentual

Nº [Li - Ls> xi fi Fi hi Hi hi x 100% Hi x 100%

1 40 - 60 50 19 19 0.19 0.19 19.00 19

2 60 - 80 70 20 39 0.20 0.39 20.00 39

3 80 - 100 90 25 64 0.25 0.64 25.00 64

4 100 - 120 110 15 79 0.15 0.79 15.00 79

5 120 - 140 130 10 89 0.10 0.89 10.00 89

6 140 - 160 150 6 95 0.06 0.95 6.00 95

7 160 - 180 170 5 100 0.05 1.00 5.00 100

100 1.00 100.00


2. Medidas de tendencia central
Moda (Mo) Mediana (Me) Media (x)

Mo = 86.67 Me = 88.80 S/n= 93

Datos Datos xi x fi

fMo = 25 n/2= 50 950

fi-1 = 20 Li = 80 1400

fi+1 = 15 F= 39 2250

d1 = 5 f= 25 1650

d2 = 10 C= 20 1300

Li = 80 900

C= 20 850
9300
3. Histograma
Ahora tu
Los gastos semanales de 65 amas de casa oscilan
entre 60 y 300 soles. Agrupando los datos en 8
intervalos de igual amplitud se tienen las siguientes
frecuencias: 2, 3, 5, 7, 12, 15, 13, 8

1.Construye la distribución de frecuencias con sus intervalos,


marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda
Fábula
El águila y
las gallinas

You might also like