You are on page 1of 69

ELEMENTOS DE

ESTADSTICA DESCRIPTIVA

Introduccin

La Estadstica es una

ciencia que facilita la


solucin de problemas en
los cuales necesitamos
conocer caractersticas
sobre el comportamiento
de algn suceso o evento.
Nos permite inferir el
comportamiento de
sucesos iguales o
similares sin necesidad
de que estos ocurran

Esto nos da la posibilidad

de tomar decisiones
acertadas y a tiempo, as
como realizar proyecciones
del comportamiento del
suceso.

Slo se realizan los clculos


y el anlisis con los datos
obtenidos de una muestra
de la poblacin y no con
toda la poblacin.

Actualmente el INEGI es el encargado de


concentrar y publicar la informacin
estadstica del pas

Conceptos bsicos
Estadstica:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para despus
obtener conclusiones. Se divide en
Estadstica Descriptiva y Estadstica Inferencial.

Estadstica descriptiva:
Se encarga de la
recoleccin, organizacin,
presentacin y anlisis de
los datos de una poblacin.

Estadstica inferencial:
Se encarga de analizar la informacin
presentada por la estadstica
descriptiva mediante tcnicas que nos
ayuden a conocer, con determinado
grado de confianza, a la poblacin. Lo
que nos permite tomar decisiones.

Poblacin:
Conjunto definido de TODOS los
INDIVIDUOS, de donde se observa cierta
caracterstica.
Al nmero de integrantes de la poblacin
se llama tamao de la poblacin y se
representa con la letra N.
Las poblaciones pueden ser finitas o
infinitas.

Poblacin Estadstica:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medicin de una
variable en los elementos de una
poblacin.

Muestra:
Subconjunto de una poblacin, que intenta
reflejar las caractersticas de la poblacin lo
mejor posible.

El nmero de individuos que integran


la muestra, llamado tamao de la
muestra se representa con la letra n.

Individuo:
Es el elemento de la poblacin o de la muestra
que aporta informacin sobre lo que se estudia.

Variable:
Caracterstica o propiedad de los
individuos que se desea estudiar y se
puede medir o calificar; cambia o vara
con el tiempo en un individuo dado, o
cambia o vara de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, nmero
de hijos, etc.

Dato:
Valor que se obtiene al realizar la medicin de la
caracterstica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.

La naturaleza de los datos pueden ser


datos cuantitativos o datos
cualitativos.

Datos Cuantitativos

(nmeros):
Valores obtenidos al medir
peso, estatura, temperatura,
nmero de hijos.

Datos Cualitativos
(categoras):
Se obtienen al calificar la
caracterstica en cuestin
como el sexo, estado civil,
grado mximo de estudios.

Variable Dicotmica:
Slo puede tomar dos valores (s no, 0 1,
hombre mujer, bueno malo, encendido
apagado).

En la variable CUANTITATIVA se pueden


distinguir dos tipos: continua y
discreta.

Variable Continua:
Si la variable puede tomar cualquier nmero
real entre dos valores dados (decimal o
entero).
Ej. El peso de un individuo.

Variable Discreta:
Si la variable slo puede tomar nmeros
enteros.
Ej. El nmero de hijos de un individuo.

Escalas de Medicin

Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de razn

Escala Nominal:
Est asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritmticas entre sus valores, pues stos
son nicamente ETIQUETAS.

Ejemplo: sexo, cdigo postal, estado civil, nmero


telefnico, nmero al correr en un maratn, deporte
favorito, carrera a estudiar, etc.

Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel especfico, pero no se
pueden hacer operaciones aritmticas entre
ellas.
Ejemplo:
Psimo Malo Regular Bueno
Excelente
Primaria Secundaria Preparatoria Licenciatura

Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y adems una NOCIN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es nico, es ms bien un
punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la
Tierra, la lnea del tiempo de la humanidad.

Escala de Razn:
La magnitud tiene SENTIDO FSICO, existe el
cero absoluto, existe orden, se puede
determinar cuntas veces es mayor uno que
otro.
Ejemplo: peso, estatura, edad, distancia, dinero,
etc.

Fuentes de informacin
Encuesta:
Recopilar los datos mediante el uso de
cuestionarios o entrevistas.

Experimento:
Procedimiento utilizado en la investigacin
cientfica para obtener informacin que
permita conocer el comportamiento de
algn proceso.

Fuentes de Informacin

Investigacin Documental:
Procedimiento para obtener
datos mediante la consulta de
informacin ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.

Orden de datos
La ordenacin es el proceso mediante el cual los datos
estn acomodados de tal manera que se establece un
orden (ascendente o descendente) entre ellos.

Hay dos mtodos comunes:

Listado en orden ascendente

Mtodo de tallo y hojas

Ejemplo
Considera que la variable de estudio es el peso

de 25 estudiantes. Los pesos se encuentran en la


siguiente tabla:

Peso de 25 estudiantes
(en kg)
40
43
48
51
49
56
44
42
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Listado en orden ascendente


El proceso consiste en ordenarlos de menor a
mayor

Peso de 25 estudiantes
(en kg)
42
40
48
51
49
56
44
43
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

Mtodo de tallo y hojas


Si los nmeros de los datos estn formados por dos
dgitos, se hace una columna con el primer dgito
(decenas) y a la derecha de cada uno de ellos se
escribe, en fila, slo el segundo dgito (unidades) de
cada uno de los datos que tengan el mismo primer
dgito.

4
5
6

Datos sin ordenar:


2,0,8,9,4,3,4,5
1,6,5,2,2,0,9,0,6,5,7,1
,8
2,3,6,3

Datos ordenados:
4
5
6

Peso de 25 estudiantes
(en kg)
42
40
48
51
49
56
44
43
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8
2,3,3,6
,9

Doble tallo
Una variante de este mtodo es en lugar de

dividir en un grupo las decenas, se divide en


dos grupos. El primero abarcando los dgitos del
0 al 4 y el segundo del 5 al 9.

El ejemplo anterior
queda:

4
4
5
5
6
6

0,2,3,4,4
5,8,9
0,0,1,1,2,2,
5,5,6,6,7,8,9
2,3,3
6

Caso de variables
cualitatitivas

El procedimiento es:

Se identifican todos los valores diferentes y se acomodan


en columna.

Se agrega una segunda columna en donde se van


registrando, mediante una lnea vertical, la veces que
aparece el valor dado.

Ejemplo
Considera que la variable de estudio es el
color de playera de 25 estudiantes.
Los colores se encuentran en la siguiente
tabla:

rosa
gris
rosa
gris
gris

azul
blanco
azul
azul
blanco

blanco
caf
caf
blanco
caf

azul
negro
blanco
rosa
negro

rosa
blanco
blanco
gris
verde

Color

rosa
gris
rosa
gris
gris

azul

blanc azul
o
blanc caf negro
o
azul
caf blanc
o
azul
blanc rosa
o
blanc caf negro
o

rosa
blanc
o
blanc
o
gris
verde

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

IIII
IIII I
II I I
IIII
II
IIII
I

Tabla de Frecuencia de Datos


Una vez que se tenga ordenados los datos, se
acomodan en la Tabla de distribucin de
frecuencias o tabla de frecuencias.

La tabla es bsicamente una tabla de valores xy, dnde x representa el dato y f representa
la frecuencia.

La frecuencia es el nmero de veces que


aparece cada dato.

Hay dos clases de tablas de frecuencias:


Para datos NO agrupados.
Para datos agrupados.

Tabla de frecuencias para


datos NO agrupados
Est formada por dos columnas: una para la variable

xi y la otra para su frecuencia f, a esta frecuencia se


le llama frecuencia absoluta o frecuencia observada.

Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

xi

xi

40

52

42

55

43

1
2

56

44

57

1
1

45

58

48

59

49

62

2
1

50
51

63
66

25

Frecuencia relativa y acumulada


Por lo regular, se agregan dos columnas: la de la

frecuencia relativa fr y la de la frecuencia


acumulada fa.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el nmero total de datos,
esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.

Ejemplo
xi

fr

40

42

0.0
4
0.0

43

44

45

48

49

50

51

1/25
fa
1

xi

fr

fa

52

14

55

56

57

0.0
8
0.0
8.0
0
8
0.0

58

59

2/25

4
0.0
4
0.0
8
0.0

4
0.0
4
0.0

7
8

4
0.0
8
0.0
8

10

62

12

63

66

5
6

Tot
al

4
0.0
4
0.0
4
0.0
4
0.0
8
0.0
4
1

16
18
19
20
21
22
24
25

25
Siempre es 1

Siempre
es el
nmero
total

Intervalo de clase
En

ocasiones es conveniente acomodar los datos en


pequeos grupos de igual tamao, llamados intervalos
de clase.
El punto medio o marca de clase xi, se obtiene con:

El

tamao del intervalo se obtiene mediante la


diferencia de los lmites superior e inferior.

Marca de clase Lmite inferior + lmite


2
superior
=

Ejemplo
Lmite inferior

Lmite superior

Intervalo de clase
38 42
43 47
48 52
53 57
58 62
63 67

+5

+5

Lm inf + Lim sup


2

Punto medio xi
40
45
50
55
60
65

+5

Lmite verdadero del


intervalo
Intervalo de clase Punto medio xi
37.5 42.5
40
5/2 = 2.5
45
40 + 2.5
40 2.5 42.5 47.5
47.5 de
52.5
50 del
clase o lmite verdadero
Frontera
intervalo:
52.5 57.5
55
57.5 62.5
60
62.5 67.5
65

+5

+5

Tabla de intervalos con


lmites verdaderos

Usando smbolos de
desigualdad

Est incluido

No est incluido

Intervalo de
clase

Punto
medio
xi
El
tamao
del
37.5 x <
40
42.5 de 5
42.5 x <
45
47.5
47.5 x <
50
52.5
52.5 x <
55
57.5

Usando parntesis y
corchetes

Est incluido

No est incluido

Intervalo
de clase

intervalo es

Punto
medio
xi

[37.5 , 42.5)

40

[42.5 , 47.5)

45

[47.5 , 52.5)

50

[52.5 , 57.5)

55

[57.5 , 62.5)

60

[62.5 , 67.5)

65

Si por alguna razn no es fcil decidir el ancho


del intervalo y el nmero de ellos, se pueden
utilizar las siguientes frmulas:

K =NC= 1 + 3.322 log (n)


Donde K = nmero aproximado de
clases
n = nmero de datos.
Amplitud de los intervalos = Rango / K
Donde Rango = diferencia entre el
dato mayor
y el dato menor.

Ejemplo
Para el ejemplo de los datos de los pesos de
25 alumnos, el valor de K:

K = 1 + 3.322log (n) = 1 + 3.322 log (25)


= 5.6.
Por lo tanto se requieren
Y
la amplitud de los intervalos
sera:
aproximadamente
6 intervalos.
Amplitud = Rango / K = (66 40) / 5.6 =
4.64.
Aproximadamente 5 unidades es la
amplitud de los intervalos.

Tabla de distribucin de
frecuencias para datos agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.

xi

52

40

55

42

56

43

57

44

45

Datos
agrupados
Interval
Punto

medio
xi

58

38 42

40

2
4

59

43 47

45

48

62

49

50

63

48 52

50

66

53 57

55

51

Tota
l

25

58 62

60

Datos sin
agrupar

o de
clase

3
3
2

Interva
lo de
clase

Punto
medio
xi

fr

Fa

38 42
40
2
0.08
2
47
45
4 de frecuencia
0.16
6
las columnas
43Se agregan
relativa
y frecuencia
48
52 fr50
8 acumulada
0.32 fa:
14
53 57
55
5
0.20
19
58 62
60
3
0.12
22
63- 68
65
3
0.12
25
Total
25
1

2/25
4/25
8/25

Por ltimo se agregan las columnas:


Frecuencia porcentual, f% %f, se obtiene

multiplicando la frecuencia relativa fr x 100.


Frecuencia relativa acumulada fra, se obtiene sumando
las frecuencias relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, f%a, se obtiene
sumando las frecuencias porcentuales acumuladas a un
dato dado.

Tablas de frecuencias absoluta, relativa


acumulada
Interva
lo de
clase
38 42

Punto
medio
xi
40

43 47

45

48 52

50

53 57

55

58 62

60

fr

0.08 x
100

0.08 x
y100

2/25

f%

fa

fra f%a

0.0 8
8
16
0.1
32
6
0.3 20
12
2
0.2 12
0 100
0.1

0.0
8
0.2
4
0.5
6
0.7

6
14
19
22

8
24
56
76

6
0.8
88
8
1 100

Grfica de Datos
Existen dos tipos de grficas mas usuales:

Polgono de Frecuencias
Histograma

Otros grficos:

Grfica de barras
Pictograma
Grfico Circular o de pastel.

Polgono de Frecuencias
Es la representacin mediante un grfico de

lnea. En l se muestra la distribucin de


frecuencias y est formado por segmentos de
lnea que unen los puntos correspondientes a
la frecuencia de cada una de las clases.

El eje x representa el dato xi


y el eje y las frecuencias.

Ejemplo
Polgono de Frecuencias
10
8
6
Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

3
Total

4
2

25

0
35

40

45

50

xi

55

60

65

70

El eje y puede ser sustituido por


las frecuencias relativas o
porcentuales.

Polgono de Frecuencia Relativa

0.35
0.3
0.25

fr

0.2
0.15
0.1
0.05
0
35

40

45

50

xi

55

60

65

70

Polgono de Frecuencia Porcentual


35
30
25

% f 20
15
10
5
0
35

40

45

xi

50

55

60

65

Histograma
Es la representacin grfica de
los datos mediante una sucesin
de rectngulos.
Est formado por rectngulos cuya anchura
representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
En el eje x estarn los lmites verdaderos,
los puntos medios y en el eje y las
frecuencias.

Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

Ejemplo

Total

Histograma
10
8
6
f

4
2
0

35

40

45

50
xi

55

60

65

25

Histograma con frecuencias relativas


0.35
0.3
0.25
0.2
0.15
fr

Tambin podemos usar la frecuencia relativa y

0.1

la frecuencia porcentual.

0.05

35

40

45

50

xi

55

60

65

Histograma con frecuencias porcentuales


35
30
25
%f

20
15
10
5
0

35

40

45

50
xi

55

60

65

Pirmide Poblacional
Una variante en el histograma es colocar en el

eje x de tal manera que las columnas


quedarn en forma horizontal, es muy comn en
datos poblacionales.

Ojiva
Es la representacin grfica de las frecuencias
acumuladas mediante un grfico de lnea. Se
muestra la distribucin de frecuencias
acumuladas de los datos.

En el eje x estarn los puntos medios y en el


eje y las frecuencias acumuladas.

Ejemplo
Interva
lo de
clase
38 42
43 47
48 52
53 57
58 62
63- 68

Punto
medio
xi
40
45
50
55
60
65
Total

fr

fa

2
4
8
5
3
3
25

0.08
0.16
0.32
0.20
0.12
0.12
1

2
6
14
19
22
25

Ojiva
30
25

25
22

20

19

fa 15

14

10
6

5
00
35

40

45

50

xi

55

60

65

Interval
Punto
o de
medio xi
clase
38 42
40

fa

fra

f%a

0.0
8
2
8
43 47
45
4
0.1
16
6
6
y la
Usando la frecuencia acumulada
48 frecuencia
52
50porcentual.
8
0.3
32
14
2
53 57
55
5
0.2
20
19
0
58 62
60
3
0.1
12
22
2

0.0
8
0.2
4
0.5
6
0.7
6
0.8
8

fr

f%

24
56
76
88

Ojiva con frecuencia relativa acumulada


1
0.88

0.8

0.76

0.6

fra

0.56

0.4
0.24

0.2
0.08

00
35

40

45

50

xi

55

60

Ojiva con frecuencia porcentual acumulada


100
90
80
70
60
f%a 50
40
30
20
10
00
35

88
76

56

24

40

45

50

xi

55

60

65

Grfico Circular
Tambin es llamado grfico de pastel.
Slo se representan datos de frecuencias

relativas o frecuencias porcentuales.


Se debe dividir el rea del crculo de manera
proporcional a las frecuencias.

Agregaremos una columna a nuestra tabla de

frecuencias Frecuencia relativa al crculo,


multiplicando (fr)(360), para mostrar la parte
proporcional de crculo medida en grados que
corresponde a cada intervalo.

Ejemplo 1
Interval
o de
clase
38 42
43 47
48 52
53 57
58 62
63- 68

Punto
medio
xi
40
45
50
55
60
65
Total

2
4
8
5
3
3
25

fr

0.08
0.16
0.32
0.20
0.12
0.12
1

0.08 x
360

(fr )
(360)

28.8
57.6
115.2
72
43.2
43.2
360

0.16 x
360

Grfico Circular

65; 12%
60; 12%
55; 20%

40; 8%
45; 16%
50; 32%

Ejemplo 2
Color

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

Conteo

IIII
IIII I
II I I

4
7
3
4
2
4
1

IIII
II
IIII
I

Color de Playera
Azul
Negro

Blanco
Rosa

16%

4%

8%
16%

Caf
Verde

Gris

16%
28%

12%

Otros Grficos
La grfica de barras se traza similar al

Histograma, slo que las barras se dibujan


separadas unas de otras.
La escala en el eje x es para mostrar
categoras o intervalos de nmeros NO
consecutivos.

Carrera
Medicina
Mecnica
Civil
Agronoma
Fsico Matemticas
Leyes
Contadura

Alumn
os
8
11
8
3
3
6
11

Eleccin de Carrera

11

11

8
3

Pictograma
Similar al de barras, slo que se sustituyen por
figuras, generalmente relacionadas con la
variable estudiada.