You are on page 1of 39

Analisis de Datos

Organizacion y representacion de datos

Luceny Guzman Acu~


na

23 de julio de 2015

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

1 / 39

Tipos de Datos
Cuando se analiza una poblacion (o muestra) a cada unidad o elemento
dentro de esta se le asigna un nombre o un numero dependiendo del
interes que se tenga. A estos le denominaremos datos. Los datos se pueden
clasi car de la siguiente manera:
1

Datos cualitativos: se re ere a categor as o atributos que pueden


clasi carse de acuerdo con determinado criterio.

Datos cuantitativos: se re eren a informacion numerica (representan


todo lo que se puede contar o medir)
1

Los datos discretos son los obtenidos de un proceso de conteo


(asociados al conjunto de los enteros no negativos)
Los datos continuos son los obtenidos de un proceso de medicion
(asociados al conjunto de los numeros reales)

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

2 / 39

Tipos de Datos

Algunos datos numericos se pueden clasi car como cualitativos, por


ejemplo: los codigos de estudiantes, grados de escolaridad, telefonos,
etc.
Algunos datos se pueden representar de los dos tipos, por ejemplo: La
estatura, cali cacion etc.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

3 / 39

Escalas de medicion

Atendiendo a la relacion entre los nombres o numeros asignados a los


elementos de la poblacion o muestra surgen las escalas de medicion.
1. Nominal. Se utilizan para datos cualitativos (clasi cacion de
productos, tipos de autos, genero, numeros telefonicos,
codigos, grados escolares, etc). Caracter sticas: no hay un
orden particular, no se pueden realizar calculos numericos,
las categor as deben ser excluyentes (un elemento no puede
asignarsele mas de una categor a) y exhaustivas (todo
elemento debe asignarsele una categor a).

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

4 / 39

Escalas de medicion

2. Ordinal. Son datos medidos en una escala nominal, pero,


ordenada de alguna manera (Cali caciones por letra,
clasi cacion de productos, grados de escuela, etc). En esta
escala la distancia entre o diferencia entre valores no tiene
signi cado. Caracter sticas: tiene sentido establecer un
ordenamiento, las categor as son excluyentes y exhaustivas,
no se pueden realizar calculos numericos.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

5 / 39

Escalas de medicion

3. De intervalo. Son datos medidos en una escala ordinal, pero


de tipo cuantitativo, la distancia entre valores tiene sentido.
Esta escala no siempre tiene un punto cero, que indique
ausencia de medida. (temperatura, puntaje en un examen).
Ademas no se pueden establecer razones entre valores.
Caracter sticas: tiene sentido establecer un ordenamiento,
las categor as son excluyentes y exhaustivas, se pueden
realizar calculos numericos, no existe un valor que indique
ausencia de la caracter stica medida, se puede establecer
diferencias entre valores.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

6 / 39

Escalas de medicion

4. De razon. son datos medidos en una escala de intervalo,


donde el punto cero indica ausencia de medida, se pueden
establecer razones entre valores (Tiempo, peso, dinero, etc).
Caracter sticas: tiene sentido establecer un ordenamiento,
las categor as son excluyentes y exhaustivas, se pueden
realizar calculos numericos, existe el valor que indique
ausencia de la caracter stica medida.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

7 / 39

Organizacion de datos

Los datos se organizan en tablas de frecuencia tambien denominadas


distribuciones de frecuencia, hablaremos de los siguientes tipos de tablas.
1

No agrupadas: Datos cualitativos y cuantitativos discretos cuando el


rango de valores no es muy amplio.

Agrupadas: Datos cuantitativos continuos y discretos cuando el rango


de valores es muy amplio.

Acumuladas: Cuantitativos

Bivariadas: Cualitativos.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

8 / 39

Representacion de un conjunto de datos

La representacion de un conjunto de datos se realiza a partir de gra cos.


Analizaremos los siguientes:
1

Diagrama de barras, de puntos, univariados y bivariados, circular


(Datos cualitativos y cuantitativos discretos de tablas no agrupadas)

Histograma (datos cuantitativos)

Pol gono (datos cuantitativos)

Ojiva (datos cuantitativos, tablas acumuladas)

Diagrama de pareto (datos cualitativos)

Diagrama de cajas (datos cuantitativos)

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

9 / 39

Tabla o distribucion de frecuencias no agrupadas

Ejemplo 1 (Datos cualitativos)


La tabla organizacion datos.xls contiene informacion para un grupo de
estudiantes de Analisis de datos I. Los datos incluidos son: ingenier a a la
cual pertenecen, numero de fallas durante el semestre hasta la semana 9;
estado (G: aprobado, R: retirado, P: reprobado).
1

Construya una tabla de frecuencias completa para la ingenier a a la


que pertenecen.

Construya una tabla de frecuencias para el estado.

Repita el ejemplo 1 sin tener en cuenta los estudiantes retirados.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

10 / 39

Tabla o distribucion de frecuencias no agrupadas


Ejemplo 1 (Datos cualitativos)
Ingenier a
IN
CV
MC
EL
ET
ST
Total

f
15
15
10
5
8
3
56

fr = nf
0;268
0;268
0;179
0;089
0;143
0;054
1

% = 100fr
26;8
26;8
17;9
8;9
14;3
5;4
100

Donde:n : numero de datos, f : frecuencia absoluta (numero de veces que


aparece un dato), fr : frecuencia relativa, % : porcentaje.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

11 / 39

Diagrama de barras
Ejemplo 1 (Datos cualitativos)

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

12 / 39

Diagrama circular
Ejemplo 1 (Datos cualitativos)
Ingenier a
IN
CV
MC
EL
ET
ST
Total

f
15
15
10
5
8
3
56

angulo: 360f
n
96; 4
96; 4
64; 3
32; 1
51; 4
19; 3
360

% = 100fr
26;8
26;8
17;9
8;9
14;3
5;4
100

Donde:n : numero de datos, f : frecuencia absoluta (numero de veces que


aparece un dato), % : porcentaje.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

13 / 39

Diagrama circular
Ejemplo 1 (Datos cualitativos)

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

14 / 39

Tabla o distribucion de frecuencias no agrupadas

Ejemplo 2 (Datos cuantitativos discretos )


La tabla organizacion datos.xls contiene informacion para un grupo de
estudiantes de Analisis de datos I. Los datos incluidos son: ingenier a a la
cual pertenecen, numero de fallas durante el semestre hasta la semana 9;
estado (G: aprobado, R: retirado, P: reprobado) construya una tabla de
frecuencias completa para el numero de fallas

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

15 / 39

Tabla o distribucion de frecuencias no agrupadas


Ejemplo 2 (Datos cuantitativos discretos )
# de fallas
0
1
2
3
4
5
6
7
8
9

Luceny Guzman Acu~


na ()

f
16
3
9
2
1
3
2
3
2
7

fr
0;286
0;054
0;161
0;036
0;018
0;054
0;036
0;054
0;036
0;125

%
28;6
5;40
16;1
3;60
1;80
5;40
3;60
5;40
3;60
1;25

# de fallas
10
11
12
13
14
15
16
17
18
Total (n)

Analisis de Datos

f
0
0
2
1
0
1
2
1
1
56

fr
0;000
0;000
0;036
0;018
0;000
0;018
0;036
0;018
0;018
1

%
0;00
0;00
3;60
1;80
0;00
1;80
3;60
1;80
1;80
100

23 de julio de 2015

16 / 39

Diagrama de barras
Ejemplo 2 (Datos cuantitativos discretos )

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

17 / 39

Diagrama de puntos
Ejemplo 2 (Datos cuantitativos discretos )

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

18 / 39

Histograma
Ejemplo 2 (Datos cuantitativos discretos )

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

19 / 39

Pol gono
Ejemplo 2 (Datos cuantitativos discretos )

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

20 / 39

Tabla o distribucion de frecuencias agrupadas


Ejemplo 3
Se realizo un estudio a un grupo de trabajadores de una empresa para
analizar su productividad. Se obtuvieron datos acerca del numero de piezas
\aceptables" producidas. Los datos se resumen en la tabla. Construya una
tabla de frecuencias.
21
22
24
29
32
33
34
34
35
35

35
36
37
37
37
38
40
40
40
40

Luceny Guzman Acu~


na ()

41
41
44
44
44
44
44
44
46
46

46
47
48
48
48
49
50
50
51
51

51
52
52
52
52
52
53
53
53
53

54
54
55
55
55
55
55
56
56
56

57
57
58
58
58
58
59
60
60
61

Analisis de Datos

61
61
61
62
62
62
62
63
63
63

64
65
66
66
66
66
66
66
68
69

69
71
71
73
73
73
74
75
75
76

77
77
77
79
80
81
81
83
84
88

23 de julio de 2015

21 / 39

Tabla o distribucion de frecuencias agrupadas


Ejemplo 3
1. Se determina el numero de clases C a utilizar. Ley de
Sturges: C = 3; 3 log n + 1; donde n es el numero de datos a
agrupar (aproximar al entero mas cercano)
2. Se calcula el rango R; R = Dato mayor

Dato menor

3. Se determina la precision (en la practica la precision es dada


por el instrumento de medicion), lo cual es quivalente a
seguir la regla siguiente:
2
3
# de cifras decimales 0 1
P
1 0;1 0;01 0;001
R
4. Se calcula la amplitud A; A = C
(se acuerda aproximar por
arriba, teniendo en cuenta la precision, es decir, la amplitud
tendra tantas cifras decimales como los datos).

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

22 / 39

Tabla o distribucion de frecuencias agrupadas


Ejemplo 3
5. Se calculan l mites teoricos (l mites de clase) y l mites
practicos (fronteras de clase) para las clases. Los de la
primera clase seran:
L mite inferior de la primera clase: LIP 1 = Dato menor;
L mite superior de la primera clase: LSP 1 = LIP 1 + A
Frontera inferior de la primera clase: F IP 1 = LIP 1

P
2

Frontera superior de la primera clase: F SP 1 = LSP 1 +

P
2

Para la clase i; i = 1; :::C,


LIi = LIi 1 + A; LSi = LSi 1 + A; F Ii = F Ii
F Si = F Si 1 + A o F Si = F Ii + A:

Luceny Guzman Acu~


na ()

Analisis de Datos

+ A;

23 de julio de 2015

23 / 39

Tabla o distribucion de frecuencias agrupadas

Ejemplo 3
Clase
1
2
3
4
5
6
7
8
Total

Luceny Guzman Acu~


na ()

L mites
21 29
30 38
39 47
48 56
57 65
66 74
75 83
84 92

Fronteras
20;5 29;5
29;5 38;5
38;5 47;5
47;5 56;5
56;5 65;5
65;5 74;5
74;5 83;5
83;5 92;5

Analisis de Datos

f
4
12
16
28
22
15
11
2
110

fr = nf
0;04
0;11
0;15
0;25
0;20
0;14
0;10
0;02
1

%
4
11
15
25
20
14
10
2
100

23 de julio de 2015

24 / 39

Tabla o distribucion de frecuencias agrupadas

Caracter sticas de las tablas agrupadas


1

Uniformidad: Todas las clases deben tener la misma amplitud.

Unicidad: Las clases no deben traslaparse.

Completez: Cada dato debe pertenecer a alguna clase.

Notas
1

Si la ultima clase queda si datos, se puede eliminar.

Si usted no sigue el acuerdo para el calculo de la amplitud, es posible


que los datos mayores no pertenezcan a ninguna clase, en este caso
anexe otra clase que cumpla con las tres propiedades anteriores.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

25 / 39

Histograma
Ejemplo 3

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

26 / 39

Pol gono
Ejemplo 3

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

27 / 39

Tabla o distribucion de frecuencias acumuladas


Ejemplo 4 (Datos cuantitativos discretos y continuos)
Calcular la tabla de frecuencias acumuladas para los datos del ejemplo 2.
# de fallas
0
1
2
3
4
5
6
7
8
9

fac
16
19
28
30
30
34
36
39
41
48

fr ac
0;286
0;339
0;500
0;536
0;554
0;607
0;643
0;696
0;732
0;857

% ac
28;6
33;9
50;0
53;6
55;4
60;7
64;3
69;6
73;2
85;7

# de fallas
10
11
12
13
14
15
16
17
18

Donde: fac es la frecuencia acumulada, fr


Luceny Guzman Acu~
na ()

Analisis de Datos

ac

fac
48
48
50
51
51
52
54
55
56

fac
n ;

fr ac
0;857
0;857
0;893
0;911
0;911
0;929
0;964
0;982
1;000

% ac
85;7
85;7
89;3
91;1
91;1
92;9
96;4
98;2
100

% ac = 100 fr
23 de julio de 2015

ac
28 / 39

Ojiva
Ejemplo 4 (Datos cuantitativos discretos y continuos)
Gra car la ojiva para los datos del ejemplo 2.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

29 / 39

Tabla o distribucion de frecuencias acumuladas


Ejemplo 4 (Datos cuantitativos discretos y continuos)
Calcular la tabla de frecuencias acumuladas para los datos del ejemplo 3.
Fronteras
20;5
29;5
38;5
47;5
56;5
65;5
74;5
83;5
92;5

Luceny Guzman Acu~


na ()

fac
0
4
16
32
60
82
97
108
110

fr ac
0;000
0;036
0;145
0;291
0;545
0;745
0;882
0;982
1

Analisis de Datos

%ac
0;0
3;6
14;5
29;1
54;4
74;5
88;2
98;2
100

23 de julio de 2015

30 / 39

Tabla o distribucion de frecuencias acumuladas


Ejemplo 4 (Datos cuantitativos discretos y continuos)
Gra car la ojiva para los datos del ejemplo 3.

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

31 / 39

Tabla o distribucion de frecuencias bivariadas


Ejemplo 5
La tabla organizacion datos.xls contiene informacion para un grupo de
estudiantes de Analisis de datos I. Los datos incluidos son: ingenier a a la
cual pertenecen, numero de fallas durante el semestre hasta la semana 9;
estado (G: aprobado, R: retirado, P: reprobado) construya una tabla de
frecuencias bivariada teniendo en cuenta la ingenier a y el estado.
Ingenier a/Estado
IN
CV
MC
EL
ET
ST
Total
Luceny Guzman Acu~
na ()

G(Aprob.)
11
5
10
4
3
2
35

P(no aprob.)
2
0
0
0
1
0
3

Analisis de Datos

R(Retir.)
2
10
0
1
4
1
18

Total
15
15
10
5
8
3
56

23 de julio de 2015

32 / 39

Diagrama de barras bivariado


Ejemplo 5

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

33 / 39

Diagrama de barras bivariado


Ejemplo 5

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

34 / 39

Tabla o distribucion de frecuencias bivariadas


Ejemplo 5
Responder a partir de la tabla:
1

>Que porcentaje de los estudiantes retirados es de ingenier a


4
) 100 %
electronica?( 18

>Que porcentaje de los estudiantes de ingenier a civil


5
aprobaron? 15
100 %

>Que porcentaje de los estudiantes son de ingenier a industrial y


aprobaron? 11
100 %
56

>Que porcentaje de los estudiantes son de ingenier a


8
100 %
electronica? 56

>Que porcentaje de los estudiantes aprobaron? 35


100 %: Si no
56
tiene en cuenta los estudiantes retirados >Cual sera este
35
porcentaje? 38
100 %
Luceny Guzman Acu~
na ()

Analisis de Datos

23 de julio de 2015

35 / 39

Diagrama de Pareto

Una forma especial de gra co de barras verticales que separa los problemas
muy importantes de los menos importantes, estableciendo un orden de
prioridades.
Fue creado por el economista italiano Vilfredo Pareto sobre la base del
principio segun el cual, el 80 % de los problemas son provenientes de
apenas el 20 % de las causas.
Sus objetivos fundamentales son:
1

Identi car y dar prioridad a los problemas mas signi cativos de un


proceso.

Evaluar el comportamiento de un problema, comparando los datos


entre el \antes" y el \despues".

Luceny Guzman Acu~


na ()

Analisis de Datos

23 de julio de 2015

36 / 39

Diagrama de Pareto
Ejemplo 6
La tabla siguiente representa las causas de los accidentes de transito
ocurridos en una interseccion durante el ultimo mes. Realizar el diagrama
de pareto, donde V: Exceso de velocidad, S : Falta de se~
nalizacion, Z :
Estado de embriaguez, R : Problemas de frenos, A: animales, N :
Problemas de sue~
no, O : otros:
Causa
V
S
Z
R
A
N
O
Luceny Guzman Acu~
na ()

Frecuenia
11
8
32
7
6
15
4

Analisis de Datos

23 de julio de 2015

37 / 39

Diagrama de Pareto

Ejemplo 6
Causa
Z
N
V
S
R
A
O
Total

Luceny Guzman Acu~


na ()

f
32
15
11
8
7
6
4
83

facum
32
47
58
66
73
79
83

Analisis de Datos

%acum
38; 5
56; 6
69; 9
79; 5
87; 9
95; 2
100

23 de julio de 2015

38 / 39

Diagrama de Pareto
Ejemplo 6

D i a g ra m a d e P a re to
100
100,00
95,18

80

87,95

Frecuencia

79,52
69,88

60
56,63

40

38,55

20

0
Z

V
N

Luceny Guzman Acu~


na ()

R
S

Analisis de Datos

O
A

23 de julio de 2015

39 / 39

You might also like