You are on page 1of 61

Estadstica General

Tema: Recoleccin de Datos

Para qu necesitamos
Recolectar Datos?
Proporcionan
la
introduccin
imprescindible para un estudio de
investigacin.
2. Medir el desempeo en un servicio o
proceso de produccin.
3. Ayudar en la formulacin de alternativas
para la toma de decisiones.
4. Satisfacer nuestra curiosidad.
1.

Ejemplos:
Un

gerente desea investigar si la calidad


del servicio o de los productos se ajustan
a los estndares de la compaa.
El investigador de mercados busca las
caractersticas que distinguen un producto
del de sus competidores.

Ejemplos:
El

inversionista
potencial
desea
determinar qu compaas de qu
industrias es probable que hayan
acelerado el crecimiento en un periodo de
recuperacin econmica.
El
fabricante farmacutico necesita
determinar si una nueva medicina es ms
eficaz que las actualmente en uso.

Los Datos pueden concebirse como


informacin numrica necesaria para
ayudarnos a tomar una decisin con ms
bases en una situacin particular.

Tcnicas e Instrumentos
1. Encuesta:
Su instrumento es el Cuestionario.
Se formulan preguntas respecto a
opiniones, actitudes, comportamiento y
otras caractersticas.
Despus las respuestas se editan,
codifican y tabulan para su anlisis.

Tcnicas e Instrumentos
2. Entrevista:
Su instrumento es la Gua de Preguntas.
Es un dilogo flexible, permite hacer
preguntas ms de una vez (repregunta).
Tanto el entrevistador como el (los)
entrevistado (s) deben tener
conocimientos fundamentados del tema
en discusin.

Tcnicas e Instrumentos
3. Observacin:
Su instrumento es la Gua de
Observacin.
a) Observacin Experimental: El investigador
influye sobre los elementos de estudio. Ej:
Prueba de medicamentos, Ensayos de
nuevos mtodos de enseanza, etc.
b) Observacin No Experimental: El
investigador toma los datos tal y como los
encuentra. Ej: Trfico, Rating, Supervisin.

Tcnicas e Instrumentos
4. Anlisis Documental:
Su instrumento es la Ficha de Registro.
Consiste en recabar informacin relacionada
al tema de investigacin de todas las fuentes
disponibles: Tesis, Revistas, Pginas Web,
Libros, Historias Clnicas, Expedientes
judiciales, Registro de ventas, Historial de
Notas, Documentales, etc.
Estas fuentes deben ser vlidas para citarse.

Diseo del Cuestionario

Preguntas Cerradas:
rea de carrera profesional:
Ciencias ( ) Letras ( )
Mdicas ( ) Otra
( )
Preguntas Abiertas:
Qu opina del acoso sexual en lugares de
trabajo?

Diseo del Cuestionario


Preguntas

Semi-Abiertas:
Qu deporte practica?
Ftbol ( )
Voley ( )
Ciclismo ( )
Natacin ( )
Otro ( )..

Consideraciones ticas
La

informacin obtenida debe ser de


inters, estrictamente, para el estudio.
Mantener el anonimato de las fuentes, si
fuera requerido.
Utilizar un lenguaje adecuado para las
personas involucradas en el estudio.
No sesgar (acomodar) los resultados
obtenidos. aleatoriedad.

Una leccin muy importante del


anlisis de datos: mirar los datos
W. Edwards Deming
Fsico-Matemtico y Estadstico
norteamericano.
(1900 1993)

CAPTULO 2
CMO ORDENAR LOS DATOS PARA HACER UNA DISTRIBUCIN DE FRECUENCIAS?

En este caso, resolveremos un ejemplo. Ordenaremos


los datos que se encuentran en la siguiente tabla:

20
12
14
14
22
18
21

19
12
22
25
15
20
28

12
22
20
25
15
15
20

19
19
14
14
14
15
17

18
17
12
21
22
24
19

PASO 1
De

acuerdo al tamao del grupo (n),


debes definir cuntas clases es
adecuado tener.
Utilizamos la siguiente frmula:
k= n
n= nmero de observaciones, k= clases
En nuestro ejemplo, hay 35 datos, por
ello:
k= 35= 5.916 clases

PASO 2
Obtenemos el recorrido o amplitud (A):
De acuerdo a la siguiente frmula:
A= dato mayor dato menor
En nuestro ejemplo:
A= 28-12=16

PASO 3
Con la informacion anterior, determinamos
el ancho de cada intervalo(i) con:
i= A/ n
En nuestro ejemplo:
i= 16/5.91 =2.70
Podemos usar intervalos de ancho 3 o 2, en
este caso usaremos 2, ya que el entero de
las clases lo aproximamos al entero mayor.

Paso 4
Podemos comenzar a construir la tabla,
primero, con las clases aparentes,
empezamos con el menor valor de la
distribucin y les sumamos el ancho del
intervalo (i), hasta cubrir el valor ms alto
la serie:
Clasesde
aparentes
12-14
15-17
18-20
21-23
24-26
27-29

PASO 5
Ahora podemos determinar las clases
reales. Restamos 0.5 del lmite inferior de
cada clase aparente y sumamos 0.5 al lmite
superior de cada clase aparente.
Clases reales
11.5-14.5
14.5-17.5
17.5-20.5
20.5-23.5
23.5-26.5
26.5-29.5

PASO 6
Ahora podemos obtener la marca de clase, la
cual es el punto medio de las clases reales y se
obtiene a travs de :
Marca de clase= (lri+lrs)/2
Donde lri: lmite real inferior
lrs: lmite real superior. Un ejemplo en nuestro
caso sera (11.5+14.5)/2= 13
Marca de clase
La tabla nos quedara as:
13
16
19
22
25
28

PASO 7
Ahora podemos colocar las
frecuencias (f), que son la cantidad
de veces que aparece un valor. Esto
lo hacemos a travs del recuento, en
el ejemplo tendramos:
Clases aparentes
12-14
15-17
18-20
21-23
24-26
27-29

Clases reales
11.5-14.5
14.5-17.5
17.5-20.5
20.5-23.5
23.5-26.5
26.5-29.5

Marca de clase
13
16
19
22
25
28

f
9
6
11
5
3
1

PASO 8
Ahora podemos colocar las
frecuencias acumuladas (F), que son
las frecuencias absolutas sumadas
en cada clase. Esto lo hacemos a
travs del recuento, en el ejemplo
tendramos:
Clases
aparentes
12-14
15-17
18-20
21-23
24-26
27-29

Clases reales
11.5-14.5
14.5-17.5
17.5-20.5
20.5-23.5
23.5-26.5
26.5-29.5

Marca de
clase
13
16
19
22
25
28

f
9
6
11
5
3
1

F
9
15
26
31
34
35

PASO 9

Ahora podemos colocar las


frecuencias relativas (fr), que son las
frecuencias absolutas divididas
entre el total. Es decir que fr= f/n

Clases
aparentes

Clases reales

Marca de
clase

fr

12-14

11.5-14.5

13

0.25714

15-17

14.5-17.5

16

15

0.17143

18-20

17.5-20.5

19

11

26

0.31429

21-23

20.5-23.5

22

31

0.14286

24-26

23.5-26.5

25

34

0.08571

27-29

26.5-29.5

28

35

0.02857

PASO 10

Clases
aparentes

Clases reales

Ahora podemos colocar las


frecuencias relativas
porcentuales(%), que se obtienen
multiplicando las frecuencias
relativas por 100. Por ejemplo:
0.2571 *100=25.71%

Marca de
clase

fr

12-14

11.5-14.5

13

9 0.25714 25.71%

15-17

14.5-17.5

16

15 0.17143 17.14%

18-20

17.5-20.5

19

11

26 0.31429 31.43%

21-23

20.5-23.5

22

31 0.14286 14.29%

24-26

23.5-26.5

25

34 0.08571

8.57%

27-29

26.5-29.5

28

35 0.02857

2.86%

Hemos construido
exitosamente una tabla de
distribucin de frecuencias.

Distribuciones de
Frecuencias
1. Agrupacin de datos
2. Frecuencias y distribuciones

Distribucin de frecuencias

Cuando se realiza una investigacin se obtiene


un conglomerado de datos que deben ser
organizados en un orden, arreglo o secuencia
lgica.
Al ordenarse y clasificarse los datos obtenidos,
se realiza una distribucin de frecuencias.

Datos crudos (sin agrupar)


Hombre, mujer, mujer, mujer,
Rawhombre,
Data hombre, mujer, mujer,
hombre, hombre, hombre, hombre, hombre, mujer, mujer,
hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer,
mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre,
hombre, hombre, hombre, mujer, mujer, hombre, hombre,
mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer,
hombre, hombre, mujer, mujer, hombre, hombre, hombre,
hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer,
hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre,
mujer, mujer, hombre, hombre, hombre, hombre, hombre,
mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer,
mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer,
hombre, hombre, hombre, hombre, hombre, mujer, mujer,
hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer,
mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre,
hombre, hombre, hombre, mujer, mujer, hombre, hombre,
mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer,
hombre, hombre, mujer, mujer, hombre, hombre, hombre,
hombre, hombre

Datos crudos (sin agrupar)


36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25,
21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31,
35, 22, 32, 21, 32, 25, 34, 33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32,
23, 24, 31, 24, 35, 34, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29,
32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 32, 25, 34,
33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32, 23, 24, 31, 24, 35, 34, 36,
27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21,
27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35,
22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22,
23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22,
35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,
26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26,
26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27,
31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29,
32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21

Ordenacin de los datos


Es una colocacin de los datos numricos en
orden de mayor a menor (o viceversa). La
diferencia entre el mayor y el menor de los
nmeros se llama rango o recorrido de
datos.
Cualitativos

Orden alfabtico
Escribir, primero el que ms se repite, luego el que
sigue y as sucesivamente

Cuantitativos

Forma creciente (menor al mayor)


Forma decreciente (mayor al menor)

Ordenacin de datos

Crudos:
Hombre, mujer, mujer, mujer, hombre, hombre,
mujer, mujer, hombre, hombre, hombre, hombre,
hombre, mujer, mujer, hombre, hombre, mujer,
mujer, hombre
Ordenados:
hombre, hombre, hombre, hombre, hombre,
hombre, hombre, hombre, hombre, hombre,
hombre, mujer, mujer, mujer, mujer, mujer,
mujer, mujer, mujer, mujer

Ordenacin de datos
Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,
26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,
33, 23, 29, 32, 23
Ordenados:
21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,
27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,
36, 36, 38, 39, 39

Agrupacin de datos
Cuando

la muestra es de menos de 20,


entonces estos datos son analizados sin
necesidad de formar clases con ellos y a
esto es a lo que se le llama tratamiento de
datos no agrupados.

Anterior diapositiva.

Datos no agrupados
Edad

Frecuencia

21

22

23

24

25

26

27

28

29

31

32

33

35

36

38

39

Una tabla
con 16
renglones

No es
muy
prctica!

Agrupacin de datos
Cuando

la muestra consta de 20 o ms
datos, lo aconsejable es agrupar los datos
en clases y a partir de stas determinar
las caractersticas de la muestra.

Pasos para
Datos nominales y ordinales
1.

2.

Ordenar los datos.


Determinar en qu orden quedarn las
categoras.

Determinar las frecuencias de cada


clase.
3. Determinar la Frecuencia Relativa.
En caso de escala ordinal, se puede
obtener Frecuencia Acumulada y Relativa
Acumulada.

La

frecuencia puede ser

absoluta (f), nmero que indica la cantidad de


veces que la variable toma un cierto valor, o
relativa (fr), divisin entre la frecuencia
absoluta y el nmero total de observaciones

Datos agrupados (nominal)


Gnero

Frecuencia
Frecuencia
Relativa

Hombre

11

0.52

Mujer

10

0.48

Datos agrupados (ordinal)


Escolarid
ad

Fr

Frecuencia
Acumulada

Primaria

15

0.41

15

Secundaria

12

0.32

27

Preparatoria

10

0.27

37

Ejemplo:
Datos:
Nominal: Hombres y mujeres en el saln.
Ordinal: Nivel de acuerdo con escuelas de tiempo
completo (De acuerdo, Indeciso/a, Desacuerdo).

Ordenar datos
Frecuencia absoluta
Frecuencia Relativa
Ordinal: Frecuencia Acumulada y Relativa Acumulada

Armar

tabla.

Agrupacin de datos
Datos cuantitativos
Deben

formarse clases de igual tamao


(tamao de clase: C)
Recomendacin: El total de grupos o
clases no debe ser menor a 5 ni mayor a
15 ( 20).

Frecuencias y distribuciones

La distribucin de frecuencias simple es una


tabla que se construye con base en los
siguientes datos: clase o variable (valores
numricos) en orden descendente o
ascendente, marcas de clase y frecuencia.
Clase
0-2
3-5
6-8
9-11

Marca de clase
1
4
7
10

Frecuencia
5
3
2
4

Frecuencias y distribuciones

Por qu del 2 se va al 3?
Por qu no inicia el rengln dos, con el nmero
2?

Clase
0-2
3-5
6-8
9-11

Marca de clase
1
3
5
7

Frecuencia
5
3
2
4

Cuando NO necesitamos
armar clases?

Ordenacin de datos
Cmo armar una distribucin de frecuencias de estos datos?

Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,
26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,
33, 23, 29, 32, 23
Ordenados:
21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,
27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,
36, 36, 38, 39, 39

Pasos para
Datos cuantitativos
1.

Ordenar los datos.


2. Obtener el rango y cantidad de datos.
3.

Determinar cuntas clases tendr la


tabla (entre 5 y 15). Dos mtodos:

Mtodo 1. Raz de n. Ejemplo: n = 15


Raz de 15 = 3.87 ---- Entonces:

Mtodo 2.

C=4

2c < n -------- Ejemplo: n = 15

Pasos para
Datos cuantitativos

2c < n. -------- Ejemplo: n = 15

21 = 2 ----------------------- 2 < 15 ? Si
22 = 2x2 = 4 --------------- 4 < 15 ? Si
23 = 2x2x2 = 8 ------------ 8 < 15 ? Si
24 = 2x2x2x2 = 16 ------- 16 < 15 ? No!

Por lo tanto, C

=3

Nota: los dos mtodos pueden dar distintos


resultados.
Regla: 2c < n, por lo general dar un resultado
menor. Usarlo cuando n > 50

Pasos para
Datos cuantitativos

4.

Determinar el tamao de las clases.

5. Determinar lmites: comenzar con el primer


lmite inferior (sumar tamao de clase).
6. Determinar las marca de clase.
7. Determinar las frecuencias de cada clase.
8. Obtener Frecuencia Acumulada.

Pasos para
Datos cuantitativos

9.

Obtener Frecuencia Relativa.

10. Obtener Frecuencia Relativa Acumulada.

Ejemplo
Frecuencias
Acumuladas

Superior

Frecuencias

Inferior

Frecuencias
Relativas
Acumuladas

Frecuencias
Relativas

Lmites reales

Marca
de clase
(X)

FA

Fr

FrA

1 3

0.5 3.5

0.333

0.333

4 6

3.5 6.5

10

0.50

0.833

7 9

6.5 9.5

12

0.166

No.
Clase

Lmites

Total de
datos (n)

Ordenar datos
Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,
26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,
33, 23, 29, 32, 23
Ordenados:
21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,
27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,
36, 36, 38, 39, 39

Usando mtodo 1 (para la cantidad de clases, raz de n)

Lmites
reales

Marca
de
clase
(X)

FA

Fr

FrA

21-24

20.5-24.5

22.5

0.26

0.26

25-28

24.5-28.5

26.5

14

0.26

0.52

29-32

28.5-32.5

30.5

17

0.11

0.63

33-36

32.5-36.5

34.5

24

0.26

0.89

37-40

36.5-40.5

38.5

27

0.11

1.00

No.
Clas
e

Lmites

Usando mtodo 2 (para la cantidad de clases, 2c < n)

Lmites
reales

Marca
de
clase
(X)

FA

Fr

FrA

21-25

20.5-25.5

23

0.33

0.33

26-30

25.5-30.5

28

15

0.22

0.56

31-35

30.5-35.5

33

21

0.22

0.78

36-40

35.5-40.5

38

27

0.22

1.00

No.
Clas
e

Lmites

Ejercicio: Cantidad de horas de


estudio a la semana
Crudos:

6, 5, 3, 1, 8, 5, 12, 10, 1, 2, 3, 2, 4, 2, 4, 6,
3, 2, 5, 4
Ordenados:

1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6,
8, 10, 12

Usando mtodos 1 y 2 (para la cantidad de clases)

Lmites
reales

Marca
de
clase
(X)

FA

Fr

FrA

13

0.5 3.5

0.45

0.45

46

3.5 6.5

17

0.40

0.85

79

6.5 9.5

18

0.05

0.90

10 12

9.5 12.5

11

20

0.10

1.00

No.
Clas
e

Lmites

Otros ejercicios en el saln


Datos:

Cantidad de personas que viven en la misma


casa.
Cantidad de horas que pasa en la
computadora a la semana.

Aplicar

pasos.

Hoja de ejercicios

Conceptos 1/3

Clase: cada rengln de una distribucin de frecuencia,


es un grupo de datos.
Intervalo: rango de datos incluido en cada clase.
Lmites de clase, superior e inferior: lmites extremos
de cada clase.
Lmites Reales de clase (o fronteras de clase): se
obtienen sumando el lmite superior de un intervalo de
clase con el lmite inferior de la clase siguiente y
dividindolos entre dos.
Marca de clase: punto medio de cada clase y se
obtiene sumando los lmites de clase y dividindolos
entre dos.

Conceptos 2/3
Tamao

de clase:

la diferencia entre los lmites reales de clase,

la diferencia entre los lmites de clase ms


una unidad (la misma que se est trabajando)

la diferencia entre las marcas de clase.

Frecuencias

acumuladas.- la suma de
cada frecuencia con la frecuencia de
todas las clases superiores.

Conceptos 3/3

Frecuencias relativas: Dividiendo cada


frecuencia entre el nmero total de
observaciones (o multiplicndolas por 100 para
tenerlas en forma de porcentaje).
Frecuencias relativas acumuladas: La suma
de cada frecuencia relativa con las frecuencias
relativas de todas las clases superiores.

Tambin se pueden obtener dividiendo cada


frecuencia acumulada entre el total de frecuencias
por 100.

Rango: Dato ms alto menos dato ms bajo.


Distribucin de frecuencias.

You might also like