You are on page 1of 30

PROBABILIDAD Y ESTADISTICA

Alex Soto Poblete


Estadstico / Mg. Estadstica
Clase 2

Bases de Datos (tabla de datos)

Organizacin bsica de la informacin obtenida


para realizar una investigacin. La estructura es
rectangular compuesta n filas y p columnas.
columnas
Individuo A1 A2 Aj Ap
1 x11 . .
2 . .
. . .
Filas

i xij xip
. . .
n xnj xnp
Ejemplo:

ID SEXO EDAD PESO NUMCIG INTERES


1 0 23 68 2 1
2 1 22 74 10 0
3 1 23 58 1 0
4 0 20 80 15 3

Variables

Caracterstica que cambia (vara) de unidad en


unidad.
Existen dos categoras o tipo de variables:
- Cualitativas
- Cuantitativas
Variable cualitativa

Los valores son identificados con palabras,


puede usar nmeros pero de carcter simblico.
Es aquella que expresa un atributo o
caracterstica cuyos posibles valores se refieren
a una cualidad presente o ausente. Los posibles
valores son excluyentes.
Esta a su vez la podemos subdividir en:
- Nominal
- Ordinal

Variable cualitativa nominal

Permiten agrupar observaciones de acuerdo a


un atributo.
La escala de valores es nominal.
Los valores son categoras.
Las categoras son valores diferentes por una
cualidad, no por una cantidad.
Ningn valor se puede decir que sea mayor o
menor que otro.
A veces los posibles valores pueden estar
predeterminados de antemano, asignando un
cdigo numrico (etiqueta) a cada categora. A
este proceso se le llama codificacin.
Puede ser dicotmica (s/no) (1,0) o politmica
(siempre, casi siempre, a veces, nunca)
(3,2,1,0).

Ejemplos:
Partido poltico por el que vot, regin en que
vive, sexo, estado civil, marca del auto que
tiene, color de pelo, etc.

No bebe (0)
S bebe (1)
Variable cualitativa ordinal
Su escala es ordinal.
Sus valores son categoras.
Existe un orden en los valores.
Los nmeros indican jerarqua.
No establece distancia entre dos puntos.

Ejemplos:
- Clase social (baja, media , alta).
- Opinin sobre una propuesta poltica (muy en
contra, ms bien en contra, indiferente, ms bien
a favor, muy a favor).
- Clasificacin de un corredor en una
competicin de 20 participantes (1, 2,, 20).
- Nivel de dolor que sufre un paciente ante un
tratamiento (sin dolor, leve, moderado, intenso).
Ejemplo:
6
5
4
3
2
1

100
50
40
30
10
1
Variable cuantitativa

Es aquella que podemos expresar


numricamente: edad, peso, n de hijos, etc.
Esta a su vez la podemos subdividir en:
- Discreta
- Continua

Variable cuantitativa discreta

Es aquella que entre dos valores prximos


puede tomar a lo sumo un nmero finito de
valores.
Los valores son nmeros enteros.
Son el resultado de contar, valores son
nmeros enteros.
Ejemplo:
personas en el hogar, aos de estudio de la
carrera, n de dientes, n de caras al lanzar una
moneda 10 veces.

Variable cuantitativa continua

El nmero de valores posibles entre dos


valores dados es infinito.
Son el resultado de medir.
Se miden en escalas de intervalo o de razn.
Ejemplo: distancia recorrida, altura, edad, etc.
Categorizacin de una variable cuantitativa

Puede realizarse una transformacin de una


variable cuantitativa y pasarla a una cualitativa
ordinal. Los valores individuales se colapsan
formando slo unos pocos grupos o categoras.
Variable antigua Variable nueva
(NUMCIG) (FUMADOR)
1 - 19 1
20 - 39 2
40 y ms 3
Categorizar Perder
(resumir) informacin

Las variables se denotan por las maysculas de


letras finales del alfabeto castellano. A su vez
cada una de estas variables puede tomar
distintos valores, colocando un subndice, que
indica orden:

X = ( X 1 , X 2 , X 3 ,L, X k 2 , X k 1 , X k )
Ejercicios

Ciudad donde naciste Frecuencia de asistencia al gimnasio


Nivel de alcoholemia Tipo de colegio donde estudiaste
Tiempo dedicado al carrete Asignaturas de la carrera
Horas que ves TV N de adverbios en un texto
Tenencia de automvil Tipo de bebedor (abstemio, leve,..)
Tipo de comuna (urbana, rural) N de mensajes recibidos en tu email
Habitantes de Talca Longitud de los pies

Tablas Estadsticas

Permiten presentar informacin de un modo


ordenado y resumido.
Cada vez ms necesario, segn crece la
cantidad de datos que analizaremos.
Etapas principales en la
construccin de una tabla

1.- Definir los propsitos de la tabla a travs de


la formulacin de la o las preguntas que se
intenta contestar con la tabla. Ejemplo: Cul
es la distribucin por edad de los alumnos?
2.- Deben tener un ttulo que especifique en
forma competa su contenido.

- Qu se presenta: Accidentados, operados, capacitados,


etc.
- Cmo se clasifican las unidades de observacin:
Accidentados segn grupos de edades, operaciones segn
resultados, capacitados segn rea de trabajo, etc.
- Dnde fueron registrados los datos: Planta A, Lnea de
produccin de papeles, etc.
- Cundo se registraron los datos: 1990, de 1990 a 2000,
etc.

3.- Asignacin de las escalas de clasificacin a


filas y columnas:

a. Cuando hay un solo criterio de clasificacin se sita


la escala de clasificacin en la primera columna

Edades N de
(aos) individuos
04 10
59 14
10 14 25
b. Cuando hay ms de un criterio de clasificacin se
sita aquel con mayor nmero de grupos en la primera
columna.

Edades Gravedad
(aos) Leve Grave
04 13 20
59 11 18
10 14 14 23

c. Cuando hay dos escalas de clasificacin y una se


refiere a los antecedentes y la otra a las consecuencias,
colocaremos los antecedentes en la columna de la
izquierda y la consecuencia en la fila superior.

Resultado
Seccin
Aprobado Reprobado
1 15 1
2 8 2
Total 23 3
4.- Adems de los datos numricos obtenidos
del material en estudio puede complementar con
porcentajes si es necesario.

Capacitados
Turno Total Capacitados Turno Total
N %
A 83 72 A 83 72 86,7
B 128 104 B 128 104 81,2
Total 211 176 Total 211 176 83,4

Tablas de Frecuencias

Ordenamiento que permite observar la


distribucin de los datos que analizamos.

Una tabla de frecuencias se compone de:


Intervalo de clase :

Es una fraccin del recorrido de la variable


analizada obtenido mediante algn criterio
razonable. La cantidad de intervalos se denota k.

Marca de clase (mi) :

Es el promedio entre los lmites de una clase


determinada.

mi
Frecuencia absoluta :

Llamaremos as a la cantidad de observaciones


cuyo valor pertenece al intervalo de clase
correspondiente. Se representa por ni.

Note que: La suma de todas las frecuencias


absolutas, siempre debe ser igual al total de
observaciones N.
k
N = ni
i =1

Frecuencia relativa :

Es la frecuencia absoluta dividida por el nmero


total de datos, su valor i-simo es:

ni
fi =
N
Note que: La suma de todas las frecuencias relativas,
siempre debe ser igual a la unidad.
k

f
i =1
i =1
Frecuencia absoluta acumulada :

Es la suma de los distintos valores de la


frecuencia absoluta tomando como referencia un
individuo dado.
N1 = n1
N2 = n1 + n2
.
Ni = n1 + n2 + . . . + ni
.
Nk = n1 + n2 + . . . + nk = N

Note que: La ltima frecuencia absoluta acumulada


es igual al n de casos

Frecuencia relativa acumulada :

Es el resultado de dividir cada frecuencia


absoluta acumulada por el nmero total de datos,
se la suele representar con la notacin Fi.
Tablas de Frecuencias para una
variable discreta

xi ni Ni fi Fi
x1 n1 N1 f1 F1
x2 n2 N2 f2 F2
x3 n3 N f3 1
ni=N 1

Ejemplo
El gobierno desea averiguar si el nmero medio
de hijos por familia ha descendido respecto de la
dcada anterior. Para ello ha encuestado a 50
familias respecto al nmero de hijos, y ha
obtenido los siguientes datos:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Se pide:
a) Cul es la poblacin objeto de estudio?
b) Qu variable estamos estudiando?
c) Qu tipo de variable es?
d) Construir la tabla de frecuencias
Soluciones:

a) La poblacin objeto de estudio es el conjunto


de familias del pas.
b) La variable que estamos estudiando es el
nmero de hijos por familia.
c) El tipo de variable es discreta ya que el
nmero de hijos solo puede tomar determinados
valores enteros (es imposible tener medio o un
cuarto de hijo).

d) Para construir la tabla de frecuencias


tenemos que ver cuantas familias tienen un
determinado nmero de hijos. Podemos ver que
el nmero de hijos, toma los valores existentes
entre 0 hijos, los que menos y 6 hijos, los que
ms y tendremos:
xi ni Ni fi Fi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.30 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.02 1
N = 50 1
Componentes de una tabla de frecuencias

Intervalo de clase: Fraccin del recorrido de la


variable.

Marca de clase (mi): promedio entre los lmites


de cada clase.

Frecuencia: Cantidad de observaciones


perteneciente al intervalo de clase
correspondiente.

Tablas de Frecuencias para una


variable continua
Distribucin con un gran nmero de datos,
entonces se suelen agrupar en intervalos para
facilitar su comprensin. Esta prctica tiene en
cambio un inconveniente: se pierde
informacin sobre la propia distribucin.
Intervalo de Clase:

[Li , Ls )
Amplitud de intervalo:

Es la longitud del intervalo, se representa por:

a = Ls Li

Marca de clase (mi):

Es el punto medio de un intervalo. Para


calcularla podemos definirla como la semisuma
de los valores extremos del intervalo, esto es
sumar los extremos, y dividir entre 2.
Pasos para construir una tabla de
Frecuencias

Paso 1.
N de Intervalos de Clase (k):

Se debe definir el nmero de intervalos de clase


para la variable en estudio. Existen muchas
formas de establecer este nmero, como por
ejemplo:
 Raz cuadrada de n: A partir de la raz
cuadrada del nmero de datos, decidimos,
redondeando el nmero de intervalos.

k2 n
 Regla de Sturges

k 1 + 3,322 Log10 (n )

 A eleccin del investigador

Paso 2.
Calcular el Recorrido de la variable:

Valor mayor, menos valor menor de los datos.

R = xmx xmn
Paso 3.
Calcular la amplitud de intervalo:

Divisin entre el Recorrido y el nmero de


intervalos que hayamos decidido. Se puede
redondear tambin.

R
a
k

Paso 4.
Recalcular el Recorrido (Recorrido efectivo):

Re = a k
Paso 4.
Recalcular el Recorrido (Recorrido efectivo):

Re = a k

Paso 5.
Recalcular el primer lmite inferior Li :

Re R
Li = xmn
2

Paso 6.
Calcular los siguientes intervalos de clase
sumando la amplitud de intervalos
Ejemplo

Un profesor desea conocer el rendimiento de


sus alumnos en una prueba. Los datos
obtenidos en escala de 1 a 7 fueron:

3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5
5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5
4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8

Pasos para construir la tabla de Frecuencias


Paso 1.
N de Intervalos de Clase (k):

Cuando no se nos dice nada el nmero de


intervalos debemos calcular una cantidad. Una
manera de hacerlo es calculando la raz
cuadrada del nmero de datos observados (n).

k 2 40
k 6,32
k 6

Paso 2.
Calcular el Recorrido de la variable:

Valor mayor, menos valor menor de los datos.

R = xmx xmn

R = 6.1 3.3 = 2.8


Paso 3.
Calcular la amplitud de intervalo:
R
a
k
2,8
a
6
a 0,467

a 0,5

Paso 4.
Recalcular el Recorrido (Recorrido efectivo):

Re = a k

Re = 0,5 6

Re = 3
Paso 5.
Recalcular el primer lmite inferior Li :

Re R
Li = xmn
2
3 2,8
Li = 3,3
2

Li = 3,3 0,1

Li = 3,2

LI LS mi ni Ni fi Fi
3,2 3,6 3,4 2 2 0,05 0,05
3,7 4,1 3,9 5 7 0,13 0,18
4,2 4,6 4,4 13 20 0,33 0,50
4,7 5,1 4,9 11 31 0,28 0,78
5,2 5,6 5,4 4 35 0,10 0,88
5,7 6,1 5,9 5 40 0,13 1,00
n= 40

You might also like