Professional Documents
Culture Documents
Estadstica y Probabilidades
UNIDAD I
ESTADSTICA
1.
INTRODUCCIN
El uso de los mtodos estadsticos para analizar datos se ha convertido en una
prctica comn en todas las disciplinas cientficas. Este material de ayuda
pretende introducir mtodos que utilizan los estudiantes en sus carreras de
formacin tecnolgica.
La exposicin matemtica es relativamente modesta. El uso sustancial del
clculo se hace slo en el captulo de probabilidades. No se utiliza lgebra
matricial en absoluto. Por lo tanto, casi toda la exposicin deber ser accesible
para aquellos estudiantes cuyo conocimiento en matemtica es bsico.
La unidad 1 se inicia con algunos conceptos y terminologa bsicos (poblacin,
muestra, estadstica descriptiva e inferencial, variables y tipos) y contina con la
elaboracin de tablas de frecuencia para variables cualitativas y cuantitativas y
grficos importantes. La unidad 2 corresponde a las medidas resumen de
posicin y de dispersin. La unidad 3 se estudia el anlisis de dos variables:
cualitativas vs cualitativas, cualitativas vs cuantitativas y cuantitativas vs
cuantitativas, adems de grficos importantes. En el captulo 4 se ofrece el
desarrollo un tanto tradicional de la probabilidad, la probabilidad condicional, la
probabilidad total y el teorema de Bayes.
1.1
POBLACIN Y MUESTRA
55
Estadstica y Probabilidades
TECSUP - PFR
ESTADSTICA
Disciplina que nos proporciona un conjunto de mtodos y procedimientos
que nos permitan recopilar, clasificar, presentar y describir datos en
forma adecuada para tomar decisiones frente a la incertidumbre o
predecir o afirmar algo acerca de la poblacin a partir de los datos
extrados de la misma.
56
TECSUP - PFR
Estadstica y Probabilidades
57
Estadstica y Probabilidades
1.4
TECSUP - PFR
VARIABLES
Se dice que algo vara si puede tomar por lo menos dos valores, grados
o formas o, incluso, cuando una caracterstica puede estar presente o
ausente en una situacin especfica.
Dicho esto, podramos estar de acuerdo en que nociones como sexo,
nmero de hijos por familia, color de automvil, nmero de huelgas
58
TECSUP - PFR
Estadstica y Probabilidades
59
Estadstica y Probabilidades
TECSUP - PFR
TECSUP - PFR
Estadstica y Probabilidades
61
Estadstica y Probabilidades
TECSUP - PFR
62
TECSUP - PFR
2.
Estadstica y Probabilidades
ESTADSTICA DESCRIPTIVA
La estadstica descriptiva se ocupa de la recopilacin, clasificacin, presentacin y
descripcin de los datos.
RECOPILACIN
Los datos pueden recopilarse de dos maneras fundamentales:
a) Si se consideran todos los elementos de la poblacin y se registran
sus caractersticas se denomina censo.
b) Si se seleccionan algunos elementos de la poblacin, pero no todos,
se denomina muestra y la informacin obtenida por este
procedimiento se llama por muestreo; si la recopilacin de los
elementos muestrales se efecta al azar se dice que el muestreo es
aleatorio y la muestra se denomina muestra aleatoria.
Un ejemplo de una recopilacin completa o censo es el Censo Poblacional
del Per realizado en el ao 1993.
CLASIFICACIN
Los datos obtenidos por observacin o medicin suelen ser registrados en
el orden en que se recopilan. Para facilitar su interpretacin y el anlisis
correspondiente deben ser clasificados y esto equivale a que los datos
deben ser organizados de alguna manera sistemtica o particionado en
clases bien definidas y una manera sencilla de hacerlo es ordenar los
datos segn su magnitud o agruparlos de acuerdo a sus caractersticas.
PRESENTACIN DE DATOS
Una vez recolectados los datos y optado por su posible clasificacin es
necesario presentarlos en forma tal que se facilite su comprensin y su
posterior anlisis. Para ello se ordenan en cuadros numricos llamados
TABLAS (Tablas de frecuencias) y luego se presentan mediante GRFICAS
(de barras, sectores circulares, histograma, polgono de frecuencias, ojiva,
pictograma, etc.)
63
Estadstica y Probabilidades
TECSUP - PFR
Ttulo de la tabla
El ttulo de la tabla debe ser breve, claro y explicativo. Debe ser puesto arriba de la
tabla, en el margen superior izquierdo, debajo de la palabra Tabla (con la inicial en
mayscula) y acompaado del nmero con que la designa (las tablas deben ser
enumeradas con nmeros arbigos secuencialmente dentro del texto y en su
totalidad). Ej.: Tabla 1, Tabla 2, Tabla 3, etc.
Citar tablas en el cuerpo del texto
Al citar tablas en el cuerpo del texto, escriba apenas el nmero correspondiente a la
tabla, por ejemplo: Tabla 1, Tabla 2, Tabla 3, etc. (la palabra Tabla tendr que ser
presentada con la inicial mayscula)
Nunca escriba "tabla abajo/arriba o tabla de la pgina xx, pues la numeracin de las
pginas del trabajo puede ser alterada.
Cuerpo de la fuente de la tabla
Times New Roman, tamao 10.
Fuente de las notas de la tabla
Times New Roman, tamao 9.
Notas de la tabla
Las tablas presentan tres tipos de notas: notas generales, notas especficas y notas de
probabilidad. Las notas son tiles para eliminar la repeticin en el cuerpo de una
tabla (APA, 2001, p. 147). Ellas son presentadas en el margen izquierdo (sin sangra)
debajo de la tabla (entre la tabla y la nota hay que inserir dos espacios). Y deben ser
ordenadas en esta secuencia: nota general, nota especfica y nota de probabilidad, y
cada tipo de nota debe ser puesta en una lnea nueva.
Notas generales: Una nota general cualifica, explica u ofrece informaciones
relacionadas a la tabla como un todo y finaliza con una explicacin de abreviaturas,
smbolos y afines (APA, 2001, p. 145).
Nota especfica se refiere a una columna, lnea o tem especfico y debe ser indicada
por letra minscula sobrescrita (a, b, c).
Nota de probabilidad indica los resultados de pruebas significativos y se indican con
asterisco sobrescrito (*).
64
TECSUP - PFR
I.
Estadstica y Probabilidades
65
Estadstica y Probabilidades
Tabla 3.
TECSUP - PFR
Opinin
Frecuencia
Frecuencia relativa
Porcentaje
Deficiente
20
20/160 = 0.1250
0.125*100 = 12.50 %
Bueno
35
35/160 = 0.2188
21.88 %
Excelente
65
0.4063
40.63 %
Otros
40
0.2500
25.00 %
Total
160
II.
Segn la APA, una figura es cualquier tipo de ilustracin que no sea tabla. Una figura
puede ser un cuadro, un grfico, una fotografa, un dibujo u otra forma de
representacin (APA, 2001, p. 149).
Tanto para las figuras como para las tablas el interlineados que se utiliza es sencillo
(1,0) o de uno punto cinco (1,5). Esto en el contenido de las tablas y figuras como en
las notas de las tablas, ttulo de tablas o figuras y leyendas. Segn sea el caso.
Ttulo de la figura
El ttulo explica la figura de forma concisa, pero de forma discursiva. Debe ser puesto
debajo de la figura, con nmeros arbigos secuencialmente dentro del texto como un
todo, precedido por la palabra Figura (con la inicial en mayscula). Ej.: Figura 1, Figura
2, Figura 3, etc.
Cualquier otra informacin necesaria para elucidar la figura (como la unidad de
medida, smbolos, escalas y abreviaturas) que no estn incluidas en la leyenda,
tendrn que ser colocadas luego del ttulo.
Cuerpo de la fuente de la figura
Times New Roman, tamao 10.
66
TECSUP - PFR
Estadstica y Probabilidades
Leyenda
Se trata de la explicacin de los smbolos empleados en la figura y debe ser puesto
dentro de los lmites de la figura.
III.
1. Diagrama de barras
Un diagrama de barras es una grfica para representar un conjunto de datos
cualitativos que se han resumido en una distribucin de frecuencias absolutas, relativas
o porcentuales. En uno de los ejes de la grfica, por lo general el eje horizontal, se
colocan las categoras de la variable y en el otro eje de la grfica (por lo general el eje
vertical) se pueden usar las frecuencias absolutas, relativas o porcentuales. Luego, se
construye una barra de ancho fijo en cada categora y cuya altura corresponda a la
frecuencia utilizada en el grfico. Las barras deben estar separadas para enfatizar el
hecho que las categoras no se superponen.
67
Estadstica y Probabilidades
TECSUP - PFR
Ejemplo:
10.20%
9.60%
9.20%
8.50%
Horizonte
Integra
Unin vida
Profuturo
Figura 1. Rentabilidad por AFP del Sistema Privado de Pensiones. Fuente: Sabadini,
(2013)
2. Diagrama circular
El diagrama circular, tambin llamado diagrama de pie, es otra forma de representar la
distribucin de frecuencias relativas o porcentuales. Para su construccin primero se
traza un crculo y luego se divide en sectores circulares de forma proporcional a la
frecuencia relativa de cada categora. Puesto que todo el crculo representa un ngulo
de 360 en total cada sector es el porcentaje correspondiente de dicho total, es decir,
el ngulo del sector que le corresponde a cada categora se obtiene multiplicando 360
por la respectiva frecuencia relativa.
Ejemplo:
68
TECSUP - PFR
Estadstica y Probabilidades
2
3
0
4
0
3
4
6
3
5
9
8
5
12
0
11
1
10
1
0
0
4
3
1
8
3
13
3
1
0
1
8
2
10
3
0
A 0; 13
I i Li , Li 1 , i=1, 2, ...,k
Los intervalos semi-abiertos por la derecha Ii se denominan intervalos de
clase.
Los Li , i=1, 2, ...,k+1 se denominan los lmites de clase.
El valor entero de k, fundamentalmente, depende del estadstico y/o
investigador, pero es recomendable utilizar la regla de Sturges para
determinar un valor aproximado de k:
k 1 3,3logn
Donde n es el nmero total de datos disponibles.
La frmula es un poco conservadora y nos da un nmero de intervalos
un poco menor del que se utiliza en la prctica. Cuando el nmero de
datos es menor que 100, el nmero de intervalos se debe tomar menor
que 10. Para un nmero de datos bastante grande, el nmero de
intervalos es mayor que 10, la prctica aconseja los siguientes lmites: 5
k 15 .
En el ejemplo:
k = 1 + 3,3 log(40) = 6,286
69
Estadstica y Probabilidades
TECSUP - PFR
k=7.
Wi l ( I i ) Li 1 Li
Para conseguir anchos de clase iguales (W ), como es deseable; se usa
la siguiente relacin:
l ( A)
, donde l (A) es la longitud del alcance.
k
En el ejemplo:
W
13
1,857
7
tomamos W = 2
Tabulacin
N de familias por
clases
Intervalos de clase o
clases: Ii
[0; 2>
Frecuencias Absolutas:
[2; 4>
[4; 6>
[6; 8>
[8; 10>
ni
14
70
TECSUP - PFR
Estadstica y Probabilidades
[10; 12>
[12; 14>
TOTAL
40
En el ejemplo: n = 40
,k=7
Se verifica que:
i
1
14
k
ni n1 n2 n3 n4 n5 n6 n7 14 9 7 1 4 3 2 40 n
i 1
n3= 3
Tabla N2
Cabezas
de ganado
N de
familias
Marcas
de clase
Frecuencias
relativas
Clases
[0; 2>
ni
xi
hi
14
0,350
[2; 4>
0,225
[4; 6>
[6; 8>
[8; 10>
Frecuencias
relativas
acumuladas
Frecuencias
absolutas
acumuladas
Frecuencias
relativas
porcentuales
Frecuencias
relativas
acumuladas
porcentuales
Hi
Ni
0,35
14
100hi%
35
100Hi%
35
0,575
23
22,5
57,5
0,175
0,750
30
17,5
75
0,025
0,775
31
2,5
77,5
0,100
0,875
35
10
87,5
71
Estadstica y Probabilidades
TECSUP - PFR
[10; 12>
11
0,075
0,950
38
7,5
95
[12; 14>
13
0,050
40
100
TOTALES
40
100
xi
Li Li 1
2
i = 1, 2, ....., k
L L2 0 2
x1 1
1
2
2
L L3 2 4
x2 2
3
2
2
......
; .....
Se verifica que:
0 hi 1
k
hi h1 h2 h3 h4 h5 h6 h7 0,350 0,225 0,175 0,025 0,100 0,075 0,050 1
i 1
TECSUP - PFR
Estadstica y Probabilidades
Respuesta: 17,5 %
Frecuencia Absoluta Acumulada ( Ni ):
Se define:
Ni = n1 + n2 + .... + ni
i = 1, 2, ....., k
En el ejemplo:
N1 n1 14
N2 n1 n2 14 9 23
N3 30,.... N7 40
Se verifica:
0 Ni 40
Nk N7 40
H i h1 h2 ... hi
Hi
Ni
; i 1, 2, ... , k
n
H1 h1 0,350
H2 h1 h2 0,575
H3 0,750,..... H7 1
Se verifica:
0 Hi 1
Hk H7 1
2da.clase es 0,575
73
Estadstica y Probabilidades
TECSUP - PFR
Ii
vs. ni
Ii
vs. ni
Ii
vs. hi
b) Polgonos de frecuencias
(Fig. N 2)
,n
,h
i
i
i
i
Son polgonos construidos uniendo los puntos
mediante segmentos de recta, o uniendo los puntos medios de los
techos de los rectngulos del histograma. (Fig. N 3)
ni
ni
Histograma
15
Polgono de Frecuencias
15
Fig. N2
Fig. N3
10
10
10
12
14
Ii
10
74
12
14
Ii
TECSUP - PFR
Estadstica y Probabilidades
Ii
vs. Ni
Ii
vs. Hi
(Fig. N 4)
d) Ojivas
Son poligonales asociadas a distribuciones de frecuencias absolutas o
relativas acumuladas construidas como aparece en la Figura N5
Ni
Funcin Escalonada
Ni
Ojiva
40
40
30
30
20
20
10
10
10
12
14
Ii
Fig. N4
10
12
14
Fig. N5
PROBLEMAS PROPUESTOS
75
Ii
Estadstica y Probabilidades
TECSUP - PFR
Ojos: 5
Piernas: 1
811
753
872
787
1076
863
620
1050
869
923
958
852
650
918
841
792
970
788
815
850
863
799
765
968
725
876
842
937
896
817
743
1027
851
816
740
678
703
889
837
758
891
865
844
878
822
817
1075
759
907
890
811
753
1074
923
TECSUP - PFR
c)
Estadstica y Probabilidades
Frecuencias
32
47
75
89
126
38
10
417
862
873
700
851
926
885
912
864
857
922
800
844
791
931
907
77
825
722
917
935
774
786
895
903
820
758
925
930
Estadstica y Probabilidades
TECSUP - PFR
789
941
790
909
753
784
910
882
847
859
784
903
936
925
706
704
758
792
887
888
890
763
892
914
889
925
805
893
794
791
895
796
915
931
782
768
759
890
701
713
869
916
888
772
724
892
853
865
935
868
895
789
909
887
842
912
943
931
880
892
850
712
710
933
905
920
764
798
905
792
TECSUP - PFR
Estadstica y Probabilidades
9. Las prdidas en una fbrica de papel (en miles de dlares) debidas a rasgaduras
pueden dividirse segn el producto:
Papel higinico: 132
Servilletas: 43
Toallas desechables: 85
Otros: 12 productos
11. Los siguientes datos son las velocidades (en km/h) de 80 carros que pasaron por
un punto de control de velocidad:
60
40
49
102
70
25
120
60
30
54
49
60
60
70
45
70
31
38
85
80
31
108
39
100
60
35
83
35
65
26
83
55
45
27
30
28
34
24
65
50
20
45
40
60
73
27
72
63
34
40
46
82
68
40
46
64
29
55
105
72
81
75
62
65
35
45
29
63
65
43
43
61
20
60
38
36
80
85
63
69
79
Estadstica y Probabilidades
TECSUP - PFR
IMPUESTO
900
360
120
1000
2200
3400
4000
SUELDO
Cunto de impuesto mensual paga una persona que gana s/.1500?. Cunto gana
una persona que paga mensualmente s/.300 de impuesto?
13. La siguiente tabla de frecuencias muestra los haberes mensuales de 200 obreros
de cierta fbrica, en nuevos soles (ao2000)
Haberes mensuales
Nmero de obreros
Menores a 500
500 , 700
700 , 900
900 , 1100
1100 ,1300
1300 ,1500
60
40
48
24
14
80
TECSUP - PFR
Estadstica y Probabilidades
1500 ,1700
ms de 1700
TOTAL
200
81