Professional Documents
Culture Documents
mean
PROBABILIDAD Y ESTADSTICA
CON MATLAB PARA
INVESTIGADORES
Curso bsico
Hctor Jos Pabn ngel MSc.
2010
UNIVERSIDAD
~1~
DE CUNDINAMARCA SECCIONAL UBAT
PROBABILIDAD Y ESTADSTICA
CON MATLAB
PARA INVESTIGADORES
POR:
UNIVERSIDAD DE CUNDINAMARCA
SECCIONAL UBAT
PROGRAMA DE INGENIERA
2010
2
CONTENIDO
Pg.
8
8
8
9
9
11
11
14
17
21
23
24
27
29
30
1.
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
1.13
1.14
ELEMENTOS DE MATLAB
INTRODUCCIN
ALGUNAS OPERACIONES BSICAS CON MATLAB
LOS NMEROS EN MATLAB Y LOS FORMATOS NUMRICOS
OPERACIONES ARITMTICAS
FUNCIONES MATEMTICAS DE MATLAB
VECTORES
MATRICES
CREACIN DE MATRICES ESPECIALES
OPERACIONES CON MATRICES
CADENAS DE IMPRESIN
SOLUCIN DE ECUACIONES LINEALES
GRAFICACIN CON MATLAB
SUBPLOT
DEFINICIN DE FUNCIONES
2.
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.13.1
2.13.2
2.13.3
2.14
2.14.1
2.14.2
2.14.3
2.14.4
PROBABILIDAD
INTRODUCCIN
ESPACIO MUESTRAL
EVENTO
COMBINATORIA
PROBABILIDAD DE UN EVENTO
PROBABILIDAD CONDICIONAL
EVENTOS INDEPENDIENTES
VARIABLES ALETAORIAS
DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
DISTRIBUCIN CONTINUA DE PROBABILIDAD
ESPERANZA MATEMTICA
VARIANZA
DISTRIBUCIONES DISCRETAS
Distribucin binomial
Distribucin hipergeomtrica
Distribucin de Poisson
DISTRIBUCIONES CONTINUAS
Distribucin normal
Distribucin 2 (o JI-cuadrado)
Distribucin t de Student
Distribucin F
32
32
32
32
33
34
36
37
37
38
40
41
43
45
45
47
48
50
50
57
58
59
3.
3.1
3.1.1
3.1.2
ANLISIS ESTADSTICO
ESTADSTICA DESCRIPTIVA
Estadgrafos de posicin
Estadgrafos de dispersin
61
61
66
66
4.
4.1
4.2
TEORA DE MUESTREO
INFERENCIA ESTADSTICA
PRUEBA DE HIPTESIS
72
75
75
3
5.
5.1
5.2
5.3
88
88
88
89
98
99
100
101
103
108
111
LISTA DE FIGURAS
Pg.
FIGURA 1.1
FIGURA 1.2
FIGURA 1.3
FIGURA 1.4
FIGURA 1.5
27
28
28
29
30
subplot
FIGURA 1.6
FIGURA 2.1
FIGURA 2.2
FIGURA 2.3
FIGURA 2.4
FIGURA 2.5
FIGURA 2.6
FIGURA 2.7
FIGURA 2.8
FIGURA 2.9
FIGURA 2.10
FIGURA 2.11
FIGURA 2.12
FIGURA 2.13
FIGURA 2.14
FIGURA 3.1
FIGURA 3.2
FIGURA 3.3
FIGURA 3.4
FIGURA 3.5
FIGURA 3.6
FIGURA 3.7
FIGURA 3.8
FIGURA 3.9
FIGURA 3.10
FIGURA 5.1
FIGURA 5.2
FIGURA 5.3
FIGURA 5.4
FIGURA 5.5
FIGURA 5.6
FIGURA 5.7
FIGURA 5.8
31
33
38
39
39
48
50
51
52
52
53
57
58
59
grados de libertad
Distribuciones F con 8 y 12 grados de libertad (azul), y 12 y 24
grados de libertad (verde)
Grfico de sectores (pie)
Histograma de frecuencias con seis clases del ejemplo 3.2
Diagrama de barras verticales
Diagrama de barras horizontales
Grfico de racimo
Polgono de frecuencias (rojo)
Histograma y curva normal
Histograma y curva normal
Asimetras
Curtosis
No existe relacin entre los vectores de datos x e y
Relacin lineal positiva
Relacin lineal negativa
Relacin curvilnea
Lnea recta de ajuste por mnimos cuadrados
Ajuste lineal y cuadrtico
Regresin lineal para la data del ejemplo 5.1 y lmite de confianza
de y
Grfico de la distribucin acumulativa normal de las desviaciones
de la lnea que aparece adecuada en la figura anterior
5
60
64
64
64
65
65
65
67
69
69
70
89
89
90
90
91
92
94
94
FIGURA 5.9
FIGURA 5.10
95
96
LISTA DE TABLAS
Pg.
TABLA 2.1 Datos de estudiantes de la Universidad X
TABLA 3.1 Clases vs frecuencias
TABLA 5.1 Data de la variable independiente x, y la variable dependiente y
36
64
93
1. ELEMENTOS DE MATLAB
1.1 INTRODUCCIN
En esta seccin se discutirn algunos tpicos de programacin con MATLAB. El nombre
de MATLAB
Matrix Laboratory
es un paquete para
computacin numrica extremadamente potente. Con MATLAB se pueden dar
comandos directos, como una calculadora de mano o se pueden escribir programas.
MATLAB existe como un programa de aplicacin primaria con una librera bastante
Toolbox standard
Toolbox de
MATLAB, contienen una librera amplia para resolver muchos problemas prcticos de
estadstica, tales como interpolacin, regresin, medidas de tendencia central, medidas
de dispersin, inferencia estadstica, graficacin, entre otros muchos temas.
MATLAB es un paquete de software matemtico basado en matrices. Est altamente
optimizado y es un sistema muy confiable. Muchas tareas numricas pueden ser
expresadas en forma concisa en el lenguaje del lgebra lineal sin mucha dificultad como
ocurrira en otro lenguaje de programacin no optimizado para matemticas.
1.2 ALGUNAS OPERACIONES BSICAS CON MATLAB
El prompt >> est dado por el sistema y se requiere dar <ENTER> para ejecutar un
comando MATLAB
Es posible incluir comentarios en el espacio de trabajo de MATLAB
despus de la sentencia, para indicar que es un comentario.
Ejemplo 1.1
>>% este es un comentario que no es ejecutable.
Un punto y coma colocado al final de una expresin hace que la ejecucin del comando
no sea visible al usuario. Sin el punto y coma, se muestra el resultado de la ejecucin.
Como parte de su sintaxis y su semntica, MATLAB est previsto para dar valores
excepcionales. Ms infinito (+ ) est representado por Inf, menos infinito (- ) por inf,
NAN (not a number). Estos valores excepcionales se
encuentran a menudo a travs de clculos en MATLAB.
1.4 OPERACIONES ARITMTICAS
La aritmtica en MATLAB sigue las reglas y uso de los smbolos de la computacin
estndar para los signos de las operaciones aritmticas.
9
Smbolo
Efecto
+
*
/
^
Adicin o suma
Substraccin o resta
Multiplicacin o producto
Divisin
Potencia
Conjugada transpuesta
Constantes
pi, e
Las operaciones aritmticas con MATLAB son mucho ms potentes que stas del
ejemplo 1.5, como se ver ms adelante.
Hay algunas operaciones aritmticas que requieren gran cuidado. El orden en el cual la
multiplicacin y la divisin se especifican es especialmente importante.
Ejemplo 1.6 El orden de ejecucin de las operaciones siguen un orden estricto de
acuerdo a la prioridad establecida por MATLAB
>>a=2;
>>b=3;
>>c=4;
>>a/b*c
ans =
2.6667
Efecto
abs(x)
Valor absoluto
sqrt(x)
Raz cuadrada
sin(x)
Funcin seno
cos(x)
Funcin coseno
tan(x)
Funcin tangente
log(x)
exp(x)
Funcin exponencial
atan(x)
acos(x)
asin(x)
cosh(x)
sinh(x)
Ntese que las funciones trigonomtricas su argumento debe estar en radianes (o nmero
puro) y no en grados.
Ejemplo 1.7 Calcular cos(pi/3)
11
>> cos(pi/3)
ans =
0.5000
Como se dijo antes, las variables aparecen como escalares. De hecho, todas las variables
en MATLAB son arreglos. Un aspecto importante de MATLAB es que se trabaja muy
eficientemente con arreglos y las tareas principales son mejor trabajadas con arreglos.
1.6 VECTORES
En MATLAB la palabra vector puede ser realmente interpretada como una lista de
nmeros. Estrictamente, podra ser una lista de otros objetos no numricos, pero por
ahora, decir esto es ms que suficiente y llena las expectativas del curso.
Hay dos clases bsicas de vectores en MATLAB: vector fila y vector columna.
Los dos puntos tienen un especial y potente rol. Bsicamente, permite una forma fcil de
definir un vector de nmeros igualmente espaciados. Hay dos formas bsicas de definir
un vector en MATLAB con esta la notacin, utilizando los dos puntos.
La primera se hace con dos argumentos separados por dos puntos, como sigue:
Ejemplo 1.9 Definir un vector x con elementos igualmente espaciados por una unidad.
>> x=-2:4 %crea un vector que empieza con -2 y termina con 4 con incrementos de a 1
x=
-2
-1
La segunda es con tres argumentos separados por dos veces los dos puntos y tiene el
efecto de especificar el valor inicial : espaciamiento : valor final.
Ejemplo 1.10 Definir un vector
de 0.5
>> y=-2:0.5:4 %crea un vector que empieza con -2 y termina con 4 con incrementos de a 0.5
y=
-2.0000 -1.5000 -1.0000 -0.5000
3.0000
3.5000
0.5000
1.0000
1.5000
2.0000
2.5000
4.0000
Ejemplo 1.11 Tambin se puede utilizar la notacin con dos puntos como sigue:
>> z=x(2:6) %crea el vector z con los elementos desde x(2) hasta x(6)
z=
-1
>> w=y(2:6) %crea el vector w con los elementos desde y(2) hasta y(6)
w=
-1.5000 -1.0000 -0.5000
0.5000
MATLAB tiene otros dos comandos para definir vectores de una manera adecuada. La
primera se llama funcin linspace, que se usa para especificar un vector con un nmero
dado de elementos igualmente espaciados entre un punto inicial y un punto final.
Ejemplo 1.12 Definir un vector
elementos.
x=
1.0000
1.2500
1.5000
1.7500
2.0000
espaciados.
El otro comando es llamado funcin logspace, que es similar a la funcin linspace,
excepto que los elementos crecen igualmente espaciados en forma logartmica, y tambin
valor inicial
segn 10
valor final
y 10
elementos
>> x=logspace(1,5,5)
x=
10
100
1000
10000
100000
Ejemplo 1.14 Se pueden usar vectores con MATLAB para generar tablas de valores de
funciones.
>> x=linspace(0,1,11);%crea el vector x con 11 valores entre 0 y 1
>> y=cos(x);%crea el vector y con los 11 valores de cos(x)
>> [x',y']%escribe los dos vectores x, y como columnas
ans =
0
1.0000
0.1000
0.9950
0.2000
0.9801
0.3000
0.9553
0.4000
0.9211
0.5000
0.8776
0.6000
0.8253
0.7000
0.7648
0.8000
0.6967
0.9000
0.6216
1.0000
0.5403
14
Ntese que se utiliz el apstrofe para transponer los vectores, es decir, para convertir
las filas en columnas.
Ejemplo 1.15 Otra forma de usar los dos puntos es como sigue:
>> y=sqrt(4+2*(0:0.3:2.4)')
y=
2.0000
2.1448
2.2804
2.4083
2.5298
2.6458
2.7568
2.8636
2.9665
1.7 MATRICES
Una matriz es un arreglo bidimensional de valores numricos que obedecen las reglas del
lgebra lineal.
Para entrar una matriz, se listan todos los elementos de la matriz de la primera fila
separados por espacios en blanco o comas, separando la primera fila de la segunda por
punto y coma y as sucesivamente hasta la ltima fila, encerrando todos los elementos
con corchetes. Para entrar una matriz de 3x4 de nmeros se procede as:
Ejemplo 1.16 Definir una matriz numrica de dimensin 3x4.
>> A=[1 2 3 4;5 6 7 8;8 10 11 12]%crea la matriz A de tres filas y 4 columnas
A=
1
10
11
12
ans =
1
2
3
Ejemplo 1.18 Los elementos de las matrices se pueden manipular de muchas maneras.
>> A
A=
1
10
11
12
10
11
>> A([1:3],[1:3])
ans =
1
10
11
>> x(4)=[ ]
x=
1
>> A(:,1)=[ ]
A=
2
10
11
12
Ejemplo 1.21 Para intercambiar dos filas de una matriz A, se digita el siguiente script:
>> B=A([3 2 1])
B=
10
11
12
10
11
12
>> A
A=
Ejemplo 1.22 Para cambiar la segunda fila de una matriz A de 3x3 a [2 2 2], se ejecuta el
siguiente script:
>> A=[1 2 3;4 5 6;7 8 9]
A=
1
9
17
>> A(2,:)=[2 2 2]
A=
1
Ejemplo 1.23
ejecuta el siguiente script:
se
>> A(:,2)=[1 1 1]
A=
1
A=
0
0
18
>> A=ones(3)
A=
1
>> A=ones(2,3)'
A=
1
>> I5=eye(5)
I5 =
1
1
19
Ejemplo 1.28 Para extraer la diagonal de una matriz almacenada en memoria, se usa el
nombre de la funcin diag, pero poniendo como entrada una matriz y presentando como
salida alternativa un vector.
>> A=diag([1 2 3])
A=
1
>> u=diag(A)
u=
1
2
3
Ejemplo 1.29 Crear la funcin length y la funcin size, la cual se usa para determinar el
nmero de elementos de un vector o una matriz. Estas funciones son muy tiles cuando
20
10
Ejemplo 1.30 Ahora se define el comando size, el cual retorna dos valores,
correspondientes a las filas y columnas de la matriz en cuestin, donde el primer nmero
corresponde a las filas y el segundo a las columnas.
>> A=[1 2 3 4;5 6 7 8]
A=
1
>> size(A)
ans =
2
>> size(A')
ans =
4
Ejemplo 1.31 Crear la matriz de races cuadradas de una matriz A, usando la funcin sqrt
para obtener una matriz B cuyos elementos son las races cuadradas de los elementos de
la matriz A.
>> A
A=
1
>> B=sqrt(A)
B=
21
1.0000
1.4142
1.7321
2.0000
2.2361
2.4495
2.6458
2.8284
Ejemplo 1.32 Crear una matriz triangular superior de una matriz dada A, usando la
funcin triu
>> A=[1 2 3;4 5 6;7 8 9]
A=
1
>> U=triu(A)
U=
1
>> U=triu(A,1)
U=
0
>> U=triu(A,2)
U=
0
Ejemplo 1.33 Crear una matriz triangular inferior, usando la funcin tril
>> U=tril(A)
U=
1
0
22
>> U=tril(A,-1)
U=
0
>> U=tril(A,-2)
U=
0
Ejemplo 1.34 Crear una matriz aleatoria nxn usando la funcin rand
>> R=rand(3) %siempre va a salir una matriz diferente por ser aleatoria
R=
0.8147
0.9134
0.2785
0.9058
0.6324
0.5469
0.1270
0.0975
0.9575
>> R=rand(2) %siempre va a salir una matriz diferente por ser aleatoria
R=
0.9649
0.9706
0.1576
0.9572
-1
-2
>> B=[0 1 0 1; 2 -1 -4 3; 2 1 4 1]
B=
0
2 -1
-4
1
3
>> A+B
ans =
-1
-3
-1
-1
-1
-1
-1
-1
1 -1
>> A-B
ans =
>> 2*A-3*B
ans =
-2
10
-3
-4
-1 20
-5
-4
-6
>> B=B' %
B=
0
-1
-4
>> B*A %
a.
ans =
24
14
12
-1
16 -4
-2
20 10
20
-6
18
20
0.7500
>> c=a.*b
c=
2
-2
12
>> c=a.^2
c=
1
>> c=a.^a
c=
1
27
>> c=a.^b
c=
1.0000
0.5000 81.0000
>> B=B'
B=
0
1
25
2 -1
2
-4
>> C=A.*B
C=
0
2 -16
12
>> C=C.^(1/2)
C=
0
1.4142
1.4142
1.4142
1.4142
1.4142
3.4641
2.0000
Ejemplo 1.38 Las matrices tipo string tambin pueden ser creadas como sigue:
>> nombres=['Hector';'Pabon '] %las dos cadenas deben ser de la misma longitud, o completarse
con blancos
26
nombres =
Hector
Pabon
Ejemplo 1.39 La funcin disp toma nicamente un argumento, el cual puede ser ambos, o
una matriz de caracteres o una matriz numrica.
>> x=0:0.5:2*pi;
>> y=cos(x);
>> disp([x' y'])
0
1.0000
0.5000
0.8776
1.0000
0.5403
1.5000
0.0707
2.0000 -0.4161
2.5000 -0.8011
3.0000 -0.9900
3.5000 -0.9365
4.0000 -0.6536
4.5000 -0.2108
5.0000
0.2837
5.5000
0.7087
6.0000
0.9602
Ejemplo 1.41 La funcin fprintf tiene especificaciones del nmero de dgitos en el display
27
>> A=[1 1 1;2 3 1;1 -1 -2]; %matriz de los coeficientes de las variables
>> b=[2;3;-6]; %matriz de los terminos independientes
>> x=A\b
x=
-1
1
2
Ejemplo 1.46 Encontrar la inversa de una matriz A no singular, usando la funcin inv.
>> format rat %formato de la forma p/q
>> inv(A)
ans =
-1/5
2/5
-1
3/5
-1/5
-2/5
-1/5
-1
-2
-6
1
0
0
0
1
0
0
0
1
-1
1
2
1/5
1/2
0
29
U=
2
-5/2
-5/2
>> L*U
ans =
1
-1
-2
-1
-2
>> A
A=
Las races de un polinomio p(x) se pueden hallar utilizando la funcin roots, como
roots(p).
Ejemplo 1.49 Hallar las races del polinomio p(x) = 3x2 + 5x -6
>> p=[3 5 -6];
>> r=roots(p)
r=
-2.4748
0.8081
2x + 12, en el punto
Por defecto, la funcin plot conecta los puntos por medio de segmentos de lnea slida.
Otras posibilidades que se pueden usar para cambiar la apariencia de la grfica son:
>> plot(x,y,'o'),grid
>> plot(x,y,'*'),grid
>> plot(x,y,'x'),grid
>> plot(x,y,'.'),grid
>> plot(x,y,'+'),grid
31
>> plot(x,y,'-'),grid
>> plot(x,y,'.-'),grid
>> plot(x,y,'o-'),grid
>> x=-2:0.1:2;% crea una malla para los ejes x , y
>> y=x;
>> [X,Y]=meshgrid(x,y);
>> Z= -3*X+Y;
>> mesh(X,Y,Z)
evita la divisi
>> Z=sin(R)./R;
>> surf(X,Y,Z)
32
en el dominio de -
1.13 SUBPLOT
Muchas veces es conveniente colocar ms de una figura en una misma ventana. Esto es
posible con el comando grfico llamado funcin subplot, lo cual se puede hacer como se
muestra a continuacin:
Ejemplo 1.53
>> x=-2:0.1:2;
>> y=x;
>> [X,Y]=meshgrid(x,y);
>> Z=2+(X.^2+Y.^2);
>> subplot(2,2,1); mesh(x,y,Z); title('meshplot');
>> subplot(2,2,2); surf(x,y,Z); title('surfplot');
>> subplot(2,2,3); surfc(x,y,Z); title('surfcplot');
>> subplot(2,2,4); surfl(x,y,Z); title('surflplot');
FIGURA 1.4 Varios grficos en una misma ventana utilizando la funcin subplot
33
>> x=linspace(-2*pi,2*pi);
>> subplot(2,2,1);
>> plot(x,cos(x));axis([-6.5 6.5 -1.2 1.2]); title('cos(x)')
>> subplot(2,2,2);
>> plot(x,cos(2*x));axis([-6.5 6.5 -1.2 1.2]); title('cos(2x)')
>> subplot(2,2,3);
>> plot(x,cos(3*x));axis([-6.5 6.5 -1.2 1.2]); title('cos(3x)')
>> subplot(2,2,4);
>> plot(x,cos(4*x));axis([-6.5 6.5 -1.2 1.2]); title('cos(4x)')
FIGURA 1.5 Varios grficos en una misma ventana utilizando la funcin subplot
34
1.0000
0.2000
0.8246
0.4000
0.7399
0.6000
0.8353
0.8000
1.1673
1.0000
1.7183
1.2000
2.4404
1.4000
3.3073
1.6000
4.3251
1.8000
5.5227
2.0000
6.9446
35
36
2x/(1 + x3)
2. PROBABILIDAD
2.1 INTRODUCCIN
La probabilidad est asociada con muchas tendencias en eventos aleatorios naturales
que siguen una cierta regularidad si el proceso se repite un suficiente nmero de veces.
Por ejemplo, se puede considerar el evento del lanzamiento de una moneda no cargada.
Si el experimento se repite un nmero suficiente de veces, en forma continua en un gran
nmero de ensayos, se puede esperar que se logren el mismo nmero de caras que de
sellos. Intuitivamente se puede decir que la probabilidad de obtener una cara es la misma
que la de obtener un sello en una moneda justa (no cargada) y que sta es de 0.5 o del
50%.
2.2 ESPACIO MUESTRAL
Al conjunto de todos los resultados posibles de un experimento estadstico se le llama
espacio muestral y generalmente se representa con la letra S.
A cada resultado en un espacio muestral se llama elemento o punto del espacio muestral.
Por ejemplo, al lanzar una moneda el conjunto muestral S est conformado por dos
elementos: cara y sello.
Ejemplo 2.1 En un experimento de lanzar un dado cbico (seis caras) el espacio muestral
est conformado por los puntos muestrales: S = {1, 2, 3, 4, 5, 6}
2.3 EVENTO
En cualquier experimento el hecho de que ocurra cierta circunstancia se llama evento, por
ejemplo al lanzar un dado corriente, un evento puede ser el hecho de obtener un nmero
par, en cuyo caso est conformado por tres puntos muestrales: A = {2, 4, 6}
Matemticamente se puede definir un evento A como un subconjunto de un espacio
muestral S.
Tambin se puede definir el complemento de un evento A con respecto a S como el
conjunto de todos los elementos de S que no pertenecen a A y se denota como: A .
En el ejemplo 2.1, el complemento est conformado por A = {1, 3, 5}
La interseccin de dos eventos A1 y A2, se representa con los smbolos A1 A2, y es el
evento que contiene todos los elementos comunes que pertenecen a A1 y A2.
Dos eventos A1 y A2 son mutuamente excluyentes o disyuntos si A1 A2 = , es decir,
cuando no hay puntos muestrales comunes.
37
A2
A1
A2
A1
4
38
>> c4=combnk(v,4)
c4 =
1
ans =
2
k)
= 1,
(4)
Ejemplo 2.3 Se lanza un dado (cbico) una vez, Cul es la probabilidad de que caiga un
nmero par?
Solucin. El espacio muestral para este experimento es: S = {1, 2, 3, 4, 5, 6}. A
representa el evento de que caiga un nmero par, A = {2, 4, 6}, entonces la probabilidad
de A es, P(A)=nmero de casos favorables/nmero de casos posibles = n/N = 3/6 = 0.5 =
50%.
Si A1 y A2 son dos eventos cualesquiera se tiene que:
P(A1 U A2) = P(A1) + P(A2)
P(A1
A2)
(5)
(6)
(7)
(8)
(9)
ESTUDIANTES DE
ESTUDIANTES DE
TOTAL
70
90
160
80
60
140
150
150
300
HOMBRES
MUJERES
TOTAL
I) = 70/300 = 7/30
P(H | I) =
I) = 70/160 =
P(A1|A2) = P(A1)
(10)
ccc
ccs
csc
scc
ssc
scs
css
sss
1
2
3
Se ve en la figura 2.2 que, la variable aleatoria X tiene como elementos X={0, 1, 2, 3}. Si
un espacio muestral S posee un nmero finito de posibilidades o un nmero infinito con
tantos elementos como nmeros enteros positivos existen, se llama entonces, espacio
muestral discreto.
Si el anterior no fuese el caso, es decir, si S contiene un nmero infinito de posibilidades
con tantos elementos como nmeros reales existen en un segmento de lnea, se llama
espacio muestral continuo.
2.9 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
El conjunto de parejas ordenadas (x, f(x)) es una funcin de probabilidad o distribucin de
probabilidad de la variable aleatoria X, si se cumple que para cada valor posible de x:
f(x)
=1
P(X = x) = f(x)
43
44
(12)
Una funcin f(x) es una funcin de densidad de probabilidad para la variable aleatoria
continua X, definida en el conjunto de los , si cumple las siguientes condiciones:
f(x)
0, para cada x
=1
45
La distribucin acumulada F(x) de una VAC X (variable aleatoria continua X) con funcin
de densidad f(x) es:
para - < x <
(13)
(14)
-1 < x < 2
f(x) =
0,
Hallar:
a) P(-1 < X < 2);
b) P(-1 < X < 1);
c) P(1 < X 2)
Solucin. Se utiliza el mtodo de Simpson para calcular la integral de f(x), como ya se
defini anteriormente.
function SN=simpsonR(fn,a,b,n)
%Regla trapezoidal compuesta
h=(b-a)/n;
s=(feval(fn,a)+feval(fn,b));
for k=1:2:n-1
s=s+4*feval(fn,a+k*h);
end;
for k=2:2:n-2
s=s+2*feval(fn,a+k*h);
function y=fn(x)
y=(1/3)*x.^2;
a)>> simpsonR('fn',-1,2,10)
ans =
1
b)>> simpsonR('fn',-1,1,10)
46
ans =
0.2222
c)>> simpsonR('fn',1,2,10)
ans =
0.7778
; para X discreta
; para X continua
(15)
(16)
Ejemplo 2.12. Al lanzar un dado (cbico), la VAD se anota en la siguiente tabla, lo mismo
que sus valores de probabilidad:
X
P(X = x)
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
2
1/6
4
1/6
6
1/6
8
1/6
10
1/6
12
1/6
3).
3) = E(X)
47
E(3) = 3.5
E(c) = c
E(cX) = cE(X)
E(X + c) = E(X) + c
E(X + Y) = E(X) + E(Y)
E(aX + bY) = aE(X) + bE(Y)
Ejemplo 2.15 Sea X la VAC que define la vida en horas de cierta bombilla domstica. La
funcin de densidad de probabilidad es:
,
x > 100
f(x) =
0,
= E(X) =
=
= -20000(1/x)|
= 200 horas
Como se ve, f(x) cumple con la condicin para la cual el rea bajo la curva es 1.
function y=fn(x)
>> SN=simpsonR('fn',100,100000,1000000)
SN =
199.8
Que es aproximadamente 200 horas como se calcul manualmente para esta integral
definida que es realmente fcil de calcular.
2.12 VARIANZA
48
= E[(X - )2] =
(18)
= 1.7078
1<x<2
f(x) =
0,
= E(X) =
E(X2) =
= 2[
] = 5/3
= 17/6
Por tanto, teniendo en cuenta que la varianza tambin se puede escribir como:
2
Se obtiene: 17/8
(5/3)2 = 17/6
= E(X2) -
25/9 = 1/18
49
(19)
function y=fn(x)
y=2*(x 1);
----------------------------->> SN=simpsonR('fn',1,2,10)
SN =
1
Ahora se calcula
function y=fn(x)
y=2*(x*(x 1));
>> SN=simpsonR('fn',1,2,10)
SN =
5/3
px qn-x
x,
(20)
>> p=binocdf(2,10,1/7)
p=
0.8384
Ejemplo 2.20 Encontrar la probabilidad de que diez personas que se encuentran en una
reunin un sbado, por lo menos 2 hayan nacido en este mismo da de la semana.
Solucin. Se tiene que p = 1/7, q = 6/7, x = 2, 3, 4, 5, 6, 7, 8, 9, 10.
>> p = 1-binocdf(1,10,1/7) %se calcula la probabilidad complementaria
p=
0.4292
O tambin utilizando la forma larga que es poco funcional, pero que sirve como prueba:
>> y = binopdf(2,10,1/7) + binopdf(3,10,1/7) + binopdf(4,10,1/7) + binopdf(5,10,1/7) +
binopdf(6,10,1/7) + binopdf(7,10,1/7) + binopdf(8,10,1/7) + binopdf(9,10,1/7) + binopdf(10,10,1/7)
y=
0.4292
Ejemplo 2.21 De 100 monedas que son extradas de una alcanca y puestas sobre una
mesa, Cul es la probabilidad de que entre 50 y 70 monedas inclusive se encuentren
mostrando cara?
Solucin.
>> p=binocdf(70,100,0.5)- binocdf(49,100,0.5) %se supone p=0.5
p=
0.5398
= np
= npq
(21)
h(x, m, n, k) =
(22)
b)
5)
/ k!
(23)
= np, k = nmero de
>> p0=poisspdf(0,2)
p0 =
0.1353
>> p1=poisspdf(1,2)
p1 =
0.2707
>> p2=poisspdf(2,2)
p2 =
0.2707
>> p3=poisspdf(3,2)
p3 =
0.1804
>> p4=poisspdf(4,2)
p4 =
0.0902
>> p5=poisspdf(5,2)
p5 =
0.0361
54
=2y k
>> p6=poisspdf(6,2)
p6 =
0.0120
>> p7=poisspdf(7,2)
p7 =
0.0034
>> p8=poisspdf(8,2)
p8 = 8.5927e-004
>> p9=poisspdf(9,2)
p9 = 1.9095e-004
>> p10=poisspdf(10,2)
p10 = 3.8190e-005
>> k=0:10
k=
10
= np = 20000(1/10000) = 2
a) Exactamente 5 personas
>> p=poisspdf(5,2)
p=
0.0361
>> p=poisscdf(5,2)
p=
0.9834
0.9834
= 4;
>> p4=poisspdf(6,4)
p4 =
0.1042
e-(x-
)/2
(24)
= 25, y,
y desviacin
=3
>> y=normcdf(20,25,3)
y=
0.0478
56
=0y
=1
>> nu=0;
>> ro=1;
>> x=linspace(-2.5,2.5,100);
>> y=(1/(sqrt(2*pi)*ro)*exp(-(x-nu).^2)/2*ro^2);
>> plot(x,y)
Una variable aleatoria continua (VAC) X que tiene su grfica en forma de campana como
la figura 2.6 se llama variable aleatoria normal (VAN).
La funcin matemtica correspondiente a la figura 2.6 con
f(x) =
f(x) depende de dos parmetros:
=1y
= 0, es:
e-(x-
)/2
(25)
>> nu=-3;sigma=2;
>> y1=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> nu=0;sigma=2;
>> y2=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> nu=3;sigma=2;
>> y3=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> plot(x,y1,x,y2,x,y3)
57
= -3,
=0y
=3y
constante
>> nu=0;sigma=1;
>> x=linspace(-2.5,2.5,100);
>> y1=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> nu=0;sigma=2;
>> y2=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> nu=0;sigma=4;
>> y3=(1/(sqrt(2*pi)*sigma)*exp(-(x-nu).^2)/2*sigma^2);
>> plot(x,y1,x,y2,x,y3)
Ejemplo 2.27 Para una distribucin binomial con n = 5 y p = 0.5 calcular la distribucin de
probabilidades para la variable aleatoria X.
58
Solucin.
>> x=0:5
x=
>> p=binopdf(0:5,5,0.5)
p=
0.0313
0.1562
0.3125
0.3125
0.1562
0.0313
>> bar(x,p)
Ejemplo 2.28 Para una distribucin binomial con n = 10 y p = 0.3 calcular la distribucin
de probabilidades para la variable aleatoria X.
Solucin.
FIGURA 2.10 Histograma del ejemplo 2.28
>> x=0:10
59
x=
0
10
>> p=binopdf(0:10,10,0.3)
p=
0.0282
0.2001
0.1029
0.0368
0.0000
>> bar(x,p,'r')
= np = 9(0.5) = 4.5;
= 1.5
>> p=binopdf(4,9,0.5)+binopdf(5,9,0.5)+binopdf(6,9,0.5)
cuadro a cuadro
p=
0.6563
>> p=binocdf(6.5,9,0.5)-binocdf(3.5,9,0.5)
p=
0.6562
Z = (x - )/
60
es 1
y=
0.8767
Solucin.
a) Probabilidad de que un estudiante tenga una estatura superior a 172 cm.
>> y=1-normcdf(172,170,4)
y=
0.3085
61
En trminos de porcentaje, el 49.38% de los estudiantes miden entre 160 cm y 170 cm.
Ejemplo 2.34 En una distribucin binomial de frecuencias, donde p = 0.2, encontrar la
probabilidad de obtener al menos 10 xitos en 50 experimentos.
Solucin. p = 0.2; q =0.8; n =50;
= np = 50(0.2) = 10;
>> yc=normcdf(10.5,10,2.8284)%c
=2.8284
normal
yc =
0.5702
>> yc=binocdf(10,50,0.2)%c
yc =
0.5836
Ejemplo 2.36 Se analiz una muestra de cinco bebidas gaseosas de un mismo sabor y
una misma marca y se encontr que su contenido de agua era, en mililitros: 20, 19, 22,
18, 22. Obtener el intervalo de confianza al 0.95, para estimar el contenido medio de agua
de todas las gaseosas de este tipo.
Solucin.
>> [mediamuestral,destipicamuestral,interconfianza]=normfit(x,0.05)
mediamuestral =
20.2000
destipicamuestral =
1.7889
interconfianza =
17.9788
22.4212
1.9600
63
2.3263
1.2816
/2
e-x/2, x > 0;
(26)
es un entero positivo.
>> x=2;
>> p=chi2cdf(x,v) %calcula la probabilidad acumulada de chi-cuadrado con x=2 y =3 grados de
libertad
p=
0.4276
>> x=chi2inv(p,v) %calcula el valor de x con la probabilidad calculada p, y 3 grados de libertad
x=
2.0000
son:
= ,y
=2
65
h(t) =
FIGURA 2.13
(27)
de
libertad
>> x=-5:0.1:5;
>> t1=tpdf(x,1);
>> t2=tpdf(x,2);
>> t3=tpdf(x,5);
66
>> t4=tpdf(x,100);
>> plot(x,t1,x,t2,x,t3,x,t4)
>> x=0:0.01:4;
>> y1=fpdf(0:0.01:4,8,12);
>> y2=fpdf(0:0.01:4,12,24);
>> plot(x,y1,x,y2)
La distribucin F se utiliza para el caso de dos muestras para obtener inferencias acerca
de las varianzas de poblacin. A menudo se encuentra la situacin en que se requiere la
comparacin entre dos varianzas de poblacin; es decir, determinar si la variabilidad de
una poblacin difiere de la otra. La distribucin F se utiliza para estos casos. Este tema se
tratar ms adelante, cuando se trabaje inferencia estadstica.
67
68
3. ANLISIS ESTADSTICO
3.1 ESTADSTICA DESCRIPTIVA
Una de las etapas ms importantes en el proceso de investigacin se relaciona con la
sistematizacin y anlisis de la informacin y se denomina esta etapa como anlisis
estadstico de la informacin, y es una disciplina que se define como la ciencia de la
recoleccin, anlisis, interpretacin y presentacin de informacin que puede expresarse
en forma numrica3.
Dada una serie de datos, se puede dibujar un histograma y calcular las medidas de
tendencia central: media, mediana, moda, media geomtrica, media armnica y las
medidas de dispersin como: rango, varianza, desviacin estndar, desviacin media,
etc4.
La estadstica como disciplina no debe confundirse con el concepto de
estadstica, se refiere pues a algunas medidas calculadas con respecto a una muestra
como la media aritmtica muestral o la desviacin estndar muestral.
La primera es el proceso necesario para manejar y analizar informacin (data) con el fin
de apoyar de manera sistemtica al investigador, para que identifique las leyes que guan
o regulan los fenmenos o problemas estudiados. Una estadstica es una caracterstica o
un resultado numrico a partir de una muestra de elementos. Relacionado con el
concepto de una estadstica se encuentra el de parmetro (poblacional), que es el valor
de una caracterstica de una poblacin total o Universo y ya no de una muestra de la
misma5.
La muestra se refiere a un subconjunto de elementos tomados del universo o poblacin
que a su vez incluye a todos los elementos6.
Ejemplo 3.1 Dados los siguientes datos de notas de un grupo de 10 estudiantes en
determinada asignatura, hallar la tabla de frecuencia absoluta y la frecuencia en
porcentajes.
Solucin.
>> x=[4.5 3.0 3.0 4.0 2.5 5.0 3.5 4.0 3.5 3.5];%data
69
3.0000
3.0000
3.5000
3.5000
3.5000
4.0000
4.0000
4.5000
5.0000
>> tabla=tabulate(x)
tabla =
2.5000
1.0000 10.0000
3.0000
2.0000 20.0000
3.5000
3.0000 30.0000
4.0000
2.0000 20.0000
4.5000
1.0000 10.0000
5.0000
1.0000 10.0000
>> tabulate(x)
Value Count Percent
2.5
10.00%
20.00%
3.5
30.00%
20.00%
4.5
10.00%
10.00%
Ejemplo 3.2 Dada la siguiente serie de datos, calcular las medidas de tendencia central y
de dispersin, adems hacer la representacin de datos agrupados.
Dado un examen de matemticas de 60 estudiantes de dos cursos paralelos de la misma
asignatura, obtuvieron las siguientes calificaciones:
40, 33, 28, 25, 11, 21, 22, 17, 22, 19, 17, 16, 28, 26, 20, 15, 21, 20, 19, 24, 10, 29, 23, 34,
24, 33, 26, 14, 13, 18, 28, 23, 28, 21, 29, 24, 11, 31, 25, 18, 25, 26, 20, 34, 22,30, 27, 32,
35, 39, 18, 29, 16, 37, 28, 29, 10, 34, 29, 38
Solucin.
function d=dataset11
d=[40 33 28 25 11 21 22 17 22 19 17 16 28 26 20 15 21 20 19 24 10 29 23
34 24 33 26 14 13 18 28 23 28 21 29 24 11 31 25 18 25 26 20 34 22 30 27
32 35 39 18 29 16 37 28 29 10 34 29 38];
70
>>data=dataset11;
>> max(data)
de data
ans =
40
>> min(data)
de data
ans =
10
>> sum(data) %obtiene la suma de todos los elementos del vector data
ans =
1464
>> data=sort(data) % ordena
en forma ascendente
data =
Columns 1 through 34
10 10
11
11
13
14
15
21
22
22
22
23
23
24
24
28
29
29
29
21
16 16
17
17
18
24
25
25
18
25
18
26
19
26
19
20 20
20
21
34
34
35
26
Columns 37 through 60
27
28
28
28
37
38
39
40
28
29
29
>> tabulate(data)
Value Count Percent
10
3.33%
11
3.33%
12
0.00%
13
1.67%
14
1.67%
15
1.67%
16
3.33%
17
3.33%
18
5.00%
19
3.33%
20
5.00%
71
30
31
32
33
33
34
21
5.00%
22
5.00%
23
3.33%
24
5.00%
25
5.00%
26
5.00%
27
1.67%
28
8.33%
29
8.33%
30
1.67%
31
1.67%
32
1.67%
33
3.33%
34
5.00%
35
1.67%
36
0.00%
37
1.67%
38
1.67%
39
1.67%
40
1.67%
Clase 1
Clase 2
Clase 3
Clase 4
Clase 5
Clase 6
Intervalos
Frecuencia
10-15
7
16-20
12
21-25
14
26-30
15
31-35
8
36-40
4
72
Cdigo:
Cdigo:
Cdigo:
Cdigo:
73
FIGURA 3.6 Histograma de nueve clases, distribucin acumulada de los datos dataset10
xmedian =
24.5000
>> xgeomed=geomean(data)%calcula la media geom trica
xgeomed =
23.1568
>> xarmedia=harmmean(data) %calcula la media arm nica
xarmedia =
21.7846
>> xmoda=mode(data)
moda =
28
Media
Aritmtica
Mediana
Media
Geomtrica
Media
Armnica
Posicin de la
mediana:
Moda
Md = xi
Si ni = Max{ fj }
j
ATLAB.
55.0400
>> riq=iqr(data) %rango intercuart lico q3-q1
riq =
10
Desviacin Media
Absoluta
Cuasivarianza
Varianza
Desviacin Estndar
Muestral
Fuente: http://es.wikipedia.org/wiki/Dispersi%C3%B3n_(matem%C3%A1ticas)
Ejemplo 3.3 Con el mismo vector de datos, calcular: rango intercuartlico, cuartiles 1, 2 y
3, percentiles 10, 25, 50 y 80, coeficiente de asimetra, kurtosis, momento de orden 2
centrado en el origen, e interpretar los resultados.
Solucin.
>> q1=quantile(data, 0.25)% calcula el cuartil 1
q1 =
19
76
El cuartil 1, indica que una cuarta parte de los estudiantes tienen notas por debajo de 19
El cuartil 2, indica que la mitad de los estudiantes tienen notas por debajo de 24.5. Ntese
que el cuartil dos, corresponde a la mediana.
El cuartil 3, muestra que las tres cuartas partes de los estudiantes tienen notas por debajo
de 29.
El rango intercuartlico corresponde a la diferencia entre el cuartil 3 y el cuartil 1, o sea, el
50% de estudiantes estn en ese rango, entre 19 y 29.
>> percentiles=prctile(data, [10 20 25 50 75 90]) %calcula los percentiles 10, 20, 25, 50, 75, y 90
percentiles =
14.5000 18.0000 19.0000 24.5000 29.0000 34.0000
77
CHAO L. Lincoln. Estadstica para las ciencias administrativas. McGraw Hill Latinoamericana. Bogot, 1993. pp. 64-65
78
Fuente: http://www.tuveras.com/estadistica/estadistica02.htm
Mesocrtica
Platicrtica
79
http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/parametros_est.htm
80
ymedia =
34.0500
>> CV1=std(x)/mean(x)
CV1 =
0.2243
>> CV2=std(y)/mean(y)
CV2 =
0.2296
81
4. TEORA DE MUESTREO
Tanto en las ciencias exactas como en las ciencias sociales, la mayora del conocimiento
existente se debe a experiencias basadas en inferencias a partir de la observacin y del
anlisis de un nmero limitado de eventos.10
De la calidad y representatividad que ese nmero limitado de eventos (muestra) tenga,
depender la bondad o el defecto (la precisin o el error) del conocimiento generado y,
precisamente por esto, es relevante identificar cmo se debe seleccionar una buena
muestra11.
El primer paso para lograrlo, es tener claridad de que un muestreo es un proceso por
medio del cual se seleccionan probabilsticamente elementos de un universo o poblacin
con la finalidad de estimar, con un determinado grado de precisin, algunas
caractersticas de la poblacin en su totalidad12.
De manera que, la lgica del muestreo consiste en estimar parmetros de la poblacin a
partir de estadsticos obtenidos de una muestra, aun cuando nunca se pueda afirmar con
absoluta seguridad cules son esos parmetros. Esto, que aparentemente es un
problema, realmente no lo es, ya que en la prctica lo importante es asegurar que el
parmetro se encuentre dentro de cierto rango y esto lo permite la denominada teora de
la estimacin que identifica la precisin de las estimaciones; es decir, identifica la
probabilidad de que el valor real del parmetro se encuentre dentro de unos lmites
especificados13.
Es necesario es entender que la teora del muestreo permite estimar tamaos adecuados
de muestra, indispensables para obtener una estimacin con cierto grado de precisin.
Para lograrlo, es necesario definir qu es un intervalo de confianza, qu es un grado de
de significancia y qu es una distribucin muestral.
El grado de confianza se refiere a la probabilidad de que el valor real de un parmetro, se
encuentre dentro de los lmites especificados en la estimacin que se quiere calcular14.
El intervalo de confianza corresponde a un intervalo de valores, dentro de los cuales se espera que
est el parmetro con cierto grado de confianza o con riesgo de error conocido; para ello es
necesario determinar primero la estimacin puntual.
10
VLEZ, Eduardo B. El Anlisis de la Informacin. ICFES, Mdulo 4. Serie Aprender a Investigar. Bogot D.C. 1990. pp.
80.
11
Ibid. pp. 80
12
Ibid. pp. 81
13
Ibid. pp. 81
14
Ibid. pp. 81
82
en la ecuacin se tiene:
x - 1.96
15
83
SINTAXIS MATLAB
normfit19
[muhat,sigmahat] = normfit(data)
[muhat,sigmahat,muci,sigmaci] = normfit(data)
[muhat,sigmahat,muci,sigmaci] = normfit(data,alpha)
[...] = normfit(data,alpha,censoring)
[...] = normfit(data,alpha,censoring,freq)
[...] = normfit(data,alpha,censoring,freq,options
Descripcin
>>[muhat,sigmahat] = normfit(data) %devuelve el estimativo de la media
s estimados de la m
s arreglos
confianza para , la segunda fila contiene las cotas superiores. La primera fila de
contiene las cotas inferiores de los intervalos de confianza para , y la segunda fila contiene las
cotas superiores.
>>[muhat,sigmahat,muci,sigmaci] = normfit(datos,alpha) % devuelve el intervalo de confianza al
100(1 - alfa)%
18
http://www.scribd.com/doc/15268123/Conceptos-Basicos-de-Estadistica-I
1984-2008 The MathWorks, Inc. MATLAB
19
84
especificando el ancho del intervalo de confianza. Por defecto, alfa es 0.05, lo cual corresponde
a un intervalo de confianza del 95%.
Ejemplo 4.1 El contenido de siete contenedores similares de un cido son 9.8, 10.2 10.4,
9.8, 10, 10.2, 9.6 litros. Encuentre el intervalo de confianza del 95% para la media de
todos los contenedores si se supone que la distribucin es aproximadamente normal.
Solucin.
>> x=[9.8, 10.2 10.4, 9.8, 10, 10.2, 9.6 ]; %datos
>>alfa=0.05 %alfa por defecto es 0.05
>>[muhat,sigmahat,muci]=normfit(x,alfa) %
n-1
muhat =
10
sigmahat =
0.2828
muci =
9.7384
10.2616
< 10.2616
o
o
Ho :
Ha :
=
>
o
o
Ho :
Ha :
=
<
o
o
20
21
http://www.mitecnologico.com/Main/InferenciaEstadistica
86
SINTAXIS MATLAB
ttest
22
h = ttest(x)
h = ttest(x,m)
h = ttest(x,y)
h = ttest(...,alfa)
h = ttest(...,alfa,tail)
h = ttest(...,alfa,tail,dim)
[h,p] = ttest(...)
[h,p,ci] = ttest(...)
[h,p,ci,stats] = ttest(...)
Descripcin
>>h =ttest(x) %
varianza desconocida, frente a la
h = 0, indica un
error al rechazar la h
h=ttest(x,m)
y varianza desconocida, frente a la
alternativa de que la media no sea
h=ttest(x,y)
es la diferencia x-
22
,alfa,tail)
87
,alfa,cola,dim)
de variables. Usar [] para pasar por defecto valores predeterminados para m, alfa, o tail.
[h,p] = ttest
o la
t=
Donde
m) es la media poblacional hipottica, s es la desviacin
estndar muestral, y n es el tamao de la muestra. Bajo la hiptesis nula, la prueba estadstica
tendr una distribucin t de Student con n - 1 grados de libertad.
[h,p,ci]=ttest(...) % retorna un intervalo de confianza de 100*(1
1.1724
Ha
45.425 Km/galn
>
<
0
0
Salida:
Si h = 0, entonces se acepta la hiptesis nula.
Si h = 1, entonces se rechaza la hiptesis nula.
ci : intervalo de confianza
sig : significancia
>> x= [45.425 41.640 37.854 39.747 43.532 41.640 47.318 37.854 39.747];
h=
1
sig =
0.0085
ci =
37.9730 45.3064
h = 1, significa que debe rechazarse la hiptesis nula, es decir, que lo que afirma el
vendedor no es creble bajo una certeza del 99%
sig = 0.0085 es menor que 0.01 o 1% , luego se rechaza la hiptesis nula.
ci = [37.9730 Km/galn , 45.3064 Km/galn] es el intervalo en el que puede
desempearse el carro, respecto al kilometraje que afirma el vendedor del automvil XW,
con una significancia del 1%
Como la media poblacional es 45.425 km, no cae dentro del intervalo de confianza 0.99
= 99% = (1- ), es as que se rechaza la hiptesis nula.
90
Ejemplo 4.3 Probar la hiptesis de que la distancia media requerida para poder frenar un
automvil que va a 20 Km/h es de 25 metros. Con base en una muestra de 100
conductores se obtiene que la distancia media es 27.3 metros, con una desviacin
estndar de s = 2.1 metros. Utilizar un nivel de significacin de 5%.
Solucin.
Entrada:
x: vector de 100 distancias con media 27.3
= 0.05
s = 2.5761
m = 25
Ho : = 25
Ha :
25
function d=dataset12
d=[30 30 28 26 26 24 22 30 31 29 29 26 28 26 30 25 31 30 29 26 30 29 23 34 24 30 26 24 23 28
28 23 28 31 27 24 31 28 25 28 25 26 30 24 27 30 27 32 35 29 28 29 26 27 28 29 30 24 29 28 25
24 26 30 29 28 24 28 30 23 26 27 25 24 27 29 30 24 25 28 28 28 30 26 27 25 24 25 31 26 24 30
27 28 25 26 24 27 26 28];
>> data=dataset12;
>> sigma=2.1;
>> alfa=0.05;
>> m=25;
Salida:
>> h = ztest(data,m,sigma,alfa,'both')
h=
1
Como h = 1, se rechaza la hiptesis nula, es decir, que la distancia media requerida para
frenar es diferente de 25 metros, a un nivel de significancia del 5%.
SINTAXIS MATLAB
ztest
23
23
91
h = ztest(x,m,sigma)
h = ztest(...,alpha)
h = ztest(...,alpha,tail)
h = ztest(...,alpha,tail,dim)
[h,p] = ztest(...)
[h,p,ci] = ztest(...)
[h,p,ci,zval] = ztest(...)
Descripcin
h = ztest(x,m,sigma)
Ejecuta una prueba de hiptesis z (normal), donde la data proviene de una distribucin con
media m, y que devuelve el resultado de la prueba en trminos de h. Cuando h = 0 indica que la
m
5%. Los datos se supone que provienen de una distribucin normal con desviacin estndar
sigma.
h=ztest(...,alpha) %Ejecuta una prueba de nivel de significancia del (100*alfa)%. Por defecto,
cuando no se especifica alfa da por sentado que alfa es 5% o 0.05.
h=ztest(...,alpha,tail) %Ejecuta la prueba contra la alternativa especificada por la string
Hay tres opciones para la string tail
both
especifica.
z=
Donde
es la media muestral,
es la media poblacional hipottica,
es la desviacin
estndar, y n es el tamao de la muestra. Bajo la hiptesis nula, la prueba estadstica tendr una
distribucin normal estandarizada N(0,1).
92
Ejemplo 4.3 De una poblacin con distribucin normal, constituida por 500 fichas que se
encuentran en un archivador, se extrajo una muestra de 16 observaciones como sigue: 56
45 46 37 56 41 43 36 45 56 49 62 43 60 49 72 56. Se sabe que la
desviacin estndar poblacional =10, pero es desconocida la media poblacional ( = 50
verdadera). Cometiendo un riesgo = 0.05 (nivel de significancia 5%), probar la hiptesis
de que la media poblacional sea igual a: (a) 40, (b) 49, (c) 50, (d) 51 y (e) 60.
Solucin.
(a) Ho :
Ha :
= 40
40
= 0.05
= 10
>> x=[56 45 46
37
56
41
43
36
45
56
49 62 43 60 49 72 56];
>> m=40;
>> sigma=10;
>> alfa=0.05;
>> h = ztest(x,m,sigma,alfa,'both') %
h=
1
= 40.
= 49 y
= 49
49
>> m=50;
>> h = ztest(x,m,sigma,alfa,'both')
h=
0
= 51
51
>> m=51;
>> h = ztest(x,m,sigma,alfa,'both')
h=
0
Se acepta la hiptesis nula, por lo tanto se est cometiendo un error de tipo II porque se
sabe que la media poblacional verdadera es 50.
(e) Ho :
H1 :
= 60
60
>> m=60;
>> h = ztest(x,m,sigma,alfa,'both')
h=
1
Como h = 1, se rechaza la hiptesis nula y por tanto no se comete ningn error, ya que se
rechaza algo falso.
Ejemplo 4.4 Encuentre el intervalo de confianza para la media muestral al 95% de nivel
de confianza, segn los datos dados en dataset10.
94
= 168
168
0,
esto es:
95
p = 2*(1-tcdf(t0,n-1));
>> [h,p,ci]=ttest(dataset10,168,0.05)
h=
0
p=
0.1614
ci =
155.1466 170.1784
Se obtiene h = 1; esto es, se puede rechazar la hiptesis nula y aceptar H1; p = 0.0016,
ci(1) = 155.1466, y ci(2) = 170.1784. En otras palabras, se puede tener 100(1-0.0016) =
99.84% de confianza que la media de los datos en dataset10 son diferentes del valor de la
media de 175.
set1=[41.60 41.28 42.34 41.95 41.86 42.18 41.72 42.26 41.81 42.04];
set2=[39.72 42.59 41.88 42.00 40.22 41.07 41.90 44.29];
clc
disp([' '])
[data1,data2]=dataFci;
r=var(data1)/var(data2);
L1=length(data1);
L2=length(data2);
q2=r*finv(.975,L2-1,L1-1);
q1=r/finv(.975,L1-1,L2-1);
disp([' '])
disp(['Razon de varianzas muestrales = ' num2str(r)])
disp([' '])
disp('Intervalo de confianza para la razon de varianzas muestrales al 95% de nivel de confianza:
')
disp([' '])
disp(['' num2str(q1) ' <= Razon de la varianza muestral <= ' num2str(q2)])
disp([' '])
Ejemplo 4.6 Considere los datos de dataFci. Se quiere saber si existe alguna diferencia
estadsticamente significativa entre las variaciones de estas muestras con un 95% de
confianza. As, la hiptesis es:
Ho :
H1 :
La prueba estadstica es:
fo =
97
Donde x1 y x2 son los datos, alfa = , h = 0 si Ho, y h = 1 si H1, p = valor de p, esto es:
p=2*(1-fcdf(f0,n1,n2))
para un intervalo de confianza de dos colas; f0 = f 0, y ci(1) = l y ci(2) = u son los lmites de
confianza superior e inferior, respectivamente. El script es:
>> [x1,x2]=dataFci;
>> [h,p,ci]=vartest2(x1,x2,0.05)
h=
1
p=
6.5379e-005
ci =
0.0083
0.1674
98
es la variable dependiente y
es la variable independiente. Es
99
Es necesario tambin hacer distincin entre regresin lineal y regresin curvilnea (no
lineal). En el caso de la regresin lineal, la relacin se representa mediante una lnea
recta y en el caso de regresin curvilnea obviamente mediante una curva.
Si x e y se relacionan linealmente entonces a medida que x cambia, y cambia en forma
constante. Si existe una relacin curvilnea y cambiar en cantidades diferentes a medida
que cambia x.
5.3 DIAGRAMAS DE DISPERSIN
A simple vista se puede observar que en la figura 5.1 no existe relacin alguna entre las
dos variables.
FIGURA 5.1 No existe relacin entre los vectores de datos x e y
100
En la figura 5.3, la recta tiene una pendiente negativa y proporciona un buen ajuste.
FIGURA 5.3 Relacin lineal negativa
En la figura 5.4, los puntos de los datos sugieren una relacin curvilnea
FIGURA 5.4 Relacin curvilnea
El modelo ms elemental de regresin es aquel donde los puntos tienden a formar una
lnea recta en el diagrama de dispersin. En este caso, la ecuacin de regresin lineal
simple est dada por:
y= x+
donde
function [a,b]=linefit(x,y)
n=length(x);
S1=sum(x);
S2=sum(y);
S3=sum(x.*x);
S4=sum(x.*y);
a=(n*S4-S1*S2)/(n*S3-(S1)^2);
b=(S3*S2-S4*S1)/(n*S3-(S1)^2);
for k=1:n
p1=a+b*x(k);
Error(k)=abs(p1-y(k));
end
Error=sum(Error.*Error)
Se entran primero los vectores x e y que deben ser de la misma dimensin y luego desde
el rea de trabajo se llama de la siguiente manera:
>> x=[1 2 3 4 5];
>> y=[1 5 7 8 10]
>> [a b]=linefit(x,y)
Error =
147.9000
a=
2.1000
b=
-0.1000
>> z=a+b.*x;
>> plot(x,y,'*',x,z),grid
>> z=a.*x+b;
>> plot(x,y,'*',x,z),grid
102
>> polyfit(x,y,1)
ans =
2.1000 -0.1000
>> x=[-3 -2 -1 0 1 2 3];
>> y=[8 5 2 0 1 3 10];
>> polyfit(x,y,1)%interpolaci
n de MATLAB
ans =
0.0357
4.1429
>> [a b]=linefit(x,y)
Error =
673.2232
a=
0.0357
b=
4.1429
>> z1=a.*x+b;
>> polyfit(x,y,2) %interpolaci n cuadr tica con la funci n de MATLAB
ans =
0.9643
0.0357
0.2857
>> z2=0.9643*x.^2+0.0357*x+0.2857
tica
z2 =
8.8573
4.0715
1.2143
0.2857
1.2857
4.2143
103
9.0715
La funcin p=poly(r) da los coeficientes del polinomio p cuyas races son el vector r.
La funcin polyfit(x,y,n) da los coeficientes del polinomio de grado n que se ajusta a los
puntos (x,y)
FIGURA 5.6. Ajuste lineal y cuadrtico
Ejemplo 5.1 Considere los datos dados de la tabla 5.1. Estos datos son colocados en un
archivo M de funcin llamado DataRegress1. Ntese sin embargo, que estos datos no
estn ordenados. Siendo que esto es un inconveniente cuando llega el momento de
graficarlos con una lnea recta conectada, se ordenan pues los datos en forma
ascendente. Ninguno, ni polyfit ni polyconf requieren del ordenamiento.
TABLA 5.1 Data de la variable independiente x, y la variable dependiente y
x : 2.38 2.44 2.70 2.98 3.32 3.12 2.14 2.86 3.50 3.20 2.78 2.70 2.36 2.42 2.62 2.80 2.92 3.04
3.26 2.30
y : 51.11 50.63 51.82 52.97 54.47 53.33 49.90 51.99 55.81 52.93 52.87 52.36 51.38 50.87 51.02
51.29 52.73 52.81 53.59 49.77
function [x,y]=DataRegress1
xx=[2.38 2.44 2.70 2.98 3.32 3.12 2.14 2.86 3.50 3.20 2.78 2.70 2.36 2.42 2.62 2.80 2.92 3.04
3.26 2.30];
yy=[51.11 50.63 51.82 52.97 54.47 53.33 49.90 51.99 55.81 52.93 52.87 52.36 51.38 50.87
104
FIGURA 5.7 Regresin lineal para la data del ejemplo 5.7 y lmite de confianza de y
105
Ahora, se contina adelante para investigar las desviaciones. Primero se calculan las
desviaciones y luego se grafica utilizando normplot para determinar si estn normalmente
distribuidas. El script es:
>> [x,y]=DataRegress1;
>> normplot(y-polyval(polyfit(x,y,1),x))
106
Siendo que las desviaciones estn muy cerca de la lnea que representa la distribucin
normal, se puede decir que las desviaciones estn muy cercanamente distribuidas de
forma normal, por lo tanto, el modelo es adecuado.
Ejemplo 5.2 Una muestra de 10 estudiantes que ingresaron a la universidad con los
siguientes puntajes: 39, 43, 21, 64, 57, 47, 28, 75, 34, 52 sobre 100 obtuvieron las
siguientes notas en matemtica I: 65, 78, 52, 82, 92, 89, 73, 98, 56, 75, respectivamente.
Solucin.
function [x,y]=DataRegress2
xx=[39 43 21 64 57 47 28 75 34 52];
yy=[65 78 52 82 92 89 73 98 56 75];
[x,index]=sort(xx); %los datos se ordenan pero deben preservarse las parejas
y=yy(index); %lo anterior se logra de esta manera
>> [x,y]=DataRegress2;
>> [c,s]=polyfit(x,y,1);
>> [yhat,w]=polyconf(c,x,s,0.005);
>> syy=sum(y.^2)-length(x)*mean(y)^2;
>> sse=syy-c(1)*(sum(x.*y)-length(x)*mean(x)*mean(y));
>> plot(x,yhat,'k-',x,yhat-w,'k--',x,yhat+w,'k--',x,y,'ks',[x;x],[yhat;y],'k-')
>> legend('Linea de regresion','95% intervalo de confianza de y','Location','SouthEast')
>> axis([15,80,10,140])
>> xlabel('x(Examen de Entrada)')
>> ylabel('y(Def. Matematica I)')
>> coefdet=(1coefdet =
0.7052
El coeficiente de determinacin, muestra una buena relacin lineal positiva entre las
variables, porque est prximo a 1. Para el caso en cuestin, muestra que el puntaje
obtenido por los estudiantes al ingresar a la universidad, se ha visto reflejado en las notas
de matemtica I.
Ahora, se se observan las desviaciones. Primero se calculan las desviaciones y luego se
grafica utilizando normplot para determinar si estn normalmente distribuidas. Ver figura
5.10. El script es:
107
>> [x,y]=DataRegress2;
>> normplot(y-polyval(polyfit(x,y,1),x))
108
(Curso II)
6. REGRESIN LINEAL MLTIPLE
7. SERIES DE TIEMPO
8. ANLISIS DE VARIANZA
9. PRUEBAS NO PARAMTRICAS
109
APNDICE 1
>> theta1=linspace(-2.0*pi,2.0*pi,35);
>> theta2=linspace(-2.0*pi,2.0*pi,35);
>> [T1,T2]=meshgrid(theta1,theta2);
>> F=T2.^2/2-cos(T1);
>> meshc(T1,T2,F)
>> axis([-2.0*pi,2.0*pi,-2.0*pi,2.0*pi,-5,20])
>> xlabel('\theta_1')
>> ylabel('F(\theta_1,\theta_2)')
110
APNDICE 2
>> t=linspace(0,2*pi);
>>fill(t,sin(t),'m')
>>hold on
>>fill(t,0.5*sin(2*t),'y')
>>axis off
111
APNDICE 3
>> x=linspace(0,6,100);
>> hc=plot(x,cos(x),'k-');
>> hold on
>> hch=plot(x,1./cosh(x),'k--');
>> hcl=plot([4.73,4.73],[-1,1],'k');
>> [a,b]=legend('cos(x)','1/cosh(x)','location','SouthWest');
>> xlabel('\it\bfx','FontSize',14,'FontName','Times')
>> ylabel('Value of function','FontSize',14)
>> ylabel('Valor de la funcion','FontSize',14)
>> title('\bfMuestra la interseccion de las dos curvas','FontName','Courier','FontSize',14)
112
113
APNDICE 4
Modelo de Solucin de problemas con MATLAB
Se usan globos metereolgicos para obtener datos de temperatura y presin a diferentes
alturas en la atmsfera. El globo se eleva porque la densidad del helio en su interior es
menor que la del aire que rodea al globo. Al subir el globo, el aire circundante se vuelve
menos denso, y el ascenso se va frenando hasta que el globo alcanza un punto de
equilibrio. Durante el da, la luz del Sol calienta el helio atrapado dentro del globo; el helio
se expande y se vuelve menos denso, y el globo sube ms. Durante la noche, en cambio,
el helio del globo se enfra y se vuelve ms denso, y el globo desciende a una altura
menor. El da siguiente, el Sol calienta el helio otra vez, y el globo sube. Este proceso
genera una serie de mediciones de altura con el transcurso del tiempo que se pueden
aproximar con una ecuacin polinmica.
Suponga que el siguiente polinomio representa la altura en metros durante las primeras
48 horas despus del lanzamiento de un globo metereolgico:
h(t) = -0.12t4 + 12t3
donde las unidades de t son horas. Genere curvas para la altura, velocidad y aceleracin
de este globo usando unidades de metros, m/s y m/s 2. Adems, determine y exhiba la
altura mxima y su hora correspondiente.
Planteamiento del problema
Usando el polinomio dado, determine la velocidad y aceleracin que corresponden a la
informacin de altura. Grafique la altura, velocidad y aceleracin. Adems calcule la altura
mxima y su hora correspondiente.
Descripcin de entradas/salidas
El siguiente diagrama de E/S muestra que el programa no tiene entradas externas. La
salida consiste en las curvas y la altura mxima con su correspondiente tiempo.
114
Ejemplo a mano
Solamente se necesita calcular la velocidad y la aceleracin derivando a mano la funcin
polinmica dada de la altitud. Los datos se graficarn y se determinar el valor mximo.
No obstante, es importante sealar que, al ser horas las unidades de t, se necesita
convertir m/h en m/s sustituyendo el tiempo en horas por el tiempo en segundos.
Solucin con MATLAB
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%
%polinomico para la altura de un globo metereologico.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%
t=linspace(0,48,480);
altitud=-0.12*t.^4+12*t.^3-380*t.^2+4100*t+220;
velocidad=-0.48*t.^3+36*t.^2-760*t+4100;
aceleracion=-1.44*t.^2+72*t-760;
%
subplot(2,1,1),plot(t,altitud),title('Altura del globo')
xlabel('t, horas'),ylabel('metros'),grid,pause
subplot(2,1,1),plot(t,velocidad/3600),title('Velocidad del globo')
ylabel ('m/seg'),grid
subplot(2,1,2),plot(t,aceleracion/(3600*60)),title('Aceleracion del globo'),xlabel('t, horas')
ylabel('metros/seg^2'),grid
%
clc
maxima_altitud=max(altitud)
for i=1:length(altitud)
if altitud(i)==maxima_altitud, t(i), break, end
end
clc
fprintf('La altura
\n',maxima_altitud,t(i))
115
GLOSARIO
ANLISIS DE CORRELACIN. Es el conjunto de tcnicas estadsticas empleado para
medir la intensidad de la asociacin entre dos o ms variables. El principal objetivo del
anlisis de correlacin consiste en determinar qu tan intensa es la relacin entre dos o
ms variables. Normalmente, el primer paso es mostrar los datos en un diagrama de
dispersin.
ANLISIS DE REGRESIN. Es una tcnica estadstica para el modelamiento e investiga
las relaciones entre dos o ms variables. El modelo de regresin lineal simple tiene
nicamente una variable independiente24. Es la tcnica empleada para desarrollar la
ecuacin y dar las estimaciones.
ANLISIS DE REGRESIN Y CORRELACIN MLTIPLE. Consiste en estimar una
variable dependiente, utilizando dos o ms variables independientes.
ANLISIS ESTADSTICO DE LA INFORMACIN. Disciplina que se define como la ciencia de la
recoleccin, anlisis, interpretacin y presentacin de informacin que puede expresarse en forma
numrica.
COEFICIENTE DE CONFIANZA. Es la probabilidad de que un intervalo de confianza contenga el
parmetro que se estima.
24
116
ECUACIN DE REGRESIN. Es una ecuacin que define la relacin lineal entre dos
1x1
+b2x2 + b3x3
b1
b2
ESTADSTICA. La Estadstica es la parte de las Matemticas que se encarga del estudio de una
determinada caracterstica en una poblacin, recogiendo los datos, organizndolos en tablas,
25
representndolos grficamente y analizndolos para sacar conclusiones de dicha poblacin .
ESTADSTICA DESCRIPTIVA. Realiza el estudio sobre la poblacin completa, observando una
caracterstica de la misma y calculando unos parmetros que den informacin global de toda la
poblacin.
ESTADSTICA INFERENCIAL. Realiza el estudio descriptivo sobre un subconjunto de la poblacin
26
llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin .
ESTADSTICO. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimacin de los parmetros.
ESTIMADOR. Un estimador puntual utiliza un nmero nico o valor para localizar una estimacin
del parmetro. Un intervalo de confianza denota un rango dentro del cual puede encontrarse el
parmetro, y el nivel de confianza que el intervalo contiene del parmetro.
ESTIMADORES Y ESTIMACIONES. Un estimador es el proceso mediante el cual se obtiene la
estimacin. Una estimacin es el resultado numrico del estimador.
Se dice que un buen estimador debe ser:
Insesgado, es decir, que no tenga sesgo o error, cuando el valor del estimador es igual al
del parmetro.
Consistente, o sea, que al aumentar el tamao de la muestra, converge en probabilidad al
parmetro que se estima.
25
26
http://www.scribd.com/doc/15268123/Conceptos-Basicos-de-Estadistica-I
http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/parametros_est.htm
117
Eficiente, es decir, que el estimador tiene la menor varianza entre todos los estimadores
posibles.
Suficiente, o sea, cuando incluye toda la informacin que la muestra puede proporcionar
27
acerca del parmetro .
ESTIMADOR INSESGADO. Un estimador es insesgado si la media de su distribucin muestral es
igual al parmetro correspondiente.
ESTIMADOR EFICIENTE. Dado un estimador insesgado, el estimador ms eficiente es aquel que
tenga la varianza ms pequea.
ESTIMADOR CONSISTENTE. Un estimador es consistente si, a medida que n aumenta, el valor
del estadstico se aproxima al parmetro.
ESTIMADOR SUFICIENTE. Un estimador es suficiente si ningn otro estimador puede
proporcionar ms informacin sobre el parmetro.
GRADO DE CONFIANZA. Se refiere a la probabilidad de que el valor real de un parmetro, se
encuentre dentro de los lmites especificados en la estimacin que se quiere calcular.
GRADOS DE LIBERTAD. El nmero de observaciones menos el nmero de restricciones
impuestas sobre tales observaciones.
GRFICO DE BARRAS. Son barras horizontales que representan el grado en que ciertas
caractersticas pueden existir a partir de la observacin de casos o elementos.
GRFICOS CRCULARES O DE PASTEL (PIE). Son grficas circulares divididas en sectores, que
representan fracciones del crculo total y que estn asociadas con una caracterstica especfica.
HISTOGRAMAS DE FRECUENCIA. Son grficos que presentan la informacin contenida en una
distribucin de frecuencia.
HIPTESIS ESTADSTICA. Puede considerarse como la afirmacin acerca de una caracterstica
ideal de una poblacin sobre la cual hay inseguridad en el momento de formularla y que, a la vez,
es expresada de tal forma que puede ser rechazada.
INTERVALO DE CONFIANZA. Corresponde a un intervalo de valores, dentro de los cuales se
espera que est el parmetro con cierto grado de confianza o con riesgo de error conocido; para
ello es necesario determinar primero la estimacin puntual.
MEDIANA. Es la observacin de la mitad despus de que se han colocado la data en una serie
ordenada. Se usa en variables medidas en escala ordinal, intervalo o de razn. Si la data est
agrupada, la mediana se define como el valor dentro del intervalo que divide la distribucin en dos
partes iguales.
27
118
MEDIA ARITMTICA. Se le llama tambin promedio. Es una medida de tendencia central que
consiste en la suma de las mediciones divididas por el total del nmero de mediciones. Se utiliza
en variables medidas en escalas de intervalo o de razn.
MEDIA GEOMTRICA. Proporciona una medida precisa de un cambio porcentual promedio en
28
una serie de nmeros .
MEDIDA DE DISPERSIN. Miden qu tanto se dispersan las observaciones alrededor de su
29
media .
MTODO NO PARAMTRICO. O de distribucin libre, es el anlisis estadstico que no depende
del conocimiento de la distribucin, ni de los parmetros poblacionales.
MODA. La moda de una distribucin se define como el valor ms frecuentemente encontrado, o la
mayor frecuencia. Se usa con mediciones en escala nominal, ordinal, de intervalo o de razn. Si se
trabaja con datos agrupados la moda se refiere al valor medio del intervalo que contiene la mayor
frecuencia.
MUESTRA. Es un subconjunto, extrado de la poblacin (mediante tcnicas de muestreo), cuyo
estudio sirve para inferir caractersticas de toda la poblacin.
MUESTREO. Es la tcnica utilizada en la seleccin de una muestra a partir de una poblacin.
MUESTREO NO PROBABILSTICO. Este tipo de muestreo, puede haber clara influencia de la
persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de
comodidad. Salvo en situaciones muy concretas, en la que los errores cometidos no son grandes,
debido a la homogeneidad de la poblacin, en general no es un tipo de muestreo riguroso y
cientfico, dado que no todos los elementos de la poblacin pueden formar parte de la muestra. Por
ejemplo, si se hace una encuesta telefnica por la maana, las personas que no tienen telfono o
que estn trabajando, no podrn formar parte de la muestra.
MUESTREO PROBABILSTICO. En este tipo de muestreo, todos los individuos de la poblacin
pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra. Por
lo tanto es el tipo de muestreo que se debe utilizar en las investigaciones, por ser el ms riguroso y
cientfico.
M.A.S. Es un muestreo aleatorio simple, donde todos los individuos tienen la misma probabilidad
de ser seleccionados. La seleccin de la muestre puede realizarse a travs de cualquier
mecanismo probabilstico en el que todos los elementos tengan las mismas opciones de salir.
PARMETROS ESTADSTICOS. Son las medidas que se obtienen sobre la distribucin de
probabilidades de la poblacin, tales como la media, la varianza, la proporcin, etc.
Pueden ser de dos tipos:
28
29
WEBSTER, Allen L. Estadstica Aplicada a los Negocios y la Economa. McGraw-Hill. Bogot D.C. 2000. pp. 44.
WEBSTER, Allen L. Op. Cit. pp. 47.
119
PRUEBA DE HIPTESIS. Se denomina tambin prueba de significacin que tiene por objeto
principal evaluar suposiciones o afirmaciones acerca de los valores estadsticos de la poblacin,
denominados parmetros.
RANGO. Medida de dispersin que identifica la distancia entre el valor mximo y el menor valor de
la distribucin. O tambin se define como la diferencia entre el lmite superior e inferior.
RANGO INTERCUARTLICO. Es otra medida de dispersin y se define como la diferencia entre el
cuartil superior y el inferior.
2
TEOREMA DEL LMITE CENTRAL. Si de una poblacin de tamao N con media y varianza
se obtienen muestras al azar, la distribucin de las medias de las muestras seleccionadas ser
normal. Y ms lo ser en la medida en que se incremente el nmero de muestras seleccionadas y
2
31
tendr una media de y varianza /N .
30
http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/parametros_est.htm
VLEZ, Eduardo B. El Anlisis de la Informacin. ICFES, Mdulo 4. Serie Aprender a Investigar. Bogot D.C. 1990.
32
http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/parametros_est.htm
31
120
VARIABLE CUANTITATIVA. Es cualquier caracterstica que se puede expresar con nmeros. Por
ejemplo, el nmero de hermanos o la estatura. Dentro de esta variable se pueden distinguir dos
tipos:
VARIABLE CUANTITATIVA DISCRETA. Es aquella variable que puede tomar nicamente un
nmero finito de valores. Por ejemplo, el nmero de hermanos.
VARIABLE CUANTITATIVA CONTINUA. Es aquella variable que puede tomar cualquier valor
dentro de un intervalo real. Por ejemplo, la estatura.
121
BIBLIOGRAFA
ARAJO, Ulisses F. y SASTRE, Genoveva. El Aprendizaje Basado en Problemas. Una nueva
perspectiva de la enseanza en la universidad. Gedisa Editorial. Barcelona, 2008.
ARBOLEDA Q. Dairon y LVAREZ J. Rafael. MATLAB. Aplicaciones a las Matemticas Bsicas.
Sello Editorial Universidad de Medelln, 2008.
BLAIR, Clifford R. and TAYLOR, Richard A. Bioestadstica. Pearson Prentice Hall. Mxico D.F.
2008.
BOWERMAN, Bruce L. y otros. Pronsticos, Series de Tiempo y Regresin. Un enfoque Aplicado.
CENGAGE Learning. Mxico, 2007.
BROCKWELL, Peter J. and DAVIS, Richard A. Time Series: Theory and Methods. Springer Series
in Statistics. Springer. New York, 2006.
CHAPMAN, Stephen J. MATLAB Programming for Engineers. CENGAGE Learning. International
Student Edition. Stanford, 2008
CHAO L. Lincoln. Estadstica para las Ciencias Administrativas. Mc Graw-Hill. Bogot D.C. 1998.
GIL RODRGUEZ, Manuel. Introduccin Rpida a MATLAB y SIMULINK PARA CIENCIA E
INGENIERA. Daz de Santos. Madrid, 2003.
HAIR, ANDERSON et al. Anlisis multivariante. Prentice Hall. Madrid, 2000.
HANSELMAN, Duane and LITTLEFIELD, Bruce. Mastering MATLAB 7. Pearson Prentice-Hall. New
Jersey, 2005.
INSTITUTO DE NORMAS TCNICAS Y CERTIFICACIN. Trabajos escritos: presentacin y
referencias bibliogrficas. ICONTEC. Bogot D. C. 2009.
KREYSZIG, Erwin. Introduccin a la Estadstica Matemtica. Principios y Mtodos. Editorial
LIMUSA S. A. Mxido D.F. 1990.
MILLER, Irwin y FREUND, John E. Probabilidad y Estadstica para Ingenieros. Prentice Hall.
Mxico D.F. 1990
PREZ, Csar. MATLAB y sus aplicaciones en las Ciencias y la Ingeniera. Prentice Hall. Madrid,
2002.
PREZ, Csar. Econometra de las Series Temporales. Pearson. Prentice Hall. Madrid, 2006.
Prentice Hall. New Jersey, 2010.
MARTNEZ BENCARDINO, Ciro. Estadstica y Muestreo. ECOE Ediciones. Bogot D.C. 2003.
122
SMITH, David M. Engineering Computation with MATLAB. Addsison Wesley. Boston, 2010.
STANLEY, WillIam D. Technical Analysis and Applications with MATLAB. THOMPSON Delmar
Learning. Canada, 2005.
VLEZ, Eduardo B. El Anlisis de la Informacin. ICFES, Mdulo 4. Serie Aprender a Investigar.
Bogot D.C. 1990
WALPOLE, Ronald y otros. Probabilidad y Estadstica para Ingenieros. Prentice Hall. Pearson
Educacin. Addison Wesley. Mxico D.F. 1998.
WEBSTER, Allen L. Estadstica Aplicada a los Negocios y la Economa. McGraw-Hill. Bogot D.C.
2000.
ZIMMERMANN, Francisco Jos P. Estadstica para Investigadores. Universidad de la Sabana.
Editorial Escuela Colombiana de Ingeniera. Bogot D.C. 2004.
123
124