Control

REVICION DE LOS FUNDAMENTOS DE ESTADISTICA
I.
OBJETIVO
Revisar los principales conceptos y aplicaciones de los fundamentos de
estadstica, debido a su importante relacin con las actividades de control
de calidad en la industria alimentaria.
II.
REVISIN Y APLICACIONES A PRESENTAR

II.1.
DISTRIBUCIONES DE FRECUENCIA
2.1.1 DEFINICIONES RELATIVAS A LAS DISTRIBUCIONES DE
FRECUENCIAS
Distribuciones de frecuencia.
Necesidad de resumir la informacin. Para que los datos
sean tiles deben organizarse
para distinguir patrones y
tendencias y llegar as a conclusiones lgicas.
Una forma de organizar un conjunto de datos es clasificarlos
en categoras o clases y luego contar cuntas observaciones
quedan dentro de cada categora.
Para el anlisis e interpretacin de datos es valioso conocer:
. La forma o patrn de distribucin de los datos.
. La posicin de la distribucin: alrededor de qu valor se
tienden a concentrar los
datos.
. Variabilidad: la dispersin de los datos alrededor de los
valores centrales.
Ordenamiento o arreglo de los datos en clases o categoras
indicando para cada una de ellas, el nmero de elementos
que contiene o frecuencia.
Frecuencia relativa.
Se obtiene dividiendo la frecuencia absoluta por el nmero de
observaciones. Denota la importancia de la clase, al expresarse
en trminos porcentuales. Facilitan el anlisis de los datos, en
especial para comparar distribuciones de frecuencias basadas en
diferentes nmeros de observaciones.
Frecuencia acumulada.
Nmero de observaciones que son menores que el lmite superior
de la clase.
Se obtiene sumando las frecuencias (absolutas o relativas) en
sentido
descendente.
clase (nmero de intervalos).

Valor central de la clase.
Promedio entre el lmite inferior de entre dos clases sucesivas.
Es el valor representativo de la clase.
Rango.
En estadstica, el rango representa la diferencia entre el
valor mximo y el valor mnimo de un conjunto de datos.
El rango nos muestra qu tan distribuidos estn los valores
en una serie. Si el rango es un nmero muy alto, entonces
los valores de la serie estn bastante distribuidos; en
cambio, si se trata de un nmero pequeo, quiere decir que
los valores de la serie estn muy cerca entre s.
2.1.2. REPRESENTACIONES GRAFICAS.

Histograma de frecuencia.
Grfico de barras verticales, las barras no guardan
separacin entre s.
Definidas las escalas en el eje
cartesiano se dibuja un rectngulo acorde a la frecuencia de
la clase (altura).
En clases de igual amplitud las barras son proporcionales
a la frecuencia de la clase.
Diagrama de frecuencia.
Esta representacin grfica se corresponde con la de una
funcin constante entre cada dos valores de la variable a
representar hasta el menor de los dos valores de la variable
que construyen el tramo en el que es constante.
Ejemplo:
Tambin para el ejemplo del Nmero de Hijos, se tendr undiagrama de
frecuenciascomo el del siguiente grfico.
Diagrama de barras.
El diagrama
de
barras (o grfico
de
barras)
es
un grfico que se utiliza para representar datos de variables
cualitativas o
discretas.
Est
formado
por barras rectangulares cuya altura es proporcional a la
frecuencia de cada uno de los valores de la variable.
Tipos de grficos de barras

Existen cuatro tipos de grficos de barras segn las series de datos y como
estn estas representadas:
1. Grfico de barras sencillo:
Representa los datos de una nica serie o conjunto de datos.
2. Grfico de barras agrupado:
Representa los datos de dos o ms series o conjuntos de datos.

Cada serie se representa en un mismo color.
Las barras se colocan una al lado de la otra por categora de la variable para
comparar las series de datos.
3. Grfico de barras apilado

Representa los datos de dos o ms series o conjuntos de datos.
Cada serie se representa en un mismo color.
Cada barra representa una categora de la variable, y se divide en segmentos
que representan cada una de las series de datos.
4. Pirmide de poblacin:
Una pirmide de poblacin es un diagrama de barras bidireccional que muestra
la poblacin por sexo y rangos de edad en un momento determinado.
En el eje vertical se representan los intervalos de edades. En el eje horizontal
se representan los porcentajes de poblacin. En una direccin se representarn
los hombres y en el otro las mujeres.
Polgono de frecuencia.
Alternativo al histograma de frecuencias podemos
representar la informacin a travs de los llamados
polgonos de frecuencias. Estos se construyen a partir de los
puntos medios de cada clase. La utilizacin de los puntos
medios o marcas de clase son llevados al escenario grfico
mediante la utilizacin de los polgonos de frecuencias. Se
construye uniendo los puntos medios de cada clase
localizados en las tapas superiores de los rectngulos
utilizados en los histogramas de las grficas. Su utilidad se
hace necesaria cuando desean destacarse las variables de
tendencia central, como son media, modas y medianas.
2.1.3. MEDIDAS ALGEBRAICAS DE LAS

DISTRIBUCIONES DE FRECUENCIA.
Medidas de exactitud.
Es el grado de concordancia entre el valor verdadero y el
experimental. Un instrumento es exacto si las medidas
realizadas con l son todas muy prximas, todas al valor
"verdadero" de la magnitud medida. Cabe recalcar que es la
proximidad entre el valor medido y el valor real, adems
indica una comparacin con un valor aceptado. Por
ejemplo, si la masa de una sustancia es 22.5 g y una
medida de dicha masa es 22.4 g se puede considerar
exacta; sin embargo, un valor de 20.05 es poco exacto.
Medidas de precisin.
Es la propiedad que se aplica a un conjunto de medidas de
una misma magnitud en condiciones sensiblemente iguales,
estas condiciones pueden ser: de repetabilidad, de precisin
intermedia o de reproducibilidad. Un instrumento mide con
precisin cuando la diferencia entre distintas medidas de
una misma magnitud es muy pequea. Los conceptos entre
exactitud y precisin son independientes entre s, pues
algunas medidas pueden ser muy precisas pero no exactas.
2.2. DISTRIBUCIONES MS COMUNES:

. Distribucin Normal.
La distribucin normal N (, es un modelo matemtico que rige
muchos fenmenos. La experiencia demuestra que las
distribuciones de la mayora de las muestras tomadas en el campo
de la industria se aproximan a la distribucin normal si el tamao de
la muestra es grande. Esta distribucin queda definida por dos
parmetros: la media y la desviacin tpicaSe presenta
mediante una curva simtrica conocida como campana de Gauss.
Esta distribucin nos da la probabilidad de que al elegir un valor,
ste tenga una medida contenida en unos intervalos definidos. Esto
permitir predecir de forma aproximada, el comportamiento futuro
de un proceso, conociendo los datos del presente.
Ejemplo: Una maquina llena un recipiente con una cantidad medida de caf.
El peso del caf en cada recipiente tiene una distribucin normal con una
media de 510g de caf y una desviacin estndar de 4g. Cul es la
probabilidad de que un recipiente escogido al azar contenga menos de 500 g

de caf?
Sea y = peso del caf en el recipiente. Entonces,
f ( y)=
1
e( y510 ) / 2(4)
2 .4
2
La cantidad
z=
y510
4
tendr una distribucin normal estndar
f ( y)=
1 z /2
e
2
2
Cuando y = 500, z = (500-510)/4 = -2,5. Por tanto,

2,5
Pr(y 500) = Pr(z 2,5) =
f ( z ) dz
Esta cantidad aparece tabulada en la tabla como 0.0048. La probabilidad

de que un recipiente tomado al azar contenga menos de 500 g de caf
es de 0.0048.
.Distribucin Binomial.
La distribucin binomial es una distribucin de
probabilidad discreta que mide el nmero de xitos si
la variable es una variable aleatoria discreta, es decir,
slo puede tomar los valores 0, 1, 2, 3, 4, ..., n
suponiendo que se han realizado n pruebas. En las
empresas tenemos muchas situaciones donde se
espera que ocurra o no un evento especfico. ste, slo
puede ser de xito o fracaso. Por ejemplo, en la
produccin de una pieza, sta puede salir buena o
defectuosa. Para situaciones como stas se utiliza la
distribucin binomial. La estructura de este objeto de
aprendizaje es como sigue: en primer lugar se
presentan los objetivos que se desean consigan los
alumnos; a continuacin se trabaja la definicin y
caractersticas de la distribucin binomial, haciendo
especial relevancia en como identificarla y diferenciarla
de otras distribuciones discretas y se resuelven
algunos ejemplos prcticos para ayudar a su
comprensin. Finalmente, en el Cierre, se destacan los

conceptos bsicos de aprendizaje con respecto a la
distribucin binomial y sus aplicaciones prcticas.
Caractersticas
Se dice que X sigue una distribucin Binomial de parmetros n y p, que se
representa con la siguiente notacin:
X =B (n, p)
Su funcin de probabilidad viene definida por:
Ecuacin 1. Funcin de Probabilidad de la distribucin Binomial.

Donde, n, debe ser un entero positivo y p debe pertenecer al intervalo
0 p 1, por ser una proporcin. Su media y su varianza, vendrn dadas por
las siguientes expresiones:
E = (X)=NxP
Ecuacin 2. Esperanza de la distribucin Binomial.
Una distribucin de probabilidad binomial es una distribucin terica,

que se puede calcular mediante el uso de la frmula de la funcin de
probabilidad. Sin embargo, los clculos pueden ser muy tediosos,
especialmente cuando nos piden probabilidades acumuladas, ya que
ser necesario aplicar la frmula repetidamente. Por tal motivo existen
tablas en las que se pueden consultar las probabilidades de un
determinado nmero de xitos para varios valores de n y de p, pero
nicamente para valores mximos de n = 25. Para cualquier n superior
hemos de utilizar inevitablemente la frmula de la funcin de
probabilidad.
Se puede obtener ms informacin al respecto en el
recurso polimedia, referido en bibliografa. Sin embargo, el clculo
puede ser todava tedioso. Para solventar el problema del clculo de
probabilidades de la distribucin binomial para n elevados, y siempre
que el producto n x p x (1p) es elevado, del orden de 9 o superior, las
probabilidades correspondientes a una variable con distribucin
binomial, pueden tambin aproximarse, usando las tablas de la
distribucin normal, por el Teorema Central del Lmite, la suma de
variables aleatorias independientes, tiende a distribuirse normalmente a
medida que aumenta el nmero de sumandos. En caso de que podamos
aproximar, debemos tener en cuenta que estamos pasando de una

variable discreta (binomial) a una continua (normal), y por tanto son
distribuciones diferentes. El precio que hay que pagar por pasar de
una a otra se denomina correccin por continuidad y consiste en hacer
determinados ajustes para que la aproximacin realizada sea lo ms
precisa posible.
En las distribuciones continuas, la probabilidad de obtener un valor exacto es
cero, como se vio en temas precedentes y en consecuencia, la correccin por
continuidad Consiste en tomar un pequeo intervalo de longitud 1 alrededor
del determinado punto k (aumentar y disminuir un poco el valor solicitado
creando en lugar de una valor nico un intervalo). La distribucin binomial se
puede expresar de forma grfica, y que en realidad consiste en un diagrama de
barras, similar a los obtenidos en la funcin de probabilidad pero que van a ir
variando su forma en funcin de los valores de n y de p al modificarse las
probabilidades de los distintos posibles valores de P(X=x).
Por ejemplo, para p=0,2 (azul), y p=0,3 (rojo) y distintos valores de n:
En la siguiente figura, puede apreciarse como al incrementar n, se ve que los

curvas de frecuencias se aproximan a una forma en forma de campana, con la
tpica forma de campana de Gauss, pudiendo a deducirse, que conforme
aumenta n, las variables discretas que siguen una distribucin binomial tiende
a aproximarse a la distribucin normal.
Tabla de distribucion binomial:
Ejemplo 3.
Con el propsito de verificar si se aceptan los lotes de piezas de que se reciben
en una determinada fbrica, se lleva a cabo un plan de control consistente en
seleccionar 10 artculos al azar de cada lote y determinar el nmero de piezas
defectuosas. Un lote se rechaza si se encuentran dos o ms piezas
defectuosas. Cul es la probabilidad de aceptar lotes con un 5 % de piezas
defectuosas?
Sea el suceso A: ser pieza defectuosa.
La probabilidad de A, ser p= 0,05 al ser la proporcin de defectuosos de lote
del 5%.
Sea la variable X nmero piezas defectuosas en el lote B (n=10, p=0,05).
Sea el coeficiente de aceptacin, a (o c), a = 2.
p ( aceptar ) =P ( X< 2 )=P ( X=0 ) + P( X =1)
( 100 ) x ( 0.05 ) x (10.005) +( 101 ) x (0.005) (10.005)
P ( aceptar ) =
10
P (aceptar) = 0.599 + 0.315 = 0.914
Distribucin de Poisson.
La distribucin de Poisson se utiliza en situaciones donde los
sucesos son impredecibles o de ocurrencia aleatoria. En
otras palabras no se sabe el total de posibles resultados.
Permite determinar la probabilidad de ocurrencia de un
suceso con resultado discreto.
Es muy til cuando la muestra o segmento n es grande y la
probabilidad de xitos p es pequea.
Se utiliza cuando la probabilidad del evento que nos
interesa se distribuye dentro de un segmento n dado como
por ejemplo distancia, rea, volumen o tiempo definido.
Frmula de Poisson:
P (x I ) = la probabilidad de que ocurran X xitos cuando el nmero

promedio de ocurrencia de ellos es
media o promedio de xitos por unidad de tiempo, rea o producto
e =es la constante 2.7183, base de los logaritmos naturales, en tanto
que los valores de e- pueden obtenerse de tablas.
X = seala un valor especfico que la variable pueda tomar (el nmero
de xitos que deseamos ocurran)
Por definicin, el valor esperado (media en el intervalo o regin de
inters) de una distribucin de probabilidad de Poisson es igual a la
media de la distribucin.
E(X) =
La varianza del nmero de eventos de una distribucin de probabilidad
de Poisson tambin es igual a la media de la distribucin . De este
modo, la desviacin estndar es la raz cuadrada de .
V(X) = =
n = nmero de experimentos
exito
p = probabilidad de
Una microbiologa quiere estimar la concentracin de cierto tipo de bacteria en

un muestra de agua tratada, ella pone una muestra de 0.5 ml de agua tratada
en vidrio del microscopio y descubre 39 bacterias. Estime la concentracin por
ml. En esta agua tratada y determine la incertidumbre en la estimacin.
X = numero de bacterias en los 0.5 ml

Y = concentracin real de bacterias por ml.
Poisson = (0.5)
El valor observado de x = 39.
La concentracin estimada de y = 39/0.5 = 78
La incertidumbre x=78/0.5 = 12.49
Y = 78 +- 12
Distribucin hipergeometrica.
En teora
de
la
hipergeomtrica es
probabilidad la distribucin
una distribucin discreta
relacionada
con muestreos aleatorios y sin reemplazo. Supngase que

se tiene una poblacin de N elementos de los cuales, d
pertenecen a la categora A y N-d a la B. La distribucin
hipergeomtrica
mide
la
probabilidad
de
obtener x (
) elementos de la categora A en una muestra

sin reemplazo de n elementos de la poblacin original.
Propiedades:
La funcin
de
probabilidad de
una
variable
aleatoria
con
distribucin
hipergeomtrica puede deducirse a travs de razonamientos combinatorios y

es igual a
donde
es el tamao de poblacin,
extrada,
es el tamao de la muestra
es el nmero de elementos en la poblacin original que
pertenecen a la categora deseada y
es el nmero de elementos en la
muestra que pertenecen a dicha categora. La
notacin hace referencia al coeficiente binomial, es decir, el nmero de

combinaciones posibles al seleccionar
elementos de un total
El valor esperado de una variable aleatoria X que sigue la distribucin

hipergeomtrica es
y su varianza,
En la frmula anterior, definiendo
se obtiene
La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y

la binomial a muestreos con reemplazo. En situaciones en las que el
nmero esperado de repeticiones en el muestreo es presumiblemente bajo,
puede aproximarse la primera por la segunda. Esto es as cuando N es
grande y el tamao relativo de la muestra extrada, n/N, es pequeo.
Ejemplo. Un cargamento de 20 cajas de chocolate contiene 5 defectuosas, si

diez de ellas son aleatoriamente elegidas, Cul es la probabilidad de que 2
estn defectuosas?
X=2
n= 10
t=5
N= 20
NT T
)( )
X
N X X
p
,T ,n =
N
N
( )
n
p(x = 2, N = 20, t = 5, N = 10) =
5 205 5
( )(
)( )
2 102 2
=0.3482
20
( )
10
2.3. CORRELACION ENTRE DOS VARIABLES.

Correlacion.
La correlacin es la forma numrica en la que la estadstica
ha podido evaluar la relacin de dos o ms variables, es
decir, mide la dependencia de una variable con respecto de
otra variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
edad
15
30
18
42
28
19
31
peso
60
75
67
80
60
65
92
Si tenemos los datos que se presentan en la tabla y

consideramos que la edad determina el peso de las
personas entonces podremos observar la siguiente
grfica:
Donde los puntos

pares ordenados
recta
que
los datos, que en
que se observa
peso.
representan cada uno de los

y la lnea podra ser una
represente la tendencia de
otras palabras podra decirse
que a mayor edad mayor
La
correlacin
se
puede
explicar con la pendiente de esa recta
estimada y de esta forma nos podemos dar
cuenta que tambin existe el caso en el que
al crecer la variable independiente
decrezca la variable dependiente. En
aquellas rectas estimadas cuya pendiente
sea cero entonces podremos decir que no
existe correlacin.
As en estadstica podremos calcular la correlacin para datos no agrupados
con la siguiente formula.
En
R
N
X
Y
i 1
i 1
n xi y i x i * y i
i 1
n x xi n y i2
i 1 i 1
i 1
n
2
i
y
i 1
donde:
= coeficiente de correlacin
=
nmero
de
pares
ordenados
= variable independiente
= variable independiente
Ejemplo:
Edad (x)
15
30
18
42
28
19
31
183
Peso (y)
60
75
67
80
60
65
92
499
X2
225
900
324
1764
784
361
961
5319
Y2
3600
5625
4489
6400
3600
4225
8464
36403
X* Y
900
2250
1206
3360
1680
1235
2852
13483
Supngase que deseamos obtener la correlacin de los datos de la tabla

anterior:
Ahora podemos observar que:
n
n
n
n xi yi xi * yi
i 1
i 1
i 1
n 2 n 2 n 2 n 2
n xi xi n yi yi
i 1
i 1 i 1
i 1

7 * 13483 (183 * 499)

0.65638606
7 * 5319 (183) 2 7 * 36403 ( 499) 2
Se debe aclarar que el coeficiente de correlacin slo puede variar de la

siguiente manera:
y que para entenderlo mejor se debe obtener el
1 r 1
coeficiente de determinacin que se obtiene con r cuadrada, ya que

este representa el porcentaje que se explica y mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, est
muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)2= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
Primero tendremos que pensar que se genera una matriz, ya que, ahora
estamos juntando dos tablas de distribucin de frecuencias y por ello nuestros
clculos sern ms laboriosos, por lo que les recomiendo el uso de una hoja de
clculo o al menos una calculadora con regresin para datos agrupados.
De cualquier forma aqu tambien estamos evaluando numricamente si existe
relacin entre dos variables y lo haremos con la siguiente ecuacin.
En
donde
podemos
encontrar k como el
j 1 i 1
i 1
i 1
r
nmero de clases para la
2
2
l
k
k
l
variable "y" y l para el

2
2
n fx xi fx xi n fy y i fy y i
nmero de clases de "x".
i 1
i 1
i 1

i 1
Tambin
podemos
observar que hay varios
tipos de "f" es decir, la que se encuentra sola (sin subndice) que nos habla de
las frecuencias celdares (cada una de las frecuencias que se encuentran en la
interseccin entre una columna y un rengln) y las "f" con subndices que
representan las frecuencias de cada una de las variables.
k
n f xi y i fx xi * fy y i
Para entender el uso de esta frmula usaremos un ejemplo:

Los resultados que se presentan en la siguiente tabla representan los pesos y
las estaturas de 48 alumnos entrevistados el "da anhuac"
Marcas de clase de
"x"
1.4 1.5 1.6 1.74 1.845 1.9
45 45 45
5
45
44.5
3
1
marcas 54.5
5
9
5
fy
fx y
4
19
178
1035.5
fx
y^2
7921
56434.
75
de
64.5
clase
de "Y" 74.5
84.5
94.5
fx
fx
x
fx
x^2
0
0
9
13.9
05
21.4
832
25
580.5
521.5
422.5
1
3
4
12
17
7
3
48
19.7 29.66 12.91 5.83 82.06
4
5
5
5
32.4 51.76 23.82 11.3 140.898
723 5425 8175 490
2
75
378
3116
37442.
25
38851.
75
35701.
25
35721
212072
f x y 5380.7
7
Correlacin 0.695
=
La sustitucin de la frmula es la siguiente:

k
i 1
i 1
n f xi y i f x x i * fy y i
j 1 i 1
2
2
2
k
k

n f x x i f x x i n f y y i fy y i
i 1
i 1
i 1

i 1
l
48 * 5380.77 - (82.06 * 3116)

((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 3116 2 )
0.695
Al interpretar nuestro resultado podemos concluir que si existe relacin entre el

peso y la estatura, es decir, que a mayor estatura mayor peso.
En muchas ocasiones el resultado de la correlacin es negativo y lo que
debemos pensar es que la relacin de las variables involucradas en el clculo
es inverso es decir que en la medida que crece la variable independiente la
variable dependiente decrece:
demanda
150
1698
100 2045
1348
50
1268
0
1000
47
15
100
120
1500
2000
Coeficiente de correlacin.
Una vez calculado el valor del coeficiente de correlacin

interesa determinar si tal valor obtenido muestra que las
variables X e Y estn relacionadas en realidad o tan solo
presentan dicha relacin como consecuencia del azar. En
otras palabras, nos preguntamos por la significacin de
dicho coeficiente de correlacin.
Un coeficiente de correlacin se dice que es significativo si se puede afirmar,
con una cierta probabilidad, que es diferente de cero. Ms estrictamente, en
trminos estadsticos, preguntarse por la significacin de un cierto coeficiente
de correlacin no es otra cosa que preguntarse por la probabilidad de que tal
coeficiente proceda de una poblacin cuyo valor sea de cero. A este respecto,
como siempre, tendremos dos hiptesis posibles:
H0: rxy = 0 El coeficiente de correlacin obtenido procede de una poblacin
cuya correlacin es cero ( = 0 ).
H1 : rxy = 0 El coeficiente de correlacin obtenido procede de una poblacin
cuyo coeficiente de correlacin es distinto de cero ( 0).
Desde el supuesto de la Hiptesis nula se demuestra que la distribucin
muestral de correlaciones procedentes de una poblacin caracterizada por una
correlacin igual a cero ( = 0) sigue una ley de Student con N-2 grados de
libertad, de media el valor poblacional y desviacin tipo:
En consecuencia, dado un cierto coeficiente de correlacin r xy obtenido en una

determinada muestra se trata de comprobar si dicho coeficiente es posible que
se encuentre dentro de la distribucin muestral especificada por la Hiptesis
nula. A efectos prcticos, se calcula el nmero de desviaciones tipo que se
encuentra el coeficiente obtenido del centro de la distribucin, segn la
formula conocida:
y se compara el valor obtenido con el existente en las tablas para un cierto

nivel de significacin y N-2 grados de libertad t(,N-2) - , que como se sabe,
marca el lmite (baja probabilidad de ocurrencia, segn la Hiptesis nula) de
pertenencia de un cierto coeficiente r xy a la distribucin muestra de
correlaciones procedentes de una poblacin con = 0. De esta forma si:
t > t ( ,N 2) Se rechaza la Hiptesis nula. La correlacin obtenida no
procede de una poblacin cuyo valor xy = 0. Por tanto las variables estn
relacionadas.
t t ( ,N 2) Se acepta la Hiptesis nula. La correlacin obtenida procede

de una poblacin cuyo valor xy = 0. Por tanto ambas variables no estn
relacionadas.
Regresin: lineal y curvilnea.
Lineal.
Se supone que se tiene una muestra (x1, y1),(x2, y2), . . . ,
(xn, yn) correspondiente a la observacin conjunta de las
variables X e Y . El objetivo ser encontrar una relacin
entre ambas variables, esta relacin podra estar dada por
una recta (ecuacin de regresin: yb = 0 + 1 x)
En un diagrama de dispersin, cada unidad de anlisis es un punto cuyas
coordenadas son los valores de las variables.
El error aleatorio; son las desviaciones de los verdaderos valores de Y con

respecto a los valores estimados y (recta).
Curvilnea.
Cuando las variables X e Y se relacionan segn una
lnea curva, se
habla de regresin no lineal o
curvilnea. Es una funcin de segundo grado la que se
ajusta lo suficiente a la situacin real dada.
La expresin general de un polinomio de segundo grado es:
Y =a+bX+cX2 donde a , b y c son los parmetros.
El problema consiste, por tanto, en determinar dichos parmetros para
una distribucin dada. Se seguir para ello, un razonamiento y la utilizacin de
las ecuaciones normales de Gauss. Las ecuaciones normales son:
Y = na + b X + C X2 (1)
X Y = a X + b X2 + C X3 (2)
X2 Y = a X2 + b X3 + C X4 (3)
Para lo cual se necesita elaborar el cuadro con cada una de las variables que
aparecen en las ecuaciones normales y los resultados obtenidos en este
sustituirlos en ellas para encontrar los valores de las constantes.
Para encontrar los valores de las constantes utilizaremos matrices.
Una matriz es un conjunto de elementos de cualquier naturaleza aunque, en
general, suelen ser nmeros ordenados en filas y columnas.
Se llama matriz de orden "m n" a un conjunto rectangular de elementos aij
dispuestos en m filas y en n columnas. El orden de una matriz tambin se
denomina dimensin o tamao, siendo m y n nmeros naturales.
Las matrices se denotan con letras maysculas: A, B, C, ... y los elementos de
las mismas con letras minsculas y subndices que indican el lugar ocupado: a,
b, c, ... Un elemento genrico que ocupe la fila i y la columna j se escribe aij . Si
el elemento genrico aparece entre parntesis tambin representa a toda la
matriz : A = (aij)
Al encontrar los valores de las constantes que buscamos sustituimos los
valores en la ecuacin de regresin curvilnea para obtener los resultados que
buscamos. Y poder hacer las estimaciones correspondientes.
Diagrama de regresin linial
2.4. PRUEBAS ESTADSTICAS.

2.4.1. PARAMETRICAS.
A. DISEOS EXPERIMENTALES.
Diseo completamente al azar.
El diseo completamente al azar es un prueba basada en el
anlisis de varianza, en donde la varianza total se
descompone en la varianza de los tratamientos y la
varianza del error. El objetivo es determinar si existe un
diferencia significativa entre los tratamientos, para lo cual
se compara si la varianza del tratamiento contra la
varianza del error y se determina si la primera es lo
suficientemente alta segn la distribucin F.
Caractersticas del diseo:
Se definen los t tratamientos que se van a aplicar a las n unidades
experimentales, de tal forma que a r unidades experimentales les va a
corresponder un tipo de tratamiento. Las unidades experimentales se sortean
para la asignacin a cada tratamiento. Se define la variable a medir.
Ejemplo. Se desea investigar el efecto del pH en el crecimiento de cierto

microorganismo en un medio especifico. Para ello se realiza un experimento,
teniendo como punto de partida la misma cantidad de microrganismos. Se
hacen cuatro repeticiones y se obtienen los siguientes resultados. estos datos
son evidencia suficiente para afirmar que los niveles de pH donde se logra
menor y mayor crecimiento son el 3 y el 2, respectivamente? Explique su
respuesta.
NIVEL DE PH
1
2
3
CRESIMIENTO PROMEDIO(EN %)
80
105
75
No se puede afirmar que el nivel de pH influya directamente en el crecimiento

promedio, se considera que hay ms factores, edemas es necesario que nos
proporcionen ms datos por tratamiento para tomar esa decisin.
Diseo de bloques completamente al azar.
El material experimental es dividido en b grupos de t
unidades experimentales (UE) cada uno, donde t es el
nmero de tratamientos , tales que las UE dentro de cada
grupo son lo ms homognea posible y las diferencias entre
las UE sea dada por estar en diferentes grupos. Los
conjuntos son llamados bloques. Dentro de cada bloque las
UE son asignadas aleatoriamente, cada tratamiento ocurre
exactamente una vez en un bloque. Si la variacin entre las
UE dentro de los bloques es apreciablemente pequea en
comparacin con la variacin entre bloques, un diseo de
bloque completo al azar es ms potente que un diseo
completo al azar.
Ejemplo. Se hace un estudio sobre la efectividad de 3 marcas de atomizador

para matar moscas. Para ello, cada atomizador se aplica a un grupo de 100
moscas, y se cuenta el nmero de moscas muertas (expresada en porcentaje).
Se hicieron 6 rplicas, pero estas se hicieron en das diferentes, por ello se
sospecha que puede haber algn efecto importante debido a esta fuente de
variacin. Los datos obtenidos se muestran a continuacin:
Suponiendo un (DBCA) Diseos de bloques completos al azar formule la
hiptesis adecuada utilice = 0.5
No hubo variacin en los efectos de atomizador en los diferentes

das
Diseos cuadrados latino.

Los diseos en cuadrados latinos son apropiados cuando es
necesario controlar dos fuentes de variabilidad. En dichos
diseos el nmero de niveles del factor principal tiene que
coincidir con el nmero de niveles de las dos variables de
bloque o factores secundarios y adems hay que suponer
que no existe interaccin entre ninguna pareja de factores.
Supongamos que el nmero de niveles de cada uno de los
factores es K. El diseo en cuadrado latino utiliza K2
bloques, cada uno de estos bloques corresponde a una de
las posibles combinaciones de niveles de los dos factores de
control. En cada bloque se aplica un solo tratamiento de

manera que cada tratamiento debe aparecer con cada uno
de los niveles de los dos factores de control. Si
consideramos una tabla de doble entrada donde las filas y
las columnas representan cada uno de los dos factores de
bloque y las celdillas los niveles del factor principal o
tratamientos, el requerimiento anterior supone que cada
tratamiento debe aparecer una vez y slo una en cada fila y
en cada columna.
Recibe el nombre de cuadrado latino de orden K a una disposicin en filas y
columnas de K letras latinas, de tal forma que cada letra aparece una sola vez
en cada fila y en cada columna. A continuacin vamos a dar una forma simple
de construccin de cuadrados latinos. Se parte de una primera fila con las
letras latinas ordenadas alfabticamente
Las sucesivas filas se obtienen moviendo la primera letra de la fila anterior a la

ltima posicin (construccin por permutacin cclica), el cuadrado as obtenido
es un cuadrado latino estndar. Un cuadrado latino se denomina estndar
cuando las letras de la primera fila y la primera columna estn ordenadas
alfabticamente. A parte de los cuadrados latinos as obtenidos existen otros
cuadrados latinos diferentes, estndares y no estndares. En el Apndice B se
muestran algunos cuadrados latinos estndares para los rdenes 3, 4, 5, 6, 7, 8
y 9.
Ejemplo. Se probaron 4 raciones alimenticias para pollos, criados en jaula de

4 pisos y cuatro casilleros. La variable analizada fue: peso en kg a las 8
semanas de edad.
Realice la prueba de hiptesis correspondientes. Use = 0.05
Experimentos factoriales.
Por lo tanto, se puede definir a los experimentos factoriales
como aquellos en los que se comparan o estudian
simultneamente dos o ms factores principales, incluyendo
los diferentes niveles o modalidades de cada uno. El Anova
en experimentos factoriales constituye una tcnica
estadstica para analizar el efecto de dos o ms variables
independientes (factores) sobre una variable respuesta.
Como en estos experimentos los tratamientos se forman
combinando cada nivel de un factor con cada uno de los
niveles del otro (o de los otros, si hubiere ms de dos), este
tipo de experimento permite adems evaluar los efectos de
las interacciones. Se dice que entre dos factores hay
interaccin si los efectos de un nivel de un factor dependen
de los niveles del otro.
Dicho con otras palabras la respuesta de un factor es
influenciada en forma diferenciada por los niveles del otro.
La existencia de interacciones indica que los efectos de los
factores sobre la respuesta no son aditivos y por tanto no
pueden separarse los efectos de los factores.
Tabla 1: Expresiones para el clculo del cuadro de anlisis de la varianza de un
experimento bifactorial con diseo completamente aleatorizado.
EJEMPLO.
B. PRUEBAS DE COMPARACION DE PROMEDIOS.

Prueba de t de Student.
La prueba de t Student, es un mtodo de anlisis
estadstico, que compara las medias de dos grupos
diferentes. Es una prueba paramtrica, o sea que solo sirve
para comparar variables numricas de distribucin normal.
La prueba t Student, arroja el valor del estadstico t. Segn
sea el valor de t, corresponder un valor de significacin
estadstica determinado. En definitiva la prueba de t
Student contrasta la H0 de que la media de la variable
numrica y, no tiene diferencias para cada grupo de la
variable categrica x
Prueba T de Student para muestras relacionadas:
La prueba estadstica t de Student para muestras dependientes es una
extensin de la utilizada para muestras independientes. De esta manera, los
requisitos que deben satisfacerse son los mismos, excepto la independencia de
las muestras; es decir, en esta prueba estadstica se exige dependencia entre
ambas, en las que hay dos momentos uno antes y otro despus.
Con ello se da a entender que en el primer perodo, las observaciones servirn
de control o testigo, para conocer los cambios que se susciten despus de
aplicar una variable experimental.
Con la prueba t se comparan las medias y las desviaciones estndar de grupo
de datos y se determina si entre esos parmetros las diferencias son
estadsticamente significativas o si slo son diferencias aleatorias.
Consideraciones para su uso
El nivel de medicin, en su uso debe ser de intervalo o posterior.
El diseo debe ser relacionado.
Se deben cumplir las premisas paramtricas.
En cuanto a la homogeneidad de varianzas, es un requisito que tambin debe
satisfacerse y una manera prctica es demostrarlo mediante la aplicacin de la
prueba ji cuadrada de Bartlett. Este procedimiento se define por medio de la

siguiente frmula:
Donde:
t = valor estadstico del procedimiento.
= Valor promedio o media aritmtica de las diferencias entre los
momentos antes y despus.
sd = desviacin estndar de las diferencias entre los momentos
antes y despus.
N = tamao de la muestra.
La media aritmtica de las diferencias se obtiene de la manera siguiente:
La desviacin estndar de las diferencias se logra como sigue:
Pasos:
Ordenar los datos en funcin de los momentos antes y despus, y obtener las
diferencias entre ambos.
Calcular la media aritmtica de las diferencias ( ).
Calcular la desviacin estndar de las diferencias (sd).
Calcular el valor de t por medio de la ecuacin.
Calcular los grados de libertad (gl) gl = N - 1.
Comparar el valor de t calculado con respecto a grados de libertad en la tabla
respectiva, a fin de obtener la probabilidad.
Decidir si se acepta o rechaza la hiptesis.
Prueba T de Student para muestras no relacionados:

Todas las pruebas paramtricas, en las cuales se incluye la t de Student y la F
de Fischer, se basan en supuestos tericos para utilizarse. Dichos supuestos
matemticos las hacen vlidas, pues al analizar las mediciones de las
observaciones, se tienen procedimientos de gran potencia-eficiencia para
evitar error del tipo I.
En tales pruebas paramtricas se exige una serie de requisitos para aplicarlas

como instrumento estadstico:
Las observaciones deben ser independientes.
Las observaciones se deben efectuar en universos poblacionales distribuidos
normalmente.
Las mediciones se deben elaborar en una escala de intervalo, entendiendo que
una escala de intervalo exige que puedan efectuarse todas las operaciones
aritmticas admisibles. Tambin se requiere que los intervalos entre las
mediciones tengan la misma magnitud.
Las varianzas de los grupos deben ser homogneas, de modo que cabe aclarar
que en las mediciones realizadas en biomedicina, es poco probable encontrar
varianzas iguales. Por ello, se utiliza la prueba ji cuadrada de Barlett para
decidir si las diferencias observables en la magnitud de las varianzas son
significativas o no.
El modelo matemtico que en seguida se presenta, corresponde a dos
muestras independientes.
Donde:
t = valor estadstico de la prueba t de Student.
1 = valor promedio del grupo 1.
2 = valor promedio del grupo 2.
sp = desviacin estndar ponderada de ambos
grupos.
N1 = tamao de la muestra del grupo 1.
N2 = tamao de la muestra del grupo 1.
Ecuacin para obtener la desviacin estndar ponderada:
Donde:
sp = desviacin estndar ponderada.
SC = suma de cuadrados de cada grupo.
N = tamao de la muestra 1 y 2.
Pasos:
Determinar el promedio o media aritmtica de cada grupo de poblacin.
Calcular las varianzas de cada grupo, a fin de demostrar la homogeneidad de
varianzas mediante la prueba de X2 de Bartlett.
Calcular la suma de cuadrados de cada grupo: Suma de cuadrados (SC) = S(X
- )2.
Calcular la desviacin estndar ponderada (sp) de ambos grupos.
Obtener la diferencia absoluta entre los grupos ( 1 - 2).
Aplicar la frmula y obtener el valor estadstico de t.
Calcular los grados de libertad (gl). gl = N1 + N2 -2
Obtener la probabilidad del valor t en la tabla.
Decidir si se acepta o rechaza la hiptesis.
Ejemplo: Un investigador ha obtenido la talla de 20 nios de 5 aos de edad,

de dos condiciones socioeconmicas contrastantes (alta y baja). Considera que
ambos grupos de poblacin tienen estaturas diferentes.
Eleccin de la prueba estadstica.
Tenemos un modelo experimental con dos muestras independientes.
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las tallas de nios de 5 aos de las dos muestras, de
condiciones socioeconmicas contrastantes, son distintas.
Hiptesis nula (Ho). Las diferencias observadas en las tallas de nios de las dos
muestras de condicin socioeconmica similar se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Talla en cm de nios de condiciones socioeconmicas baja y alta.
Aplicacin de la prueba estadstica.

Suma de cuadrados.
Desviacin estndar ponderada.
Ecuacin t.
gl = N1 + N2 -2 = 10 + 10 - 2 = 18
El valor de to se compara con los valores crticos de la tabla (tt) con 18 grados
de libertad, y se obtiene que en el valor ms cercano al calculado, la
probabilidad es de 0.001 (valor crtico de t: 3.92).
Decisin.
Como el valor de to (3.99) tiene una probabilidad de significancia menor que
0.001, tambin es menor que 0.05, propuesto como nivel de significancia, por
lo cual se acepta Ha y se rechaza Ho.
Interpretacin.
Las diferencias en talla de ambos nios de condiciones socioeconmicas
antagnicas (alta y baja) difieren notoriamente en el nivel de confianza de p
menor que 0.001.
Prueban de Ducan.
Se utiliza para comparar todos los pares de medias. Fue

desarrollado por primera vez por Duncan en 1951 pero
posteriormente l mismo modific su primer mtodo generando el
que ahora se denomina Nuevo mtodo de Rango Mltiple de
Duncan. Esta prueba no requiere de una prueba previa de F, como
sucede con la DMS o sea que an sin ser significativa la prueba F
puede llevarse a cabo.
La estadstica de Prueba es denotado, por
Donde es el nmero de medias inclusives entre las dos medias a comparar

para diseos balanceados. Para aplicar esta prueba al nivel
se debe pasar
por las siguientes etapas:
1. Determine el error estndar (desviacin estandar) de cada promedio,
cual es dado por la expresin:
Donde el CM
es obtenido de la tabla Anova
, el
2. Con los grados de libertad del error y el nivel de significancia
determinar
los valores de
(intervalos o amplitudes estandarizadas significativos)
utilizando las tablas de amplitudes estandarizadas de Duncan dadas por Harter
(1960) y que se encuentran en el libro de Miller (1992). Para encontrar estos
valores, se requieren los grados de libertad del error y el valor de
.
3. Determinar las amplitudes mnimas significativas denotadas por
calculados por la expresin:
4.
Se
ordenan
de
manera
creciente
los
resultados
promedios
del
experimento
5. Se comparan las medias ordenadas
comparar en el siguiente orden:
as:comienza a
a) El promedio ms alto,
con el ms bajo,
comparando esta diferencia
con el intervalo mnimo significativo . Si esta diferencia es no significativa
entonces todas las otras diferencias son no significantes. Si la diferencia es
significativa se continua con b)
b) Posteriormente se calcula la diferencia entre el valor ms alto
penltimo
y el
y se compara con el intervalo mnimo significativo
c) Este procedimiento se contina hasta que todas las medias se han

comparado con la media ms grande
d) A continuacin se compara la segunda media ms grande
con la ms
pequea
y se compara con el intervalo mnimo significativo
Este proceso contina hasta que han sido comparadas las diferencias entre
todos los
posibles pares.
Si una diferencia observada es mayor que el intervalo mnimo significativo, se

concluye que la pareja de medias comparadas son significativamente
diferentes.
Para evitar contradicciones, ninguna diferencia entre una pareja de medias se
considera significativamente diferentes si stas se encuentran entre otras dos
que no difieren significativamente. A manera de ilustracin se tiene:
Cuando el diseo es desbalanceado pero los tamaos de rplicas
en vez de
muestras
difieren marcadamente este mtodo puede adaptarse utilizando

en la estadstica, el valor de la media armnica de los tamaos de
o alternativamente se puede reemplazar a

medias extremas, donde
por
la media armnica de las
y
y
son los tamaos de muestra correspondientes a las medias de
tratamientos menos pequeo y ms grande respectivamente.
Ejemplo: Al aplicar el mtodo de Duncan a los datos del ejemplo del algodn
se tiene:
1. El error estndar de la media es
2. Determinacin de los intervalos significativos como
Utilizacin la tabla VII del Apndice de Montgomery se tiene:
3. Los rangos mnimos significativos son:
4. Las medias ordenadas ascendentemente son:
5. Comparacin de las medias
se
compara con
porque entre
hay inclusive
medias.Ver numeral 4 .
Al presentar en u diagrama de lneas los resultados se tiene
Prueba de Tukey.
Este procedimiento fue propuesto por Tukey (1952) para
probar la hiptesis
Este metodo es muy similar en la aplicacin al de

, salvo por el hecho de
que en lugar de utilizar las distribuciones de como base para realizar las
comparaciones, se emplea la distribucin del rango estandarizado o
estudentizado
Se rechaza
Nosotros comparamos
si
con
Donde
es
el
percentil
de
estandarizado.Tablas para hallar los valores de

(1960), Hochberg and Tamhane (1987).
la
distribucin
rango
son dadas por Harter
En esta prueba se utiliza un slo valor con el cual se comparan todos los
posibles pares de medias. El mtodo de comparacin de Tukey fue reformado
por Kramer (1956) para casos en el que el nmero de rplicas no es igual. Este
mtodo es conocido como mtodo de Tukey-Kramer. Este simplemente
reemplaza la expresin dada en Tukey por:
Donde
en un D.C.A.
Si el nmero de repeticiones no es demasiado desigual, Spotuall y Stoline

(1973) dieron un mtodo para probar la hiptesis
Rechazar
si
Cuando las rplicas son muy diferentes este mtodo es menos sensible que el
de Scheff.
Ejemplo: En el ejemplo de los medicamentos los contrastes C , C
comparaciones independientes, as
hiptesis
Son respectivamente rechazar
si
y C , son
y la regla de decisin para todas las
El valor de
es 2.522
2.4.2. NO PARAMETRICAS.
Prueva para k muestras independientes.
En este apartado se presentan dos pruebas que permiten contrastar si k >2
muestras aleatorias e independientes proceden de una misma poblacin, es
decir, si un factor que subdivide la poblacin de origen incide de forma
significativa sobre el valor central de la poblacin. Estos contrastes son
alternativas no paramtricas al anlisis de la varianza cuando se incumple
alguno de los supuestos bsicos de dicho anlisis. El nico requisito para
aplicar estos contrastes es que la variable est medida al menos en una escala
ordinal.
PRUEBA H DE KRUSKAL-WALLIS
Este contraste permite decidir si puede aceptarse la hiptesis de que k
muestras independientes proceden de la misma poblacin o de poblaciones
idnticas con la misma mediana. El nico supuesto necesario es que las
distribuciones subyacentes de las variables sean continuas y que stas hayan
sido medidas por lo menos en una escala ordinal.
Sean n1, n2 ... nk los tamaos de cada una de las muestras y n el total de
observaciones. Para el clculo del estadstico de prueba se ordenan las n
observaciones de menor a mayor y se les asignan rangos desde 1 hasta n. A
continuacin se obtiene la suma de los rangos correspondientes a los
elementos de cada muestra, Rj y se halla el rango promedio. Si la hiptesis
nula es cierta, es de esperar que el rango promedio sea aproximadamente
igual para las k muestras; cuando dichos promedios sean muy diferentes es un
indicio de que H0 es falsa.
El estadstico de prueba es:
Si H0 es cierta y los tamaos muestrales son todos mayores que 5, el

estadstico H se distribuye aproximadamente como chi-cuadrado con k-1
grados de libertad. La aproximacin es tanto mejor cuanto mayor es el nmero
de muestras y el tamao de las mismas.
Cuando se producen empates, es decir, cuando varias observaciones de la
misma o de distintas muestras son iguales y a todas se les asigna el mismo
rango, es necesario dividir el valor de H por el siguiente factor de correccin:
En esta expresin g es el nmero de rangos que se repiten y ti es el nmero de

veces que se repite el rango i-simo. El efecto del factor de correccin es
elevar ligeramente el valor de H.
PRUEBA DE LA MEDIANA
Mediante esta prueba se contrasta la hiptesis nula de que k muestras
independientes de tamaos n1, n2 ... nk proceden de la misma poblacin o de
poblaciones con medianas iguales. Para este contraste se requiere que la
variable sea medible por lo menos en una escala ordinal y es particularmente
til cuando por alguna razn (como, por ejemplo, por haberse establecido
puntos de corte durante el proceso de obtencin de los datos) se sabe que las
muestras no pueden contener observaciones extremas.
Para hallar el valor del estadstico de prueba se ordenan las n observaciones
(n1 + n2 +... +nk) de menor a mayor y se determina el valor de la mediana
comn, Me.. A continuacin, cada una de las observaciones originales se
asigna a una de dos categoras: a la categora 1 si es superior a la mediana
comn o a la categora 2 si es inferior o igual.
El nmero de observaciones de cada grupo asignadas a cada categora se
recoge en una tabla de contingencia como la siguiente:
Muestra
Superiore
s a Me
Inferiores
a
Me
Inferior o
iguales a
Me
Total
El estadstico de prueba
es:
Eij es la frecuencia esperada en la i-sima fila de la j-sima columna bajo el

supuesto de que la hiptesis nula es cierta, calculada como producto de las
frecuencias marginales dividido por n. Si la hiptesis nula es cierta el
estadstico de prueba se distribuye aproximadamente como una chi-cuadrado
con k - 1 grados de libertad. Se rechazar H0 si el valor del estadstico de
prueba est en la regin crtica.
Cuando aparecen frecuencias esperadas menores que 5 la aproximacin de la
distribucin del estadstico de prueba mediante la chi-cuadrado no es buena y
debern agruparse muestras o aumentar el tamao de las mismas para
resolver el problema.
REALIZACIN DE LOS CONTRASTES
.Para realizar estas pruebas la secuencia es:
.Analizar
.Pruebas no paramtricas
.k muestras independientes
En el cuadro de dilogo se seleccionan en Contrastar variables la variable que

recoge las puntuaciones de los grupos. En Variable de agrupacin se indica la
variable que determina los grupos, es decir, la variable que acta como factor
y se indica en Definir el rango los valores enteros para el mximo y el mnimo
que se correspondan con las categoras mayor y menor de la variable de
agrupacin. Se activa la o las pruebas que se quieren realizar en el recuadro
Tipo de prueba. Por defecto nicamente est activada la prueba H de KruskalWallis.
Ejemplo: Con los datos de la encuesta Enctrans.sav probar si los alumnos
que utilizan habitualmente los transportes pblicos (metro, bus, tren) valoran
de forma significativamente distinta las caractersticas independencia (Inde) y
rapidez (Rapi).
Se trata de contrastar la hiptesis nula de que la valoracin asignada a la
independencia y a la rapidez difieren significativamente en funcin del tipo de
transporte pblico utilizado. Dado que las valoraciones de ambas
caractersticas se miden en una escala ordinal y las muestras son
independientes, el contraste ms adecuado es la prueba H de Kruskal-Wallis.
Para realizar este contraste la secuencia es:
Estadstica > Pruebas no paramtricas > k muestras independientes.
En el cuadro de dilogo se selecciona en Contrastar variables Independencia y
Rapidez; en Variable de agrupacin se indica el factor, es decir, la variable que
induce los diferentes grupos, que en este caso es la variable Trans. Como
nicamente interesa comparar la opinin de los usuarios del transporte pblico
en el cuadro de dilogo que se abre con el botn Definir rango se indica como
rango Mnimo 1 y como rango Mximo 3, ya que 1, 2 y 3 son las codificaciones
asignadas a las modalidades metro, bus y tren respectivamente. Al aceptar se
obtienen los siguientes resultados:
Por lo que se refiere a la variable Rapidez, el estadstico de prueba es 6,449 y

por tanto se rechaza la hiptesis nula segn la cual los tres grupos valoran
igualmente esta caracterstica. En el caso de la variable Independencia el valor
del estadstico Chi-cuadrado es 0,891 y no se rechaza la hiptesis nula
Prueba para k muestras relacionadas.
Este procedimiento es til en aquellos casos que deseemos comparar k
muestras relacionadas utilizando una variable dependiente medida en una
escala ordinal. El procedimiento de introduccin de los datos es anlogo al de
la prueba "t" para muestras relacionadas, es decir, debemos introducir los
resultados de cada medida en una variable distinta. En nuestro caso hemos
registrado la posicin en que un grupo de atletas llega al final de una carrera
en
tres
das
consecutivos.
El programa nos proporciona tres posibles estadsticos. La prueba
de Friedman podramos considerarla como una prueba anloga a la de Kruskal
Wallis para el caso de muestras relacionadas. La prueba de Kendall, por su
parte es til para verificar el grado de acuerdo entre una serie de jueces al
respecto de un grupo de tems. Finalmente la prueba Q de Cochran se aplica en
aquellos casos en que operemos con variables dicotmicas. En nuestro caso
vamos a ver el output que obtendramos al aplicar la prueba de Friedman.
En primer lugar el output nos muestra el rango promedio que han obtenido los
atletas en cada uno de los das de competicin, podemos observar como media
de las posiciones que han ocupado el tercer da parece ser mayor que la de los
dos primeros das. Posteriormente el programa nos presenta la prueba de
inferencia
correspondiente:
Partiendo de este resultado podemos concluir que la posicin en la que han
terminado la carrera este grupo de atletas se ha ido modificando a lo largo de
los tres das en los que hemos obtenido los datos.
III.
BIBLIOGRAFIA
.http://www.virtual.unal.edu.co
.https://www.clubensayos.com/Temas-Variados/RegresionCurvilinea/34154.html
.http://www.vitutor.com/pro/3/b_g.html (Consultado 29/09/2008).
. JORGE GALBIATI RIESCO: DISEO DE EXPERIMENTOFACTORIALES
APLICADOS A
PROCESOS INDUSTRIALES
.EDICIONES DIAZ DE SANTOS, S.A: CONTROL DE CALIDAD- TEORIA Y
APLICASIONES
.Dette H., Melas VB, Pepelyshev A. Optimal designs for a class of
nonlinear regression models. Ann Stats 2004, 32: 214267

Control

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Control

Uploaded by

Copyright:

Available Formats

REVICION DE LOS FUNDAMENTOS DE ESTADISTICA

REVISIN Y APLICACIONES A PRESENTAR

clase (nmero de intervalos).

2.1.2. REPRESENTACIONES GRAFICAS.

Tipos de grficos de barras

1. Grfico de barras sencillo:

Representa los datos de una nica serie o conjunto de datos.

2. Grfico de barras agrupado:

Representa los datos de dos o ms series o conjuntos de datos.

3. Grfico de barras apilado

2.1.3. MEDIDAS ALGEBRAICAS DE LAS

2.2. DISTRIBUCIONES MS COMUNES:

probabilidad de que un recipiente escogido al azar contenga menos de 500 g

tendr una distribucin normal estndar

Cuando y = 500, z = (500-510)/4 = -2,5. Por tanto,

Pr(y 500) = Pr(z 2,5) =

Esta cantidad aparece tabulada en la tabla como 0.0048. La probabilidad

comprensin. Finalmente, en el Cierre, se destacan los

Ecuacin 1. Funcin de Probabilidad de la distribucin Binomial.

Una distribucin de probabilidad binomial es una distribucin terica,

aproximar, debemos tener en cuenta que estamos pasando de una

En la siguiente figura, puede apreciarse como al incrementar n, se ve que los

Tabla de distribucion binomial:

p ( aceptar ) =P ( X< 2 )=P ( X=0 ) + P( X =1)

( 100 ) x ( 0.05 ) x (10.005) +( 101 ) x (0.005) (10.005)

P (aceptar) = 0.599 + 0.315 = 0.914

P (x I ) = la probabilidad de que ocurran X xitos cuando el nmero

Una microbiologa quiere estimar la concentracin de cierto tipo de bacteria en

X = numero de bacterias en los 0.5 ml

una distribucin discreta

con muestreos aleatorios y sin reemplazo. Supngase que

) elementos de la categora A en una muestra

hipergeomtrica puede deducirse a travs de razonamientos combinatorios y

es el nmero de elementos en la poblacin original que

pertenecen a la categora deseada y

muestra que pertenecen a dicha categora. La

notacin hace referencia al coeficiente binomial, es decir, el nmero de

El valor esperado de una variable aleatoria X que sigue la distribucin

En la frmula anterior, definiendo

La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y

Ejemplo. Un cargamento de 20 cajas de chocolate contiene 5 defectuosas, si

p(x = 2, N = 20, t = 5, N = 10) =

2.3. CORRELACION ENTRE DOS VARIABLES.

Si tenemos los datos que se presentan en la tabla y

Donde los puntos

representan cada uno de los

Supngase que deseamos obtener la correlacin de los datos de la tabla

7 * 13483 (183 * 499)

Se debe aclarar que el coeficiente de correlacin slo puede variar de la

coeficiente de determinacin que se obtiene con r cuadrada, ya que

variable "y" y l para el

Para entender el uso de esta frmula usaremos un ejemplo:

La sustitucin de la frmula es la siguiente:

48 * 5380.77 - (82.06 * 3116)

Al interpretar nuestro resultado podemos concluir que si existe relacin entre el

Una vez calculado el valor del coeficiente de correlacin

En consecuencia, dado un cierto coeficiente de correlacin r xy obtenido en una

y se compara el valor obtenido con el existente en las tablas para un cierto

t t ( ,N 2) Se acepta la Hiptesis nula. La correlacin obtenida procede

El error aleatorio; son las desviaciones de los verdaderos valores de Y con

Diagrama de regresin linial

2.4. PRUEBAS ESTADSTICAS.

Ejemplo. Se desea investigar el efecto del pH en el crecimiento de cierto