Professional Documents
Culture Documents
Estadística. Unidad IV
Estadística no paramétrica
Luis María Dicovskiy Riobóo
Objetivos
1
Para quienes no poseen una formación básica estadística, son más fácil de
entender y calcular.
La hipótesis nula de esta prueba, H0: plantea que no hay diferencias de notas
entre la evaluación final menos la evaluación de inicio o sea que existe el mismo
2
número de positivos (+) que de negativos (-), donde la probabilidad de (+) es un ½
y la mediana de las diferencias es 0. Se rechaza H0 en favor de HA sólo si el
número observado de signos (+), es grande, la fracción observada de signos
positivos es significativamente mayor que ½. Se rechaza la H0 si el valor p (+)
calculado es mayor que un alfa de 0.05
Procedimiento
1) Se eligen al azar pares de personas (estudiantes del mismo curso, con
igual formación previa) y se hace una evaluación antes y después, se
calcula la diferencia para cada par.
2) diferencia >0 se asigna un signo (+).
3) diferencia <0 se asigna un signo (–).
Si “n” es pequeño se considera que son “n” pruebas Bernoulli independientes con
p =1/2 (+) y (1-p) = q = 1/2 (-). Por lo que el número total de (+) es una variable
aleatoria con distribución BINOMIAL con parámetros n y p.
Entonces
El promedio esperado de (+) es “n p = n/2”
La varianza de (+) es “n p(1-p) = n/4”
3
Z+= ((Estimador 0.5) – Promedio esperado) / Desvío estándar
del Estimador
Ejercicio 1
Donde:
Ejercicio
a) En el siguiente grupo de estudiantes determinar por la prueba del signo, si
hubo mejora entre las notas promedios de la primera evaluación de
exámenes trimestrales y la segunda evaluación trimestral.
5
Primer Segundo Primer Segundo
Estudiante Trimestre Trimestre Estudiante Trimestre Trimestre
Sindy 80 87 Indira 75 80
Tatiana 80 85 Rosa 69 73
Eyleen 67 70 Lilliam 70 65
Arlen 70 85 Heydi 75 73
Wilmer 70 75 Clark 75 79
Wendel 72 72 Heydi L. 70 75
Juniel 64 85 Axel 70 70
Juan J 82 73 Itzan 65 70
Nesly 90 88 Milton 71 76
Jeydels 82 89 Meyling 80 82
Erick 78 85 Jasser 70 69
Miriam 79 84 Darol 60 60
Nely 81 90 Karla 63 74
6
Por ejemplo si se quiere vincular la variable tener o no beca, con el éxito de un
examen académico, dos variables cualitativas nominales. Los resultados de un
estudio de este tipo se pueden comprimir en una tabla de contingencia 2x2 del tipo
como la siguiente
Becado No Becado
Éxito a b m = a+b
No E c d n = c+d
e = a+c f = b+d T
Donde se estudian “T” total de alumnos, “a” son becados (B) y tienen éxito en un
examen (Éxito), “b” alumnos que no tienen beca (N B) y no tiene éxito en un
examen (No E).
Para resolver esta prueba se debe construir una tabla de valores esperados, como
a continuación se observa:
Becado No Becado
Éxito em/T fm/T m
No E en/T fn/T n
e f T
𝒌
𝟐
(𝑶𝒊 − 𝑬𝒊 )𝟐
𝝌 =∑
𝑬𝒊
𝒊=𝟏
7
son 1. Esto se puede generalizar a tablas CxF y los grados de libertad son
(Columnas-1) x (Filas-1). El valor tabular se busca en una tabla de ji-cuadrado, X2
a continuación se muestra un resumen de la misma, para un alfa del 5%.
Ejemplo
Éxito No E Totales
Becado 88 12 100
No Becado 143 57 200
Totales 231 69 300
Éxito No E
Becado 231x100/300=77 69x100/300=23
No Becado 231x200/300=154 69x200/300=46
Obsérvese que una vez calculado uno de los valores esperados, los demás vienen
dados para conservar los totales marginales (eso es lo que significa que hay 1
g.l.).
8
A partir de aquí calculamos el valor χ2 con una corrección, sustraer 0.5 del valor
absoluto, corrección de Yates, que se usa solamente en las tablas 2x2 (de dos
filas y dos columnas), esto es para lograr continuidad en los datos. Como no existe
un consenso generalizado sobre su aplicación, este queda a criterio del
investigador, sin embargo algunos autores sugieren usar la solamente la
corrección cuando los totales de ambas variables son fijos. En este ejemplo
aplicaremos la corrección de Yates a modo de ejemplo.
𝑘
2
(|𝑂𝑖 − 𝐸𝑖 | − 0.5)2 10.52 10.52 10.52 10.52
𝜒 =∑ = + + + = 9.34
𝐸𝑖 77 23 154 46
𝑖=1
𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2 112 112 112 112
𝜒 =∑ = + + + = 10.25
𝐸𝑖 77 23 154 46
𝑖=1
2
El valor de tabla con un grado de libertad, (2-1) X (2-1), es de 𝜒1(0.05) = 3.84
9
INFOSTAT se debe construir una tabla de contingencia y buscar en estadísticos la
prueba X2
10
Gráfico de Barras
10
Beca
8 No
Si
6
Cantidad
0
varón mujer
Sexo
Frecuencias observadas
Turno
Día Tarde Noche
Defectuosos 450 550 700
11
Sea que p1, p2 y p3 representen las proporciones reales de artículos
defectuosos para los turnos del día, la tarde y la noche, respectivamente.
Resolver la siguiente prueba de hipótesis
Donde:
K: número de grupos.
n: número total de elementos o datos.
Rj: Suma de Rangos del grupo j.
nj: número de elementos del grupo j.
12
H1: Al menos una de las medianas es diferente
Una vez calculado el estadístico H, se busca en una tabla diseñada para esta
prueba el valor crítico, H crítico, si H calculado>H crítico se rechaza la hipótesis nula y por
tanto existe diferencia entre los grupos. En caso de tener suficientes repeticiones,
más de 5 observaciones por grupo, se puede usar los valores de la tabla “X 2” con
K-1 grados de libertad para determinar el valor crítico y no es necesario usar la
Tabla de valores H.
K= 3
N= 19, NV = 6, NI =6, NP = 7.
Rango Video: 1, 2, 4, 5, 6.5, 8 = 26.5
Rango Internet: 3, 6.5, 9.5, 11, 13, 14.5 = 57.5
Rango Profesor: 9.5, 12, 14.5, 16, 17, 18, 19 = 106
13
Se concluye que hay diferencias de retención según la forma de impartir la
capacitación ya que el valor 𝐻𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 11.78 ≥ 5.99 con α=0.05 y 2 grados de
libertad.
En esta prueba los datos se organizan en una matriz, donde las filas son los
bloques y las columnas los tratamientos o grupos.
Donde:
K: número de grupos o tratamientos.
n: número bloques o filas.
Rj: es la suma de las jerarquías dentro de la columna o tratamiento j.
14
Se puede usar los valores críticos de la tabla “X2” con K-1 grados de libertad para
determinar que hipótesis se cumple.
Ejemplo, se les pidió a nueve estudiantes de Ingeniería Industrial las notas de las
cuatro asignaturas que habían cursado el semestre anterior. Se quiere saber si
hay diferencias en la evaluación de las asignaturas, pero como se considera que
cada estudiante es diferente en su comportamiento, se trata de neutralizar este
efecto con un diseño de bloques aplicado a los estudiantes.
Datos
Estudiantes/ Asignaturas, Notas
bloque Programación Probabilidades Física III Metalurgia
II
A 74 86 79 93
B 75 82 99 95
C 72 80 84 86
D 79 78 80 88
E 74 75 67 93
F 76 82 84 96
G 71 85 86 94
H 82 86 93 97
I 75 86 96 94
15
Cálculo del coeficiente de Friedman:
12
𝑋2 = (112 + 192 + 262 + 342 ) − 3(9)(4 + 1) = 19.27
9(4)(4+1)
6 ∑𝑛1=𝑖 𝑑𝑖2
𝑟 =1−
𝑛(𝑛2 − 1)
16
Crear dos nuevas variables, una con las diferencias “d” de cada pareja de
observaciones y otra con las diferencias al cuadrado “d2”. Sumar esta última
variable. Se debe verificar que la suma de las diferencias “d” sea igual a 0.
Calcular el coeficiente “r” de Spearman con los valores de “d2” y “n”.
Matemáticas 2 3 5 5 6 6 7 7 8 9
Español 2 2 5 5 6 7 5 8 7 10
Diferencia -0.5 0.5 -0.5 -0.5 -0.5 -2.0 3.5 -1.5 1.5 0
de rangos
Diferencia al 0.25 0.25 0.25 0.25 0.25 4.00 12.25 2.25 2.25 0.0
cuadrado d2
En este ejemplo el valor “r” de Spearman de 0.87 se asemeja al valor del “r” de
Pearson de 0.919.
17