You are on page 1of 361

 

  
 
   

   
                
                   
         
      
              
                   
             !   
                     
 "        #$##   "    
    "  %      
           "
& '        " %   
   !         
          '     
  %     '

$()   *         


  
  +  ,  "-  
 ./     ! ! !  
0   ! !  !    
 
 "    0   
01"         
+       ,(
  

  

  



 
  

  
  
 
  

  
 
 
   
  

    


 
 

 
      
             
  
 
   
 !  
  
"        #     
$  !%  !      &  $  
'      '    ($    
'   # %  % )   % *   %
'   $  '     
+      " %        & 
'  !#     
 $,
 ( $



 - .
           /   
     
      -     
  
   .
      .  
  ! 
0     1       
  . (      -       %        
   1                      
     /  -      %
     %    %      %
       %  %        -    % 
          2       
                1   - 
 -  1% %     2 

3   $$$   

4 5 
5 " 6 5  7
     
8& )*93 +)
  
 :;<%==>>>&  %  " 
5 35 - 
? !  

*   &


    @ .


31    A;B>=8& )*93 +)


"C   0       &  ;B>=
Dedicado a mis hermanas
Miriam y Yessenia
FERNANDO MAUREIRA CID


ESTADISTICA AVANZADA PARA EDUCACION FISICA

AGRADECIMIENTOS

Quiero agradecer a mi Grupo de Investigación en


Neurocognición y Educación Física ya que ellos me inspiran a
seguir trabajando en textos de apoyo para la investigación científica.
Agradezco enormemente a Elizabeth Flores Ferro Magíster en
Docencia e Investigación Universitaria y Profesora de Educación
Física por la revisión del texto, los análisis estadísticos y por sus
comentarios para mejorar este libro,


FERNANDO MAUREIRA CID


ESTADISTICA AVANZADA PARA EDUCACION FISICA

INDICE DE CONTENIDOS ABREVIADOS

Introducción……………………………………………………… 17
Capítulo 1. Diseños de experimentos………………………… 19
Capítulo 2. Diseños de bloques aleatorizados……………… 63
Capítulo 3. Diseños factoriales……………………………….. 113
Capítulo 4. Análisis estadísticos de los diseños de
experimentos con SPSS………………………… 145
Capítulo 5. Estadística multivariante…………………………… 187
Capítulo 6. Métodos de dependencia………………………… 215
Capítulo 7. Métodos de interdependencia…………………… 279
Capítulo 8. Métodos estructurales……………………………. 323
Referencias bibliográficas……………………………………… 341
Anexos…………………………………………………………… 343

5
FERNANDO MAUREIRA CID


ESTADISTICA AVANZADA PARA EDUCACION FISICA

INDICE DE CONTENIDOS

Introducción……………………………………………………… 17

CAPITULO 1
DISEÑOS DE EXPERIMENTOS……………………………… 19
I. Introducción al diseño de experimentos……………… 21
1. Conceptos básicos en los experimentos………… 22
2. Principios básicos y pasos del diseño de
experimentos………………………………………… 28
3. Ronald Fisher………………………………………… 29
II. Diseño completamente aleatorizado…………………. 31
1. DCA y análisis de varianza………………………… 33
1.1 Comparaciones múltiples…………………. 41
2. Idoneidad del modelo………………………………. 44
2.1 Normalidad de los residuos……………… 44
2.2 Independencia de los residuos…………… 46
2.3 Homocedasticidad de los residuos……… 48
3. No idoneidad del modelo…………………………… 49
4. Tamaño de la muestra……………………………… 49
III. Diseños de mediciones en un experimento………… 53
1. Con post-prueba única……………………………… 53
2. Con pre y post-prueba……………………………… 53
3. Esquema de cuatro grupos de Solomon………… 54
4. Series cronológicas múltiples……………………… 54
5. Series cronológicas múltiples y tratamientos
repetidos……………………………………………… 56
6. Series cronológicas múltiples y tratamientos
múltiples……………………………………………… 58

CAPITULO 2
DISEÑOS DE BLOQUES ALEATORIZADOS…………….... 63
I. Diseño de bloques completamente
aleatorizado……………………………………………… 65
1. DBCA y ANOVA……………………………………… 69
1.1 Comparaciones múltiples………………… 75
7


FERNANDO MAUREIRA CID

2. Idoneidad del modelo………………………………. 77


2.1 Aditividad……………………………………. 77
2.2 Normalidad de los residuos……………… 80
2.3 Independencia de los residuos…………… 80
2.4 Homocedasticidad de las varianzas…… 80
II. Diseño de bloques incompletos
aleatorizados……………………………………………. 83
1. DBIA y ANOVA……………………………………… 85
III. Diseño de cuadrado latino……………………………. 93
1. DCL y ANOVA………………………………………. 94
1.1 Comparaciones múltiples………………… 101
2. Idoneidad del modelo……………………………… 101
IV. Diseño de cuadrado grecolatino……………………. 103
1. DCGL y ANOVA……………………………………… 104
1.1 Comparaciones múltiples………………… 111
2. Idoneidad del modelo………………………………. 111

CAPITULO 3
DISEÑOS FACTORIALES…………………………………….. 113
I. Diseño factorial 22………………………………………. 115
1. Diseño factorial 22 y ANOVA………………………. 117
1.1 Comparaciones múltiples………………… 122
2. Idoneidad del modelo………………………………. 122
3. Diseño factorial 22 con un caso por celda……….. 123
II. Diseño factorial 2k & 3k…………………………………. 127
1. Diseño factorial nk y ANOVA………………………. 128
III. Bloques y diseños factoriales 2k……………………… 137
1. Diseño factorial 22 con bloques y ANOVA………. 137

CAPITULO 4
ANALISIS ESTADÍSTICOS DE LOS DISEÑOS DE
EXPERIMENTOS CON SPSS………………………………….. 145
I. Análisis para diseño completamente
aleatorizado……………………………………………… 147
1. ANOVA para un DCA………………………………. 147
1.1 Pruebas Post-Hoc………………………… 151
8


ESTADISTICA AVANZADA PARA EDUCACION FISICA

2. Normalidad de los residuos……………………….. 153


3. Independencia de los residuos……………………. 157
4. Homocedasticidad de los residuos……………….. 158
II. Análisis para DBCA, DBIA, DCL Y DCGL….………… 159
1. ANOVA para un DBCA…………………………….. 159
2. ANOVA para un DBIA………………………………. 162
3. ANOVA para un DCL……………………………….. 165
4. ANOVA para un DCGL…………………………….. 168
III. Análisis para diseños factoriales 171
1. ANOVA para un diseño factorial 22 con
réplicas……………………………………………….. 171
2. ANOVA para un diseño factorial 22 sin
réplicas……………………………………………….. 174
3. ANOVA para un diseño factorial 23 con
réplicas……………………………………………….. 177
4. ANOVA para un diseño factorial 23 con bloques
bloques……………………………………………….. 180
5. Análisis de covarianza (ANCOVA)……………….. 183

CAPITULO 5
ESTADISTICA MULTIVARIANTE……………………………. 187
I. Introducción a la estadística multivariante………… 189
1. Vectores……………………………………………… 191
2. Matrices………………………………………………. 192
2.1 Operaciones con matrices……………….. 194
II. Descripción de datos multivariantes………………… 197
1. Medidas de tendencia central y variabilidad
multivariante………………………………………….. 198
2. Representación de datos multivariantes…………. 205
III. Supuestos del análisis multivariante……………….. 209
1. Normalidad multivariante…………………………… 209
2. Homocedasticidad multivariante………………….. 212
3. Linealidad……………………………………………. 213
4. No colinealidad………………………………………. 213
5. Independencia………………………………………. 213


FERNANDO MAUREIRA CID

CAPITULO 6
METODOS DE DEPENDENCIA……………………………….. 215
I. Regresión lineal múltiple……………………………….. 217
1. Comprobación de los supuestos del modelo de
regresión múltiple……………………………………. 224
II. Regresión logística……………………………………… 227
1. Comprobación de los supuestos del modelo de
regresión logística……………………………………. 237
III. Análisis discriminante………………………………… 239
1. Comprobación de los supuestos del modelo de
análisis discriminante.………………………………. 250
IV. Correlación canónica………………………………….. 253
V. Análisis de la varianza múltiple (MANOVA)………… 263
1. Comparaciones múltiples…………………………… 271
2. Comprobación de los supuestos del modelo de
MANOVA.…………………………………………….. 274
3. MANCOVA……………………………………………. 274

CAPITULO 7
METODOS DE INTERDEPENDENCIA……………………….. 279
I. Métodos de reducción de datos numéricos……….. 281
1. Análisis de componentes principales……………… 281
2. Análisis factorial……………………………………… 282
3. Aplicación práctica de análisis de componentes
principales y análisis factorial……………………… 283
II. Métodos de reducción de datos categóricos……… 293
1. Análisis de correspondencia simple………………. 295
2. Análisis de correspondencia múltiple…………….. 299
III. Análisis de conglomerados o cluster………………. 303
1. Análisis cluster jerárquico………………………….. 305
2. Análisis cluster no jerárquico………………………. 310
IV. Análisis de escalamiento multidimensional………. 315

CAPITULO 8
METODOS ESTRUCTURALES……………………………… 323
I. Ecuaciones estructurales…………………………….. 325
10


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1. Conceptos básicos…………………………………. 325


2. Pasos en la modelización de ecuaciones
estructurales…………………………………………. 329
2.1 Especificación del modelo……………….. 329
2.2 Identificación del modelo…………………. 329
2.3 Evaluación de los datos………………….. 330
2.4 Estimación de parámetros……………….. 331
2.5 Bondad de ajuste del modelo……………. 331
2.6 Reajuste del modelo e interpretación de
los resultados………………………………. 332
3. Ejemplo de ecuación estructural………………….. 332

Referencias bibliográficas…………………………………… 341

ANEXOS…………………………………………………………. 343

11
FERNANDO MAUREIRA CID

12


ESTADISTICA AVANZADA PARA EDUCACION FISICA

INDICE DE FORMULAS

Fórmula 1. Aditivo lineal DCA…………………………………. 33


Fórmula 2. Coeficiente de determinación DCA………………. 41
Fórmula 3. Cuadrado medio intra-grupo promedio…………. 42
Fórmula 4. Error estándar de la media del cuadrado medio
intra-grupo.…………………………………………. 42
Fórmula 5. Valor D………………………………………………. 43
Fórmula 6. Residuos……………………………………………. 44
Fórmula 7. Rachas……………………………………………… 47
Fórmula 8. Desviación estándar de rachas de la
población…………………………………………… 47
Fórmula 9. Estadístico Z de la prueba de rachas…………… 47
Fórmula 10. Valor d……………………………………………… 50
Fórmula 11. Tamaño de la muestra………………………….. 50
Fórmula 12. Aditivo lineal DBCA………………………………. 68
Fórmula 13. Coeficiente de determinación DBCA………….. 74
Fórmula 14. Coeficiente de determinación parcial del
tratamiento..……………………………………… 74
Fórmula 15. Coeficiente de determinación parcial de los
bloques……………………………………………. 74
Fórmula 16. (VWLPDGRUGHȖ«««««««««««««« 78
Fórmula 17. Suma de cuadrados de la interacción…………. 78
Fórmula 18. Suma de cuadrados debido al error…………… 79
Fórmula 19. Valor F para la aditividad………………………… 79
Fórmula 20. Suma de cuadrados de los tratamientos
ajustados…………………………………………. 87
Fórmula 21. Valor Q…………………………………………….. 87
13


FERNANDO MAUREIRA CID

Fórmula 22. 9DORUȜ««««««««««««««««« 87


Fórmula 23. Suma de cuadrados de bloques ajustados….. 90
Fórmula 24. Valor ȕ««««««««««««««««« 90
Fórmula 25. Aditivo lineal DCL………………………………… 94
Fórmula 26. Coeficiente de determinación DCL……………. 100
Fórmula 27. Coeficiente de determinación parcial de los 100
tratamientos………………………………………. 100
Fórmula 28. Coeficiente de determinación parcial del
bloque I……………………………………………. 100
Fórmula 29. Coeficiente de determinación parcial del
bloque II……………………………………………. 100
Fórmula 30. Aditivo lineal DCGL………………………………. 104
Fórmula 31. Coeficiente de determinación DCGL………….. 110
Fórmula 32. Coeficiente de determinación parcial del
bloque III………………………………………….. 110
2
Fórmula 33.Aditivo lineal diseño factorial 2 …………………. 117
k
Fórmula 34. Aditivo lineal diseño factorial n ………………… 128
2
Fórmula 35. Aditivo lineal diseño factorial 2 con bloques… 137
Fórmula 36. Vector de medias………………………………… 199
Fórmula 37. Varianza…………………………………………… 200
Fórmula 38. Covarianza……………………………………….. 200
Fórmula 39. Correlación de Pearson…………………………. 201
Fórmula 40. Correlación parcial………………………………. 202
Fórmula 41. Determinante de una matriz……………………. 203
Fórmula 42. Desviación típica generalizada para dos
variables………………………………………….. 203

14


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Fórmula 43. Desviación típica generalizada para 3


variables………………………………………….. 204
Fórmula 44. Distancia de Mahalanobis……………………….. 204
2
Fórmula 45. Valor d …………………………………………….. 204
2
Fórmula 46. Valor k …………………………………………….. 210
Fórmula 47. Modelo de regresión lineal múltiple…………….. 218
Fórmula 48. Modelo de regresión logística…………………… 228
Fórmula 49. Modelo de análisis discriminante……………… 240
Fórmula 50. Modelo de correlación canónica……………….. 254
Fórmula 51. Modelo de análisis de la varianza múltiple
MANOVA………………………………………….. 264
Fórmula 52. Modelo de análisis de componentes
principales………………………………………… 282
Fórmula 53. Modelo del análisis factorial……………………. 282
Fórmula 54. Modelo lineal de ecuaciones estructurales
de medida………………………………………… 328
Fórmula 55. Modelo lineal de ecuaciones estructurales
de relaciones estructurales……………………. 329
Fórmula 56. gl SEM…………………………………………….. 330

15


FERNANDO MAUREIRA CID

16


ESTADISTICA AVANZADA PARA EDUCACION FISICA

INTRODUCCION

El presente texto corresponde a la continuación del libro


Estadística Básica para Educación Física, razón por la que su
lectura previa es absolutamente necesaria. Muchos de los
fundamentos estadísticos se estudiaron previamente en dicho libro
y su conocimiento es fundamental para continuar avanzando en la
estadística para investigación científica.
La realización de experimentos es un paso importante para la
obtención de resultados en ciertos tipos de investigación, existiendo
diversos modelos según la complejidad del estudio realizado. En
algunos casos es necesario controlar una, dos o tres variables
intervinientes, existiendo modelos específicos para cada caso.
Otras veces las variables independientes presentan diversos niveles
de intervención necesitando experimentos específicos para obtener
los resultados óptimos.
En el libro Estadística básica para educación física se estudió
la estadística univariada, pero a veces es necesario trabajar con
múltiples variables al mismo tiempo y en ese caso es primordial la
utilización de la estadística multivariante, que se estudiará en el
presente texto.
Este libro esta compuesto de 8 capítulos. En el primero de
ellos se revisan los conceptos básicos del diseño de experimentos
necesarios para su aplicación, también se estudia el diseño
experimental más simple (diseño completamente aleatorizado) y los
diseños de aplicación de las mediciones y tratamientos durante la
investigación. En el segundo capítulo se explican los diseños de
bloque aleatorizados, el diseño de cuadrado latino y el diseño de
cuadrado grecolatino.
En el capítulo 3 se describen los diseños factoriales con dos
variables de dos niveles cada uno, de tres variables con dos
niveles, diseños factoriales con formación de bloques, etc.

17


FERNANDO MAUREIRA CID

En el capítulo 4 se presentan los análisis de los diversos


diseños de experimentos realizados mediante el programa
estadístico SPSS.
En el capítulo 5 se estudian los conceptos básicos de la
estadística multivariante, las medidas de tendencia central y
variabilidad multivariante y los supuestos necesarios para la
utilización de diversos análisis multivariantes.
En el capítulo 6 se analizan los diversos métodos de
dependencia multivariante (regresión simple, regresión logística,
análisis discriminante, correlación canónica y análisis de varianza
múltiple). En el capítulo 7 se revisan los diversos métodos de
interdependencia multivariante (componentes principales, análisis
factorial, análisis de correspondencia, análisis de conglomerados y
análisis de escalamiento dimensional). Finalmente, en el capítulo 8
se explican las ecuaciones estructurales.
Es importante destacar que los ejemplos mostrados en cada
uno de los capítulos de este libro son FICTICIOS y sólo formulados
para ilustrar los análisis correspondientes.
Espero que este libro sea una guía para estudiantes de
Magister y Doctorado en educación física, tanto para la realización
de sus trabajos de grado como para las investigaciones posteriores
que entreguen conocimiento a nuestra disciplina.

18


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPITULO 1

DISEÑOS DE EXPERIMENTOS

I. Introducción al diseño de experimentos

II. Diseño completamente aleatorizado

III. Diseños de mediciones en un experimento

19


FERNANDO MAUREIRA CID

20


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
INTRODUCCION AL DISEÑO DE
EXPERIMENTOS

 Los experimentos son procedimientos mediante los cuales se


trata de comprobar hipótesis relacionadas con un fenómeno, a
través de la manipulación de una o más variables independientes
para ver sus efectos sobre una o más variables dependientes. Por
ejemplo, un profesor quiere saber si un sistema de entrenamiento
de la fuerza es eficaz para estudiantes de 3° año m edio, para ello
evalúa la fuerza de los alumnos y los separa en dos grupos
homogéneos, posteriormente somete al grupo 1 al entrenamiento y
al grupo 2 no aplica ninguna intervención para que actué de grupo
control. Para determinar los efectos, el profesor evaluará los niveles
de fuerza de sus estudiantes tras la aplicación del programa y
comparará los resultados obtenidos por los dos grupos.
El ejemplo anterior es el diseño más simple de un
experimento y puede graficarse así:

G1 01 X1 02
G2 03 - 04

G1 = Grupo 1 (experimental)
G2 = Grupo 2 (control)
01, 03 = mediciones de la fuerza antes de la intervención
X1 = entrenamiento
- = sin intervención
02, 04 = mediciones de la fuerza tras la intervención

21


FERNANDO MAUREIRA CID

1. CONCEPTOS BASICOS EN LOS EXPERIMENTOS

a) Los factores corresponden al conjunto de variables dentro del


experimento y se dividen en:

x Factores del diseño: son las variables que se seleccionan para


ver sus cambios con el experimento (corresponden a las
variables dependientes). Por ejemplo, los niveles de motricidad
en estudiantes de primero básico.

x Factores estudiados: son las variables que se investigan en el


experimento para ver cómo afectan a las variables del diseño
(corresponden a las variables independientes o tratamientos).
Por ejemplo, los talleres de actividad física que se aplicarán para
ver sus efectos sobre lo niveles de motricidad en estudiantes de
primero básico.

x Factores perturbadores controlables: son las variables que


pueden afectar los resultados del experimento y cuyos niveles
pueden ser ajustados por el investigador. Por ejemplo, la hora y
los días de la semana en que se realizará el taller de actividad
física a los estudiantes de primero básico.

x Factores perturbadores no controlables: son las variables


que pueden afectar los resultados del experimento y que no
pueden ser contraladas, pero sí medidas por el investigador.
Estas variables son tratadas con análisis de covarianzas para
restar sus efectos en el experimento. Por ejemplo, otras
actividades físicas fuera del colegio, alimentación, horas de
sueño, etc. de los estudiantes de primero básico que realizarán
el taller.

b) Las unidades experimentales corresponden al sujeto o grupos


de sujetos que serán expuestos a un tratamiento.

c) El error experimental corresponde a la variación entre los su-


22


ESTADISTICA AVANZADA PARA EDUCACION FISICA

jetos que participan en el experimento. Por ejemplo, dos sujetos


expuestos al mismo programa de entrenamiento poseen
diferentes índices de mejora de la flexibilidad.

d) En un experimento es fundamental contar con un grupo control
que corresponde a un conjunto de sujetos que no serán
expuestos al tratamiento, pero que igualmente serán medidos
para saber si existen cambios aún sin la intervención, ya que de
ser así no es posible atribuir las variaciones al tratamiento.

e) Los rangos corresponden a los niveles en que se hará variar los


factores estudiados o tratamientos. Por ejemplo, si el factor es el
ejercicio físico sus rangos podrían ser: ejercicio aeróbico,
anaeróbico y mixto.

f) Los bloques consisten en una distribución de las unidades


experimentales en grupos, siendo los integrantes dentro de cada
grupo homogéneos y al mismo tiempo siendo los grupos
heterogéneos entre sí. La finalidad de esto es reducir la
variabilidad entre las unidades y por ende reducir el error
experimental. Por ejemplo, para un grupo de personas
establecemos bloques para las edades (grupo 20-30 años,
grupo 31-40 años, grupo 41-50 años) dentro de los grupos los
valores de la variable dependiente serán similares entre los
sujetos, pero estos valores serán distintos entre los tres grupos.

g) La sensibilidad es la capacidad que tiene el diseño


experimental de detectar pequeñas diferencias entre los
tratamientos.

h) La ortogonalidad es la independencia entre los tratamientos o


efectos de los tratamientos.

i) El aditivo lineal es una expresión algebraica que resume todos


los componentes del experimento (tratamientos, bloques,
efectos, etc.).

23


FERNANDO MAUREIRA CID

j) Los experimentos unifactoriales son aquellos en que se


estudia un solo factor (una variable dependiente y una variable
independiente) en tanto los experimentos multifactoriales son
aquellos en que se estudian simultáneamente dos o más
factores (una variable dependiente y dos o más variables
independientes; dos o más variables dependientes y una o más
variables independientes).

Unifactorial
Experimento
Multifactorial

Figura 1. Experimentos según cantidad de factores.

k) Un diseño experimental indica la manera en que se aleatorizan


los tratamientos aplicados a la unidades experimentales y la
forma de controlar las variables perturbadoras. Los diseños más
utilizados son el diseño completamente aleatorizado (DCA), el
diseño de bloques completamente aleatorizado (DBCA), diseño
de bloques incompletos aleatorizados (DBIA), diseño de
cuadrado latino (DCL) y diseño de cuadrado grecolatino (DCGL).

DCA
Unifactorial DBCA
DBIA
Multifactorial DCL
DCGL

Figura 2. Diseños experimentales.

l) Un diseño experimental es de factores fijos cuando los rangos


del factor representan todos los niveles posibles o si son los
únicos niveles sobre los que se desea inferir. Por ejemplo, si un
investigador quiere conocer los efectos de diversos sistemas
energéticos de actividad física puede utilizar el ejercicio físico
aeróbico, anaeróbico y mixto.
24


ESTADISTICA AVANZADA PARA EDUCACION FISICA

m) Un diseño experimental es de factores aleatorios cuando los


rangos del factor representan una muestra aleatoria de todos los
posibles rangos. Por ejemplo, si un investigador quiere conocer
los efectos de diversas cargas de trabajo aeróbico puede utilizar
un entrenamiento físico al 50%, 70% y 90% de la FCmáx.

n) Un diseño experimental es de factores mixtos cuando los


rangos de un factor son fijos y los rangos de otro factor son
aleatorios. Por ejemplo, los efectos del ejercicio físico sobre
todos los niveles de IMC (factor fijo) y algunos niveles del gasto
energético (factor aleatorio).

o) Un diseño experimental es balanceado cuando cada grupo del
experimento posee la misma cantidad de observaciones.

p) Un diseño experimental es desbalanceado cuando a lo menos
un grupo del experimento posee una cantidad diferente de
observaciones.

De la mezcla de factores fijos, aleatorios y mixtos y de


experimentos balanceados y desbalanceados surge la siguiente
taxonomía de diseños de experimentos:

Balanceado
Factores
fijos Desbalanceado
DCA
Unifactorial DBCA Balanceado
DBIA Factores
Multifactorial DCL aleatorios Desbalanceado
DCGL
Balanceado
Factores
mixtos Desbalanceado

Figura 3. Experimentos según factores y sujetos por grupos.

25


FERNANDO MAUREIRA CID

q) Los diseños de tratamientos corresponden a la selección de


factores, sus niveles y combinación de ellos. Los diseños
factoriales más utilizados son 22, 23, 2k, 32, 33, 3k, nk, 2x2x3,
3x3x5, etc.

Factores 22, 23,…2k,


fijos 32, 33,…3k
balanceado y nk
desbalanceado 2x2x3, 3x3x5
DCA
DBCA Factores 22, 23,…2k,
Multifactorial DBIA aleatorios 32, 33,…3k
DCL balanceado y nk
DCGL desbalanceado 2x2x3, 3x3x5

Factores 22, 23,…2k,


mixtos 32, 33,…3k
balanceado y nk
desbalanceado 2x2x3, 3x3x5

Figura 4. Diseños factoriales en experimentos multifactoriales.

r) Los diseños de mediciones corresponden a las combinaciones


de mediciones y sus aplicaciones. Los diseños de mediciones
más utilizados son pre-prueba, pre y post-prueba, de Solomón,
de series cronológicas múltiples (SCM), de series cronológicas
múltiples y tratamientos repetidos (SCMTR), de series
cronológicas múltiples y tratamientos múltiples (SCMTM), etc.

26


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Pre-prueba
Factores Pre y post-prueba
fijos De Solomón
balanceado y SCM
desbalanceado SCMTR
SCMTM

DCA Pre-prueba
Unifactorial DBCA Factores Pre y post-prueba
DBIA aleatorios De Solomón
Multifactorial DCL balanceado y SCM
DCGL desbalanceado SCMTR
SCMTM

Pre-prueba
Factores Pre y post-prueba
mixtos De Solomón
balanceado y SCM
desbalanceado SCMTR
SCMTM

Figura 5. Esquema de diseños de mediciones en un experimento.

Todo lo anterior nos permite clasificar un experimento como


Unifactorial, diseño completamente aleatorizado de factores fijos,
balanceado con pre y post-prueba. En otro ejemplo, un experimento
puede ser Multifactorial, diseño de bloques completamente
aleatorizado de factores fijos, desbalanceado, factorial 32, de series
cronológicas múltiples.

27


FERNANDO MAUREIRA CID

2. PRINCIPIOS BASICOS Y PASOS DEL DISEÑO DE


EXPERIMENTOS

Para generar un diseño estadístico del experimento, que


corresponde al proceso de planificación de dicho experimento, es
necesario considerar tres aspectos fundamentales:

x Realización de réplicas: corresponde a la repetición del


experimento básico. Por ejemplo, si se aplica un sistema de
entrenamiento X a un grupo y un sistema de entrenamiento Y a
otro grupo, y cada grupo está compuesta de 5 sujetos, se dice
que se ha obtenido 5 réplicas. Esto permite obtener una
estimación del error experimental y permite estimar el efecto de
un factor. Un experimento con 1 réplica no puede hacer
inferencias sobre los resultados.

x La aleatorización: corresponde a la asignación al azar de los


sujetos a los grupos de experimentación, de los ensayos, del
material experimental, de los tratamientos, etc. Esto se logra a
través de programas estadísticos, de tablas randómicas o
simplemente con una tómbola donde se colocan las tarjetas con
el nombre de los sujetos y se extraen una a una en forma
aleatoria.

x La formación de bloques: corresponde a una técnica de diseño


para reducir o eliminar el efecto de factores perturbadores. Por
ejemplo, en un experimento de hidratación utilizamos líquidos de
dos marcas lo que puede llevar una variación entre ellas. Si no
tenemos interés en el efecto de las marcas de líquidos entonces
pasa a ser un factor perturbador, por lo tanto cada marca pasa a
ser un bloque. Los criterios más comunes para crear bloques
son la proximidad (cercanía), características físicas (edad, peso,
etc.), tiempo y tareas de experimentación. El diseño de bloques
se explicará más ampliamente en el capítulo 2.

28


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Para realizar un experimento debemos:

a) Establecer el problema de investigación: enunciar en forma


clara las preguntas de investigación y establecer las hipótesis
que serán las guías durante todo nuestro experimento1.

b) Elección de los factores y rangos.

c) Elección del diseño experimental: corresponde a la selección


de un diseño en base al tamaño de la muestra, aleatorización,
constitución o no de bloques, factores y rangos, etc.

d) Realización del experimento: corresponde a la ejecución real


del experimento. Se sugiere realizar pruebas pilotos para ajustar
el experimento de ser necesario.

e) Análisis de datos y conclusiones: utilización de análisis


estadísticos con los datos obtenidos del experimento, que se
pueden realizar mediante diversos paquetes estadístico. Un
buen diseño y los análisis adecuados permiten formular
conclusiones sólidas de nuestro experimento.

3. RONALD FISHER

Ronald Fisher (1890-1962) fue profesor de genética en la


University College of London y en Cambridge, realizando grandes
contribuciones a la estadística biométrica de la genética y la
selección natural, sin embargo, sus trabajos han impactado
fuertemente a todo el mundo científico experimental, incluyendo el
diseño de los experimentos y los análisis de datos.
 
1
Para más información leer Maureira y Flores (2012) Manual de investigación
científica para estudiantes de educación física, Editorial Académica
Española.

29


FERNANDO MAUREIRA CID

Entre 1919 y 1933 trabaja como asesor estadístico para la


Rothamsted Experimental Station donde desarrolla el análisis de
varianza (ANOVA) que publica en 1921 y crea los diseños de
experimentos que ampliamente se utilizan actualmente,
introduciendo los conceptos de aleatorización, diseños factoriales,
diseños combinatorios, bloques, cuadrados latinos, análisis de
covarianza, etc. Sus aportes iniciales en esta área están contenidos
en su libro Diseño de experimentos de 1935.
También elaboró la distribución Z, el test de bondad de ajuste
de una regresión, los estudios de residuos, función discriminante,
distribución de los valores propios de los componentes principales,
etc. Incursionando en la distribución de muestreo, los modelos
lineales, la estadística multivariada, el uso correcto de la distribución
X2, etc.

30


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
DISEÑO COMPLETAMENTE
ALEATORIZADO

El diseño completamente aleatorizado (DCA) es el diseño de


experimento más sencillo y trata de asignar tratamientos a las
unidades experimentales al azar utilizando un único factor. Por
ejemplo, a 9 corredores de 5000 mts. planos (escogidos al azar
entre la población de estos corredores) se les administran diferentes
tipos de hidratación: a) agua; b) agua con glucosa; c) bebida
isotónica. Los tres tratamientos se asignan al azar a los corredores.

2
1 5 Agua
2 8
3
4 1
5 4 Agua con glucosa
6 7
7
8 3
9 6 Bebida isotónica
9

Figura 6. Diseño completamente aleatorizado con tres tratamientos


y tres unidades experimentales.

31


FERNANDO MAUREIRA CID

El diseño anterior es un experimento con:


x Un solo factor (hidratación)
x Con alfa= 3 (Tres niveles del factor = agua, agua con glucosa y
bebida isotónica)
x Con n= 3 (Tres réplicas, ya que cada tratamiento se aplicó a tres
sujetos).

Recordemos que en un DCA con un solo factor los


tratamientos estudiados (fijos o aleatorios) y la cantidad de
observaciones (balanceado o desbalanceado) dan origen a cuatro
modelos de diseños:

Balanceado
Factores fijos
Desbalanceado
DCA
Balanceado
Factores aleatorios
Desbalanceado

Figura 7. Diversos modelos del DCA.

x DCA de factores fijos y balanceado= Asignación al azar de las


unidades a los grupos, con todos los niveles posibles o sobre los
que se desea inferir del tratamiento y con el mismo número de
unidades en cada grupo.

x DCA de factores fijos y desbalanceado= Asignación al azar


de las unidades a los grupos, con todos los niveles posibles o
sobre los que se desea inferir del tratamiento y al menos un
grupo con una cantidad diferente de unidades.

x DCA de factores aleatorios y balanceado= Asignación al azar


de las unidades a los grupos, con los niveles escogidos al azar

32


ESTADISTICA AVANZADA PARA EDUCACION FISICA

entre los posibles del tratamiento y con el mismo número de


unidades en cada grupo.

x DCA de factores aleatorios y desbalanceado= Asignación al


azar de las unidades a los grupos, con los niveles escogidos al
azar entre los posibles del tratamiento y al menos un grupo con
una cantidad diferente de unidades.

En el ejemplo anterior el experimento es unifactorial, DCA de


factores fijos, balanceado con pre y post-prueba.

Para establecer la naturaleza de los efectos y las restricciones


del DCA utilizamos el siguiente aditivo lineal que resume los
factores del experimento:
yij = NJ + Ti + eij (fórmula 1)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento
eij = error experimental


1. DCA & ANALISIS DE VARIANZA

El Análisis de Varianza (ANOVA) es una prueba estadística


que se utiliza para comparar las medias de tres o más grupos. La
idea de esta técnica es separar las variaciones en los datos en las
provocadas por: a) los tratamientos y b) el error experimental.
Cuando las variaciones provocadas por el tratamiento son
mayores a las variaciones provocadas por el error experimental, las
medias son diferentes y por ende existe efecto de los tratamientos.
Por el contrario, cuando las variaciones por el tratamiento son
iguales o menores a las variaciones provocadas por el error
experimental, las medias son iguales (Hurtado y Gómez, 2015).
El ANOVA permite contrastar la igualdad de medias dadas por
las siguientes hipótesis:
33


FERNANDO MAUREIRA CID

H0 = Ш1 Ш2 Ш3 =… Шk
H1 = Шi Шj 

Es decir, contrastamos que no hay diferencia entre las medias


de los grupos frente a la alternativa que al menos un par de medias
difieren entre ellas.
Toda la información necesaria para realizar este contraste de
hipótesis se describe en la tabla de ANOVA.

Tabla 1. ANOVA de un factor para un DCA.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Entre SCt= ™\ij² - yij² k-1 CMt = SCt CMt
tratamientos n N glt CME
Dentro de los SCE= SCT - SCt k(n-1) CME= SCE
tratamientos glE
(error)
Total SCT=™™\ð- yij² N-1
N
n=número de sujetos por grupo
N=número total de sujetos
k=número de grupos

En la tabla 1 se puede observar la suma de cuadrados entre


tratamientos (SCt), del error (SCE) y totales (SCT), los cuadrados
medios entre tratamientos (CMt), y del error (CME) y el valor F.

ƒ Ejemplo 1
Un investigador busca conocer los efectos de 3 programas de
entrenamiento (aeróbico, anaeróbico y mixto) en el desarrollo de
la resistencia en estudiantes varones de primer año medio de un
colegio de Santiago. Para ello utiliza una muestra constituida por
34


ESTADISTICA AVANZADA PARA EDUCACION FISICA

20 escolares, a los cuales se les mide la resistencia con el test


de naveta obteniendo los siguientes resultados:

Sujeto Naveta Sujeto Naveta Sujeto Naveta Sujeto Naveta


1 6 6 7 11 6 16 7
2 5 7 6 12 5 17 6
3 6 8 6 13 6 18 5
4 6 9 6 14 5 19 6
5 5 10 5 15 6 20 5

Todos los sujetos de la muestra alcanzaron tiempos entre 5 y


7 minutos en el test. Ahora cada uno es designado al azar a uno de
los cuatro grupos que se utilizan en el experimento (3 de
intervención y uno control). El esquema del experimento sería así:

G1 01 X1 02
G2 03 X2 04
G3 05 X3 06
G4 07 - 08

G1 = Grupo 1; G2 = Grupo 2; G3 = Grupo 3; G4 = Grupo 4


01 03 05 07 = mediciones de la resistencia antes de la intervención
X1 = intervención aeróbica
X2 = intervención anaeróbica
X3 = intervención mixta
- = sin intervención
02 04 06 08 = mediciones de la resistencia tras la intervención

Este experimento corresponde a un DCA de factores fijos,


balanceado, con pre y post-prueba, esto debido a que los sujetos
fueron asignados al azar a cada tratamiento, los factores son todos
los posibles o sobre todos los que se desea inferir, cada grupo
posee la misma cantidad de sujetos y se mide antes y después de
la intervención.
Un punto muy importante dentro de los experimentos es que
los grupos utilizados deben ser homogéneos en relación a la
variable dependiente antes de las aplicaciones de los tratamientos,
35


FERNANDO MAUREIRA CID

es decir, las puntuaciones obtenidas por los sujetos deben ser


similares de manera que las medias de cada grupo también lo sean.
En el ejemplo 1 todos los estudiantes obtuvieron valores
relativamente similares (entre 5 y 7 minutos) lo que asegura la
homogeneidad inicial de los grupos. Si las medias de los grupos a
comparar son inicialmente diferentes los resultados del
experimento no tendrán ninguna validez.
La primera forma de obtener grupos con medias similares de
la variable dependiente es asignar las unidades experimentales al
azar a cada grupo. También si el investigador quiere cerciorarse de
esta igualdad puede realizar un Análisis de Varianza de un Factor
(ANOVA de un factor) o una prueba de Kruskal-Wallis 2 entre las
medias de los grupos.
Es importante recordar que si el experimento sólo posee dos
grupos (uno de intervención y uno control) es necesario aplicar una
prueba t para muestras independientes o una prueba U de Mann-
Whitney3 en lugar de un ANOVA para comparar las medias de los
dos grupos.
G1 6,0 X1 02
G2 5,6 X2 04
G3 5,4 X3 06
G4 6,0 - 08

ANOVA para comparar medias

Una vez corroborada la homogeneidad de los grupos se


procede a la aplicación de los tratamientos, que en el caso del
 
2
 Para ver los detalles del cálculo paso a paso de un Prueba de Kruskal-Wallis
consultar Maureira, F. (2015). Estadística básica para educación física.
Madrid: Editorial Académica Española, pág.: 237.
3
Para ver los detalles del cálculo paso a paso de un Prueba t para muestras
independientes o una prueba U de Mann-Whitney consultar Maureira, F.
(2015). Estadística básica para educación física. Madrid: Editorial Académica
Española, pág.: 165 y 221 respectivamente.

36


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ejemplo 1 corresponden a 12 sesiones de entrenamiento: grupo 1


ejercicio aeróbico, grupo 2 ejercicio anaeróbico y grupo 3 ejercicio
mixto. Al grupo 4 no se le aplica ningún entrenamiento para que
sirva de grupo control.
Tras la aplicación del tratamiento a cada grupo se le vuelve a
medir la resistencia con el test de naveta entregando los siguientes
resultados:

Observaciones
Tratamientos 1 2 3 4 5 Totales Ш
G1 Aeróbico 8 7 8 9 9 41 8,2
G2 Anaeróbico 6 7 7 5 6 31 6,2
G3 Mixto 7 6 7 6 9 35 7,0
G4 Control 5 6 6 7 5 29 5,8
™ Ш 6,65

Se observa que el grupo 1 (aeróbico) presenta una media de


8,2 minutos tras la intervención, el grupo 2 (anaeróbico) 6,2
minutos, el grupo 3 (mixto) 7,0 minutos y el grupo 4 (control) 5,8
minutos. Ahora es posible utilizar una prueba t para muestras
relacionadas o una prueba de Wilcoxon4 para comparar las medias
de cada grupo antes y después de la intervención. Así podemos
determinar si cada tratamiento tuvo efecto sobre la variable
dependiente.

G1 6,0 X1 8,2
G2 5,6 X2 6,2
G3 5,4 X3 7,0
G4 6,0 - 5,8

Prueba t para muestras relacionadas para comparar medias

 
4
 Para ver los detalles del cálculo paso a paso de una Prueba t para muestras
relacionadas o una prueba de Wilcoxon consultar Maureira, F. (2015).
Estadística básica para educación física. Madrid: Editorial Académica
Española, pág.: 173 y 225 respectivamente.

37


FERNANDO MAUREIRA CID

Ahora procedemos a contrastar la hipótesis de igualdad de


medias entre los cuatro grupos tras la intervención y así podemos
determinar si algún tratamiento es más eficiente que otro. Para ello
utilizamos un ANOVA de un factor como muestra el esquema
siguiente:

G1 6,0 X1 8,2
G2 5,6 X2 6,2
G3 5,4 X3 7,0
G4 6,0 - 5,8

ANOVA para comparar medias

A continuación se realizará el ANOVA con los resultados post-


intervención del ejemplo 1.

¾ Paso 1
Calcular la suma de puntuaciones por grupos (yi) y sumarlas
(™  OXHJR HOHYDU al cuadrado cada valor yi (yi2). Sumar
todos los valores yi2 (™). Sumar las puntuaciones de los
sujetos 1, 2, 3, etc. por columnas (yj). Elevar al cuadrado la
puntuación de cada sujeto y sumarlas por columnas (™\2j ).
Finalmente sumar todos los valores de ™\2j (™ 

1 2 3 4 5 yi yi2
G1 8 7 8 9 9 41 1681
G2 6 7 7 5 6 31 961
G3 7 6 7 6 9 35 1225
G4 5 6 6 7 5 29 841
yj 26 26 28 27 29 ™136 ™4708
™y2j 174 170 198 191 223 ™956

38


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 2
Calcular las sumas de cuadrados:

SCT= ™™\²j - yij² = 956 - (136)² = 31,2


N 20

SCt= ™\ij² - yij² = 4708 - (136)² = 16,8


n N 5 20

SCE= SCT – SCt = 31,2 – 16,8 = 14,4

¾ Paso 3
Calcular los grados de libertad:

glt = k – 1 = 4 – 1 = 3
glE = k(n – 1) = 4*(5 – 1) = 16
glT = N – 1 = 20 – 1 = 19

¾ Paso 4
Calcular los cuadrados medios:

CMt= SCt = 16,8 = 5,6


glt 3

CME= SCE = 14,4 = 0,9


glE 16

¾ Paso 5
Calcular el valor F del ANOVA:

F= CMt = 5,6 = 6,22


CME 0,9

39


FERNANDO MAUREIRA CID

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 16,8 3 5,6 6,22
Error 14,4 16 0,9
Total 31,2 19

Ahora el investigador debe contrastar el valor F obtenido


(6,22) con los valores críticos de F según el nivel de confianza
escogido utilizando los gl de los cuadrados medios de los
tratamientos y el error experimental, buscando los gl menor entre
ellos en la primera fila (horizontal) y los gl mayores en la primera
columna (vertical).

La intersección de ambos (3 y 16) fue un valor F de 3,24. A


continuación se sigue la regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.
40


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Como 6,22>3,24 se debe rechazar la H0 y podemos concluir


que existen diferencias entre al menos dos grupos de los cuatro
evaluados.
También es posible calcular la proporción de variabilidad de
los datos que es explicada por el modelo de análisis de varianza,
mediante el coeficiente de determinación (R 2) que se obtiene con la
siguiente fórmula:
R2 = SCt (fórmula 2)
SCT

Con los datos del ejemplo 1 reemplazamos en la fórmula:

R2= 17,75 = 0,57


31,2

Es decir que la variación de los datos es explicado en un 57%


por el modelo de ANOVA de un factor.

1.1 Comparaciones múltiples

En el caso que se presenten diferencias entre las medias es


necesario determinar entre que pares de promedios se dan esas
diferencias y para eso es posible utilizar la prueba de Bonferroni,
Duncan, Scheffé, Dunnett, etc. Aquí utilizaremos el procedimiento
de Tukey modificado por Snedecor.

¾ Paso 1:
Se ubican las medias de los grupos de mayor a menor y la
diferencia entre ellas.

Grupo aeróbico = 8,2 Grupo mixto = 7,0


Grupo anaeróbico = 6,2 Grupo control = 5,8

G. aeróbico – G. mixto = 8,2 – 7,0 = 1,2


G. aeróbico – G. anaeróbico = 8,2 – 6,2 = 2,0
41


FERNANDO MAUREIRA CID

G. aeróbico – G. control = 8,2 – 5,8 = 2,4


G. mixto – G. anaeróbico = 7,0 – 6,2 = 0,8
G. mixto – G. control = 7,0 – 5,8 = 1,2
G. anaeróbico – G. control = 6,2 – 5,8 = 0,4

¾ Paso 2
Obtener un cuadrado medio intra-grupo promedio (CMintraX) con
la siguiente fórmula:

CMintraX = 1 CME + CME +… CME (fórmula 3)


k n1 n2 nk

k = número de grupos
n = número de sujetos de cada grupo

Con los datos del ejemplo 1 reemplazamos en la fórmula:

CMintraX = 1 * 0,9 + 0,9 + 0,9 = 0,135


4 5 5 5

¾ Paso 3:
Calcular el error estándar de la media del cuadrado medio intra-
grupo (Sx) con la siguiente fórmula:

Sx = CMintraX (fórmula 4)

Con los datos del ejemplo 1 reemplazamos en la fórmula:

Sx = 0,135 = 0,367

¾ Paso 4:
Determinar el valor Q con el número de grupos (en el ejemplo 1=
4 grupos) y los grados de libertad dentro de los grupos (gl del
error, en el ejemplo 1= 16).
42


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 5:
Se calcula D con la siguiente fórmula:

D = Q * Sx (fórmula 5)

Con los datos del ejemplo 1 tenemos:

D = 4,05 * 0,367 = 1,486

¾ Paso 6:
Se compara el valor D con las diferencias de los pares de
medias de los grupos. Valores mayores que D significan
diferencias entre los grupos.

G. aeróbico – G. mixto = 1,2<1,486


G. aeróbico – G. anaeróbico = 2,0>1,486
G. aeróbico – G. control = 2,4>1,486
G. mixto – G. anaeróbico = 0,8<1,486
G. mixto – G. control = 1,2<1,486
G. anaeróbico – G. control = 0,4<1,486
43


FERNANDO MAUREIRA CID

Se observa que la puntuación del tratamiento aeróbico es


igual al mixto, pero mayor al anaeróbico y al control. Por otra parte,
las puntuaciones del tratamiento anaeróbico, mixto y control son
estadísticamente iguales.
Con estos resultados es posible concluir que en el ejemplo 1
el entrenamiento aeróbico resulta ser el más efectivo para mejorar
los niveles de resistencia en estudiantes varones de 1° medio de un
colegio de Santiago.

2. IDONEIDAD DEL MODELO

Para saber si el modelo propuesto es válido y por lo tanto, si


los resultados obtenidos también lo son, resulta necesario conocer
si se cumplen las tres hipótesis básicas de dicho modelo:

2.1 Normalidad de los residuos

Para calcular los residuos (R) se aplica la fórmula siguiente:

R= (yij – Ш) (fórmula 6)

yij = cantidades conocidas


Ш = media de cada tratamiento

Aeróbico Anaeróbico Mixto Control


yij (yij – Ш) yij (yij – Ш) yij (yij – Ш) yij (yij – Ш)
8 -0,2 6 -0,2 7 0 5 -0,8
7 -1,2 7 0,8 6 -1 6 0,2
8 -0,2 7 0,8 7 0 6 0,2
9 0,8 5 -1,2 6 -1 7 1,2
9 0,8 6 -0,2 9 2 5 -0,8
Ш=8,2 Ш=6,2 Ш=7,0 Ш=5,8

44


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Tanto la normalidad de la variable dependiente como la


normalidad de los residuos se obtienen de la misma forma: con la
prueba de Kolmogorov-Smirnov (Prueba KS)5.
Con los datos de los residuos del ejemplo 1 obtenemos una
prueba KS de 0,121.
Ahora el investigador debe contrastar el valor KS obtenido con
los valores críticos de D según el nivel de confianza escogido y con
la cantidad de sujetos evaluados.

- - -

Con XQĮ \1=20 el valor D es de 0,295. A continuación


se sigue la regla de decisión:

x Si el valor D obtenido es menor o igual al valor D de la tabla


se debe aceptar la H0.
x Si el valor D obtenido es mayor al valor D de la tabla se debe
rechazar la H 0.

 
5
 Para ver los detalles del cálculo paso a paso de la Prueba KS consultar
Maureira, F. (2015). Estadística básica para educación física. Madrid:
Editorial Académica Española, pág.: 137.

45


FERNANDO MAUREIRA CID

En este ejemplo, el valor KS obtenido fue de 0,121< 0,295 por


lo tanto, debemos aceptar la H0 que plantea una distribución teórica
igual a la observada, es decir, los residuos poseen una distribución
normal.

2.2 Independencia de los residuos

Para determinar la independencia de los residuos es


necesario conocer si estos son aleatorios, lo cual se calcula con la
prueba de Rachas.

¾ Paso 1
En la secuencia de residuos calculamos los valores de n1, n2 y el
número de rachas.

0,2 -0,8 -0,8 0,2 1,2 0 1 0 -1 0 0,4 -0,6


0,4 -0,6 0,4 -0,8 0,2 0,2 1,2 -0,8

n1 = valores positivos = 13
n2 = valores negativos = 7
G = número de rachas = 12

El número de rachas corresponde a la cantidad de secuencias


de valores positivos y negativos, por ejemplo si en la secuencia
anterior reemplazamos los valores positivos por P y los
negativos por N nos queda la siguiente secuencia:

PNNPPPPPNPPNPNPNPPPN

Una secuencia de valores P es una racha, al cambiar a valores


N se tiene otra racha y al cambiar nuevamente a P se tiene otra
racha. Por ejemplo, en la secuencia anterior el 1° valor P es una
racha, luego cambia a valores N (2° racha), luego v uelve a
valores P (3° racha), luego a valores N (4° racha) y así hasta
completar 12 rachas.
46


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 2
Calcular la media de rachas de la población (NJG) con la fórmula
siguiente:
NJG = 2n1 n2 +1 (fórmula 7)
n1 + n2

Reemplazamos con los datos del ejemplo 1:

NJG = 2(13) * 7 + 1 = 10,1
13 + 7

¾ Paso 3
Calcular la desviación estándar de rachas de la población (ıG)
con la fórmula siguiente:

ıG = (2n1n2)(2n1 n2 – n1 – n2) (fórmula 8)


(n1 + n2)2 (n1 + n2 – 1)

Reemplazamos con los datos del ejemplo 1:

ıG = (26*7)(26*7 – 13 – 7) = 29484 = 3,879


(13+7)2 (13+7 – 1) 7600

= 1,969

¾ Paso 4
Calcular el estadístico Z de la prueba de rachas con la siguiente
fórmula:
Z = G – NJG (fórmula 9)
ıG

Reemplazamos con los datos del ejemplo 1:

Z = 12 – 10,1 = 0,964
1,969
47


FERNANDO MAUREIRA CID


 Puesto que el nivel de signifiFDQFLD HV Į   =   \
0,964<1,96 se acepta la H0, por lo tanto los residuos son aleatorios
y por ende independientes.

2.3 Homocedasticidad de los residuos

Para determinar la homogeneidad de varianza de los residuos


del diseño completamente aleatorizado de factor fijo y balanceado
se puede utilizar la prueba de Hartley 6, en cambio para el diseño
completamente aleatorizado de factor fijo y desbalanceado es
necesario usar la prueba de Bartlett7.
En el ejemplo 1 el valor de la prueba de Hartley es de 2,33.
Ahora el investigador debe contrastar el valor F obtenido con los
valores críticos de F según el nivel de confianza escogido y los
valores correspondientes al número de muestra y número de
grupos.

 - - - - - - - - -

 
6
Para ver los detalles del cálculo paso a paso de la Prueba de Hartley
consultar Maureira, F. (2015). Estadística básica para educación física.
Madrid: Editorial Académica Española, pág.: 159.
7
 Para ver los detalles del cálculo paso a paso de la Prueba de Bartlett
consultar Maureira, F. (2015). Estadística básica para educación física.
Madrid: Editorial Académica Española, pág.: 160.

48


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Con un Į  \ 1ƒ   \ 1ƒ   VH REWLHQH XQ YDORU GH
2,87. Ahora se debe seguir la siguiente regla de decisión:

x Si el valor F obtenido es menor o igual al valor F de la tabla


se debe aceptar la H0.
x Si el valor F obtenido es mayor al valor F de la tabla se debe
rechazar la H 0.

En este ejemplo 2,33<2,87 por lo tanto, debemos aceptar H 0


que plantea la igualdad de varianza entre los cuatro grupos.
Una situación importante es que el diseño desbalanceado
aumenta la sensibilidad del ANOVA de un factor cuando existe
heterocedasticidad (varianzas diferentes entre los grupos), por lo
tanto, es menos sensible para cometer el error tipo II, en relación al
diseño balanceado que es más potente.

3. NO IDONEIDAD DEL MODELO

Si los análisis de los residuos no muestran una distribución


normal, independencia u homocedasticidad, el ANOVA de un factor
no es adecuado para los datos y en ese caso es necesario realizar
los análisis con la prueba de Kruskal-Wallis.

4. TAMAÑO DE LA MUESTRA

Cuando establecemos un diseño experimental una situación


de enorme importancia es la selección del tamaño de la muestra, es
decir, el número de réplicas que se utilizarán. Para esto resulta útil
usar los valores de una curva de operaciones características,
que corresponde a un grafica de la probabilidad de cometer el error
tipo II.

49


FERNANDO MAUREIRA CID

¾ Paso 1:
Seleccionamos un tamaño de la muestra tal que si la diferencia
de la media de dos grupos cualquiera sobrepase cierto valor la
H 0 debe rechazarse. Debemos calcular un valor d con la
siguiente fórmula:

d= (NJ1 – NJ2) (fórmula 10)


NJ1 – NJ2 = Diferencia de medias establecida


ı= desviación estándar que establecemos

ƒ Ejemplo 2
Un investigador desea comparar los tiempos de resistencia de
tres grupos de deportistas sometidos a diferentes programas de
entrenamiento. Además desea rechazar la hipótesis nula con
una potencia de 0,95 con un alpha de 0,05 si la media de dos
grupos difiere hasta en 5 minutos. Suponiendo que ı es de 2,0
tenemos:

d= 5 = 1,25
2*2,0

Se quiere rechazar la H 0 un 95% de las veces que NJ1 – NJ2 = 5


HQWRQFHVȕ \HQHO$QH[RFRQȕ \G VHREWLHQHXQ
n* de 13. Ahora para calcular el tamaño de la muestra usamos la
siguiente fórmula:

n= n* + 1 (fórmula 11)
2

Reemplazamos en la fórmula:

n= 13 + 1 =7
2

50


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Los resultados anteriores muestran que cada grupo debe


tener como mínimo 7 sujetos.

51


FERNANDO MAUREIRA CID

52


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
DISEÑOS DE MEDICIONES EN UN
EXPERIMENTO

En el DCA y en todos los diseños de experimentos que se


verán más adelante, existen diversas formas de organizar las
mediciones de la variable dependiente y de los tratamientos
(variable independiente) para conocer sus efectos. Algunas de los
más conocidos son:

1. CON POST-PRUEBA UNICA

Solo hay evaluación después de la intervención.

G1 X1 01
G2 X2 02
G3 - 03

x 01 02 03 se comparan con un ANOVA de un factor.

2. CON PRE Y POST-PRUEBA

Hay evaluación antes y después de la intervención.

G 1 01 X1 02
G 2 03 X2 04
G 3 05 - 06

53


FERNANDO MAUREIRA CID

Este esquema de mediciones y tratamientos es el más utilizado.


x 01 03 05 se comparan con un ANOVA de un factor.
x 01 02 se comparan con una pruebas t para muestras
relacionadas (igualmente 03 04 y 05 06).
x 02 04 06 se comparan con un ANOVA de un factor.

3. ESQUEMA DE CUATRO GRUPOS DE SOLOMON

Es una mezcla de los dos esquemas anteriores. Existen dos


grupos experimentales (uno con post-prueba única y otro con pre y
post-prueba) y dos grupos controles (uno con post-prueba única y
otro con pre y post-prueba). Este esquema permite aislar el posible
efecto de la primera medición sobre los resultados, por ejemplo
cuando el instrumento utilizado para medir la variable dependiente
puede ser aprendido con su aplicación.

G 1 01 X1 02
G 2 03 - 04
G3 - X2 05
G4 - - 06

x 01 03 se comparan con una prueba t para muestras


independientes.
x 01 02 se comparan con una prueba t para muestras relacionadas
(igualmente 03 04).
x 02 04 05 06 se comparan post-intervención con un ANOVA de un
factor.

4. SERIES CRONOLOGICAS MULTIPLES

Las mediciones de la variable dependiente se realizan varias


veces a través del tiempo para conocer cómo evoluciona dicho
factor. Estas series pueden ser de diferentes tipos:

54


ESTADISTICA AVANZADA PARA EDUCACION FISICA

a) Series cronológicas múltiples con post-pruebas únicamente.

G 1 X1 01 02
G 2 X2 03 04
G3 - 05 06

b) Series cronológicas múltiples con pre y post-pruebas.

G1 01 X1 02 03
G2 04 X2 05 06
G3 07 - 08 09

c) Series cronológicas múltiples de Solomon con post-pruebas.

G1 01 X1 02 03
G2 04 - 05 06
G3 - X2 07 08
G4 - - 09 010

d) Series cronológicas múltiples con varias pre y post-pruebas.

G1 01 02 X1 03 04
G2 05 06 X2 07 08
G3 09 010 - 011 012

e) Series cronológicas múltiples de Solomon con varias pre y post-


pruebas
G 1 01 02 X1 03 04
G 2 05 06 - 07 08
G3 - - X2 09 010
G4 - - - 011 012

x Para comparar las mediciones correspondientes a las mismas


columnas se aplica una prueba t para muestras independientes
(si son dos grupos) o ANOVA (si son 3 o más grupos).
x Para comparar las mediciones correspondientes a las mismas
filas se aplica un ANOVA de medidas repetidas.
55


FERNANDO MAUREIRA CID

5. SERIES CRONOLOGICAS MULTIPLES Y


TRATAMIENTOS REPETIDOS

Son similares a las series cronológica múltiples, sólo que


entre cada medición se vuelve a aplicar el tratamiento. Estas series
pueden ser de diversos tipos:

a) Series cronológicas múltiples y tratamientos repetidos con pre y


post-prueba.
G1 01 X1 02 X1 03
G2 04 X2 05 X2 06
G3 07 - 08 - 09

b) Series cronológicas múltiples y tratamientos repetidos con pre y


varias post-pruebas.

G1 01 X1 02 X1 03 04
G2 05 X2 06 X2 07 08
G3 09 - 010 - 011 012

G1 01 X1 02 0 3 X1 04 05
G2 06 X2 07 0 8 X2 09 010
G3 011 - 012 0 13 - 014 015

c) Series cronológicas múltiples y tratamientos repetidos con varias


pre y post-pruebas.

G1 01 02 X1 0 3 X1 04 05
G2 06 07 X2 0 8 X2 09 010
G3 011 012 - 0 13 - 014 015

G 1 01 02 X1 03 04 X1 05 06
G 2 07 08 X2 09 010 X2 011 012
G 3 013 014 - 015 016 - 017 018

d) Series cronológicas múltiples y tratamientos repetidos con pre y


post-pruebas a intervalos regulares.

56


ESTADISTICA AVANZADA PARA EDUCACION FISICA

G1 01 X1 X1 02 X1 X1 03
G2 04 X2 X2 05 X2 X2 06
G3 07 - - 08 - - 09

e) Series cronológicas múltiples y tratamientos repetidos con pre y


varias post-pruebas a intervalos regulares.

G1 01 X1 X1 02 X1 X1 03 04
G2 05 X2 X2 06 X2 X2 07 08
G3 09 - - 010 - - 011 012

G1 01 X1 X1 02 0 3 X1 X1 04 05
G2 06 X2 X2 07 0 8 X2 X2 09 010
G3 011 - - 012 0 13 - - 014 015

f) Series cronológicas múltiples y tratamientos repetidos con varias


pre y post-pruebas a intervalos regulares.

G1 01 02 X1 X1 0 3 X1 X1 04 05
G2 06 07 X2 X2 0 8 X2 X2 09 010
G3 011 012 - - 0 13 - - 014 015

G 1 01 02 X1 X1 03 04 X1 X1 05 06
G 2 07 08 X2 X2 09 010 X2 X2 011 012
G 3 013 014 - - 015 016 - - 017 018

g) Series cronológicas múltiples y tratamientos repetidos con pre y


post-pruebas a intervalos irregulares.

G1 01 X1 02 X1 X1 03
G2 04 X2 05 X2 X2 06
G3 07 - 08 - - 09

h) Series cronológicas múltiples y tratamientos repetidos con pre y


varias post-pruebas a intervalos irregulares.

G1 01 X1 02 X1 X1 03 04
G2 05 X2 06 X2 X2 07 08
G3 09 - 010 - - 011 012
57


FERNANDO MAUREIRA CID

G1 01 X1 02 03 X1 X1 04 05
G2 06 X2 07 08 X2 X2 09 010
G3 011 - 012 013 - - 014 015

i) Series cronológicas múltiples y tratamientos repetidos con varias


pre y post-pruebas a intervalos irregulares.

G1 01 02 X1 03 X1 X1 04 05
G2 06 07 X2 08 X2 X2 09 010
G3 011 012 - 013 - - 014 015

G1 01 02 X1 03 04 X1 X1 05 06
G2 07 08 X2 09 010 X2 X2 011 012
G3 013 014 - 015 016 - - 017 018

x Para comparar las mediciones correspondientes a las mismas


columnas se aplica una prueba t para muestras independientes
(si son dos grupos) o ANOVA (si son 3 o más grupos).
x Para comparar las mediciones correspondientes a las mismas
filas se aplica un ANOVA de medidas repetidas.

6. SERIES CRONOLOGICAS MULTIPLES Y


TRATAMIENTOS MULTIPLES
Son similares a las series cronológicas múltiples y
tratamientos repetidos, sólo que en cada aplicación del tratamiento
este es diferente. Es importante aleatorizar la aplicación de los
tratamientos, para evitar que siempre tengan el mismo orden en los
grupos y así controlar el efecto de un tratamiento sobre otro. Es
deseable tener un grupo para cada combinación de tratamientos,
por ejemplo, si tenemos los tratamientos X1 X2 X3 tenemos cuatro
combinaciones posibles donde cada tratamiento se ubica por lo
menos una vez como tratamiento inicial, medio y final (X1 X2 X3 ; X2
X1 X3 ; X2 X3 X1 ; X3 X1 X2) por lo tanto sería deseable tener cuatro
grupos experimentales y uno control.
Estas series pueden ser de diversos tipos:

58


ESTADISTICA AVANZADA PARA EDUCACION FISICA

a) Series cronológicas múltiples y tratamientos múltiples con pre y


post-prueba.
G1 01 X1 02 X2 03
G2 04 X2 05 X1 06
G3 07 - 08 - 09

b) Series cronológicas múltiples y tratamientos múltiples con pre y


varias post-pruebas.

G1 01 X1 02 X2 03 04
G2 05 X2 06 X1 07 08
G3 09 - 010 - 011 012

G1 01 X1 02 0 3 X2 04 05
G2 06 X2 07 0 8 X1 09 010
G3 011 - 012 0 13 - 014 015

c) Series cronológicas múltiples y tratamientos múltiples con varias


pre y post-pruebas.

G1 01 02 X1 0 3 X2 04 05
G2 06 07 X2 0 8 X1 09 010
G3 011 012 - 0 13 - 014 015

G 1 01 02 X1 03 04 X2 05 06
G 2 07 08 X2 09 010 X1 011 012
G 3 013 014 - 015 016 - 017 018

d) Series cronológicas múltiples y tratamientos múltiples con pre y


post-pruebas a intervalos regulares.

G1 01 X1 X2 02 X1 X2 03
G2 04 X2 X1 05 X2 X1 06
G3 07 - - 08 - - 09

e) Series cronológicas múltiples y tratamientos múltiples con pre y


varias post-pruebas a intervalos regulares.

59


FERNANDO MAUREIRA CID

G1 01 X1 X2 02 X1 X2 03 04
G2 05 X2 X1 06 X2 X1 07 08
G3 09 - - 010 - - 011 012

G1 01 X1 X2 02 0 3 X1 X2 04 05
G2 06 X2 X1 07 0 8 X2 X1 09 010
G3 011 - - 012 0 13 - - 014 015

f) Series cronológicas múltiples y tratamientos múltiples con varias


pre y post-pruebas a intervalos regulares.

G1 01 02 X1 X2 0 3 X1 X2 04 05
G2 06 07 X2 X1 0 8 X2 X1 09 010
G3 011 012 - - 0 13 - - 014 015

G 1 01 02 X1 X2 03 04 X1 X2 05 06
G 2 07 08 X2 X1 09 010 X2 X1 011 012
G 3 013 014 - - 015 016 - - 017 018

g) Series cronológicas múltiples y tratamientos múltiples con pre y


post-pruebas a intervalos irregulares.

G1 01 X1 02 X1 X2 03
G2 04 X2 05 X2 X1 06
G3 07 - 08 - - 09

h) Series cronológicas múltiples y tratamientos múltiples con pre y


varias post-pruebas a intervalos irregulares.

G1 01 X1 02 X1 X2 03 04
G2 05 X2 06 X2 X1 07 08
G3 09 - 010 - - 011 012

G1 01 X1 02 03 X1 X2 04 05
G2 06 X2 07 08 X2 X1 09 010
G3 011 - 012 013 - - 014 015

60


ESTADISTICA AVANZADA PARA EDUCACION FISICA

i) Series cronológicas múltiples y tratamientos múltiples con varias


pre y post-pruebas a intervalos irregulares.

G1 01 02 X1 03 X1 X2 04 05
G2 06 07 X2 08 X2 X1 09 010
G3 011 012 - 013 - - 014 015

G1 01 02 X1 03 0 4 X1 X2 05 06
G2 07 08 X2 09 0 10 X2 X1 011 012
G3 013 014 - 015 0 16 - - 017 018

x Para comparar las mediciones correspondientes a las mismas


columnas se aplica una prueba t para muestras independientes
(si son dos grupos) o ANOVA (si son 3 o más grupos).
x Para comparar las mediciones correspondientes a las mismas
filas se aplica un ANOVA de medidas repetidas.

61


FERNANDO MAUREIRA CID

62


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPITULO 2

DISEÑOS DE BLOQUES ALEATORIZADOS

I. Diseño de bloques completos aleatorizados

II. Diseño de bloques incompletos aleatorizados

III. Diseño de cuadrado latino

IV. Diseño de cuadrado grecolatino

63


FERNANDO MAUREIRA CID

64


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
DISEÑO DE BLOQUES COMPLETOS
ALEATORIZADOS

Cuando realizamos un experimento puede suceder que los


grupos iniciales a los cuales se les aplicó un tratamiento sean
distintos, lo que aumenta el error experimental. Esta situación se
puede subsanar considerando grupos homogéneos o formando
bloques, de tal manera que los sujetos que conforman cada bloque
sean lo más homogéneos posible y los bloques a su vez sean
heterogéneos.
En un Diseño de Bloques Completos Aleatorizado (DBCA) se
consideran tres fuentes de variación: tratamiento, bloques y error
aleatorio. La cantidad de bloques dependerán del experimentador,
cada uno se divide en parcelas o grupos de personas y estos deben
ser iguales a la cantidad de tratamientos. Es importante destacar
que la característica por la cual se hacen los bloques no es la
variable que se desea medir, es por una variable que se desea
controlar porque se sabe o se cree que puede afectar los resultados
de la variable respuesta. Otra cosa importante, es que la
aleatorización de las unidades se realiza solamente dentro de los
bloques y no entre los bloques.

ƒ Ejemplo 1
Si deseamos ver el efecto de un programa de ejercicio físico
sobre la agilidad en un grupo de 16 personas de edades entre
18 y 60 años, podemos determinar 4 bloques (18-25 años, 26-40
años, 41-50 años y 51-60 años) porque consideramos que la
65


FERNANDO MAUREIRA CID

edad puede ser un factor que interfiera en nuestros resultados.


Ahora dentro de cada bloque deben existir 2 parcelas (un grupo
al que se le aplicará el programa de entrenamiento y otro para el
grupo control) y por lo tanto, cada parcela dentro del bloque
queda constituida por 2 estudiantes (Fig. 8).

1 1 Parcela 1
2 Bloque 1 2
3 (18-25 años) 3 Parcela 2
4 4

5 5 Parcela 1
6 Bloque 2 6
7 (26-40 años) 7 Parcela 2
8 8

9 9 Parcela 1
10 Bloque 3 10
11 (41-50 años) 11 Parcela 2
12 12

13 13 Parcela 1
14 Bloque 4 14
15 (51-60 años) 15 Parcela 2
16 16

Figura 8. Distribución de 16 estudiantes en 4 bloques con 2


parcelas cada uno.

En el ejemplo 1, cada bloque está constituido por personas de


edades similares siendo estos homogéneos. Los tratamientos se
deben aplicar en forma aleatoria a las parcelas dentro de los
bloques.
66


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Bloque 1 Parcela 1 Ejercicio


Parcela 2 Control
Bloque 2 Parcela 1 Control
Parcela 2 Ejercicio
Bloque 3 Parcela 1 Control
Parcela 2 Ejercicio
Bloque 4 Parcela 1 Ejercicio
Parcela 2 Control

Por lo tanto, a los sujetos 1 y 2 (18-25 años) se le aplicará el


programa de ejercicio físico, de igual forma que a los sujetos 7 y 8
(26-40 años), 11 y 12 (41-50 años) y 13 y 14 (51-60 años). A los
restantes no se les realizará ninguna intervención. Con los bloques
es posible controlar la variable edad en los efectos del ejercicio
físico sobre la agilidad en la muestra.
Un diseño de bloques aleatorizados generalmente contiene
una parcela dentro de cada bloque para cada tratamiento, pero es
posible que contenga dos, tres, etc. parcelas para cada tratamiento.
En un DBCA los tratamientos estudiados y bloques (fijos,
aleatorios o mixtos) y la cantidad de observaciones (balanceado o
desbalanceado) dan origen a seis modelos de diseños:

x DBCA de factores fijos y balanceados: Bloques para la


variable que se desea controlar, asignación al azar de los
tratamientos dentro de los bloques, con todos los niveles
posibles o sobre los que se desea inferir del tratamiento y
bloques y con el mismo número de unidades en cada bloque.

x DBCA de factores fijos y desbalanceados: Bloques para la


variable que se desea controlar, asignación al azar de los
tratamientos dentro de los bloques, con todos los niveles
posibles o sobre los que se desea inferir del tratamiento y
bloques y al menos un bloque con una cantidad diferente de
unidades.

67


FERNANDO MAUREIRA CID

x DBCA de factores aleatorios y balanceados: Bloques para la


variable que se desea controlar, con todos los niveles escogidos
al azar entre los posibles del tratamiento y bloques y con el
mismo número de unidades en cada bloque.

x DBCA de factores aleatorios y desbalanceados: Bloques para


la variable que se desea controlar, con todos los niveles
escogidos al azar entre los posibles del tratamiento y bloques y
al menos un bloque con una cantidad diferente de unidades.

x DBCA de factores mixtos y balanceados: Bloques para la


variable que se desea controlar, con los tratamientos fijos y
bloques aleatorios (o viceversa) y con el mismo número de
unidades en cada bloque.

x DBCA de factores mixtos y desbalanceados: Bloques para la


variable que se desea controlar, con los tratamientos fijos y
bloques aleatorios (o viceversa) y al menos un bloque con una
cantidad diferente de unidades.

Para establecer la naturaleza de los efectos y las restricciones


del DBCA utilizamos el siguiente aditivo lineal que resume los
factores del experimento:

yij = NJ + Ti + Ȗj + eij (fórmula 12)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento
Ȗj = efecto del bloque
eij = error experimental

68


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1. DBCA & ANOVA

El ANOVA en un DBCA permite separar las variaciones en los


datos en las provocadas por los tratamientos, las provocadas por
los bloques y las provocadas por el error experimental.
El ANOVA permite contrastar la igualdad de medias dadas por
las siguientes hipótesis:

H01 = 71 72 73 =… 7k H02 = ǂ1 ǂ2 ǂ3 =… ǂk


H1 = 7i 7j      H2 = ǂi ǂj 

Es decir, en la H 01 contrastamos que no hay diferencia entre


las medias de los diversos tratamientos, frente a la alternativa que
al menos un par de tratamientos difieren entre ellos. En la H 02
contrastamos que no hay diferencia entre las medias de los
bloques, frente a la alternativa que al menos un par de bloques
difieren entre ellos.
Toda la información necesaria para realizar estos contrastes
de hipótesis se describen en la tabla de ANOVA del DBCA.

Tabla 2. ANOVA de un factor para un DBCA.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamientos SCt= ™\ij² - yij² a-1 CMt= SCt CMt
b ab glt CME
Bloques SCȕ= ™\ij² - yij² b-1 CMȕ= SCȕ CMȕ
a ab glȕ CME
Error SCE= 6&76&W6&ȕ (a-1)(b-1) CME= SCE
glE
Total SCT= ™™\ðij - yij² N-1
N
a= número de tratamientos
b= número de bloques
69


FERNANDO MAUREIRA CID

ƒ Ejemplo 2
Un investigador buscar conocer los efectos de un taller de
actividad física sobre los niveles de motricidad en estudiantes de
primero básico de 4 colegios de Santiago. El taller de actividad
física se aplicará en tres formas: 1) desarrollo de cualidades
físicas que influyen en la motricidad; 2) actividades motrices
propiamente tales; 3) juegos recreativos orientados a la
motricidad. La muestra de 36 estudiantes será dividida en
bloques aleatorizados, correspondiendo cada bloque al colegio
de los estudiantes, ya que esto podría afectar los resultado de
motricidad de los niños. A su vez cada bloque se dividirá en 3
parcelas (una para cada tratamiento) con 3 unidades
experimentales cada una. Los resultados tras la aplicación de los
tratamientos fueron los siguientes:

Taller Bloque A Bloque B Bloque C Bloque D


G1 13 17 13 19
16 Ш=15,33 15 Ш=17,0 10 Ш=12,67 20 Ш=19,67
17 19 15 20
G2 19 15 12 23
19 Ш=18,0 18 Ш=16,33 19 Ш=15,33 20 Ш=21,67
18 16 15 22
G3 21 23 18 27
24 Ш=22,67 18 Ш=20,0 14 Ш=16,33 23 Ш=25,33
23 19 17 26

El experimento del ejemplo 2 corresponde a un DBCA de


factores fijos, balanceado, con pre y post-prueba.

¾ Paso 1
Calcular la suma de puntuaciones por bloques (yj) y por taller
(yi). Sumar los valores yi (™  /XHJR HOHYDU al cuadrado
cada valor yj (yj2) y cada valor yi (yi2). Sumar los valores yi2

70


ESTADISTICA AVANZADA PARA EDUCACION FISICA

(™16381,73) y sumar los valores yj2 (™12390,13). Elevar al


cuadrado la puntuación de cada sujeto y sumarlas por columnas
(™\2j). Finalmente sumar todos los valores de ™\2j (™4188,92).

Bloque Bloque Bloque Bloque yi yi2


A B C D
G1 15,33 17,0 12,67 19,67 64,67 4182,21
G2 18,0 16,33 15,33 21,67 71,33 5087,97
G3 22,67 20,0 16,33 25,33 84,33 7111,66
yj 56,0 53,33 44,33 66,67 ™ ™
yj2 3136 2844,09 1965,15 4444,89 ™
™y2j 1072,94 955,67 662,21 1498,11 ™4188,92

¾ Paso 2
Calcular las sumas de cuadrados:

2
SCT= ™™y j - yij² = 4188,92 - (220,33)² = 143,48
ab 12

SCt= ™\ij² - yij² = 16381,73 - (220,33)² = 49,99


a ab 4 12

SCȕ= ™\ij² - yij² = 12390,13 - (220,33)² = 84,60


b ab 3 12

SCE= SCT – SCt – SCȕ = 143,48 – 49,99 – 84,60 = 8,89

¾ Paso 3
Calcular los grados de libertad:

glt = a – 1 = 3 – 1 = 2
glȕ = b – 1 = 4 – 1 = 3
glE = (a-1)(b-1) = 2*3 = 6
glT = N – 1 = 12 – 1 = 11
71


FERNANDO MAUREIRA CID

¾ Paso 4
Calcular los cuadrados medios:

CMt= SCt = 49,99 = 24,995


glt 2

CMȕ= SC ȕ = 84,60 = 28,2


glȕ 3

CME= SCE = 8,89 = 1,48


glE 6

¾ Paso 5
Calcular los valores F del ANOVA:

Ft= CMt = 24,995 = 16,88


CME 1,48

Fȕ= CMȕ = 28,2 = 19,05


CME 1,48

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 49,99 2 24,995 16,88
Bloques 84,60 3 28,2 19,05
Error 8,89 6 1,48
Total 143,48 11

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento y bloque y
el error experimental, buscando los gl menor entre ellos en la
72


ESTADISTICA AVANZADA PARA EDUCACION FISICA

primera fila (horizontal) y los gl mayores en la primera columna


(vertical).

La intersección del valor F de los tratamientos fue 5,14 y del


valor F de los bloques fue 4,76. A continuación se sigue la regla de
decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

16,88>5,14 por lo tanto, se debe rechazar la H01 y podemos


concluir que existen diferencias entre los tratamientos aplicados.
19,05>4,76 por lo tanto, se debe rechazar la H02 y podemos
concluir que existen diferencias entre los bloques aplicados. Por
ende, es posible concluir que los bloques tienen influencia sobre las
respuestas a los tratamientos, por lo tanto resulta necesario
controlar ese factor en futuros experimentos.

73


FERNANDO MAUREIRA CID

Un hecho importante es que un efecto pequeño de los


bloques es perjudicial para el modelo y no resulta necesario
debiendo usar un DCA. Se ha comprobado que un valor F de los
bloques menor de 3 indica que estos no deben usarse.
También es posible calcular la proporción de variabilidad de
los datos que es explicada por el modelo de ANOVA para DBCA,
mediante el coeficiente de determinación (R 2) que se obtiene con la
siguiente fórmula:
R2 = R2t + R2B (fórmula 13)

R2t = coeficiente de determinación parcial del tratamiento


R2B= coeficiente de determinación parcial de los bloques

A su vez, los coeficientes de determinaciones parciales se


obtienen con las fórmulas siguientes:

R2t = SCt (fórmula 14)


SCT

R 2ȕ = SC ȕ (fórmula 15)
SCT

Con los datos del ejemplo 2 reemplazamos en las fórmulas:

R2t = 49,99 = 0,35


143,48

R 2ȕ = 84,60 = 0,59
143,48

R2 = 0,35 + 0,59 = 0,94

Es decir, los tratamientos (talleres) explican el 35% de la


variación de la motricidad en la muestra, los bloques (colegios)
explican el 59% de la variación y el modelo total explica el 94% de
la variabilidad de la motricidad.
74


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1.1 Comparaciones múltiples

Para realizar las comparaciones entre pares de medias


utilizaremos el procedimiento de Tukey modificado por Snedecor, el
mismo utilizado para el DCA solo con dos modificaciones:

x Los valores de n en el CMintra X del DCA (fórmula 3) se deben


reemplazar por el número de bloques en el DBCA.
x Los gl del error para determinar el valor Q en el DCA es el n°
total de sujetos menos uno (N – 1) y en el DBCA es n° de
tratamientos menos uno y esto multiplicado por el n° de bloques
menos uno ((a – 1)(b – 1)).

¾ Paso 1:
Se ubican las medias de los grupos de mayor a menor y la
diferencia entre ellas.

Grupo 3= 21,08 Grupo 2= 17,83 Grupo 3= 16,17

Grupo 3 – Grupo 2 = 21,08 – 17,83 = 3,25


Grupo 3 – Grupo 1 = 21,08 – 16,17 = 4,91
Grupo 2 – Grupo 1 = 17,83 – 16,17 = 1,66

¾ Paso 2
Obtener un cuadrado medio intra-grupo promedio (CMintraX) con
la fórmula 3 (reemplazando el n° de sujetos por el n° de
bloques).

CMintraX = 1 * 1,48 + 1,48 + 1,48 = 0,37


3 4 4 4

¾ Paso 3:
Calcular el error estándar de una media (Sx) con la fórmula 4.

75


FERNANDO MAUREIRA CID

Sx = 0,37 = 0,608

¾ Paso 4:
Determinar el valor Q con el número de grupos y los grados de
libertad dentro de los grupos (gl del error modificado).

¾ Paso 5:
Se calcula D con la siguiente fórmula 5:

D = 4,34 * 0,608 = 2,638

¾ Paso 6:
Se compara el valor D con las diferencias de los pares de
medias de los grupos. Valores mayores que D significa
diferencia entre los grupos. Con los datos del ejemplo 2
tenemos:

G3 – G2 = 3,25>2,638
G3 – G1 = 4,91>2,638
G2 – G1 = 1,66<2,638

76


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Por lo tanto, es posible concluir que la puntuación del taller de


juegos recreativos es mayor que el taller de motricidad y taller de
cualidades físicas. Por otra parte, las puntuaciones del taller de
motricidad y de cualidades físicas son estadísticamente iguales.

2. IDONEIDAD DEL MODELO

Para saber si el modelo propuesto es válido y por lo tanto, si


los resultados obtenidos también lo son, resulta necesario conocer
si se cumplen las cuatro hipótesis básicas de dicho modelo:

2.1 Aditividad

Para conocer si los tratamientos y bloques son aditivos (los


efectos de los tratamientos y lo bloques no están relacionados) se
puede utilizar la prueba de interacción de Tukey.

¾ Paso 1
Calcular la media de cada tratamiento (ШL) y de cada bloque (ШM).
Luego a la media del tratamiento A se le resta la media total de
los tratamientos (ШL–Ш) y se eleva al cuadrado (ШL–Ш)2 así con
cada tratamiento y cada bloque.

Bloque Bloque Bloque Bloque Шi (ШL–Ш) (ШL–Ш)2


A B C D
A 15,33 17,0 12,67 19,67 16,17 -2,19 4,81
B 18,0 16,33 15,33 21,67 17,83 -0,53 0,28
C 22,67 20,0 16,33 25,33 21,08 2,72 7,41
Шj 18,67 17,78 14,78 22,22 Ш= 18,36 ™
(ШM–Ш) 0,31 -0,58 -3,58 3,86
(ШM–Ш)2 0,09 0,34 12,84 14,93 ™

77


FERNANDO MAUREIRA CID

¾ Paso 2
Calcular los productos cruzados de los tratamientos (™Шij (ШM –
ШL)).

™Шij (ШM - ШL)


A (15,33*0,31)+(17,0*-0,58)+(12,67*-3,58)+(19,67*3,86) -55,76
= 4,75 + (-9,86) + (-45,36) + 75,93 = 25,46
25,46*(-2,19) = -55,76
B (18,0*0,31)+(16,33*-0,58)+(15,33*-3,58)+(21,67*3,86) -13,18
= 5,58 + (-9,47) + (-54,88) + 83,65 = 24,87
24,87*(-0,53) = -13,18
C (22,67*0,31)+(20,0*-0,58)+(16,33*-3,58)+(25,33*3,86) 94,49
= 7,03 + (-11,6) + (-58,46) + 97,77 = 34,74
34,74*2,72 = 94,49
™

¾ Paso 3
Calcular el estimador de gamma (Ȗ) y la suma de cuadrados de
la interacción (SC IT).

Ȗ  ™™Ш ij (ШM - ШL) (fórmula 16)


™ ШL–Ш)2 ™ ШM–Ш)2

Con los datos anteriores:

Ȗ  25,55 = 0,072


12,50*28,20

SCIT = ™™Ȗ2 (ШL–Ш)2 (ШM–Ш)2 (fórmula 17)

Con los datos anteriores:

SC IT = (0,072)2 * 12,50 * 28,20 = 1,827

¾ Paso 4
Calcular la suma de cuadrados debido al error con la siguiente
fórmula:
78


ESTADISTICA AVANZADA PARA EDUCACION FISICA

SCR = SCT – SCt – SCB – SC TI (fórmula 18)

Con los datos del ejemplo 2:

SCR = 143,48 – 49,99 – 84,60 – 1,827 = 7,063

¾ Paso 5
Calcular el valor F para la interacción con la fórmula siguiente:

F= SCIT (fórmula 19)


1
SCR
(a*b) – a – b

Con los datos del ejemplo 2:

F= 1,827
1 = 1,827 = 1,293
7,063 1,413
(3*4) – 3 – 4

Ahora el investigador debe contrastar el valor F obtenido con


los valores críticos de F según el nivel de confianza escogido
utilizando los gl del numerador (que siempre será 1) y los gl del
denominador (en este caso es 3*4 – 3 – 4 = 5), buscando los gl
menor entre ellos en la primera fila (horizontal) y los gl mayores en
la primera columna (vertical).


79


FERNANDO MAUREIRA CID

La intersección del valor F fue 6,61. A continuación se sigue la


regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

1,293<6,61 por lo tanto, se debe aceptar la H0 y podemos


concluir que los tratamientos y los bloques son aditivos, es decir, no
existe interacción entre ellos.

2.2 Normalidad de los residuos

Es necesario calcular los residuos como se hizo anteriormente


en el DCA (página 44) y luego aplicar la prueba Kolmogorov-
Smirnov (KS) para determinar la normalidad de los mismos.
En el ejemplo 2 los residuos entregan un valor
KS=0,091<0,230 por lo cual se debe aceptar la H0 que plantea la
normalidad de los datos.

2.3 Independencia de los residuos

Para determinar la independencia de los residuos se puede


utilizar la prueba de rachas explicada en la página 46.
En el ejemplo 2 la prueba de rachas entregan un valor
Z=0,845<1,96 por lo cual se debe aceptar la H0 que plantea la
independencia de los residuos.

2.4 Homocedasticidad de varianzas

Para determinar la homogeneidad de varianzas de los


tratamientos y de los bloques se puede aplicar la prueba de Hartley
80


ESTADISTICA AVANZADA PARA EDUCACION FISICA

o de Bartlett como se explica en la página 48.


En el ejemplo 2 la prueba de Levene entrega un valor
F=2,558<3,24 por lo tanto se debe aceptar la H0 que plantea que
las varianzas son homogéneas.

81


FERNANDO MAUREIRA CID

82


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
DISEÑO DE BLOQUES INCOMPLETOS
ALEATORIZADOS

Cuando utilizamos un diseño de bloques puede suceder que


no sea posible aplicar todos los tratamientos en cada bloque (ya
sea por el costo, tamaño de la muestra, etc.). En este caso el
diseño recibe el nombre de Diseño de Bloques Incompletos
Aleatorizado (DBIA) y considera tres fuentes de variación:
tratamiento, bloques y error aleatorio.
En este diseño es importante constatar que cada tratamiento
ocurre el mismo número de veces en el diseño, es decir, si la
intervención A se aplica 3 veces, la intervención B, C y D también
deben ser aplicadas 3 veces cada una. Otra cosa importante es que
cada par de tratamientos ocurren juntos el mismo número de veces,
es decir, si se aplican las intervenciones A y B una vez, los pares de
intervenciones A y C, además de B y C se aplicarán también una
vez.
Al igual que en el DBCA los sujetos deben ser asignados
aleatoriamente a los tratamientos dentro de los bloques. Cuando la
cantidad de tratamientos es igual a la cantidad de bloques se dice
que el diseño es simétrico.
En un DBIA los tratamientos estudiados y bloques (fijos,
aleatorios o mixtos) y la cantidad de observaciones (balanceado o
desbalanceado) dan origen a seis modelos de diseños:

x DBIA de factores fijos y balanceados: Bloques para la variable


que se desea controlar, asignación al azar de algunos de los
tratamientos dentro de los bloques, con todos los niveles

83


FERNANDO MAUREIRA CID

posibles o sobre los que se desea inferir del tratamiento y


bloques y con el mismo número de unidades en cada bloque.

x DBIA de factores fijos y desbalanceados: Bloques para la


variable que se desea controlar, asignación al azar de algunos
de los tratamientos dentro de los bloques, con todos los niveles
posibles o sobre los que se desea inferir del tratamiento y
bloques y al menos un bloque con una cantidad diferente de
unidades.

x DBIA de factores aleatorios y balanceados: Bloques para la


variable que se desea controlar, con algunos de los niveles
escogidos al azar entre los posibles del tratamiento y bloques y
con el mismo número de unidades en cada bloque.

x DBIA de factores aleatorios y desbalanceados: Bloques para


la variable que se desea controlar, con algunos de los niveles
escogidos al azar entre los posibles del tratamiento y bloques y
al menos un bloque con una cantidad diferente de unidades.

x DBIA de factores mixtos y balanceados: Bloques para la


variable que se desea controlar, con algunos de los
tratamientos fijos y bloques aleatorios (o viceversa) y con el
mismo número de unidades en cada bloque.

x DBCA de factores mixtos y desbalanceados: Bloques para la


variable que se desea controlar, con algunos de los
tratamientos fijos y bloques aleatorios (o viceversa) y al menos
un bloque con una cantidad diferente de unidades.

Para establecer la naturaleza de los efectos y las restricciones


del DBIA utilizamos el mismo aditivo lineal que para el DBCA:

yij = NJ + Ti Ȗj + eij

84


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1. DBIA & ANOVA


El ANOVA en un DBIA permite separar las variaciones en los
datos en las provocadas por los tratamientos, las provocadas por
los bloques y las provocadas por el error experimental.
El ANOVA permite contrastar la igualdad de medias dadas por
las siguientes hipótesis:

H01 = 71 72 73 =… 7k H02 = Ȗ1 ǃ2 ǃ3 =… ǃk


H1 = 7i 7j      H2 = ǃi ǃj 

Es decir, en la H 01 contrastamos que no hay diferencia entre


las medias de los diversos tratamientos, frente a la alternativa que
al menos un par de tratamientos difieren entre ellos. En la H02
contrastamos que no hay diferencia entre las medias de los
bloques, frente a la alternativa que al menos un par de bloques
difieren entre ellos.
Toda la información necesaria para realizar estos contrastes
de hipótesis se describen en la tabla de ANOVA del DBIA.

Tabla 3. ANOVA de un factor para un DBIA.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamientos SC t*= N™4ði a-1 CMt*= SCt* CMt*
ajustados ȜO glt CME
Bloques SCȕ= ™\ij² - yij² b-1 CMȕ= SCȕ CMȕ
k N glȕ CME
Error SCE= 6&76&W6&ȕ N-a-b+1 CME= SCE
glE
Total SCT= ™™\ðij - yij² N-1
N
a= número de tratamientos
b= número de bloques
k= n° tratamientos por bloque

85


FERNANDO MAUREIRA CID

ƒ Ejemplo 1
Un investigador buscar conocer los efectos de un taller de baile
sobre los niveles de motivación por la práctica de actividad física
de las dueñas de casa de un área de la comuna de Santiago. El
taller se efectuará en tres formas: 1) Baile entretenido (G1); 2)
Baile entretenido + acondicionamiento físico (G2); 3) Baile
entretenido + charlas de los beneficios de la actividad física (G3).
La muestra de 6 dueñas de casa será dividida en bloques
aleatorizados, correspondiendo cada bloque a los días que se
realizará el taller (Bloque A= lunes y miércoles; Bloque B=
martes y jueves; Bloque C= miércoles y viernes). Cada bloque se
dividirá en 2 parcelas con una unidad experimental cada una.
Los resultados tras la aplicación de los talleres fueron los
siguientes:

Bloque A Bloque B Bloque C


G1 8,5 8,8
G2 9,6 10
G3 7,6 9

El experimento del ejemplo 1 corresponde a un DBIA de


factores fijos, balanceado, con pre y post-prueba.

¾ Paso 1
Calcular la suma de puntuaciones por bloques (yj), por taller (yi)
y luego elevar ambas al cuadrado (yj2; yi2). Sumar los valores yj2
(™926,09) y los valores yi2 (™931,97). Luego sumar los valores al
cuadrado de cada bloque (™\2j ).

Bloque Bloque Bloque yi yi2


A B C
G1 8,5 8 16,5 272,25
G2 9,6 10 19,6 384,16
G3 7,6 9 16,6 275,56
yj 17,2 17,5 18 ™52,7 ™931,97
yj2 295,84 306,25 324 ™926,09
™y2j 149,92 153,25 164 ™467,17
86


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 2
Calcular las sumas de cuadrados:

2
SCT= ™™y j - yij² = 467,17 - (52,7)² = 4,29
N 6

SCȕ= ™\ij² - yij² = 926,09 - (52,7)² = 0,16


k N 2 6

SCt* (ajustado) = k™42 (fórmula 20)


ȜO

Q = yi – ™Qij yij (fórmula 21)


k

Para calcular la SCt ajustado primero debemos calcular el


valor Q de cada tratamiento:

Q1= 16,5 – 17,5 + 18 = 16,5 – 17,75 = -1,25


2

Q2= 19,6 – 17,2 + 18 = 19,6 – 17,6 = 2


2

Q3= 16,6 – 17,2 + 17,5 = 16,6 – 17,35 = -0,75


2

Ȝ 5 k–1 (fórmula 22)


l–1

R= n° de veces que cada tratamiento se presenta en el diseño


k= n° de tratamientos por bloques
I= n° de tratamientos

Ȝ   2–1 =1
3–1
87


FERNANDO MAUREIRA CID

Ahora reemplazamos en la fórmula de SCt* (ajustado):

SCt* = 2* ((-1,25)2 + 22 + (-0,75)2) = 4,08


1*3

SCE= SCT – SCt* – SCȕ = 4,29 – 4,08 – 0,16 = 0,05

¾ Paso 3
Calcular los grados de libertad:

glt = a – 1 = 3 – 1 = 2
glȕ = b – 1 = 3 – 1 = 2
glE = N – a – b + 1 = 6 – 3 – 3 + 1= 1
glT = N – 1 = 6 – 1 = 5

¾ Paso 4
Calcular los cuadrados medios:

CMt*= SCt* = 4,08 = 2,04


glt 2

CMȕ= SC ȕ = 0,16 = 0,08


glȕ 2

CME= SCE = 0,05 = 0,05


glE 1

¾ Paso 5
Calcular los valores F del ANOVA:

Ft*= CMt* = 2,04 = 40,8


CME 0,05

Fȕ= CMȕ = 0,08 = 1,6


CME 0,05
88


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 4,08 2 2,04 40,8
ajustados
Bloques 0,16 2 0,08 1,6
sin ajustar
Error 0,05 1 0,05
Total 4,29 5

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento ajustados y
el error experimental, buscando los gl menor entre ellos en la
primera fila (horizontal) y los gl mayores en la primera columna
(vertical).

La intersección del valor F de los tratamientos fue 199,50 y del


valor F calculado fue 40,8. A continuación se sigue la regla de
decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.
89


FERNANDO MAUREIRA CID

40,8<199,50 por lo tanto, se debe aceptar la H01 y podemos


concluir que no existen diferencias entre los tratamientos aplicados.

A continuación vamos a estudiar el efecto de los bloques en el


DBIA. Para ello calculamos la suma de cuadrados de los bloques
ajustado con la siguiente fórmula:

SCȕ* (ajustado) = R™ȕ2i (fórmula 23)


ȜM

ȕ  yi – ™Qijyj (fórmula 24)


R

¾ Paso 1
Para calcular la SC ȕ ajustado primero debemos calcular el valor
ȕ de cada tratamiento:

ȕ – 19,6 + 16,6 = 17,2 – 18,1 = -0,9


2

ȕ – 16,5 + 16,6 = 17,5 – 16,55 = 0,95


2

ȕ – 16,5 + 19,6 = 18,0 – 18,05 = -0,05


2

¾ Paso 2
Lambda (Ȝ) se calcula de la misma forma para la suma de
cuadrados de tratamientos ajustados (fórmula 22).
En el ejemplo  Ȝ   Ahora reemplazamos en la fórmula de
SC ȕ* (ajustado):

SC ȕ* = 2* ((-0,9)2 + 0,95 2 + (-0,05)2 = 1,143


1*3

SCE= SCT – SCt – SCB* = 4,29 – 3,10 – 1,143 = 0,05

90


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 3
Los gl son los mismos ya utilizados (glt = 2; glȕ = 2; glE = N-a-b+1
= 1; glT = 5).

¾ Paso 4
Calcular los cuadrados medios:

CMt= SCt = 3,10 = 1,55


glt 2

CMȕ*= SCȕ* = 1,143 = 0,57


glȕ 2

CME= SCE = 0,05 = 0,05


glE 1

¾ Paso 5
Calcular los valores F del ANOVA:

Ft= CMt = 1,55 = 31


CME 0,05

Fȕ*= CMȕ* = 0,67 = 13,4


CME 0,05

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 3,10 2 1,55 31,0
sin ajustar
Bloques 1,143 2 0,57 13,4
ajustados
Error 0,05 1 0,05
Total 4,29 5
91


FERNANDO MAUREIRA CID

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F, utilizando el mismo valor crítico
anterior (F=199,50).
A continuación se sigue la regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

13,4<199,50 por lo tanto, se debe aceptar la H02 y podemos


concluir que no existen diferencias entre los bloques aplicados.

92


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
DISEÑO DE CUADRADO LATINO

El DBCA controla un factor de bloque para eliminar su


influencia en la respuesta del experimento y así reducir el error
experimental. Pero es posible que necesitemos controlar dos
factores que interfieren en los resultados y para ello es necesario
crear un diseño con dos factores de bloques, este recibe el nombre
de Diseño de Cuadrado Latino (DCL). Este diseño necesita la
misma cantidad de niveles para los tres factores y permite controlar
la variabilidad producida por: a) los tratamientos; b) el factor de
bloque I (columnas); c) factor de bloque II (renglones); d) error
experimental.
Como este diseño posee la misma cantidad de niveles de
todos sus factores forma un cuadrado, en donde los tratamientos se
designan con letras latinas (A, B, C, etc.) de ahí su nombre. Es
importante recordar que no debe existir interacción entre los
factores del experimento.
El DCL queda como la tabla siguiente:

Factor 2
Factor 1 1 2 3 4
1 A B C D
2 B C D A
3 C D A B
4 D A B C

93


FERNANDO MAUREIRA CID

Siendo los valores 1, 2, 3 y 4 del factor 1 los niveles del


mismo (Bloque I); los valores 1, 2, 3 y 4 del factor 2 los niveles del
mismo (Bloque II) y las letras latinas A, B, C y D los tratamientos.
Para establecer la naturaleza de los efectos y las restricciones
del DCL utilizamos el siguiente aditivo lineal que resume los
factores del experimento:

yij = NJ + Ti Ȗj + įl+ eij (fórmula 25)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento
Ȗj = efecto del bloque I
įl = efecto bloque II
eij = error experimental

1. DCL & ANOVA

El ANOVA en un DCL permite contrastar la igualdad de medias


dadas por las siguientes hipótesis:

H01 = 71 72 73 =… 7k H02 = ǃ1 ǃ2 ǃ3 =… ǃk


H1 = 7i 7j      H2 = ǃi ǃj 

H03 = į1 į2 į3 =… įk


H3 = įi įj

Es decir, en la H 01 contrastamos que no hay diferencia entre


las medias de los diversos tratamientos, frente a la alternativa que
al menos un par de tratamientos difieren entre ellos. En la H02
contrastamos que no hay diferencia entre las medias del bloque 1,
frente a la alternativa que al menos un par de medias difieren entre
ellos. En la H 03 contrastamos que no hay diferencias entre las
medias del bloque 2, frente a la alternativa que al menos un par de
medias difieren entre ellos.
94


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Toda la información necesaria para realizar estos contrastes


de hipótesis se describen en la tabla de ANOVA del DCL.

Tabla 4. ANOVA de un factor para un DCL.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamientos SCt= ™\ij² - yij² p -1 CMt= SCt CMt
p N glt CME
Bloque I SCȖ= ™\ij² - yij² p -1 CMȖ= SCȖ CMȖ
p N glȖ CME
Bloque II SCį= ™\ij² - yij² p-1 CMį= SCį CMį
p N glį CME
Error SCE= por sustracción (p-2)(p-1) CME= SCE
glE
Total SCT= ™™™\ðij - yij² p2 - 1
N
p= número de tratamientos

ƒ Ejemplo 1
Un investigador buscar conocer los efectos de un programa de
talleres de técnicas de estudio (3 sesiones, 5 sesiones; 8
sesiones y 10 sesiones) sobre el rendimiento académico en
estudiantes de educación física, controlando los hábitos de
estudio (bajo, medio bajo, medio alto y alto) y la motivación
(baja, media baja, media alta y alta). Para ello se utiliza un DCL
4x4 (cuatro niveles de los factores). Los resultados tras la
aplicación de los tratamientos fueron los siguientes:

Motivación
Hábitos estudio 1 2 3 4
1 A = 4,0 B = 5,2 C = 5,5 D = 6,0
2 B = 5,8 C = 6,2 D = 6,5 A = 4,8
3 C = 5,4 D = 5,8 A = 5,1 B = 4,8
4 D = 5,6 A = 5,0 B = 5,0 C = 5,6
95


FERNANDO MAUREIRA CID

¾ Paso 1
Sumar las puntuaciones por columnas (yj) y por fila (yi). Luego
elevarlas al cuadrado (yj2; yi2). Sumar los valores yj2 (™89)
y los valores yi2 (™ 

1 2 3 4 yi yi2
1 A = 4,0 B = 5,2 C = 5,5 D = 5,8 20,5 420,25
2 B = 5,8 C = 6,2 D = 6,5 A = 4,8 23,3 542,89
3 C = 5,4 D = 5,8 A = 5,1 B = 4,8 21,1 445,21
4 D = 5,6 A = 5,0 B = 5,0 C = 5,6 21,2 449,44
yj 20,8 22,2 22,1 21,0 ™86,1 ™
yj2 432,64 492,84 488,41 441 ™1854,89

¾ Paso 2
Sumar los valores al cuadrado de cada bloque (™\2j ). También
es necesario sumar los puntajes al cuadrado de cada
tratamiento (™ 

1 2 3 4 yi yi2
1 A = 4,0 B = 5,2 C = 5,5 D = 5,8 20,5 420,25
2 B = 5,8 C = 6,2 D = 6,5 A = 4,8 23,3 542,89
3 C = 5,4 D = 5,8 A = 5,1 B = 4,8 21,1 445,21
4 D = 5,6 A = 5,0 B = 5,0 C = 5,6 21,2 449,44
yj 20,8 22,2 22,1 21,0 ™ ™
yj2 432,64 492,84 488,41 441 ™
™\2j 110,16 124,12 123,51 111,08 ™

™ ™2
Tratamiento A 18,9 357,21
Tratamiento B 20,8 432,64
Tratamiento C 22,7 515,29
Tratamiento D 23,7 561,69
™

96


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 3
Calcular las sumas de cuadrados:

2
SCT= ™™™y j - yij² = 468,87 - (86,1)² = 5,54
N 16

SCt= ™\ij² - yij² = 1866,83 - (86,1)² = 3,38


p N 4 16

SCȖ= ™\ij² - yij² = 1857,79 - (86,1)² = 1,21


p N 4 16

SCį= ™\ij² - yij² = 1854,89 - (86,1)² = 0,39


p N 4 16

SCE= SCT – SCt – SCB1 – SCB2 = 5,54 – 3,38 – 1,21 – 0,39 = 0,56

¾ Paso 4
Calcular los grados de libertad:

glt = p – 1 = 4 – 1 = 3
glȖ = p – 1 = 4 – 1 = 3
glį = p – 1 = 4 – 1 = 3
glE = (p – 2)(p – 1) = 2*3 = 6
glT = p2 – 1 = 16 – 1 = 15

¾ Paso 5
Calcular los cuadrados medios:

CMt= SCt = 3,38 = 1,13


glt 3

CMȖ= SC Ȗ = 1,21 = 0,40


glȖ 3
97


FERNANDO MAUREIRA CID

CMį= SC į = 0,39 = 0,13


glį 3

CME= SCE = 0,56 = 0,09


glE 6

¾ Paso 6
Calcular los valores F del ANOVA:

Ft= CMt = 1,13 = 12,55


CME 0,09

FȖ= CMȖ = 0,40 = 4,44


CME 0,09

Fį= CMį = 0,13 = 1,44


CME 0,09

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 3,38 3 1,13 12,55
Bloque I 1,21 3 0,40 4,44
Bloque II 0,39 3 0,13 1,44
Error 0,56 6 0,09
Total 5,54 15

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento y/o bloque
correspondiente y el error experimental, buscando los gl menor
entre ellos en la primera fila (horizontal) y los gl mayores en la
primera columna (vertical).
98


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La intersección del valor F de los tratamientos y bloques fue


fue 4,76. A continuación se sigue la regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

12,55>4,76 por lo tanto, se debe rechazar la H01 y podemos


concluir que existen diferencias entre los tratamientos aplicados.
4,44<4,76 por lo tanto, se debe aceptar la H 02 y podemos
concluir que no existen diferencias entre los niveles del bloque 1
aplicados (hábitos de estudio).
1,44<4,76 por lo tanto, se debe aceptar la H 03 y podemos
concluir que no existen diferencias entre los niveles del bloque 2
aplicados (motivación).
Por ende, es posible concluir que los bloques no tienen
influencia sobre las respuestas a los tratamientos, por lo tanto no
resulta necesario controlar esos factores en futuros experimentos.

99


FERNANDO MAUREIRA CID

También es posible calcular la proporción de variabilidad de


los datos que es explicada por el modelo de ANOVA para DCL,
mediante el coeficiente de determinación (R 2) que se obtiene con la
siguiente fórmula:
R2 = R2t + R2Ȗ + R2į (fórmula 26)

R2t = coeficiente de determinación parcial del tratamiento


R2Ȗ= coeficiente de determinación parcial de bloque 1
R2į= coeficiente de determinación parcial de bloque 2

A su vez, los coeficientes de determinaciones parciales se


obtienen con las fórmulas siguientes:

R2t = SCt (fórmula 27)


SCT

R 2Ȗ= SC Ȗ (fórmula 28)


SCT

R 2į= SC į (fórmula 29)


SCT

Con los datos del ejemplo 1 reemplazamos en las fórmulas:

R2t = 3,38 = 0,61


5,54

R2Ȗ= 1,21 = 0,22


5,54

R2į= 0,39 = 0,07


5,54

R2 = 0,61 + 0,22 + 0,07 = 0,90

100


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Es decir, los tratamientos (talleres) explican el 61% de la


variación del rendimiento académico en la muestra. Por su parte, el
bloque 1 (hábitos de estudio) explican el 22% de la variación y el
bloque 2 (motivación) explica el 7% de la variación de los datos.
Finalmente, el modelo total explica el 90% de la variabilidad del
rendimiento académico.

1.1 Comparaciones múltiples

En el caso que se presente diferencias entre las medias, es


necesario comparar los grupos por pares y para eso utilizaremos el
procedimiento de Tukey modificado por Snedecor, el mismo
utilizado para el DBCA.

2. IDONEIDAD DEL MODELO

Para saber si el modelo propuesto es válido y por lo tanto, si


los resultados obtenidos también lo son, resulta necesario conocer
si se cumplen las hipótesis básicas de dicho modelo:

a) Aditividad: los efectos de los tratamientos y lo bloques no están


relacionados.
b) Normalidad de los residuos.
c) Independencia de los residuos.
d) Homogeneidad de varianzas entre los tratamientos y los
bloques.

Estos supuestos se contrastan de la misma forma que en el


DBCA.

101


FERNANDO MAUREIRA CID

102


ESTADISTICA AVANZADA PARA EDUCACION FISICA

IV
DISEÑO DE CUADRADO GRECOLATINO

El DCL controla dos factores mediante bloques para eliminar


su influencia en la respuesta del tratamiento, pero es posible que el
investigador requiera controlar 3 factores mediante 3 bloqueos,
situación conocida como Diseño de Cuadrado Grecolatino (DCGL).
Este diseño necesita la misma cantidad de niveles para los cuatro
factores y permite controlar la variabilidad producida por: a) los
tratamientos; b) el factor de bloque I (columnas); c) factor de bloque
II (renglones); d) factor de bloque III (letras griegas); e) error
experimental.
Es importante recordar que no debe existir interacción entre
los factores del experimento.
El DCGL queda como la tabla siguiente:

Factor 2
Factor 1 1 2 3 4
1 AĮ Bȕ CȖ Dį
2 Bį CĮ Dȕ Aǃ
3 Cȕ DȖ Aį BĮ
4 DȖ Aį BĮ Cȕ

Siendo los valores 1, 2, 3 y 4 del factor 1 los niveles del


mismo (Bloque I); los valores 1, 2, 3 y 4 del factor 2 los niveles del
PLVPR %ORTXH ,,  ODV OHWUDV JULHJDV Į ȕ Ȗ \ į del factor 3 los
niveles del mismo y las letras latinas A, B, C y D los tratamientos.

103


FERNANDO MAUREIRA CID

Para establecer la naturaleza de los efectos y las restricciones


del DCGL utilizamos el siguiente aditivo lineal que resume los
factores del experimento:

yij = NJ + Ti Ȗj + įl+ ijP + eij (fórmula 30)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento
Ȗj = efecto del bloque I
įl = efecto bloque II
ijP= efecto bloque III
eij = error experimental

1. DCGL & ANOVA



El ANOVA en un DCGL permite contrastar la igualdad de
medias dadas por las siguientes hipótesis:

H01 = 71 72 73 =… 7k H02 = ǃ1 ǃ2 ǃ3 =… ǃk


H1 = 7i 7j      H2 = ǃi ǃj 

H03 = į1 į2 į3 =… įk H04 = ij1 ij2 ij3 =… ijk


H3 = įi įj H4 = iji ijj

Es decir, en la H 01 contrastamos que no hay diferencia entre


las medias de los diversos tratamientos, frente a la alternativa que
al menos un par de tratamientos difieren entre ellos. En la H02
contrastamos que no hay diferencia entre las medias del bloque 1,
frente a la alternativa que al menos un par de medias difieren entre
ellos. En la H 03 contrastamos que no hay diferencias entre las
medias del bloque 2, frente a la alternativa que al menos un par de
medias difieren entre ellos. En la H 04 contrastamos que no hay
diferencias entre las medias del bloque 3, frente a la alternativa que
al menos un par de medias difieren entre ellos.
104


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Toda la información necesaria para realizar estos contrastes


de hipótesis se describen en la tabla de ANOVA del DCGL.

Tabla 5. ANOVA de un factor para un DCGL.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamientos SCt= ™\ij² - yij² p -1 CMt= SC t CMt
p N glt CME
Bloque I SCȖ= ™\ij² - yij² p -1 CMȖ = SCȖ CMȖ
p N glȖ CME
Bloque II SCį= ™\ij² - yij² p-1 CMį= SCį CMį
p N glį CME
Bloque III SCij= ™\ij² - yij² p-1 CMij= SCij CMį
p N glij CME
Error SCE= por sustracción (p-3)(p-1) CME= SCE
glE
Total SCT= ™™™™\ðLM - yij² p2 - 1
N
p= número de tratamientos

ƒ Ejemplo 1
Un investigador busca conocer los efectos de un programa de
flexibilidad (estático activo, estático pasivo, facilitación
neuromuscular propioceptiva, mixto y grupo control) sobre los
niveles de agilidad en estudiantes de 1° año medio de sexo
femenino, controlando la resistencia aeróbica (nivel 1, 2, 3, 4, y
5), la fuerza (baja, media baja, media, media alta y alta) y la
velocidad (muy baja, baja, media, alta y muy alta). Para ello se
utiliza un DCGL 5x5 (cinco niveles de los factores). Los
resultados tras la aplicación de los tratamientos fueron los
siguientes:

105


FERNANDO MAUREIRA CID

Factor 2
Factor 1 1 2 3 4 5
1 AĮ=8 Bȕ=6 CȖ=4 Dį  (İ=9
2 Bİ  CĮ  Dȕ  Eǃ  Aį 
3 Cȕ  DȖ  Eį  $İ  BĮ 
4 DȖ  Eį  $İ  %Į  Cȕ 
5 Eį  Aİ  BĮ  Cȕ  DȖ 

¾ Paso 1
Calcular la suma de puntuaciones por columnas (yj) y por filas
(yi). Luego elevarlas al cuadrado (yj2; yi2). Luego sumar los
valores al cuadrado de cada bloque (™\2j).También es necesario
sumar los puntajes del tercer bloque y de cada tratamiento.

1 2 3 4 5 yi yi2
1 $Į  BȖ=6 Cİ=4 Dǂ  Eį=9 35 1225
2 Bǂ  Cį=7 DĮ=8 Eǃ  Aİ  35 1225
3 CȖ=5 Dİ=9 Eǂ  Aį=5 BĮ  31 961
4 Dį=6 EĮ  $Ȗ=4 %İ=7 &ȕ  32 1024
5 Eİ  Aȕ=5 Bį=7 CĮ=5 'Ȗ  26 676
yj 33 33 29 31 33 ™159 ™
yj 2 1089 1089 841 961 1089 ™5069
™y2j 241 227 181 199 239 ™

Factor 3 ™ ™2 Tratamiento ™ ™2
Į 33 1089 A 26 676
ȕ 38 1444 B 36 1296
Ȗ 26 676 C 30 900
į 34 1156 D 36 1296
İ 28 784 E 31 961
™5149 ™5129

¾ Paso 2
Calcular las sumas de cuadrados:

106


ESTADISTICA AVANZADA PARA EDUCACION FISICA

2
SCT= ™™™™y j - yij² = 1087 - (159)² = 75,76
N 25

SCt= ™\ij² - yij² = 5129 - (159)² = 14,56


p N 5 25

SCȖ= ™\ij² - yij² = 5111 - (159)² = 10,96


p N 5 25

SCį= ™\ij² - yij² = 5069 - (159)² = 2,56


p N 5 25

SCij= ™\ij² - yij² = 5149 - (159)² = 18,56


p N 5 25

SCE= SCT – SCt – SCȖ – SCį – SCij


= 75,76 – 14,56 – 10,96 – 2,56 – 18,56 = 29,12

¾ Paso 3
Calcular los grados de libertad:

glt = p – 1 = 5 – 1 = 4
glB1 = p – 1 = 5 – 1 = 4
glB2 = p – 1 = 5 – 1 = 4
glB3 = p – 1 = 5 – 1 = 4
glE = (p – 3)(p – 1) = 2*4 = 8
glT = p2 – 1 = 25 – 1 = 24

¾ Paso 4
Calcular los cuadrados medios:

CMt= SCt = 14,56 = 3,64


glt 4

107


FERNANDO MAUREIRA CID

CMȖ= SC Ȗ = 10,96 = 2,74


glȖ 4

CMį= SC į = 2,56 = 0,64


glį 4

CMij= SCij = 18,56 = 4,64


glij 4

CME= SCE = 29,12 = 3,64


glE 8

¾ Paso 6
Calcular los valores F del ANOVA:

Ft= CMt = 3,64 = 1


CME 3,64

FȖ= CMȖ = 2,74 = 0,75


CME 3,64

Fį= CMį = 0,64 = 0,18


CME 3,64

Fij= CMij = 4,64 = 1,27


CME 3,64

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamientos 14,56 4 3,64 1
Bloque I 10,96 4 2,74 0,75
Bloque II 2,56 4 0,64 0,18
Bloque III 18,56 4 4,64 1,27
Error 29,12 8 3,64
Total 75,76 24
108


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamientos, bloques y
el error experimental, buscando los gl menor entre ellos en la
primera fila (horizontal) y los gl mayores en la primera columna
(vertical).

La intersección del valor F de los tratamientos y bloques fue


3,84. A continuación se sigue la regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

1,00<3,84 por lo tanto, se debe aceptar la H 01 y podemos


concluir que no existen diferencias entre los tratamientos aplicados.
0,74<3,84 por lo tanto, se debe aceptar la H 02 y podemos
concluir que no existen diferencias entre los niveles del bloque 1
aplicados (resistencia).
0,18<3,84 por lo tanto, se debe aceptar la H 03 y podemos
concluir que no existen diferencias entre los niveles del bloque 2
aplicados (fuerza).

109


FERNANDO MAUREIRA CID

1,27<3,84 por lo tanto, se debe aceptar la H 04 y podemos


concluir que no existen diferencias entre los niveles del bloque 3
aplicados (velocidad).

Por ende, es posible concluir que los bloques no tienen


influencia sobre las respuestas a los tratamientos, por lo tanto no
resulta necesario controlar esos factores en futuros experimentos.
También es posible calcular la proporción de variabilidad de
los datos que es explicada por el modelo de ANOVA para DCGL,
mediante el coeficiente de determinación (R 2) que se obtiene con la
siguiente fórmula:

R2 = R2t + R2Ȗ + R2į + R2ij (fórmula 31)

R2t = coeficiente de determinación parcial del tratamiento (fórmula 27)


R2Ȗ= coeficiente de determinación parcial de bloque 1(fórmula 28)
R2į= coeficiente de determinación parcial de bloque 2 (fórmula 29)
R2ij= coeficiente de determinación parcial de bloque 3

R2ij = SCij / SCT (fórmula 32)

Con los datos del ejemplo 1 reemplazamos en las fórmulas:

R2t = 14,56 = 0,19


75,76

R2Ȗ= 10,96 = 0,14


75,76

R 2į= 2,56 = 0,03


75,76

R2ij= 18,56 = 0,24


75,76

R2 = 0,19 + 0,14 + 0,03 + 0,24 = 0,60


110


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Es decir, los tratamientos (programas de flexibilidad) explican


el 19% de la variación de la agilidad en la muestra. Por su parte, el
bloque 1 (resistencia aeróbica) explica el 14% de la variación, el
bloque 2 (fuerza) explica el 3% de la variación y el bloque 3
(velocidad) explica el 24% de la variación de los datos. Finalmente,
el modelo total explica el 60% de la variabilidad de la agilidad.

1.1 Comparaciones múltiples

En el caso que se presente diferencias entre las medias, es


necesario comparar los grupos por pares y para ello utilizaremos el
procedimiento de Tukey modificado por Snedecor, el mismo
utilizado para el DBCA (pág. 75).

2. IDONEIDAD DEL MODELO

Para saber si el modelo propuesto es válido y por lo tanto, si


los resultados obtenidos también lo son, resulta necesario conocer
si se cumplen las hipótesis básicas de dicho modelo:

a) Aditividad: los efectos de los tratamientos y lo bloques no están


relacionados.
b) Normalidad de los residuos.
c) Independencia de los residuos.
d) Homogeneidad de varianzas entre los tratamientos y los
bloques.

Estos supuestos se contrastan de la misma forma que en el


DBCA.

111


FERNANDO MAUREIRA CID

112


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPITULO 3

DISEÑOS FACTORIALES

I. Diseños factoriales 22

II. Diseños factoriales 2k & 3k

III. Bloques y diseños factoriales 2k

113


FERNANDO MAUREIRA CID

114


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
DISEÑOS FACTORIALES 22

En algunos experimentos es necesario analizar el efecto de


dos o más factores sobre una variable dependiente, estudiando la
influencia conjunta de dichos factores sobre réplicas del
experimento. Este tipo de diseños reciben el nombre de diseños
factoriales.
El diseño de experimento corresponde a la manera en que los
tratamientos se aleatorizan a los diferentes sujetos, pudiendo estos
ser DCA, DBCA, DBIA, DCL y DCGL. Por su parte, los diseños de
tratamientos corresponden a la selección de los factores, sus
niveles e interacciones, pudiendo estos ser diseños factoriales de
dos factores con dos niveles cada uno (22), con tres niveles cada
uno (23), etc., con tres factores con dos niveles cada uno (32), con
tres niveles (33), etc.

Diseños Diseños de
experimentales tratamientos

DCA 22, 2 3,…2k


DBCA
DBIA 32, 3 3,…3k
DCL
DCGL n2, n 3,…nk

Figura 9. Diseños de experimentos y sus posibles diseños de


tratamientos.

115


FERNANDO MAUREIRA CID

ƒ Ejemplo 1
Un investigador busca conocer los efectos de un entrenamiento
físico y el suplemento alimenticio sobre los niveles de fuerza. El
primer tratamiento posee dos niveles: fuerza máxima y potencia.
El segundo tratamiento también posee dos niveles: suplemento
con proteínas y suplemento con creatina. Ahora se debe
estudiar los efectos del tratamiento A, los efectos del tratamiento
B y los efectos de la interacción de AB.

El ejemplo anterior corresponde al diseño factorial más


sencillo (2x2 ó 22), con dos tratamientos con dos niveles cada uno.
En este caso el experimento es unifactorial, DCA de factores
fijos, balanceado, factorial 22 con pre y post-prueba. La
investigación planteada amerita estudiar ambas variables que ya se
encuentran relacionadas, pues al cambiar el tipo de suplemento
(proteína y creatina) la fuerza máxima varía, misma situación que
ocurre con la potencia.
Los diseños factoriales se utilizan cuando existe interacción
entre los tratamiento aplicados, ya que cuando sucede esto es más
importante conocer la interacción de las variables que los efectos
principales de estas por separado.



Figura 10. Gráficos de un diseño factorial 2x2 sin interacción (a la


izquierda) y con interacción (a la derecha).

116


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Para establecer la naturaleza de los efectos y las restricciones


de un DCA de factores fijos, balanceado con un diseño factorial 22
utilizamos el siguiente aditivo lineal que resume el experimento:

y ij = NJ + Ti ȕj + 7ȕ ij + eij (fórmula 33)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento A de los renglones
ȕj = efecto del tratamiento B de las columnas
7ǂij = efecto de la interacción de AB
eij = error experimental

1. DISEÑO FACTORIAL 22 & ANOVA



El ANOVA en un diseño factorial permite contrastar la
igualdad de medias dadas por las siguientes hipótesis:

H01 = 71 72   H02 ȕ1 ȕ2


H1 = 71 72   H2 ȕ1 ȕ2

H03 7ȕij = 0
H3 7ȕij 

Es decir, contrastamos la H 01 que plantea que no hay


diferencia entre las medias del tratamiento A frente a la alternativa
que si hay diferencia entre ellas. Contrastamos la H02 que plantea
que no hay diferencia entre las medias del tratamiento B frente a la
alternativa que si hay diferencia entre ellas. Finalmente,
contrastamos la H03 que plantea que no hay interacción entre el
tratamiento A y B frente a la alternativa que si existe interacción.
Toda la información necesaria para realizar este contraste de
hipótesis se describe en la tabla de ANOVA del diseño factorial.

117


FERNANDO MAUREIRA CID

Tabla 6. ANOVA para el diseño factorial 22 con factores fijos.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamiento SCA= ™\ij² - yij² a-1 CMA= SCA CMA
A bn abn glA CME
Tratamiento SCB= ™\ij² - yij² b-1 CMB= SCB CMB
B an abn glB CME
Interacción SCAB= SCAB-SCA-SCB (a-1)(b-1) CMAB=SCAB CMAB
glAB CME
Error SCE= por sustracción ab(n-1) CME= SCE
glE
Total SCT= ™™™\ðLM - yij² abn - 1
abn
a= número de tratamientos A
b= número de tratamientos B
n= sujetos por tratamiento
SCAB= ™\LM² - yij² – SCA – SCB
n abn

ƒ Ejemplo 2
Un investigador busca conocer los efectos de un programa de
entrenamiento de la fuerza (máxima y sub-máxima) y de
proteínas (consumo y no consumo) sobre el porcentaje de grasa
corporal. Para ello se intervinieron a 12 varones con edades
entre 20 y 30 años de Santiago de Chile. Los resultados tras la
intervención se muestran en la tabla siguiente:
Proteínas
Fuerza Consumo No consumo
22,0 25,3
Máxima 20,0 ™65,4 22,8 ™
23,4 24,6
18,5 23,5
Sub-máxima 20,2 ™ 22,3 ™
19,2 21,0
118


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Este diseño corresponde a un DCA de factores fijos,


balanceado, factorial 22, con pre y post-prueba.

¾ Paso 1
Sumar los renglones (yi) y columnas (yj). Luego elevar ambos
valores al cuadrado (yi2; yj2). Elevar al cuadrado el valor de cada
casilla y sumarlos (yj+2). Sumar los valores al cuadrado de cada
sujeto de cada bloque (™\2j).

Proteínas
Fuerza Consumo No consumo yi yi2
Máxima 65,4 72,7 138,1 19071,61
Sub-máxima 57,9 66,8 124,7 15550,09
yj 123,3 139,5 ™ ™
yj2 15202,89 19460,25 ™
yj+2 7629,57 9747,53 ™
™\2j 2550,49 3255,63 ™

¾ Paso 2
Calcular las sumas de cuadrados:

2
SCT= ™™™y j - yij² = 5806,12 - (262,8)² = 50,8
abn 12

SCA= ™\ij² - yij² = 34621,7 - (262,8)² = 14,96


bn abn 6 12

SCB= ™\ij² - yij² = 34663,14 - (262,8)² = 21,87


an abn 6 12

SC AB= ™\ij² - yij² -SCA – SCB = 17377,1 - (262,8)² = 37,05


n abn 3 12

= 37,05 – 14,96 – 21,87 = 0,22

119


FERNANDO MAUREIRA CID

SCE= SCT–SC A –SCB –SC AB = 50,8 – 14,96 – 21,87 – 0,22 = 13,75

¾ Paso 3
Calcular los grados de libertad:

glA = a – 1 = 2 – 1 = 1
glB = b – 1 = 2 – 1 = 1
glAB = (a – 1)(b – 1) = 1 * 1 = 1
glE = ab(n – 1) = 4*2 = 8
glT = abn – 1 = 12 – 1 = 11

¾ Paso 4
Calcular los cuadrados medios:

CMA= SCA = 14,96 = 14,96


glA 1

CMB= SCB = 21,87 = 21,87


glB 1

CMAB= SCAB = 0,22 = 0,22


glAB 1

CME= SCE = 13,75 = 1,719


glE 8

¾ Paso 5
Calcular los valores F del ANOVA:

FA= CMA = 14,96 = 8,702


CME 1,719

FB= CMB = 21,87 = 12,723


CME 1,719

120


ESTADISTICA AVANZADA PARA EDUCACION FISICA

FAB= CMAB = 0,22 = 0,128


CME 1,719

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamiento A 14,96 1 14,96 8,702
Tratamiento B 21,87 1 21,87 12,723
Intersección 0,22 1 0,22 0,128
Error 13,75 8
Total 50,8 11

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios del tratamiento A, B,
intersección AB y el error experimental, buscando los gl menor entre
ellos en la primera fila (horizontal) y los gl mayores en la primera
columna (vertical).

La intersección del valor F fue 5,32. A continuación se sigue la


regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.
121


FERNANDO MAUREIRA CID

8,702>5,32 por lo tanto, se debe rechazar la H01 y podemos


concluir que existen diferencias entre los tratamientos A aplicados
(entrenamiento de fuerza).
12,723>5,32 por lo tanto, se debe rechazar la H02 y podemos
concluir que existen diferencias entre los tratamientos B aplicados
(proteínas).
0,128<5,32 por lo tanto, se debe aceptar la H03 y podemos
concluir que no existen interacción entre los tratamiento A y B.

1.1 Comparaciones múltiples

En el caso que se presente diferencias entre las medias, es


necesario comparar los grupos por pares y para ello utilizaremos el
procedimiento de Tukey modificado por Snedecor, el mismo
utilizado para el DCA (pág. 41).

2. IDONEIDAD DEL MODELO

Para saber si el modelo propuesto es válido y por lo tanto, si


los resultados obtenidos también lo son, resulta necesario conocer
si se cumplen las tres hipótesis básicas de dicho modelo:

a) Normalidad de los residuos.


b) Independencia de los residuos.
c) Homogeneidad de varianzas entre los tratamientos.

Estos supuestos se contrastan de la misma forma que en el


DCA.

122


ESTADISTICA AVANZADA PARA EDUCACION FISICA

3. DISEÑO FACTORIAL 22 CON UN CASO POR CELDA

En un experimento de dos factores es posible tener solo una


réplica, es decir, una sola observación por celda. En este caso no
es posible separar el efecto de la interacción AB del error
experimental. En esta situación se utiliza la siguiente tabla de
ANOVA:

Tabla 7. ANOVA para el diseño factorial 22 de factores fijos con un


caso por celda.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamiento SCA= ™\LMð - yij² a-1 CMA= SCA CMA
A b ab glA CME
Tratamiento SCB= ™\LMð - yij² b-1 CMB= SCB CMB
B a ab glB CME
Error SCE= por sustracción (a-1)(b-1) CME = SC E

glE
Total SCT= ™™\ðLM - yij² ab - 1
ab

ƒ Ejemplo 3
Un investigador busca conocer los efectos de un taller deportivo
de 12 sesiones (hándbol y voleibol) y de un entrenamiento
perceptivo visual-auditivo (5 sesiones y 10 sesiones) sobre la
velocidad de reacción. Para ello se intervinieron a 4 varones con
edades entre 18 y 22 años de Santiago de Chile. Los resultados
tras la intervención se muestran en la tabla siguiente:

Entrenamiento perceptivo
Taller 5 sesiones 10 sesiones
Hándbol 2,71 1,46
Voleibol 3,83 2,12
123


FERNANDO MAUREIRA CID

¾ Paso 1
Sumar los renglones (yi) y columnas (yj). Luego elevar ambos
valores al cuadrado (yi2; yj2). Sumar los valores al cuadrado de
cada sujeto de cada bloque (™\2j).

Entrenamiento perceptivo
Taller 5 sesiones 10 sesiones yi yi2
Hándbol 2,71 1,46 4,17 17,39
Voleibol 3,83 2,12 5,95 35,40
yj 6,54 3,58 ™ ™
yj2 42,77 12,82 ™
™\2j 22,01 6,63 ™28,64

¾ Paso 2
Calcular las sumas de cuadrados:

2
SCT= ™™y j - yij² = 28,64 - (10,12)² = 3,036
ab 4

SCA= ™\ij² - yij² = 52,79 - (10,12)² = 0,791


b ab 2 4

SCB= ™\ij² - yij² = 55,59 - (10,12)² = 2,191


a ab 2 4

SCE= SCT–SC A –SCB = 3,036 – 0,791 – 2,191= 0,054

¾ Paso 3
Calcular los grados de libertad:

glA = a – 1 = 2 – 1 = 1
glB = b – 1 = 2 – 1 = 1
glE = (a – 1)(b – 1) = 1 * 1 = 1
glT = ab – 1 = 4 – 1 = 3

124


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 4
Calcular los cuadrados medios:

CMA= SCA = 0,791 = 0,791


glA 1

CMB= SCB = 2,191 = 2,191


glB 1

CME= SCE = 0,054 = 0,054


glE 1

¾ Paso 5
Calcular los valores F del ANOVA:

FA= CMA = 0,791 = 14,648


CME 0,054

FB= CMB = 2,191 = 40,574


CME 0,054

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamiento A 0,791 1 0,791 14,648
Tratamiento B 2,191 1 2,191 40,574
Error 0,054 1 0,054
Total 3,036 3

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento A, B y el
error experimental, buscando los gl menor entre ellos en la primera
fila (horizontal) y los gl mayores en la primera columna (vertical).
125


FERNANDO MAUREIRA CID

La intersección del valor F fue 161,45. A continuación se sigue


la regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

14,648<161,45 por lo tanto, se debe aceptar la H01 y


podemos concluir que no existen diferencias entre los tratamientos
A aplicados (taller deportivo).
40,574<161,45 por lo tanto, se debe aceptar la H02 y podemos
concluir que no existen diferencias entre los tratamientos B
aplicados (entrenamiento perceptivo).

126


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
DISEÑOS FACTORIALES 2k & 3k

Un diseño factorial nk posee k tratamientos con n niveles cada


uno. El diseño 22 es el más sencillo de todos, con dos tratamientos
con niveles cada uno, en un diseño 23 (también expresado como
2x2x2) existen tres tratamientos con 2 niveles cada uno, en un
diseño 24 (2x2x2x2) existen cuatro tratamientos con 2 niveles cada
uno, etc. Un diseño 2k posee k tratamientos con 2 niveles cada uno.
Un diseño factorial 32 (3x3) posee dos tratamientos con 3
niveles cada uno, un 33 (3x3x3) posee tres tratamientos con 3
niveles cada uno, etc. Un diseño factorial 3k posee k tratamientos
con 3 niveles cada uno. Su utilización y desarrollo es similar a los
diseños 2k.
También existen diseños factoriales con diferente cantidad de
niveles en cada tratamiento, por ejemplo, un experimento factorial
4x2x3 posee un primer tratamiento con cuatro niveles, un segundo
tratamiento con dos niveles y un tercer tratamiento con tres niveles.
Siempre se recomienda no tener demasiados tratamientos y/o
niveles ya que eso dificulta los análisis y las interpretaciones de los
resultados.

Los aditivos lineales y tablas de ANOVA para diseños


factoriales nk se modificaran en relación al número de tratamientos
que comprenda el experimento. Para establecer la naturaleza de los
efectos y las restricciones de un DCA de factores fijos, balanceado
con un diseño factorial nk utilizamos el siguiente aditivo lineal que
resume el experimento:

127


FERNANDO MAUREIRA CID

yij = NJ + Ti ȕj «N 7ȕ ij 7N  ȕN Hij (fórmula 34)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento A
ȕj = efecto del tratamiento B
k = efecto del tratamiento k
7ǂij = efecto de la interacción de AB
Tk = efecto de la interacción de Ak
ȕN HIHFWRGHODLQWHUDFFLón Bk
eij = error experimental

1. DISEÑO FACTORIAL nk & ANOVA



El ANOVA en un diseño factorial permite contrastar la
igualdad de medias dadas por las siguientes hipótesis:

H01 = 71 72  H 02 = ȕ1 = ȕ2 … H0k = k1 = k2


H1 = 71 72  H 2 = ȕ1 ȕ2 ... Hk = k 1 N 2

H04 = Tȕij = 0 H05 = Tkij = 0 ... H06 = ȕkij = 0


H4 = Tȕij  H 4 = Tkij  ... H6 = ȕkij 

Es decir, contrastamos la H 01 que plantea que no hay


diferencia entre las medias del tratamiento A frente a la alternativa
que si hay diferencia entre ellas. Contrastamos la H02 que plantea
que no hay diferencia entre las medias del tratamiento B frente a la
alternativa que si hay diferencia entre ellas. Así hasta el tratamiento
k con n niveles. Luego contrastamos la H04 que plantea que no hay
interacción entre el tratamiento A y B frente a la alternativa que si
existe interacción. Así contrastamos los k pares de tratamientos.
Toda la información necesaria para realizar este contraste de
hipótesis se describe en la tabla de ANOVA del diseño factorial.

128


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Tabla 8. ANOVA para el diseño factorial 23 con factores fijos.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Tratamiento SCA= ™\LMð - yij² a-1 CMA= SCA CMA
A bcn abcn glA CME
Tratamiento SCB= ™\LMð - yij² b-1 CMB= SCB CMB
B acn abcn glB CME
Tratamiento SCC= ™\LMð - yij² c-1 CMC= SCC CMC
C abn abcn glC CME
Interacción SCAB= SCAB-SCA-SCB (a-1)(b-1) CMAB= SCAB CMAB
AB glAB CME
Interacción SCAC= SCAC-SCA-SCC (a-1)(c-1) CMAC= SCAC CMAC
AC glAC CME
Interacción SCBC= SCBC-SCB-SCC (b-1)(c-1) CMBC= SCBC CMBC
BC glBC CME
Interacción SCABC (al pie de tabla) (a-1)(b-1) CMABC= SCABC CMABC
ABC (c-1) glABC CME
Error SCE= por sustracción abc(n-1) CME= SCE
glE
Total SCT= ™™™\ðLM - yij² abcn - 1
abcn
a= número de tratamientos A
b= número de tratamientos B
n= sujetos por tratamiento
SCAB= ™™\LM² - yij² – SCA – SCB
cn abcn

SCAC= ™™\LM² - yij² – SCA – SCC


bn abcn

SCBC= ™™\LM² - yij² – SCB – SCC


an abcn

SCABC= ™™™\LM² - yij² – SCA – SCB – SCC – SCAB – SCAC – SCBC


n abcn

129


FERNANDO MAUREIRA CID

ƒ Ejemplo 1
Un investigador busca conocer los efectos de un programa de
actividad física (2 y 3 veces por semana), de las horas de sueño
(7-8 horas; 9-10 horas) y de la ansiedad (poco ansioso y muy
ansioso) sobre el rendimiento en una prueba de motricidad. Para
ello se intervinieron a 12 estudiantes de primer año medio de un
colegio de Santiago de Chile. Los resultados tras la intervención
se muestran en la tabla siguiente:

 Sueño  
7-8 horas 9-10 horas
Act. física -ansiedad +ansiedad -ansiedad +ansiedad
2 veces x 8 3 9 6
semana 6 ™ 4 ™ 8 ™ 6 ™
3 veces x 7 5 8 5
semana 7 ™ 3 ™ 8 ™ 6 ™

Este diseño corresponde a un DCA de factores fijos,


balanceado, factorial 23, con pre y post-prueba.

¾ Paso 1
Construir una tabla sumando los renglones (yi) y elevarlos al
cuadrado (yi2). Sumar las columnas yj (™). Sumar los valores
yj de sueño en 7-8 horas con ambos grupos de ansiedad (=43) y
elevarlo al cuadrado. Hacer los mismo con los valores yj de
sueño en 9-10 horas con ambos grupos de ansiedad (=56).
Luego sumar los valores yj de menos ansiedad de ambos
grupos de sueño (=61) y elevarlo al cuadrado. Hacer lo mismo
con los valores yj con más ansiedad en ambos grupos de sueño
(=38). Sumar los valores al cuadrado de cada sujeto de cada
bloque (™\2j ).

130


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Sueño
7-8 horas 9-10 horas
Menos Más Menos Más
2
Act. física ansiedad ansiedad ansiedad ansiedad yi yi
2 veces semana 14 7 17 12 50 2500
3 veces semana 14 8 16 11 49 2401
yj 28 15 33 23 ™ ™
yjsueño 28+15 = 43 33+23 = 56
yj2sueño 1849 3136 ™
yjansiedad 28+33 = 61 15+23 = 38
2
yjansiedad 3721 1444 ™
2
™\ j 198 59 273 133 ™

¾ Paso 2
Construir una tabla AxB sumando los valores de la variable B
(sueño) y elevarlas al cuadrado. Luego sumar los resultados
(™ 
Construir una tabla AxC sumando los valores de la variable C
(ansiedad) y elevarlas al cuadrado. Luego sumar los resultados
(™ 
Construir una tabla BxC sumando los valores por columnas y
elevarlas al cuadrado. Luego sumar los resultados (™ 

AxB - + - +
2 veces semana 14 7 17 12
3 veces semana 14 8 16 11
14+7 =21 17+12 =29
14+8 =22 16+11 =27
441 841 ™1282
484 729 ™1213
™2495

131


FERNANDO MAUREIRA CID

AxC - + - +
2 veces semana 14 7 17 12
3 veces semana 14 8 16 11
14+17 =31 7+12 =19
14+16 =30 8+11 =19
961 361 ™
900 361 ™
™

BxC - + - +
2 veces semana 14 7 17 12
3 veces semana 14 8 16 11
28 15 33 23
784 225 1089 529 ™

¾ Paso 3
Calcular las sumas de cuadrados:

2
SCT= ™™™y j - yij² = 663 - (99)² = 50,438
abcn 16

SCA= ™\ij² - yij² = 4901 - (99)² = 0,062


bcn abcn 8 16

SCB= ™\ij² - yij² = 4985 - (99)² = 10,56


acn abcn 8 16

SCC= ™\ij² - yij² = 5165 - (99)² = 33,06


abn abcn 8 16

SCAB= ™\ij² - yij² -SC A - SC B


cn abcn

= 2495 - (99)² = 11,19 – 0,062 – 10,56 = 0,57


4 16
132


ESTADISTICA AVANZADA PARA EDUCACION FISICA

SCAC= ™\ij² - yij² -SC A – SCC


bn abcn

= 2583 - (99)² = 33,19 – 0,062 – 33,06 = 0,07


4 16

SCBC= ™\ij² - yij² -SCB – SCC


an abcn

= 2627 - (99)² = 44,19 – 10,56 – 33,06 = 0,57


4 16

SCE= SCT – SCA – SCB – SCC – SC AB – SCAC – SCBC


= 50,438 – 0,062 – 10,56 – 33,06 – 0,57 – 0,07 – 0,57 = 5,546

¾ Paso 4
Calcular los grados de libertad:

glA = a – 1 = 2 – 1 = 1
glB = b – 1 = 2 – 1 = 1
glc = c – 1 = 2 – 1 = 1
glAB = (a – 1)(b – 1) = 1 * 1 = 1
glAC = (a – 1)(c – 1) = 1 * 1 = 1
glBC = (b – 1)(c – 1) = 1 * 1 = 1
glAB = (a – 1)(b – 1)(c – 1) = 1 * 1 * 1 = 1
glE = abc(n – 1) = 2*2*2(2 – 1) = 8*1 = 8
glT = abcn – 1 = 16 – 1 = 15

¾ Paso 5
Calcular los cuadrados medios:

CMA= SCA = 0,062 = 0,062


glA 1

CMB= SCB = 10,56 = 10,56


glB 1
133


FERNANDO MAUREIRA CID

CMC= SCC = 33,06 = 33,06


glC 1

CMAB= SCAB = 0,57 = 0,57


glAB 1

CMAC= SC AC = 0,07 = 0,07


glAC 1

CMBC= SCBC = 0,57 = 0,57


glBC 1

CME= SCE = 5,546 = 0,693


glE 8

¾ Paso 6
Calcular los valores F del ANOVA:

FA= CMA = 0,062 = 0,089


CME 0,693

FB= CMB = 10,56 = 15,24


CME 0,693

FC= CMC = 33,06 = 47,71


CME 0,693

FAB= CMAB = 0,56 = 0,808


CME 0,693

FAC= CMAC = 0,06 = 0,087


CME 0,693

FBC= CMBC = 0,56 = 0,808


CME 0,693

Los resultados se organizan en una tabla como la siguiente:

134


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Tratamiento A 0,062 1 0,062 0,089
Tratamiento B 10,65 1 10.56 15,24
Tratamiento C 33,06 1 33,06 47,71
Interacción AB 0,57 1 0,57 0,808
Interacción AC 0,07 1 0,07 0,087
Interacción BC 0,57 1 0,57 0,808
Error 5,546 8 0,693
Total 50,438 15

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento A, B, C y el
error experimental, además de los gl de las interacciones AB, AC,
BC y el error experimental, buscando los gl menor entre ellos en la
primera fila (horizontal) y los gl mayores en la primera columna
(vertical).

La intersección del valor F fue 5,32. A continuación se sigue la


regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.

135


FERNANDO MAUREIRA CID

x Si el valor F calculado es igual o mayor al valor F de la tabla


se debe rechazar la H0.

0,089<5,32 por lo tanto, se debe aceptar la H01 y podemos


concluir que no existen diferencias entre los tratamientos A
aplicados (días de actividad física).
15,24>5,32 por lo tanto, se debe rechazar la H02 y podemos
concluir que existen diferencias entre los tratamientos B aplicados
(horas de sueño).
47,71>5,32 por lo tanto, se debe rechazar la H03 y podemos
concluir que existen diferencias entre los tratamiento C aplicados
(ansiedad).
0,808<5,32 por lo tanto, se debe aceptar la H04 y podemos
concluir que no existe interacción entre el tratamiento A y B.
0,087<5,32 por lo tanto, se debe aceptar la H05 y podemos
concluir que no existe interacción entre el tratamiento A y C.
0,808<5,32 por lo tanto, se debe aceptar la H06 y podemos
concluir que no existe interacción entre el tratamiento B y C.

136


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
BLOQUES Y DISEÑOS FACTORIALES 2k

En la sección I y II de este capítulo se revisaron los diseños


factoriales 2k para DCA, pero en ocasiones es preciso realizar
bloques en un experimento de esta naturaleza. Los conceptos
básicos de la formación de bloques se estudiaron en el capítulo 2,
ahora se analizará como bloquizar en diseños factoriales 22.
Para establecer la naturaleza de los efectos y las restricciones
de un DBCA de factores fijos, balanceado con un diseño factorial 22
utilizamos el siguiente aditivo lineal que resume el experimento:

yij = NJ + Ti ȕj  7ȕ ij įk +eij (fórmula 35)

yij = variable que se estudia


NJ= media global
Ti = efecto del tratamiento A de los renglones
ȕj = efecto del tratamiento B de las columnas
7ǂij = efecto de la interacción de AB
įk = efecto del bloque
eij = error experimental

1. DISEÑO FACTORIAL 22 CON BLOQUE & ANOVA



El ANOVA en un diseño factorial con bloque permite
contrastar la igualdad de medias dadas por las siguientes hipótesis:

137


FERNANDO MAUREIRA CID

H01 = 71 72   H02 ȕ1 ȕ2


H1 = 71 72   H2 ȕ1 ȕ2

H03 7ȕij = 0 H04 į1 į2 «įk


H3 7ȕij  H4 įi įj

Es decir, contrastamos la H 01 que plantea que no hay


diferencia entre las medias del tratamiento A frente a la alternativa
que si hay diferencia entre ellas. Contrastamos la H02 que plantea
que no hay diferencia entre las medias del tratamiento B frente a la
alternativa que si hay diferencia entre ellas. Luego contrastamos la
H03 que plantea que no hay interacción entre el tratamiento A y B
frente a la alternativa que si existe interacción. Finalmente,
contrastamos la H04 que plantea que no hay diferencia entre las
medias de los bloques frente a la alternativa si hay diferencia al
menos en un par de ellas.
Toda la información necesaria para realizar este contraste de
hipótesis se describe en la tabla de ANOVA del diseño factorial.


Tabla 9. ANOVA para el DBCA con factores fijos, balanceado, de
diseño factorial 22.

Fuente de Suma de Cuadrados


variación cuadrados gl medios F
Bloques SCȕ= ™\ij² - yij² n-1 CMȕ= SCɴ CMɴ
ab abn glɴ CME
Tratamiento SCA= ™\ij² - yij² a-1 CMA= SCA CMA
A bn abn glA CME
Tratamiento SCB= ™\ij² - yij² b-1 CMB= SCB CMB
B an abn glB CME
Interacción SCAB= SCAB-SCA-SCB (a-1)(b-1) CMAB= SCAB CMAB
glAB CME
Error SCE= por sustracción (ab-1)(n-1) CME= SCE
glE
Total SCT= ™™™\ðLM - yij² abn - 1
abn

138


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ƒ Ejemplo 1
Un investigador busca conocer los efectos de una intervención
de 3 charlas sobre los beneficios de asistir a un gimnasio
(charlas sobre beneficios a la salud y charlas sobre beneficios
estéticos de la actividad física) y de una clase en un gimnasio
(asistencia y no asistencia) sobre la concurrencia a un gimnasio
durante el mes posterior a la intervención (12 sesiones), pero
controlando el factor sexo de la muestra. Para ello se
intervinieron a 12 personas sedentarias (6 varones y 6 damas)
con edades entre 20 y 25 años de Santiago de Chile. Los
resultados tras la intervención se muestran en la tabla siguiente.
(Este diseño corresponde a un DBCA de factores fijos,
balanceado, factorial 22, con pre y post-prueba)

Damas Varones
Charlas Clase Si Clase No Clase Si Clase No
Beneficios   10 8
salud   6 8
™ ™ ™16 ™6
Beneficios   10 10
estéticos   10 8
™ ™ ™20 ™18

¾ Paso 1
Sumar los renglones (yi) y columnas (yj). Luego elevar ambos
valores al cuadrado (yi2; yj2). Sumar las columnas yj (™ 
Sumar los valores yj de clase si de damas y varones (=52) y
elevarlo al cuadrado. Hacer los mismo con los valores yj de
clase no de damas y varones (=46). Luego sumar los valores yj
de damas con y sin la clase (=28) y elevarlo al cuadrado. Hacer
lo mismo con los valores yj de varones con y sin la clase (=70).
Sumar los valores de beneficios salud clase si damas y varones
(=20). Hacer los mismo con beneficios salud clase no damas y
139


FERNANDO MAUREIRA CID

varones (=18), beneficios estéticos clase si damas y varones


(=32) y beneficios estéticos clase no damas y varones (=28).
Sumar los valores al cuadrado de cada sujeto de cada bloque
(™\2j).

Damas Varones
Charlas Clase Clase Clase Clase yi yi2
Si No Si No
Beneficios 4 2 16 16 38 1444
salud
Beneficios 12 10 20 18 60 3600
estéticos
yj 16 12 36 34 ™ ™
yj2 256 144 1296 1156 ™
16+36 =52 12+34 =46
Tratamiento B 2704 2116 ™
16+12 =28 36+34 =70
Bloques 784 4900 ™
AxB 4+16 12+20 2+16 10+18
=20 =32 =18 =28
400 1024 324 784 ™
™\2j 88 56 336 292 ™

¾ Paso 2
Calcular las sumas de cuadrados:

2
SCT= ™™™y j - yij² = 772 - (98)² = 171,75
abn 16

SCA= ™\ij² - yij² = 5044 - (98)² = 30,25


bn abn 8 16

SCB= ™\ij² - yij² = 4820 - (98)² = 2,25


an abn 8 16

140


ESTADISTICA AVANZADA PARA EDUCACION FISICA

SCȕ= ™\ij² - yij² = 5684 - (98)² = 110,25


ab abn 8 16

SCAB= ™\ij² - yij² -SCA - SCB


n abn

= 2532 - (98)² = 32,75 – 30,25 – 2,25 = 0,25


4 16

SCE= SCT – SCA – SCB – SCȕ – SC AB


= 171,75 – 30,25 – 2,25 – 110,25 – 0,25= 28,75

¾ Paso 3
Calcular los grados de libertad:

glA = a – 1 = 2 – 1 = 1
glB = b – 1 = 2 – 1 = 1
glȕ = n – 1 = 2 – 1 = 1
glAB = (a – 1)(b – 1) = 1 * 1 = 1
glE = (ab – 1)(n – 1) = 3*3 = 9
glT = abn – 1 = 16 – 1 = 15

¾ Paso 4
Calcular los cuadrados medios:

CMA= SCA = 30,25 = 30,25


glA 1

CMB= SCB = 2,25 = 2,25


glB 1

CMC= SCC = 110,25 = 110,25


glC 1

CMAB= SCAB = 0,25 = 0,25


glAB 1
141


FERNANDO MAUREIRA CID

CME= SCE = 28,75 = 3,19


glE 9

¾ Paso 5
Calcular los valores F del ANOVA:

FA= CMA = 30,25 = 9,48


CME 3,19

FB= CMB = 2,25 = 0,705


CME 3,19

FC= CMC = 110,25 = 34,56


CME 3,19

FAB= CMAB = 0,25 = 0,078


CME 3,19

Los resultados se organizan en una tabla como la siguiente:

Fuente de Suma de gl Cuadrados F


Variación Cuadrados Medios
Bloques 110,25 1 110,25 34,56
Tratamiento A 30,25 1 30,25 9,48
Tratamiento B 2,25 1 2,25 0,705
Intersección 0,25 1 0,25 0,078
Error 28,75 9 3,19
Total 171,75 15

Ahora el investigador debe contrastar los valores F obtenido


con los valores críticos de F según el nivel de confianza escogido
utilizando los gl de los cuadrados medios de tratamiento A, B,
bloques y el error experimental, buscando los gl menor entre ellos
en la primera fila (horizontal) y los gl mayores en la primera columna
(vertical).
142


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La intersección del valor F fue 5,12. A continuación se sigue la


regla de decisión:

x Si el valor F calculado es menor al valor F de la tabla se


debe aceptar la H0.
x Si el valor F calculado es igual o mayor al valor F de la tabla
se debe rechazar la H0.

9,48>5,12 por lo tanto, se debe rechazar la H01 y podemos


concluir que existen diferencias entre los tratamientos A aplicados
(charlas).
0,705<5,12 por lo tanto, se debe aceptar la H02 y podemos
concluir que no existen diferencias entre los tratamientos B
aplicados (asistencia a un clase).
0,078<5,12 por lo tanto, se debe aceptar la H03 y podemos
concluir que no existen interacción entre los tratamiento A y el B.
34,56>5,12 por lo tanto, se debe rechazar la H04 y podemos
concluir que existen diferencias entre los bloques aplicados (sexo).

143


FERNANDO MAUREIRA CID

144


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPÍTULO 4

ANALISIS ESTADISTICOS DE LOS


DISEÑOS DE EXPERIMENTOS CON SPSS

I. Análisis para Diseño Completamente


Aleatorizado

II. Análisis para DBCA, DBIA, DCL y DCGL

III. Análisis para diseños factoriales

145


FERNANDO MAUREIRA CID

146


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
ANALISIS PARA DISEÑO
COMPLETAMENTE ALEATORIZADO

 En la actualidad existen muchos programas estadísticos que


pueden ayudarnos a realizar los cálculos necesarios para nuestras
investigaciones. A continuación se utilizará el programa SPSS
(Statistical Package for the Social Sciences) para trabajar los
análisis de nuestros experimentos.

1. ANOVA PARA UN DCA

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA8:

a) Distribución normal de la variable dependiente (con la prueba


KS)
b) Naturaleza numérica de la variable dependiente.
c) Homocedasticidad (que se puede seleccionar dentro de la
misma prueba ANOVA)
d) Independencia de las variables

En el paquete estadístico SPSS vamos en el menú a:

 
8
 Para realizar los análisis de los supuestos del ANOVA en SPSS leer
Maureira, F. (2015) Estadística básica para educación física. Madrid:
Editorial Académica Española. Pág.: 273.

147


FERNANDO MAUREIRA CID

>Analizar >Comparar medias >ANOVA de un factor

En la pantalla de la figura 11 llevamos la variable dependiente


al cuadro superior derecho y los tratamientos al cuadro Factor.

Figura 11. Pantalla de ANOVA de un factor en un DCA.

Luego presionamos opciones y marcamos estadísticos


descriptivos, test de homogeneidad de varianza, Brown-
Forsythe y Welch. Hecho esto presionamos continuar para volver a
la pantalla de ANOVA y presionamos OK.

Figura 12. Pantalla de opciones del ANOVA en un DCA.

148


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La hoja de cálculos del programa nos entrega las tres tablas


siguientes:

En la primera tabla se observa la media de cada grupo, la


desviación estándar, el error estándar, el intervalo de confianza de
la media, los valores mínimo y máximo.

En la segunda tabla se observa el estadístico de Levene para


igualdad de varianza, los grados de libertad 1 (número de grupos
menos 1, por lo tanto, 4 – 1 = 3), los grados de libertad 2 (número
total de observaciones menos el número de grupos, por lo tanto, 20
– 4 = 16) y la Sig. o valor p
El investigador debe contrastar el valor F calculado con el
valor crítico de F obteniendo: 0,101<3,24 por lo tanto se acepta la
H0 que plantea que las varianzas de los grupos son iguales.
También se puede contrastar el valor p calculado (p=0,958) siendo
p>0,05 se debe aceptar la hipótesis nula.
149


FERNANDO MAUREIRA CID

En la tabla de ANOVA se observa la suma de cuadrados inter-


grupos, la suma de cuadrados intra-grupos, la suma de cuadrados
totales, los grados de libertad inter-grupos, los grados de libertad
intra-grupos, los grados de libertad totales, los cuadrados medios
inter-grupos, los cuadrados medios intra-grupos, el valor F y la Sig.
bilateral o valor p.
Ahora el investigador debe contrastar el valor F calculado con
el valor crítico de F obteniendo: 6,222>3,24 por lo tanto se debe
rechazar la H 0 que plantea que las medias de los grupos son
iguales. También se puede contrastar el valor p calculado (p=0,005)
siendo p<0,05 se debe rechazar la hipótesis nula.

NOTA

Las pruebas de Welch y Brown-Forsythe son buenas


alternativas al estadístico F cuando no se pueden asumir varianzas
iguales de los grupos (valor F<0,05 en la prueba de Levene).

150


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1.1 Pruebas Post-Hoc

Si la prueba de ANOVA indica que existen diferencias entre


los grupos, resulta necesario conocer entre cuales grupos se dan
esas diferencias. En el paquete estadístico SPSS cuando estamos
en la pantalla ANOVA de un factor (Fig. 11) marcamos Post-Hoc y
aparece una pantalla como la figura 13, donde marcamos Tukey si
asumimos varianzas iguales o Games-Howell si no asumimos
varianzas iguales. Hecho esto presionamos continuar para volver a
la pantalla de ANOVA y presionamos OK.

Figura 13. Pantalla de Post-Hoc del ANOVA.

La hoja de cálculos del programa nos entrega las dos tablas


siguientes. En la primera de ellas se puede observar la diferencia de
medias entre cada par de grupos evaluados, el error estándar de
diferencia de medias de muestras independientes, la Sig. o valor p y
los intervalos de confianza de diferencia de medias independientes.
Los valores iguales o menores de 0,05 indican que se debe
rechazar la H 0. Por su parte, la diferencia de medias nos permite
conocer cuál de los dos grupos comparados posee una puntuación
mayor. Si el valor es positivo el primer grupo posee un puntaje
mayor, por el contrario, si el valor es negativo el primer grupo posee
una puntación menor que el segundo grupo.

151


FERNANDO MAUREIRA CID

En la segunda tabla se observa los cuatro grupos y el número


de sujetos de cada grupo y subconjuntos donde se agrupan los

152


ESTADISTICA AVANZADA PARA EDUCACION FISICA

cursos. En este caso hay dos subconjuntos, por lo tanto, existe


igualdad entre los grupos del mismo sub-conjunto: 1) control y
anaeróbico y mixto; 2) mixto y aeróbico. Es posible observar que
existen diferencias significativas entre el entrenamiento aeróbico y
el anaeróbico-control.

La hoja de cálculos del programa nos entrega la tabla


siguiente si marcamos Games-Howell, la que se interpreta igual que
la prueba de Tukey:

2. NORMALIDAD DE LOS RESIDUOS

En el paquete estadístico SPSS vamos en el menú a:

153


FERNANDO MAUREIRA CID

>Analizar >Modelo lineal general >Univariante

En la pantalla de la figura 14 llevamos la variable dependiente


al cuadro superior derecho variable dependiente y los tratamientos
al cuadro Factor fijo.

Figura 14. Pantalla de modelo lineal general univariante.

Presionamos guardar y aparece una pantalla como la figura


siguiente, donde presionamos residuos no tipificados:

Figura 15. Pantalla guardar univariante.


154


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Luego presionamos continuar y volvemos a la pantalla de


Univariante donde presionamos OK. Con esto en la pantalla de
datos del SPSS se ha creado una nueva variable (RES_1) que
corresponde a los residuos de la variable dependiente.

Figura 16. Variable de residuos en el ANOVA de un factor.

Ahora es posible usar la prueba KS para determinar la


normalidad de los residuos. En el paquete estadístico SPSS vamos
en el menú a:

>Analizar >Pruebas no paramétricas >Prueba KS de una


muestra

En la pantalla de la figura 17 aparece en el cuadro de la


izquierda la lista de nuestras variables. Tomamos la variable
residuos y la llevamos al cuadro derecho (lista prueba de variables).
Por defecto aparece marcada la opción normal en el cuadro prueba
de distribución. Luego presionamos OK.

155


FERNANDO MAUREIRA CID

Figura 17. Pantalla de prueba KS.

La hoja de resultados entrega una tabla como la siguiente:




En la tabla se observa el número de sujetos, la media y


desviación estándar de los datos, las diferencias más extremas al
comparar las frecuencias teóricas y las frecuencias observadas, el
valor Z de la prueba KS y la Sig. ó valor p de la prueba.
Ahora el investigador debe contrastar el valor Z calculado con
el valor crítico de Z obteniendo: 0,541<1,96 por lo tanto de debe
aceptar la H 0 que plantea que la distribución de datos es normal.
También se puede contrastar el valor p calculado (p=0,932) siendo
p>0,05 se debe aceptar la hipótesis nula.
156


ESTADISTICA AVANZADA PARA EDUCACION FISICA

3. INDEPENDENCIA DE LOS RESIDUOS

En el paquete estadístico SPSS vamos en el menú a:

>Analizar >Pruebas no paramétricas >Rachas

Llevamos la variable residuos al cuadro derecho. Por defecto


aparece marcada la opción mediana. Luego presionamos OK.

Figura 18. Pantalla prueba de Rachas.

La hoja de respuestas nos entrega una tabla como la


siguiente:

157


FERNANDO MAUREIRA CID

La tabla muestra el valor de la prueba de rachas, la cantidad


de casos bajo y sobre el valor de la prueba, en n° total de casos, el
n° de rachas, el valor Z y la Sig. ó valor p.
El valor Z de la tabla es menor al valor Z para sig. 0,05
(0,689<1,96) por lo tanto, es necesario aceptar la H0 que plantea la
independencia de los residuos. También se puede contrastar el
valor Sig. ó p= 0,491>0,05 por lo cual se acepta la hipótesis nula.

4. HOMOCEDASTICIDAD DE LOS RESIDUOS

Cuando estamos en la pantalla de ANOVA de un factor (Fig.


11), colocamos la variable residuos en la ventana de variable
dependiente y la variable de agrupación en Factor. Luego
presionamos opciones (Fig. 12) y marcamos test de
homogenidad de varianza. Presionamos continuar y OK. Así la
hoja de respuesta entrega una tabla de prueba de Levene como la
siguiente:

158


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
ANALISIS PARA DBCA, DBIA, DCL Y
DCGL

1. ANOVA PARA UN DBCA

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 19. Pantalla ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


los tratamientos y bloques al cuadro Factor fijo (si ambos son
factores fijos) o al cuadro aleatorio (si ambos factores son al azar).
159


FERNANDO MAUREIRA CID

Luego presionamos Modelo con lo que aparece una pantalla como


la siguiente:

Figura 20. Pantalla Modelo en ANOVA Univariante.

En la sección superior especificar modelo marcamos


Personalizar, luego en construir términos marcamos efectos
principales y pasamos la variable independiente y la variable
bloques al cuadro derecho. Por defecto aparece marcado la opción
Suma de cuadrados tipo III y la opción incluir intersección en el
modelo. Presionamos continuar para volver a la pantalla
Univariante y presionamos OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación. En ella se muestran la suma de cuadrados
de los tratamientos ajustados, bloques ajustados y error
experimental. Los cuadrados medios de los tratamientos ajustados,
bloques ajustados y error experimental. Los valores F de los
tratamientos ajustado y bloques ajustados. Finalmente la Sig.
bilateral o valor p de los tratamientos ajustados y bloques ajustados.

160


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Ahora el investigador debe contrastar el valor F de los


tratamientos ajustados calculado con el valor crítico de F
obteniendo: 17,447>3,32 por lo tanto se debe rechazar la H0 que
plantea que las medias de los tratamientos son iguales. También se
puede contrastar el valor p calculado (p=0,000) siendo p<0,05 se
debe rechazar la hipótesis nula.
También se debe contrastar el valor F de los bloques
ajustados calculado con el valor crítico de F obteniendo:
20,033>2,92 por lo tanto se debe rechazar la H0 que plantea que las
medias de los bloques son iguales. También se puede contrastar el
valor p calculado (p=0,000) siendo p<0,05 se debe rechazar la
hipótesis nula.
El R2 muestra que el diseño explica el 72% de la variación de
los datos.

161


FERNANDO MAUREIRA CID

2. ANOVA PARA UN DBIA

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 21. Pantalla ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


los bloques y posteriormente los tratamientos al cuadro Factor fijo
(si ambos son factores fijos) o al cuadro aleatorio (si ambos
factores son al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 22. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos la variable bloque y posteriormente
la variable independiente al cuadro derecho. Por defecto aparece
marcado la opción Suma de cuadrados tipo III y la opción incluir
intersección en el modelo.
162


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 22. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación:

163


FERNANDO MAUREIRA CID

En ella se muestran la suma de cuadrados de los tratamientos


ajustados, bloques ajustados y error experimental. Los cuadrados
medios de los tratamientos ajustados, bloques ajustados y error
experimental. Los valores F de los tratamientos ajustado y bloques
ajustados. Finalmente la Sig. bilateral o valor p de los tratamientos
ajustados y bloques ajustados.

Ahora el investigador debe contrastar el valor F de los


tratamientos ajustados calculado con el valor crítico de F
obteniendo: 49,00<199,50 por lo tanto se debe aceptar la H0 que
plantea que las medias de los tratamientos son iguales. También se
puede contrastar el valor p calculado (p=0,101) siendo p>0,05 se
debe aceptar la hipótesis nula.
También se debe contrastar el valor F de los bloques
ajustados calculado con el valor crítico de F obteniendo:
13,720<199,50 por lo tanto se debe aceptar la H 0 que plantea que
las medias de los bloques son iguales. También se puede
contrastar el valor p calculado (p=0,188) siendo p>0,05 se debe
aceptar la hipótesis nula.
El R2 muestra que el diseño explica el 95,1% de la variación
de los datos.

164


ESTADISTICA AVANZADA PARA EDUCACION FISICA

3. ANOVA PARA UN DCL

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 23. Pantalla ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


luego los tratamientos y posteriormente los bloques al cuadro
Factor fijo (si los tres son factores fijos) o al cuadro aleatorio (si
los tres son factores al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 24. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos la variable independiente y
posteriormente las dos variables bloques al cuadro derecho. Por
defecto aparece marcado la opción Suma de cuadrados tipo III y
la opción incluir intersección en el modelo.
165


FERNANDO MAUREIRA CID

Figura 24. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación.

166


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En ella se muestran la suma de cuadrados de los tratamientos


(técnicas de estudio), de ambos bloques (hábitos de estudio y
motivación) y del error experimental. Los cuadrados medios de los
tratamientos, de ambos bloques y del error experimental. Los
valores F de los tratamientos, del bloque 1 y bloque 2. Finalmente la
Sig. bilateral o valor p de los tratamientos y ambos bloques.

Ahora el investigador debe contrastar el valor F de los


tratamientos calculado con el valor crítico de F obteniendo:
10,507>4,76 por lo tanto se debe rechazar la H0 que plantea que las
medias de los tratamientos son iguales. También se puede
contrastar el valor p calculado (p=0,008) siendo p<0,05 se debe
rechazar la hipótesis nula.
También se debe contrastar el valor F del bloque 1 (hábitos de
estudio) calculado con el valor crítico de F obteniendo: 3,485<4,76
por lo tanto se debe aceptar la H 0 que plantea que las medias de los
bloques son iguales. También se puede contrastar el valor p
calculado (p=0,090) siendo p>0,05 se debe aceptar la hipótesis
nula.
También se debe contrastar el valor F del bloque 2
(motivación) calculado con el valor crítico de F obteniendo:
1,233<4,76 por lo tanto se debe aceptar la H 0 que plantea que las
medias de los bloques son iguales. También se puede contrastar el
valor p calculado (p=0,377) siendo p>0,05 se debe aceptar la
hipótesis nula.
El R2 muestra que el diseño explica el 71% de la variación de
los datos.

167


FERNANDO MAUREIRA CID

4. ANOVA PARA UN DCGL

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 25. Pantalla ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


luego los tratamientos y posteriormente los bloques al cuadro
Factor fijo (si los cuatro son factores fijos) o al cuadro aleatorio (si
los cuatro son factores al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 26. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos la variable independiente y
posteriormente la tres variables bloques al cuadro derecho. Por
defecto aparece marcado la opción Suma de cuadrados tipo III y
la opción incluir intersección en el modelo.
168


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 26. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación.

169


FERNANDO MAUREIRA CID

En ella se muestran la suma de cuadrados de los tratamientos


(flexibilidad), de los tres bloques (resistencia, fuerza y velocidad) y
del error experimental. Los cuadrados medios de los tratamientos,
de los tres bloques y del error experimental. Los valores F de los
tratamientos, del bloque 1, del bloque 2 y del bloque 3. Finalmente
la Sig. bilateral o valor p de los tratamientos y los tres bloques.

Ahora el investigador debe contrastar el valor F de los


tratamientos calculado con el valor crítico de F obteniendo:
0,827<3,84 por lo tanto se debe aceptar la H 0 que plantea que las
medias de los tratamientos son iguales. También se puede
contrastar el valor p calculado (p=0,544) siendo p>0,05 se debe
aceptar la hipótesis nula.
También se debe contrastar el valor F del bloque 1
(resistencia) calculado con el valor crítico de F obteniendo:
0,687<3,84 por lo tanto se debe aceptar la H0 que plantea que las
medias de los bloques son iguales. También se puede contrastar el
valor p calculado (p=0,621) siendo p>0,05 se debe aceptar la
hipótesis nula.
También se debe contrastar el valor F del bloque 2 (fuerza)
calculado con el valor crítico de F obteniendo: 0,164<3,84 por lo
tanto se debe aceptar la H 0 que plantea que las medias de los
bloques son iguales. También se puede contrastar el valor p
calculado (p=0,951) siendo p>0,05 se debe aceptar la hipótesis
nula.
Finalmente se debe contrastar el valor F del bloque 3
(velocidad) calculado con el valor crítico de F obteniendo:
0,568<3,84 por lo tanto se debe aceptar la H 0 que plantea que las
medias de los bloques son iguales. También se puede contrastar el
valor p calculado (p=0,693) siendo p>0,05 se debe aceptar la
hipótesis nula.
El R2 muestra que el diseño explica el 47,1% de la variación
de los datos.

170


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
ANALISIS PARA DISEÑOS FACTORIALES

1. ANOVA PARA UN DISEÑO FACTORIAL 22 CON


REPLICAS

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 27. ANOVA Univariante.

171


FERNANDO MAUREIRA CID

Llevamos la variable dependiente al cuadro superior derecho,


luego los 2 tratamientos al cuadro Factor fijo (si los dos son
factores fijos) o al cuadro aleatorio (si los dos son factores al azar).
Como este es un modelo de dos factores y se quiere estudiar
la posible interacción entre ellos, se utiliza el modelo completo, así
que no es necesario marcar nada en la opción Modelo.
Presionamos directamente OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación.

En ella se muestran la suma de cuadrados de los tratamientos


(entrenamiento de la fuerza y proteínas), de la interacción de ambos
y del error experimental. Los cuadrados medios de los tratamientos,
de la interacción y del error experimental. Los valores F de los
tratamientos y de la interacción. Finalmente la Sig. bilateral o valor p
de los tratamientos y la interacción.

172


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Ahora el investigador debe contrastar el valor F del


tratamiento A calculado con el valor crítico de F obteniendo:
8,704>5,32 por lo tanto se debe rechazar la H01 que plantea que las
medias del tratamiento A son iguales. También se puede contrastar
el valor p calculado (p=0,018) siendo p<0,05 se debe rechazar la
hipótesis nula.
También se debe contrastar el valor F del tratamiento B
calculado con el valor crítico de F obteniendo: 12,721>5,32 por lo
tanto se debe rechazar la H 02 que plantea que las medias del
tratamiento B son iguales. También se puede contrastar el valor p
calculado (p=0,007) siendo p<0,05 se debe rechazar la hipótesis
nula.
Finalmente, se debe contrastar el valor F de la interacción AB
calculado con el valor crítico de F obteniendo: 0,124<5,32 por lo
tanto se debe aceptar la H03 que plantea que no hay interacción
entre los tratamientos A y B. También se puede contrastar el valor p
calculado (p=0,734) siendo p>0,05 se debe aceptar la hipótesis
nula.
El R2 muestra que el diseño explica el 63% de la variación de
los datos.

173


FERNANDO MAUREIRA CID

2. ANOVA PARA UN DISEÑO FACTORIAL 22 SIN


REPLICAS

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 28. ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


luego los 2 tratamientos al cuadro Factor fijo (si los dos son
factores fijos) o al cuadro aleatorio (si los dos son factores al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 29. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos las dos variable independiente al
cuadro derecho. Por defecto aparece marcado la opción Suma de
cuadrados tipo III y la opción incluir intersección en el modelo.

174


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 29. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK.
La hoja de resultados nos entrega una tabla como la que se
presenta a continuación.

175


FERNANDO MAUREIRA CID

En ella se muestran la suma de cuadrados de los tratamientos


(taller y entrenamiento perceptivo) y del error experimental. Los
cuadrados medios de los tratamientos y del error experimental. Los
valores F de los tratamientos. Finalmente la Sig. bilateral o valor p
de los tratamientos.

Ahora el investigador debe contrastar el valor F del


tratamiento A calculado con el valor crítico de F obteniendo:
14,974<161,45 por lo tanto se debe aceptar la H01 que plantea que
las medias del tratamiento A son iguales. También se puede
contrastar el valor p calculado (p=0,161) siendo p>0,05 se debe
aceptar la hipótesis nula.
También se debe contrastar el valor F del tratamiento B
calculado con el valor crítico de F obteniendo: 41,406>161,45 por lo
tanto se debe aceptar la H 02 que plantea que las medias del
tratamiento B son iguales. También se puede contrastar el valor p
calculado (p=0,098) siendo p>0,05 se debe aceptar la hipótesis
nula.
El R2 muestra que el diseño explica el 95% de la variación de
los datos.

176


ESTADISTICA AVANZADA PARA EDUCACION FISICA

3. ANOVA PARA UN DISEÑO FACTORIAL 23 CON


REPLICAS

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 30. ANOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


luego los 3 tratamientos al cuadro Factor fijo (si los tres son
factores fijos) o al cuadro aleatorio (si los tres son factores al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 31. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos las tres variables independiente al
cuadro derecho. Posterior a esto, en construir términos marcamos
Todas de 2 y seleccionamos los tres factores y los pasamos al
cuadro derecho (el sistema los agrupará en pares). Por defecto
aparece marcado la opción Suma de cuadrados tipo III y la opción
incluir intersección en el modelo.
177


FERNANDO MAUREIRA CID

Figura 31. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK. La hoja de resultados nos entrega una tabla como
la que se presenta a continuación.

178


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En ella se muestran la suma de cuadrados de los tratamientos


(Actividad física, sueño y ansiedad), de la interacción de los
tratamientos (AB, AC y BC) y del error experimental. Los cuadrados
medios de los tratamientos, de las interacciones y del error
experimental. Los valores F de los tratamientos e interacciones.
Finalmente la Sig. bilateral o valor p de los tratamientos e
interacciones.

Ahora el investigador debe contrastar el valor F del


tratamiento A calculado con el valor crítico de F obteniendo:
0,101<5,12 por lo tanto se debe aceptar la H 01 que plantea que las
medias del tratamiento A son iguales. También se puede contrastar
el valor p calculado (p=0,758) siendo p>0,05 se debe aceptar la
hipótesis nula.
Se debe contrastar el valor F del tratamiento B calculado con
el valor crítico de F obteniendo: 17,090>5,12 por lo tanto se debe
rechazar la H02 que plantea que las medias del tratamiento B son
iguales. También se puede contrastar el valor p calculado (p=0,003)
siendo p<0,05 se debe rechazar la hipótesis nula.
Se debe contrastar el valor F del tratamiento C calculado con
el valor crítico de F obteniendo: 53,494>5,12 por lo tanto se debe
rechazar la H03 que plantea que las medias del tratamiento C son
iguales. También se puede contrastar el valor p calculado (p=0,000)
siendo p<0,05 se debe rechazar la hipótesis nula.
Se debe contrastar el valor F de la interacción AB calculado
con el valor crítico de F obteniendo: 0,101<5,12 por lo tanto se debe
aceptar la H04 que plantea que no hay interacción de los
tratamientos A y B. También se puede contrastar el valor p
calculado (p=0,758) siendo p>0,05 se debe aceptar la hipótesis
nula.
Se debe contrastar el valor F de la interacción AC calculado
con el valor crítico de F obteniendo: 0,910<5,12 por lo tanto se debe
aceptar la H05 que plantea que no hay interacción de los
tratamientos A y B. También se puede contrastar el valor p
calculado (p=0,365) siendo p>0,05 se debe aceptar la hipótesis
nula.
179


FERNANDO MAUREIRA CID

Se debe contrastar el valor F de la interacción BC calculado


con el valor crítico de F obteniendo: 0,910<5,12 por lo tanto se debe
aceptar la H06 que plantea que no hay interacción de los
tratamientos A y B. También se puede contrastar el valor p
calculado (p=0,365) siendo p>0,05 se debe aceptar la hipótesis
nula.
El R2 muestra que el diseño explica el 82% de la variación de
los datos.

4. ANOVA PARA UN DISEÑO FACTORIAL 23 CON


BLOQUES

En primer lugar debemos constatar que se cumplen los


supuestos para la aplicación de una prueba ANOVA.
Posteriormente en el paquete estadístico SPSS vamos en el menú
a:

>Analizar >Modelo lineal general >Univariante

Figura 32. ANOVA Univariante.

180


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Llevamos la variable dependiente al cuadro superior derecho,


luego el bloque y posteriormente los 2 tratamientos al cuadro
Factor fijo (si los tres son factores fijos) o al cuadro aleatorio (si
los tres son factores al azar).
Luego presionamos Modelo con lo que aparece una pantalla
como la figura 33. En la sección superior especificar modelo
marcamos Personalizar, luego en construir términos marcamos
efectos principales y pasamos el bloque y posteriormente los dos
tratamientos al cuadro derecho. Luego de esto, en construir
términos marcamos Todas de 2 y seleccionamos los dos
tratamientos y los pasamos al cuadro derecho (para analizar su
interacción). Por defecto aparece marcado la opción Suma de
cuadrados tipo III y la opción incluir intersección en el modelo.

Figura 33. Pantalla Modelo en ANOVA Univariante.

Presionamos continuar para volver a la pantalla Univariante y


presionamos OK. La hoja de resultados nos entrega una tabla como
la que se presenta a continuación.

181


FERNANDO MAUREIRA CID

En ella se muestran la suma de cuadrados del bloque (sexo),


los tratamientos (charlas y clase en gimnasio), de la interacción de
los tratamientos AB y del error experimental. Los cuadrados medios
del bloque, de los tratamientos, de las interacciones y del error
experimental. Los valores F del bloque, de los tratamientos e
interacciones. Finalmente la Sig. bilateral o valor p del bloque, de
los tratamientos e interacciones.

Ahora el investigador debe contrastar el valor F del Bloque


calculado con el valor crítico de F obteniendo: 42,183<4,84 por lo
tanto se debe aceptar la H01 que plantea que las medias de los
bloques son iguales. También se puede contrastar el valor p
calculado (p=0,000) siendo p>0,05 se debe aceptar la hipótesis
nula.
Se debe contrastar el valor F del tratamiento A calculado con
el valor crítico de F obteniendo: 30,250>4,84 por lo tanto se debe
rechazar la H02 que plantea que las medias del tratamiento A son

182


ESTADISTICA AVANZADA PARA EDUCACION FISICA

iguales. También se puede contrastar el valor p calculado (p=0,006)


siendo p<0,05 se debe rechazar la hipótesis nula.
Se debe contrastar el valor F del tratamiento B calculado con
el valor crítico de F obteniendo: 2,250<4,84 por lo tanto se debe
aceptar la H 03 que plantea que las medias del tratamiento B son
iguales. También se puede contrastar el valor p calculado (p=0,373)
siendo p>0,05 se debe aceptar la hipótesis nula.
Se debe contrastar el valor F de la interacción AB calculado
con el valor crítico de F obteniendo: 0,096<4,84 por lo tanto se debe
aceptar la H04 que plantea que no hay interacción de los
tratamientos A y B. También se puede contrastar el valor p
calculado (p=0,763) siendo p>0,05 se debe aceptar la hipótesis
nula.

El R2 muestra que el diseño explica el 77% de la variación de


los datos.

5. ANÁLISIS DE COVARIANZA (ANCOVA)

El ANCOVA es un análisis que utiliza la regresión lineal y el


análisis de varianza para estimar mejor el efecto de la variable
independiente (tratamientos) sobre la dependiente. Esta técnica se
emplea cuando existen variables extrañas que pudiendo medirse no
pueden controlarse y es posible que afecten los resultados en la
variable dependiente. Este análisis corrige los efectos de las
variables extrañas (covariables) sobre la respuesta.
El ANCOVA puede controlar una o varias covariables
simultáneamente, siendo importante que dichas covariables no
deben estar relacionadas con los tratamientos, pero si deben
relacionarse con la variable dependiente.
La existencia de covariables puede darse en el cualquiera de
los diseños estudiados en este libro.

En el paquete estadístico SPSS vamos en el menú a:


183


FERNANDO MAUREIRA CID

>Analizar >Modelo lineal general >Univariante

Figura 34. ANCOVA Univariante.

Llevamos la variable dependiente al cuadro superior derecho,


luego la variable independiente al cuadro Factor fijo (si los factores
son fijos) o al cuadro aleatorio (si los factores son al azar). La
variable que deseamos controlar para restar su efecto en la variable
dependiente la llevamos al cuadro covariable.
Presionamos OK. La hoja de resultados nos entrega una tabla
como la que se presenta a continuación. En ella se muestran la
suma de cuadrados de la variable independiente (fuerza), de la
covariable (resistencia) y del error experimental. Los cuadrados
medios de la fuerza, la resistencia y del error experimental. Los
valores F de la fuerza y resistencia. Finalmente la Sig. bilateral o
valor p de la fuerza y resistencia.
Ahora el investigador debe contrastar el valor F de la variable
independiente calculado con el valor crítico de F obteniendo:
2,462<3,02 por lo tanto se debe aceptar la H01 que plantea que la
fuerza no afecta a la agilidad controlando la resistencia de los
sujetos. También se puede contrastar el valor p calculado (p=0,088)
siendo p>0,05 se debe aceptar la hipótesis nula.

184


ESTADISTICA AVANZADA PARA EDUCACION FISICA

También se debe contrastar el valor F de la covariable con el


valor crítico de F obteniendo: 3,595<4,97 por lo tanto se debe
rechazar la H02 que plantea que la resistencia no afecta los niveles
de agilidad. También se puede contrastar el valor p calculado
(p=0,087) siendo p>0,05 se debe aceptar la hipótesis nula.
Al realizar un análisis para DCA sin controlar la resistencia, la
fuerza mostraba una influencia significativa sobre la agilidad
(F=3,255; gl1=9; gl2=11; p=0,035). Esto muestra que la fuerza no
tiene impacto sobre la agilidad cuando se toma en cuenta la
resistencia, lo que significa que es una variable fundamental para
explicar que sucede con la agilidad.

El R2 muestra que el diseño explica el 59,8% de la variación


de los datos.

185


FERNANDO MAUREIRA CID

186


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPITULO 5

ESTADISTICA MULTIVARIANTE

I. Introducción a la estadística multivariante

II. Descripción de datos multivariantes

III. Representación de datos multivariantes

187


FERNANDO MAUREIRA CID

188


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
INTRODUCCION A LA ESTADISTICA
MULTIVARIANTE

Los análisis multivariantes son un conjunto de métodos


estadísticos que describen e interpretan los datos provenientes de
muchas variables que se estudian simultáneamente. Por ejemplo,
para describir la antropometría de un conjunto de deportistas
podemos utilizar el peso, la talla, el IMC, el porcentaje de grasa, el
porcentaje de masa magra, el perímetro de cintura y cadera, el
largo de fémur, los pliegues cutáneos, etc. Es decir, utilizamos
variados elementos para describir un aspecto de la realidad.
Estos métodos estadísticos utilizan algebra lineal, matricial,
geometría línea, etc., para poder resumir en pocas variables
nuevas, la información contenida en un gran conjunto de variables
originales con una mínima perdida de información, también sirven
para encontrar grupos en los datos, clasificar las observaciones en
grupo definidos, relacionar conjuntos de variables, etc. (Peña,
2002). Estos métodos son muy utilizados en biología, economía,
ingeniería, psicología, sociología, etc.
Las técnicas de análisis multivariante se dividen tres grandes
grupos:

a) Métodos de dependencia: buscan explicar si las variables


independientes afectan a las dependientes y de qué forma. En
este ámbito se encuentran los análisis de regresiones lineales,
regresiones logísticas, análisis discriminantes, modelos
loglineales, análisis de segmentación, MANOVA, etc.
189


FERNANDO MAUREIRA CID

b) Métodos de interdependencia: no utilizan variables


dependientes e independientes, ya que buscan identificar
variables que están relacionadas y por qué. En este ámbito se
encuentran los análisis de componentes principales, análisis
factoriales, análisis de correspondencia, escalamiento
multidimensional, análisis clusters, etc.

c) Métodos estructurales: buscan explicar no solo si las variables


independientes afectan a las dependientes, sino también como
están relacionadas las variables. En este ámbito se encuentran
las ecuaciones estructurales.

Comparación: MANOVA
y MANCOVA

Dependencia Asociación: regresión


múltiple, regresión
logística, correlación
canónica y análisis
discriminante
Análisis
multivariados
Reducción de datos:
componentes principales,
análisis factoriales, de
Interdependencia correspondencia y esca-
lamiento multidimensional

Clasificación: análisis
clusters

Estructurales Ecuaciones
estructurales

Figura 35. División de la estadística multivariante.


190


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1. VECTORES

Un conjunto de datos puede representarse geométricamente


como un vector en el espacio n dimensional. Un vector es una
magnitud física que posee un módulo (magnitud) y dirección. Por
ejemplo, cuando estamos realizando una RM en press banco
aplicamos una fuerza que posee magnitud (peso levantado) y
además una dirección (desplazamiento de la barra) por lo tanto,
decimos que la fuerza es un vector. Por otra parte, un escalar es un
número que posee magnitud pero no dirección, por ejemplo la
temperatura.
Si medimos la fuerza (kilos) en press banco de 3 personas,
esta muestra se puede representar por el vector:

X= 55,0
42,5
65,5

Un vector posee dirección, por lo tanto no es lo mismo el


vector n y el –n lo cual afecta las operaciones matemáticas que
podemos llevar a cabo. La suma o resta de dos vectores se define
como un nuevo vector resultado de la suma o resta de los
anteriores. Por ejemplo:

X+Y= 55,0 36,5 91,5


42,5 + 20,0 = 62,5
65,5 40,5 106

X-Y= 55,0 36,5 18,5


42,5 - 20,0 = 22,5
65,5 40,5 25

El producto de un vector por un escalar k es un nuevo vector


resultado de la multiplicación del vector anterior y el escalar. Por
ejemplo:
191


FERNANDO MAUREIRA CID

X*k= 5 30
2 * 6 = 12
4 24

El producto de dos vectores puede ser:

x Un número escalar resultado de la multiplicación del 1° valor de


X por el 1° valor de Y más la multiplicación del 2° valor de X por
el 2° valor de Y, etc.

X*Y= 5 3
2 * 6 = (5*3)+(2*6)+(4*2) = 15+12+8 = 35
4 2

x Un vector resultado de la multiplicación y resta de valores


cruzados del vector X y el vector Y (b1c2-b2c1, c1a2-c2a1, a1b2-
a2b1). Por ejemplo:

X*Y= 5 3 a1 a2 (2*2)-(6*4) -20


2 * 6 = b1 * b2 = (4*3)-(2*5) = 2
4 2 c1 c2 (5*6)-(3*2) 24

Dos vectores son ortogonales o perpendiculares si su


producto escalar es cero. Cuando sucede esto los dos vectores no
poseen correlación entre sí.

2. MATRICES

Las matrices corresponden a un conjunto de p variables o


vectores dispuestos en filas y columnas, donde una matriz n x p
tiene n filas y p columnas. Por ejemplo, una matriz 2x3 tiene 2 filas y
3 columnas.
Un elemento (valor) dentro de la matriz se diferencia de otro
por su posición (fila y columna), denominándose aij (a=valor,
i=número de fila; j=número de columna).
192


ESTADISTICA AVANZADA PARA EDUCACION FISICA

A= 541
224 Matriz 3x3
413

Las matrices pueden ser de diferentes tipos:

x Matriz fila: la que posee solo una fila de valores


x Matriz columna: la que posee solo una columna de valores
x Matriz rectangular: la que posee distinto número de filas y
columnas.
x Matriz traspuesta: matriz que se obtiene cambiando
ordenadamente las filas por las columnas.
x Matriz nula: la que posee solo valores cero.
x Matriz cuadrada: la que posee el mismo número de filas y
columnas.

A B C D E

5 -2 4 3 2 -3 5 3 4 -2 1 000
6 -1 2 4 0 3 -1 5 000
-4 0 4 2 -2 5 2 2 000

F
2 -3 5 2 -1 0
A -1 2 4 ĺ$t -3 2 4
0 4 2 5 4 2

Tipos de matrices. A=matriz fila; B=matriz columna; C=matriz


cuadrada; D=matriz rectangular; E=matriz nula; F=matriz
traspuesta.

Las matrices cuadradas a su vez pueden ser triangulares


superiores (los elementos ubicados bajo la diagonal son ceros),
triangulares inferiores (los elementos ubicados sobre la diagonal
son ceros), diagonales (sólo los elementos de la diagonal son
193


FERNANDO MAUREIRA CID

diferentes a cero), escalares (matriz diagonal cuyos valores de la


diagonal son iguales), identidad (matriz diagonal cuyos valores de la
diagonal son unos), etc.

2.1 Operaciones con matrices

La suma o resta de dos matrices se define como una nueva


matriz resultado de la suma o resta de las anteriores. Para realizar
estas operaciones es fundamental que ambas matrices contengan
el mismo número de filas y columnas. Por ejemplo:

A+B= -2 3 2 2 1 -1 0 4 1
1 2 4 + 3 -1 0 = 4 1 4
3 -3 0 4 0 2 7 -3 2

A-B= -2 3 2 2 1 -1 0 2 1
1 2 4 - 3 -1 0 = -2 1 4
3 -3 0 4 0 2 -1 -3 -2

El producto de dos matrices puede ser:

x Una matriz resultado de la multiplicación de cada valor de la


matriz anterior por el escalar k. Por ejemplo:

A*k= 5 2 1 20 8 4
2 0 -2 *4 = 8 0 -8
-1 2 4 -4 8 16

x Una matriz resultado de la multiplicación y suma de cada


elemento de las filas de A por cada elemento de las columnas
de B. Es necesario que el número de filas de A coincida con el
número de columnas de B. Por ejemplo:

194


ESTADISTICA AVANZADA PARA EDUCACION FISICA

A*B= 2 2 1 3 1 2
2 0 -2 * 1 1 -1
-1 2 4 2 0 -2

= (2*3)+(2*1)+(1*2) (2*1)+(2*1)+(1*0) (2*2)+(2*-1)+(1*-2)


(2*3)+(0*1)+(-2*2) (2*1)+(0*1)+(-2*0) (2*2)+(0*-1)+(-2*-2)
(-1*3)+(2*1)+(4*2) (-1*1)+(2*1)+(4*0) (-1*2)+(2*-1)+(4*-2)

= 10 4 0
2 2 8
7 1 -12

195


FERNANDO MAUREIRA CID

196


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
DESCRIPCIÓN DE DATOS
MULTIVARIANTES

Una matriz n x p posee n sujetos y p variables.

ƒ Ejemplo 1
Un investigador mide los niveles de fuerza, velocidad,
resistencia, flexibilidad y agilidad a un conjunto de 16
estudiantes varones de sexto básico de un colegio de Santiago.
La matriz de datos sería la siguiente:

Sujeto Fuerza Velocidad Resistencia Flexibilidad Agilidad


1 45 7,5 5 15,5 5
2 32 6,2 6 13 6
3 58 8,5 8 14,5 8
4 26 7,6 7 14 6
5 36 9,4 4 15 6
6 35 9,1 6 16,5 8
7 30 7,4 6 17 5
8 42 11,0 7 12,0 6
9 40 7,2 5 14,5 7
10 35 8,9 8 16 5
11 38 9,2 6 13,5 6
12 28 9,0 5 18 8
13 30 10,0 7 13 7
14 34 9,2 6 15 9
15 31 8,1 8 14,5 5
16 46 10,2 7 18,5 5
197


FERNANDO MAUREIRA CID

Cada una de las variables (p) corresponde a una variable


escalar o univariante, en tanto, el conjunto de variables p
corresponde a una variable vectorial o multivariante.
Recordemos que los datos de una variable pueden ser de tipo
categóricos o continuos. A su vez los primero pueden ser nominales
(categorías sin orden jerárquico, por ejemplo, sexo, estado civil,
religión, nacionalidad, etc.) u ordinales (categorías con orden
jerárquico, por ejemplo, cargo en una empresa, niveles de IMC,
nivel de estudios, etc.). En tanto los datos continuos pueden ser
intervalares (corresponden a valores continuos dentro de una
escala con distancias equivalentes entre cada valor, por ejemplo,
fecha, temperatura, puntaje de un escala, etc.) o de razón
(corresponden a valores continuos dentro de una escala pero donde
el cero no es arbitrario, ya que muestra la ausencia de la variable
medida, por ejemplo, velocidad, número de hijos, edad, ingreso,
etc.).

1. MEDIDAS DE TENDENCIA CENTRAL Y


VARIABILIDAD MULTIVARIANTE

Cuando describimos datos multivariantes debemos estudiar


cada variable aisladamente y además las relaciones entre ellas. En
el caso de datos univariantes si las variables son categóricas los
análisis con gráficos de barra/ torta y tablas de frecuencia son las
más utilizados. Para variables continuas los análisis de medida de
tendencia central (media, mediana y moda), de dispersión (rango,
varianza y desviación estándar) y de forma (asimetría y curtosis)
son las más utilizados9.
También se suele utilizar los gráficos de caja y bigotes para
detectar datos outliers o atípicos, los cuales deben ser eliminados
ya que afectan los resultados de nuestra investigación.
 
9
 Para ver la descripción detallada de estos análisis consultar Maureira, F.
(2015). Estadística básica para educación física. Madrid: Editorial Académica
Española, pág.: 37.

198


ESTADISTICA AVANZADA PARA EDUCACION FISICA

a) Vector de medias

En el caso de datos multivariantes la medida de tendencia


central más utilizada es el vector de medias que posee las medias
de cada una de las k variables. Se calcula con la fórmula siguiente:

Ш1
Ш= 1 x’ 1 = Ш2 (fórmula 36)
n .
.
Шp

Con los datos del ejemplo 1 tenemos:

ШIXHU]D 36,6
Ш= ШYHORFLGDG = 8,7
ШUHVLVWHQFLD 6,3
ШIOH[LELOLGDG 15,0
ШDJLOLGDG 6,4

b) Matriz de varianzas y covarianzas

La variabilidad de los datos multivariantes y su relación lineal


se resumen en la matriz de varianzas y covarianzas (S), que
corresponde a una matriz cuadrada simétrica de orden p, donde los
elementos de la diagonal muestra las varianzas y elementos de las
no-diagonales las covarianzas entre las variables.

S21 S12 S13 …S1p


6= S21 S22 S23 …S2p
S31 S32 S23 …S3p
.
Sp1 Sp2 Sp3 …S2p

Recordemos que la varianza es la media del cuadrado de las


desviaciones respecto a la media de los datos y la covarianza es
199


FERNANDO MAUREIRA CID

una medida de fuerza de la relación lineal entre dos variables.


La fórmula para calcular la varianza es la siguiente:

S= ™ [ i - Ш)2 (fórmula 37)


n–1

xi = valor de cada sujeto en la variable x.


Ш = media de la variable x
n= número total de sujetos de la muestra

Con los datos del ejemplo 1 tenemos:

66,5
1,58
S= 1,43
3,32
1,72

La fórmula para calcular la covarianza es la siguiente:

Sxy= ™ [ i - Ш)(yi - y) (fórmula 38)


n–1

Con los datos del ejemplo 1 tenemos:

66,5 1,936 1,592 -0,054 0,483


1,936 1,58 0,268 0,051 0,264
S= 1,592 0,268 1,43 -0,377 -0,258
-0,054 -0,051 -0,377 3,32 -0,079
0,483 0,264 -0,258 -0,079 1,72

Cuando los valores de la covarianza son mayores a cero la


fuerza de la relación lineal de las variables es positiva, cuando son
menores a cero la fuerza de la relación lineal es negativa y valores
200


ESTADISTICA AVANZADA PARA EDUCACION FISICA

cercanos a cero indican que no existe relación lineal entre las


variables.

c) Matriz de correlación

Esta matriz es cuadrada positiva y simétrica que tiene unos en


su diagonal y los valores de correlación fuera de ella.

1 r12 r13 …r1p


5= r21 1 r23 …r2p
r31 r32 1 …r3p
.
rp1 rp2 rp3 …1

La fórmula para calcular la correlación de Pearson es la


siguiente:
R= S xy (fórmula 39)
S x Sy

Sxy= covarianza XY
Sx= desviación estándar X
Sy= desviación estándar Y

Con los datos del ejemplo 1 tenemos:

1 0,189 0,163 -0,004 0,045


0,189 1 0,178 0,022 0,160
S= 0,163 0,178 1 -0,173 -0,165
-0,004 0,022 -0,173 1 -0,033
0,045 0,160 -0,165 -0,033 1

d) Matriz de correlaciones parciales

Se define como la matriz que mide las relaciones de dos


variables eliminando el efecto de las otras variables. Por ejemplo, si

201


FERNANDO MAUREIRA CID

relacionamos la variable 1 y 2 se elimina el efecto de las variables,


3, 4, 5, etc.

1 r12,34…p r13,24…p …r1k,np


5= r21,34…p 1 r23,14…p …r2k,np
r31,24…p r32,14…p 1 …r3k,np
.
rpk,np rpk,np rpk,np3 … 1

La fórmula para calcular la correlación parcial es la siguiente:

RAB,C= rAB – rAC rBC (fórmula 40)


¥ 1- r2AC * ¥ 1- rBC

rAB= correlación AB
rAC= correlación AC
rBC= correlación BC

Con los datos del ejemplo 1 tenemos:

1 0,152 0,141 0,020 0,045


0,152 1 0,242 0,080 0,212
R= 0,141 0,242 1 -0,222 -0,282
0,020 0,080 -0,222 1 -0,098
0,045 0,212 -0,282 -0,098 1

e) Varianza generalizada

Es una medida escalar de la variabilidad conjunta de k


variables, que es la determinante de la matriz varianza y
covarianza.
5= S2x rsx,sy
rsx,sy S2 y

202


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La determinante de una matriz corresponde a la suma del


producto de los elementos de una línea cualquiera de la matriz (fila
o columna) elegida por su correspondiente adjunto.
La determinante de la matriz anterior R se obtiene con la
formula siguiente:

VG= = S2x * S2y (1 – r2) (formula 41)

S2x = varianza x
S2y = varianza y
r2 = correlación de Pearson al cuadrado de xy

El cálculo de los determinantes de orden 2 son los más


sencillos. Por ejemplo:

5= 2,6 0,85 = 2,6*1,8 * (1 – 0,852) = 4,68 – 0,278 = 4,402


0,85 1,8

f) Desviación típica o estándar generalizada

Se obtiene a partir de la varianza generalizada con la fórmula


siguiente:
ρ6ρ1/2= Sx Sy 1 – r2 (fórmula 42)

5= 2,6 0,85 = 4,68 * 0,278 = 2,47


0,85 1,8

La desviación típica o estándar describe la dispersión de


datos de una variable, en tanto la desviación típica o estándar
generalizada describe la dispersión conjunta de datos de diversas
variables en base a la correlación entre ellas.
La fórmula 42 da cuenta de la desviación típica generalizada
para dos variables, a continuación se presenta la fórmula para este
análisis con 3 variables:
203


FERNANDO MAUREIRA CID

ρ6ρ1/2=Sx S y Sz (1+ r21,2 (r1,3 -1) + r21,3 (r1,2 -1) – r1,3 r1,2)1/2 (fórmula 43)

g) Distancia de Mahalanobis

Corresponde a una medida de distancia para determinar la


similitud entre dos variables aleatorias multidimensionales.

dm(x, y)= (x – y)T™-1(x – y) (fórmula 44)

También es frecuente referirse al valor d2 como la distancia de


Mahalanobis, el cual puede calcularse con la formula siguiente:

d2M= 1 (x1-x2)2 + (y1-y2)2 – 2r (x1-x 2)(y1-y2) (fórmula 45)


1-r2 S21 S22 S1S2

Si consideramos 3 personas del ejemplo 1 con las siguientes


mediciones:

Velocidad Resistencia
Sujeto A 7,5 5
Sujeto B 6,2 6
Sujeto C 8,5 8

La desviación estándar de la variable velocidad fue de 1,26 y


de la variable resistencia 1,20. La correlación entre ambas variables
fue 0,178.

d2M(A,B)= 1 1,32 + -12 – 2(0,178) 1,3


0,968 1,26 1,20 1,512

= 1,03* (1,34 + 0,83 – 0,356 * 0,86)


= 1,03*1,864
= 1,92

204


ESTADISTICA AVANZADA PARA EDUCACION FISICA

d2M(A,C)= 1 -12 + -32 – 2(0,178) 3


0,968 1,26 1,20 1,512

= 1,03* (0,79 + 7,5 – 0,356 * 1,98)


= 1,03*7,59
= 7,8

d2M(B,C)= 1 -2,32 + -22 – 2(0,178) 4,6


0,968 1,26 1,20 1,512

= 1,03* (4,2 + 3,33 – 0,356 * 3,04)


= 1,03*6,45
= 6,64

Es posible concluir que el sujeto A está más cerca de B (su d2


es el menor), luego B y C, finalmente A y C.

2. REPRESENTACIÓN DE DATOS MULTIVARIANTES

Otra forma de describir datos multivariantes es la


representación gráfica de los mismos. Para cada una de las
variables las formas más comunes son los histogramas y gráficos
de caja (Fig. 36). También es importante construir diagramas de
dispersión para cada par de variables estudiadas, de esta forma es
posible observar la relación de las variables y datos atípicos en la
relación bivariante (Fig 37).
Para representar mas de tres variables regularmente se
utilizan figuras como las caras de Chernoff que aprovecha la
facilidad que tenemos para identificar rostros para reconocer
patrones y determinar similaridades y diferencia entre un conjunto
de variables (Fig. 38) y figuras geométricas como el grafico de
estrellas, donde cada observación dará lugar a una figura (Fig. 39).

205


FERNANDO MAUREIRA CID

Figura 36. Histogramas con las variables del ejemplo 1.

Figura 37. Matriz de dispersión con las variables del ejemplo 1.

206


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 38. Caras de Chernoff.

  

 

Figura 39. Gráficos de estrellas.

207


FERNANDO MAUREIRA CID

208


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
SUPUESTOS DEL ANALISIS
MULTIVARIANTE

Antes de la aplicación de los diversos análisis multivariantes


es necesario comprobar que se cumplan ciertos supuestos
estadísticos que subyacen a los modelos.

1. NORMALIDAD MULTIVARIANTE

Muchos análisis estadísticos multivariantes requieren del


supuesto que las variables se distribuyen en forma normal. Una
distribución normal de datos es aquella que posee una simetría de
cero o cercana a cero y una curtosis de cero o cercana a cero,
donde la media, la mediana y la moda son idénticas. En estas
distribuciones la media es cero y la varianza 1.
En una distribución normal o de Gauss el 68,26% de los datos
cae dentro de una desviación estándar, el 95,45% dentro de dos
desviaciones estándar y el 99,73% dentro de tres desviaciones
estándar.
Todas las variables del modelo deben tener una distribución
normal, sin embargo, la normalidad univariante (de cada variable)
no asegura la normalidad multivariante, si bien la normalidad
multivariante si asegura la normalidad univariante. Debido a esto es
que resulta necesario comprobar inicialmente la normalidad de cada
variable mediante la prueba de Kolmogorov-Smirnov (KS) o la
prueba de Shapiro-Wilks.
209


FERNANDO MAUREIRA CID

Figura 40. Distribución normal univariante.

Aplicando la prueba KS a los datos del ejemplo 1 (sección


anterior) obtenemos los siguientes resultados:

Fuerza Velocidad Resistencia Flexibilidad Agilidad


Prueba 0,622 0,557 0,662 0,527 0,951
KS

Como todos los valores Z son menores a 1,96 se asume que


todas las variables poseen una distribución normal.

La distribución normal multivariante es una generalización de


la normalidad univariante y se puede calcular con la fórmula de
Mardia (1970):

K2p = [z(G1p)]2 + [z(G2p)]2 (fórmula 46)

z(G1p) = Coeficiente de asimetría dividido por el error típico de la


asimetría.
z(G2p) = Coeficiente de curtosis dividido por el error típico de la
curtosis.

210


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Con los datos del ejemplo 1 (sección anterior) tenemos:

Fuerza Velocidad Resistencia Flexibilidad Agilidad


Asimetría 1,214 -0,112 -0,160 0,378 0,616
Error 0,564 0,564 0,564 0,564 0,564
Curtosis 1,831 -0,275 -0,647 -0,370 -0,778
Error 1,091 1,091 1,091 1,091 1,091
zG1 2,152 -0,199 -0,284 0,670 1,092
zG2 1,678 -0,252 -0,593 -0,339 -0,713
k2 7,450 0,103 0,432 0,564 1,701

Calculamos los valores k2 con la suma de los puntajes zG1 y


zG2 al cuadrado. Utilizando la distribución X2 rechazamos la
hipótesis nula cuando el valor de k2 es superior a 5,99 para un nivel
de significancia de 0,05 (Levy y Varela, 2006).
Por lo tanto, es posible concluir que los valores de velocidad,
resistencia, flexibilidad y agilidad tienen una distribución normal
multivariante Sin embargo, la variable fuerza pese a tener una
distribución normal univariante, no posee una distribución normal
multivariante (k2=7,540>5,99).
Cuando sucede esto la variable problemática puede
transformase o eliminarse. Para normalizar variables se utilizan las
siguientes transformaciones:

x Para asimetría negativa se aplica la transformación y=x2


x Para asimetría positiva se aplica la transformación ¥X (menos
efecto) ó 1/x (más efecto).

Aplicando la trasformación ¥X obtenemos con la variable


Fuerza una asimetría de 0,944 y un error de 0,564. Una curtosis de
1,055 y un error de 1,091. El valor zG1 sería 1,674 y el valor zG 2
sería 0,967. Finalmente el valor k2 sería 3,737. Como el valor
k2<5,99 la trasformación de la variable fuerza permite obtener una
distribución normal de ella.

211


FERNANDO MAUREIRA CID

Figura 41. Distribución normal bivariante.

Además de la distribución normal multivariante, existen tres


distribuciones de gran importancia en estadística inferencial
multivariante: distribución de Wishart que corresponde a la
generalización de la distribución X2, la distribución de Hotelling una
generalización de la distribución t de Student y la distribución
lambda de Wilks una generalización de la distribución F de Fisher-
Snedecor.

2. HOMOCEDASTICIDAD MULTIVARIANTE

La Homocedasticidad multivariante hace referencia a la


igualdad de la matriz varianza y covarianza de las variables X e Y.
Para esto se suele utilizar el Contraste M de Box, el cual necesita
una distribución normal multivariante de las variables estudiadas y
debido a su sensibilidad como análisis, se recomienda un nivel de
significancia de 0,001. El contraste M de Box corresponde a una
generalización del test de Bartlett que contrasta la hipótesis de
homocedasticidad entre n varianzas en estadística univariante (el
contraste de Box se estudiará en el capítulo 6 sección III: Análisis
discriminante).

212


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La ausencia de homocedasticidad se da generalmente por la


no normalidad de una de las variables, lo que puede ser corregido
con la trasformación para normalización explicada anteriormente.

3. LINEALIDAD

La linealidad es un supuesto de todos los análisis


multivariante basados en correlaciones. Esto plantea que la relación
de la variable dependiente debe ser lineal con las variables
independientes, es decir, un aumento o descenso de la variables
X1, X2,…Xk producen un aumento o descenso de la variable Y.
El gráfico de matriz de dispersión nos permite evaluar si las
relaciones entre cada par de variables tiende a ser lineal, curva o no
existe relación entre ellas.
Para la regresión múltiple se utiliza el análisis de los residuos.

4. NO MULTICOLINEALIDAD

La independencia corresponde a la ausencia de relación lineal


exacta entre las variables independientes. Cuando no sucede esto
se dice que el modelo presenta multicolinealidad.
La prueba Factor de Varianza Inflada (VIF) sirve para
determinar la multicolinealidad. Esto se analizará en el capítulo 6
sección I: Regresión lineal múltiple.

5. INDEPENDENCIA DE LOS ERRORES

Hace relación a que los valores obtenidos por un sujeto son


diferentes a los obtenidos por otro sujeto, es decir, que una unidad
experimental no influye a la otra. Esto se asegura en el diseño
experimental y durante la toma de los datos.

213


FERNANDO MAUREIRA CID

214


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPÍTULO 6

METODOS DE DEPENDENCIA

I. Regresión lineal múltiple

II. Regresión logística

III. Análisis discriminante

IV. Correlación canónica

V. Análisis de varianza múltiple (MANOVA)

215


FERNANDO MAUREIRA CID

216


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
REGRESION LINEAL MULTIPLE

La regresión lineal múltiple permite predecir una variable


dependiente en base a dos o más variables independientes. A
diferencia de la regresión lineal simple que predice una variable X
en base a una variable Y, la regresión múltiple se ajusta más a la
realidad, ya que los fenómenos son pre-dichos por conjuntos de
otras variables.

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZÓN.

SUPUESTOS:

x DISTRIBUCIÓN NORMAL DE LOS RESIDUOS.

x HOMOCEDASTICIDAD DE LAS VARIANZAS DE LOS


ERRORES.

x NO AUTOCORRELACIÓN DE LOS ERRORES

x NO MULTICOLINEALIDAD DE LAS VARIABLES


INDEPENDIENTES.

x INDEPENDENCIA DE LAS OBSERVACIONES.

x LINEALIDAD DE LA VARIABLE DEPENDIENTE CON LAS


VARIABLES INDEPENDIENTES.

217


FERNANDO MAUREIRA CID

La regresión lineal múltiple es un método de dependencia, con


una relación, con una variable dependiente y con dependencia
numérica.

Figura 42. Clasificación de la regresión múltiple.

El modelo de la regresión lineal múltiple es el siguiente:

Yi=ȕ0 + ȕ1x1 + ȕ2x2 +…ȕkxk + İ (fórmula 47)

ȕ0 = ordenada de origen de la pendiente


ȕ1[ȕ2[ȕkx= variaciones que experimenta la variable dependiente
cuando X aumenta una unidad.
İ = error aleatorio

ƒ Ejemplo 1
Un investigador quiere saber si el rendimiento académico de los
estudiantes de educación física puede ser predicho por los
estilos de aprendizaje, los hábitos de estudio y la motivación por
218


ESTADISTICA AVANZADA PARA EDUCACION FISICA

el aprendizaje. Para ello se evaluó a 15 estudiantes de una


universidad de Santiago de Chile que cursaban 3° añ o de la
carrera. Del total fueron 9 hombres y 6 damas. Los resultados
fueron los siguientes:

Promedio Estilos de Hábitos de Motivación por


aprendizaje estudio aprender
1 5,5 13,0 6,0 5,0
2 5,8 14,0 6,0 5,0
3 5,0 12,0 6,0 4,0
4 5,8 17,0 7,0 5,0
5 6,2 15,0 9,0 5,0
6 5,1 13,0 6,0 3,0
7 4,7 14,0 6,0 3,0
8 6,0 17,0 7,0 4,0
9 5,7 16,0 8,0 5,0
10 5,0 15,0 4,0 4,0
11 5,3 15,0 7,0 4,0
12 6,5 18,0 9,0 5,0
13 5,6 13,0 7,0 4,0
14 6,0 15,0 8,0 5,0
15 5,3 16,0 7,0 4,0

¾ Paso 1
Elegir el método con que se analizarán las variables. En la
regresión lineal simple sólo existe una variable independiente
por lo tanto, el método utiliza un solo paso (la incorporación de
una variable), en cambio en el regresión múltiple el modelo se
construye con n variables que se van incorporando una a una
(paso a paso).

En el programa SPSS vamos a:

>Analizar >Regresión >Lineal

219


FERNANDO MAUREIRA CID

Figura 43. Pantalla regresión lineal.

En la figura 43 en el cuadro superior derecho introducimos


nuestra variable dependiente (en este caso rendimiento
académico expresado en notas), en el cuadro Independiente
introducimos las variables que queremos estudiar como
predictoras. La primera variable que se debe introducir es
aquella que posea una correlación más alta con la variable
dependiente, luego presionamos en Bloque 1 de 1 la opción
Siguiente donde introducimos la segunda variable con la
correlación parcial mayor, presionamos Siguiente para
introducir la variable 3 y así sucesivamente.

¾ Paso 2
En la pantalla regresión lineal presionamos Estadísticos y
aparece una pantalla como la figura 44.
Aquí marcamos las opciones Diagnóstico de colinealidad y en
residuos marcamos Durbin-Watson. Por defecto aparece
marcado Estimaciones y Ajuste del modelo. Presionamos
Continuar.

220


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 44. Pantalla estadísticos de la regresión lineal.

¾ Paso 3
Cuando regresamos a la pantalla de regresión lineal,
presionamos OK. La hoja de resultados nos entrega varias
tablas, pero las que nos interesan son las siguientes:

Aquí se observa el método en que fueron introducidas las


variables al modelo. En este caso fueron incorporadas una a una.

En la tabla resumen del modelo se muestran los R2 corregidos


en cada paso de la regresión múltiple, donde se observa que la
primera variable introducida en el modelo (hábitos de estudio)
explica un 57,7% de la variabilidad de las notas, al incorporar la
segunda variable (motivación) la variabilidad explicada
221


FERNANDO MAUREIRA CID

aumenta a un 75,1% y al incorporar la tercer variable (estilos de


aprendizaje) se aumenta a un 76,9%.

Además se observa la prueba de Durbin-Watson que evalúa


la independencia de los errores del modelo. Cuando el valor fluctúa
entre 1 y 3 se acepta la independencia de los errores. En este caso
el valor fue 2,827 por lo cual es posible aceptar el supuesto.

222


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La tabla del ANOVA muestra los valores F para los tres


modelos que estamos estudiando (el modelo 1 con una variable, el
modelo 2 con dos variables y el modelo 3 con 3 variables). Nosotros
nos centraremos en el modelo con las tres variables, donde el valor
F indica que el modelo de regresión múltiple propuesto predice
significativamente la variable dependiente. Esto se puede confirmar
con el valor p<0,05.

En la tabla Coeficientes se observan los coeficientes no


estandarizados beta para el modelo con las tres variables, donde la
FRQVWDQWHHVGH  \ FRUUHVSRQGH DO  SXQWRGH ȕ 0 (origen de la
pendiente de regresión). Los valores de las tres variables (hábitos
de estudio=0,172; motivación=0,316; EA=0,060) representan los
puntos de la pendiente. Por ejemplo, si tenemos una puntuación de
hábitos de estudio de 7, de motivación de 4 y de estilos de
aprendizaje de 14 ¿Cuál es el rendimiento académico (nota)
predicho?
Para eso reemplazamos en la ecuación de la regresión lineal
múltiple con los resultados que obtuvimos:

Yi=ȕ0 + ȕ1x1 + ȕ2x2 +«ȕkxk + İ

223


FERNANDO MAUREIRA CID

Nota= 2,118 + (0,172*7) + (0,316*4) + (0,06*14) + 0,241


= 2,118 + 1,204 + 1,264 + 0,84 + 0,241
= 5,67

Entonces con los valores entregados en las tres variables un


estudiante tendría un rendimiento académico de 5,67.

Es importante tener en cuenta que un valor t y de significación


>0,05 indica que la variable no tiene relevancia significativa en la
predicción de la variable dependiente y puede ser excluida del
modelo. En nuestro ejemplo, la variable estilos de aprendizaje
presenta p=0,195 por lo cual debería ser sacada del modelo de
regresión y en este caso trabajar con sólo dos variables
independientes.

Finalmente, la tabla de coeficientes nos entrega en los


estadísticos de colinealidad un factor de varianza inflada (VIF) que
indica si existe o no independencia de las variables independientes.
Valores mayores a 10 en alguna variable indican multicolinealidad,
lo mismo que valores de 7, 8 o 9 en todas las variables. Lo ideal es
que los valores sean lo más cercano a 1.
En el ejemplo, las tres variables presentan valores entre 1,3 y
1,6 por lo tanto asumimos que no hay multicolinealidad entre ellas.

1. COMPROBACION DE LOS SUPUESTOS DEL


MODELO DE REGRESION LINEAL MULTIPLE

a) El supuesto de normalidad de los residuos puede contrastarse


calculando los residuos y aplicando una prueba KS de
normalidad, como se explicó anteriormente para el Diseño
Completamente Aleatorizado (Pág. 44).

b) El supuesto de homocedasticidad de los errores se puede


contrastar comparando con una prueba t las observaciones con

224


ESTADISTICA AVANZADA PARA EDUCACION FISICA

puntuaciones más bajas contra las observaciones con


puntuaciones más altas y así determinar si son estadísticamente
diferentes.

c) El supuesto de no autocorrelación de los errores (independencia


de los errores) se evalúa a través de la prueba de Durbin-
Watson, explicada en esta sección.

d) El supuesto de no multicolinealidad se evalúa con la prueba de


factor de varianza inflada (VIF), explicada en esta sección.

e) El supuesto de independencia depende del diseño y la toma de


datos.

f) El supuesto de linealidad se evalúa mediante análisis de


correlaciones de Pearson de las variables independientes con la
dependiente.

225


FERNANDO MAUREIRA CID

226


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
REGRESIÓN LOGÍSTICA

La regresión logística se utiliza para predecir una variable


dependiente de tipo categórica en base a dos o más variables
independientes. Es útil para estudiar la ocurrencia o no de un
evento en base a otros factores, por ejemplo, la predicción de la
asistencia a una competencia deportiva en base a la motivación,
expectativas del deportista y nivel de ansiedad. En este caso donde
la variable dependiente puede tomar valores de 0 (no asiste) y 1
(asiste) realizar un análisis de regresión lineal múltiple resultaría
inadecuado, ya que el resultado serían valores entre las dos
respuestas o valores mayores a 1, lo que en este caso no sería
posible.

NIVEL DE MEDICIÓN: NOMINAL U ORDINAL

SUPUESTOS:

x LINEALIDAD (SE CUMPLE AUTOMÁTICAMENTE EN LA


REGRESIÓN LÓGISTICA)

x NO MULTICOLINEALIDAD DE LAS VARIABLES


INDEPENDIENTES.

x NO AUTOCORRELACIÓN DE LOS ERRORES

x INDEPENDENCIA DE LAS OBSERVACIONES.


227


FERNANDO MAUREIRA CID

La regresión logística es un método de dependencia, con una


relación, con una variable dependiente y con dependencia
categórica.

Figura 45. Clasificación de la regresión logística.

El modelo de la regresión logística es el siguiente:

In(p/q)=Į0 + Į1x1 + Į2x2 +…Įkxk + İ (fórmula 48)

In= logaritmo neperiano


p/q= todos los números reales en 0 e infinito.
Į0Į1Į2Įk= coeficientes asociados a cada variable independiente
x1; x2; xk= variables independientes
İ = error aleatorio

ƒ Ejemplo 1
Un investigador quiere saber si la percepción de una clase de
educación física (buena (1) o mala (0)) por parte de estudiantes
228


ESTADISTICA AVANZADA PARA EDUCACION FISICA

de enseñanza media de un colegio de Santiago puede ser


predicha por la unidad enseñada (deportes colectivos(1),
individuales (2) o preparación física(3)) y por la intensidad de la
clase (desde 1=baja a 5=alta). Para ello se evaluaron a 15
estudiantes entregando los siguientes resultados:

Percepción Unidad Sexo Intensidad


1 1 1 1 5
2 0 3 2 3
3 0 2 1 5
4 1 1 1 5
5 1 1 2 4
6 0 3 2 3
7 0 2 2 3
8 0 2 1 2
9 1 1 1 5
10 1 2 1 3
11 0 1 2 2
12 1 1 1 4
13 1 3 2 5
14 1 1 1 3
15 0 3 1 2

¾ Paso 1
Para comprobar los supuestos del modelo de regresión logística
primero debemos realizar un análisis de regresión lineal múltiple
(pese a que este no sirve para una variable dependiente
categórica), pero aquí obtendremos los valores de la prueba de
colinealidad y de Durbin-Watson para la independencia de los
errores (para ver el detalle de cómo realizar los análisis vea la
sección anterior de regresión lineal múltiple).
La prueba VIF de colinealidad entrega valores de 1,095 para la
variable Unidad y 1,095 para Intensidad.
La prueba de Durbin-Watson entrega un valor de 1,820.
En base a los resultados anteriores podemos concluir que se
cumplen los supuestos de no multicolinealidad y de
independencia del modelo.
229


FERNANDO MAUREIRA CID

¾ Paso 2
En el programa SPSS vamos a:

>Analizar >Regresión >Logística binaria

Figura 46. Pantalla regresión logística binaria.

En el cuadro superior derecho introducimos nuestra variable


dependiente (en este caso la percepción de los estudiantes
sobre las clases de educación física) en el cuadro Independiente
introducimos las variables que queremos estudiar como
predictoras. La primera variable que se debe introducir es
aquella que posee una correlación más alta con la variable
dependiente, luego presionamos en Bloque 1 de 1 la opción
Siguiente donde introducimos la segunda variable con la
correlación parcial mayor, presionamos Siguiente para
introducir la variable 3 y así sucesivamente.

¾ Paso 3
En la pantalla regresión logística binaria presionamos
Categórica y aparece una pantalla como la figura 47, donde
llevamos al cuadro derecho todas las variables independientes
de tipo categóricas (en este caso Unidad). Presionamos
Continuar y volvemos a la pantalla de regresión logística.
230


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 47. Pantalla categórica de la regresión logística.

Cuando regresamos a la pantalla de regresión logística


presionamos opciones y aparece una pantalla como la figura
48, donde marcamos Bondad de ajuste de Hosmer-
Lemeshow. Luego presionamos Continuar.

Figura 48. Pantalla de opciones de regresión logística.

¾ Paso 4
Una vez en la pantalla de regresión logística presionamos OK.
La hoja de resultados nos entrega varias tablas, pero las que
nos interesan son las siguientes:
231


FERNANDO MAUREIRA CID

La tabla de clasificación de paso 0 muestra el modelo antes


de incorporar cualquier variable independiente. Ahí se observa que
hay 8 observaciones que valoran como buena la clase de educación
física contra 7 que la valoran mal.
El porcentaje global nos permite saber que la opción de
obtener la variable con mayor frecuencia (buena clase) es de un
53,3%.

Para el paso 1 (introducción de la primera variable


independiente al modelo) tenemos la prueba de Chi-cuadrado que
evalúa si hay una diferencia significativa al incluir la variable
independiente al modelo. Como x2= 6,256>3,841 (valor crítico de x2
para 1 gl) se rechaza la H0 que plantea que la inclusión de la
variable independiente no es significativa en el modelo. También
podemos contrastar p=0,012<0,05 y rechazar la H 0.
Por lo tanto, la variable independiente 1 sirve para explicar los
cambios en la variable dependiente.
Esta prueba de x2 recibe el nombre de prueba de eficiencia
estadística de ROA.

232


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La tabla de resumen del modelo muestra el valor -2 log de la


verosimilitud que mide cuan bien se ajusta el modelo a los datos.
Cuando menor sea el valor mejor será el ajuste.
La misma tabla muestra el R2 de Cox y Snell que corresponde
al coeficiente de determinación que muestra la varianza de la
variable dependiente explicada por la variable independiente. El R 2
de Nagelkerke corresponde al R 2 corregido.
En el ejemplo, la variable independiente intensidad de la clase
explica un 45,5% de la variabilidad de la variable dependiente
(percepción de la clase de educación física).

La prueba de Hosmer-Lemeshow es una prueba de bondad


de ajuste del modelo de regresión logística. Con x2 = 1,895<5,991
(valor crítico de x2 con 2 gl) se acepta la H0 que plantea que las
frecuencias observadas son similares a las frecuencias esperadas.
233


FERNANDO MAUREIRA CID

También se puede contrastar p= 0,338>0,05 por lo que se acepta la


H0 (esta prueba no entrega valores cuando tenemos sólo una
variable independiente).
En el ejemplo, la prueba muestra que el modelo se ajusta a
los datos.
En la tabla de contingencia para la prueba de Hosmer y
Lemeshow se muestra el detalle de los valores observados y
esperados que contrasta la prueba de Chi-cuadrado. Se puede
notar que los valores son muy similares.

La tabla de clasificación del paso 1 se interpreta igual que en


el paso 0. Nótese que el porcentaje global aumento del 53,3% al
80,0%.

La tabla de variables en la ecuación equivale a la tabla


coeficientes en la regresión múltiple. Aquí observamos información
para la ecuación de regresión. El valor Beta (B) de la constante
corresponde al valor de origen de la pendiente y el Beta de la
intensidad es la pendiente de la recta de regresión.

234


ESTADISTICA AVANZADA PARA EDUCACION FISICA

El valor de la prueba de Wald con su Sig. corresponden al


valor t de la regresión múltiple y nos entregan información sobre el
aporte significativo de la variable al modelo. En este caso
p=0,043<0,05 por lo tanto, la variable Intensidad entrega
información significativa al modelo. Por su parte, la constante
p=0,051>0,05 por lo que el número de casos con percepción
positiva y negativa de la clase de educación física no entrega
información significativa para predecir el comportamiento de la
variable dependiente (ya que el resultado de cada elección fue
cercana al 50%).
El valor Exp (B) es el resultado que obtendríamos de la
ecuación de regresión en función de la probabilidad de acierto, si el
valor Exp(B) de la variable independiente:

x Es 1 la variable dependiente tomara el valor 0.


x Es menor que 1 el aumento del valor de la variable
independiente produce una disminución del valor de la
dependiente.
x Es mayor que 1 el aumento de la variable independiente
produce un aumento de la dependiente.

Para el ejemplo, Exp(B) =4,016>1 , por lo tanto mientras más


alta es la intensidad de la clase de educación física existe una
mayor percepción positiva de la misma.

¾ Paso 5
Para el paso 2 (introducción de la segunda variable
independiente al modelo) el programa entrega las mismas
tablas. El valor x2 del modelo es 10,389>5,991 (valor crítico para
x2 con 2 gl) por lo tanto se rechaza la H0 que planeta que la
introducción de la variable independiente no es significativa para
el modelo. También podemos contrastar p=0,016<0,05
aceptando la H0. El resto de las tablas se interpretan igual que
como se explicó anteriormente.

235


FERNANDO MAUREIRA CID

236


ESTADISTICA AVANZADA PARA EDUCACION FISICA

1. COMPROBACION DE LOS SUPUESTOS DEL


MODELO DE REGRESION LOGISTICA

a) El supuesto de linealidad se cumple automáticamente en la


regresión logística.

b) El supuesto de no multicolinealidad se evalúa con la prueba de


factor de varianza inflada (VIF), explicada en esta sección.

c) El supuesto de no autocorrelación de los errores (independencia


de los errores) se evalúa a través de la prueba de Durbin-
Watson, explicada en esta sección.

d) El supuesto de independencia de las observaciones depende


del diseño y la toma de datos.

237


FERNANDO MAUREIRA CID

238


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
ANÁLISIS DISCRIMINANTE

El análisis discriminante es un método multivariado que


permite asignar nuevas unidades experimentales a grupos
previamente definidos. Por ejemplo, un investigador evalúa a un
grupo de personas midiendo IMC, motricidad, cualidades físicas,
etc. y las divide en diversos grupos según sus niveles de condición
física. Luego llega un nuevo sujeto al cual le son medidas las
mismas variables, sus valores permitan asignarlo a uno de los
grupos con la mayor probabilidad.
El análisis discriminante explica la pertenencia a un grupo de
las unidades experimentales en función de los sus datos en la
diversas variables evaluadas y el peso de cada una de ellas en la
discriminación. El análisis también pretende predecir a que grupo
más probablemente puede pertenecer un nuevo individuo.

NIVEL DE MEDICIÓN: NOMINAL Y ORDINAL

SUPUESTOS:

x HOMOCEDASTICIDAD DE LA MATRIZ DE COVARIANZA DE


TODOS LOS GRUPOS

x NORMALIDAD MULTIVARIANTE

x LINEALIDAD DE LAS VARIABLES

239


FERNANDO MAUREIRA CID

x NO COLINEALIDAD ENTRE VARIABLES INDEPENDIENTES

x MEDIAS POBLACIONES DE LOS DOS GRUPOS


DIFERENTES

El análisis discriminante es un método de dependencia, con


una relación, con una variable dependiente y con dependencia
categórica.

Figura 49. Clasificación del análisis discriminante.

El modelo de función discriminante es el siguiente:

D =u1x1 + u2x2 +…ukxk (fórmula 49)

u = medias de los grupos


x= variables independientes

240


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ƒ Ejemplo 1
Un entrenador mide la fuerza, velocidad y resistencia a un grupo
de jóvenes cadetes de fútbol y en base a los resultados los
separa en dos grupos: a) con condición física media; b) con
condición física alta. Para ello se evaluaron a 20 futbolistas con
edades entre 15 y 17 años, todos varones. Los resultados de las
mediciones fueron los siguientes:

F V R G F V R G
1 70 7 9 2 11 60 6 7 1
2 55 6 7 1 12 63 8 10 2
3 68 7 8 1 13 51 7 8 1
4 72 6 11 2 14 76 9 9 2
5 55 9 10 2 15 73 11 7 2
6 68 10 9 2 16 68 9 8 2
7 75 8 9 2 17 72 7 7 2
8 80 7 12 2 18 70 8 10 2
9 50 9 7 1 19 64 7 7 1
10 58 7 9 1 20 71 9 7 1
F=fuerza(kg); V=velocidad(seg); R=resistencia(min); G=grupo;
G1=grupo condición física media; G2=condición física alta

¾ Paso 1
En el programa SPSS vamos a:

>Analizar >Clasificar >Discriminante

En el cuadro superior derecho colocamos la variable


dependiente (grupos de clasificación) y en el cuadro
Independientes las otras variables evaluadas. Presionamos
Definir rangos y aparece una pantalla como la figura 51, donde
definimos el rango menor y el mayor de la variable dependiente.
Luego presionamos Continuar.
En la pantalla Análisis discriminante marcamos la opción Usar
método paso a paso (stepwise), así el programa introducirá las
variables una a una.
241


FERNANDO MAUREIRA CID

Figura 50. Análisis discriminante.

Figura 51. Cuadro definir rangos.

¾ Paso 2
En la pantalla Análisis discriminante presionamos Estadísticos
apareciendo la pantalla 52, donde marcamos en descriptivos las
opciones Medias, ANOVA univariante y M de Box. En
coeficientes de la función marcamos Fisher. Luego marcamos
Continuar.

Figura 52. Estadísticos de análisis discriminante.


242


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 3
En la pantalla Análisis discriminante presionamos Clasificación
apareciendo la pantalla 53, donde marcamos en probabilidades
previas la opción calcular según tamaño de grupos. En
visualización marcamos Tabla de resumen. Luego marcamos
Continuar.

Figura 53. Clasificación en análisis discriminante.

¾ Paso 4
En la pantalla Análisis discriminante presionamos OK. La hoja
de resultados nos entrega varias tablas, pero las que nos
interesan son las siguientes:

243


FERNANDO MAUREIRA CID

En la tabla de estadísticos de grupo se muestran las medias y


desviaciones estándar de cada variable en ambos grupos y en el
total de la muestra.

La tabla de prueba de igualdad de medias muestra los


ANOVA univariantes que contrasta la igualdad de medias de las
variables independientes entre los grupos especificados en la
variable dependiente.
En el ejemplo 1, la fuerza presenta un valor F=11,042>4,41
(valor crítico de F con 1 y 18 gl) y la resistencia presenta un valor
F=9,366>4,41por lo que en ambos casos se rechaza la H0 que
plantea la igualdad de medias de la fuerza y la resistencia entre el
grupo de condición física media y el grupo de condición física alta.
También se puede contrastar el valor p=0,004<0,05 y p=0,007<0,05
respectivamente, por lo que se rechaza la H0.
La velocidad presenta un valor F=2,721<4,41 por lo que se
acepta la H 03 que plantea la igualdad de medias de la velocidad
entre el grupo de condición física media y el grupo de condición
física alta. También se puede contrastar el valor p=0,116>0,05 por
lo que se acepta la H03. Es importante recordar que una variable no
significativa a nivel univariante puede aportar información
importante a nivel multivariante.

244


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La prueba M de Box presenta un valor F=0,585<5,99 (valor


crítico de F con, 1,49 y 6 gl) por lo cual aceptamos la H0 que plantea
la igualdad de las matrices varianzas y covarianzas de los dos
grupos. También podemos contrastar p=0,742>0,05 por lo que
aceptamos la H0.

245


FERNANDO MAUREIRA CID

La tabla de variables introducidas/eliminadas muestra una


lista de las variables más significativas para la discriminación,
eliminando aquellas que no producen una diferencia entre los
grupos. En el ejemplo, las tres variables son consideradas
importantes para la discriminación (p<0,05), siendo la variable
fuerza la más importante (Ȝ   VHJXLGD GH OD UHVLVWHQFLD
Ȝ  \ODYHORFLGDG Ȝ  



La tabla Lambda de Wilks muestra si existen diferencias


significativas entre los grupos al ir agregando paso a paso cada
variable. En el ejemplo, la incorporación de cada variable mantiene
la diferencia entre los grupos (p<0,05), de no ser así no se puede
continuar con el análisis discriminante.

La tabla anterior nos entrega el autovalor de una función que


corresponde a la variabilidad de los datos proyectada sobre el
conjunto de funciones atribuibles a la función (De la Fuente, 2011).
Valores altos indican una función discriminante alta.
También se observa la correlación canónica que oscila entre 0
y 1, mientras mayor es el valor más discrimina la función.

246


ESTADISTICA AVANZADA PARA EDUCACION FISICA

El estadístico de contraste Lambda de Wilks presenta un


x2=17,317>7,815 (valor crítico de x2 con 3 gl) lo que lleva a rechazar
la H 0 que plantea que la extracción de la función discriminante no es
significativa. También se puede contrastar p=0,001<0,05
rechazando la H0, concluyendo que la función discriminante es
significativa.

Los coeficientes estandarizados de las funciones


discriminantes canónicas indican la importancia que tiene cada
variable en el cálculo de la función discriminante. En el ejemplo la
variable resistencia tiene una influencia un poco mayor que las
variables velocidad y fuerza.
La tabla matriz de estructura son correlaciones entre las
variables y la función discriminante. Ella entrega que variable tiene
el mayor poder discriminante para clasificar un individuo en uno de
los grupos (se toman en cuenta los valores netos, sin signo positivo

247


FERNANDO MAUREIRA CID

o negativo). En el ejemplo, la variable fuerza es quien tiene mayor


poder discriminante, similar a la variable resistencia. La variable
velocidad es la menos discriminante de las tres.

La funciones en los centroides de los grupos entrega el punto


de corte discriminante para ambos grupos, que corresponde al
punto medio de las funciones -1,583 y 1,055 = -0,528.

En la tabla de probabilidad previa se muestra que las


posibilidades de que un sujetos sea clasificado en uno de los
grupos antes de realizar los análisis. En el ejemplo, un joven
futbolista tiene un 60% de probabilidades de ser clasificado en el
grupo de condición física alta.

248


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La tabla de coeficientes de la función de clasificación sirve


para clasificar a los nuevos sujetos dentro de uno de los grupos.
Aparece un valor constante y los valores de las tres variables
utilizadas para cada grupo (media y alta). Por ejemplo, si un nuevo
futbolista joven presenta valores de 57 kg. en fuerza, 8 seg. en
velocidad y 9 minutos en resistencia ¿a cuál de los dos grupos
pertenece?.
Para ello utilizamos la ecuación de predicción con los valores
de la tabla de coeficientes de la función de clasificación:

Para el grupo de condición física media


Z= (1,327*57) + (8,143*8) + (8,454*9) – 103,049
= 75,639 + 65,144 + 70,086 – 103,049
= 107,82

Para el grupo de condición física alta


Z= (1,614*57) + (9,519*8) + (10,190*9) – 143,529
= 91,998 + 76,152 + 91,71 – 143,529
= 116,331

La función discriminante que tenga el puntaje mayor será el


grupo al cual pertenece la nueva unidad experimental. En el
ejemplo el nuevo futbolista pertenece al grupo de condición física
alta (Z=116,331>107,82).
249


FERNANDO MAUREIRA CID

La tabla de resultados de la clasificación muestra el grado de


confianza de las predicciones del modelo. En el ejemplo, de las 8
personas que pertenecían al grupo de condición física media el
modelo predijo correctamente 7 (87,5%) y para las 12 personas del
grupo de condición física alta el modelo predijo correctamente 11
(91,75%). Por lo tanto el modelo es preciso en un 90%.

1. COMPROBACIÓN DE LOS SUPUESTOS DEL


MODELO DE ANÁLISIS DISCRIMINANTE

a) El supuesto de homocedasticidad de la matriz de covarianza de


todos los grupos se evalúa con el contraste M de Box (Pág.
245).

b) El supuesto de normalidad multivariante se evalúa con pruebas


KS para cada variable y con las pruebas de Mardia de asimetría
y curtosis para el conjunto de variables.

c) El supuesto de linealidad de las variables se evalúan con


pruebas de correlación.

e) El supuesto de no multicolinealidad se evalúa con la prueba de


factor de varianza inflada (VIF) (Pág. 223).
250


ESTADISTICA AVANZADA PARA EDUCACION FISICA

f) El supuesto de medias poblaciones de los dos grupos diferentes


se evalúa con el ANOVA univariante del análisis discriminante
(Pág. 244).

251


FERNANDO MAUREIRA CID

252


ESTADISTICA AVANZADA PARA EDUCACION FISICA

IV
CORRELACION CANONICA

La correlación canónica es un método multivariado


desarrollado por Hotelling que establece las relaciones entre dos
grupos de variables, prediciendo múltiples variables dependientes a
partir de múltiples variables independientes. Por ejemplo, un
investigador quiere determinar si el estrés y los niveles de IMC
tienen efecto en la tendencia a practicar actividad física y en la
autopercepción de la condición física de un grupo de varones de 14-
15 años de Santiago de Chile.
La prueba de correlación canónica utiliza la distribución
Lambda de Wilks para su interpretación, la cual varía entre 0 y 1.

NIVEL DE MEDICIÓN: NOMINAL U ORDINAL

SUPUESTOS:

x LINEALIDAD DE LAS VARIBLES

x NORMALIDAD MULTIVARIANTE

x MULTICOLINEALIDAD

La correlación canónica es un método de dependencia, con


una relación, con más de una variable dependiente y con
dependencia categórica.
253


FERNANDO MAUREIRA CID

Figura 54. Clasificación de la correlación canónica.

El modelo de correlación canónica es el siguiente:

W 1=a11x1 + a12x2 +…a1kxk (fórmula 50)


V1=b11x1 + b12x2 +…b1kxk
Tal que C1 es máximo.

W1; V1 = variables canónicas


C1= correlación canónica

ƒ Ejemplo 1
Un investigador quiere conocer si el IMC (1=bajo peso;
2=normal; 3=sobrepeso; 4=obesidad) y los niveles de porcentaje
de grasa (1=bajo; 2=normal; 3=alto; 4=muy alto) influyen en la
percepción de la calidad de vida (de 1=muy baja, hasta 10=muy
alta) y la tendencia a practicar ejercicio físico (de 1=muy baja;

254


ESTADISTICA AVANZADA PARA EDUCACION FISICA

hasta 5=muy alta) en un grupo de 20 personas, damas y


varones entre 30 y 55 años de la ciudad de Santiago de Chile.
Los resultados obtenidos fueron los siguientes:

IMC % grasa Calidad de Ejercicio


vida físico
1 1 2 8 3
2 2 2 9 4
3 2 2 9 5
4 2 2 10 5
5 2 2 9 4
6 2 2 10 5
7 2 2 10 5
8 2 2 9 4
9 2 2 8 5
10 2 2 8 4
11 2 2 9 4
12 2 2 9 3
13 2 2 10 3
14 2 3 9 3
15 3 3 7 4
16 3 3 6 3
17 3 3 5 3
18 3 4 5 2
19 4 4 4 2
20 4 4 4 2

¾ Paso 1
En el programa SPSS vamos a:

>Analizar >Reducción de datos >Escalamiento óptimo

255


FERNANDO MAUREIRA CID

Figura 55. Pantalla escalamiento óptimo.

Aquí marcamos la opción algunas variables no son nominales


múltiples en el caso que tengamos variables ordinales. En caso
que todas nuestras variables sean ordinales mantenemos el
formato que viene marcado por defecto (todas las variables son
nominales múltiples).
En la parte inferior marcamos conjuntos múltiples. Luego
marcamos Definir y aparece una pantalla como la figura 56.

Figura 56. Pantalla de correlación canónica.

256


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En el cuadro superior derecho introducimos nuestro primer


conjunto de variables. Aquí marcamos nuestra primera variable y
presionamos Definir rango y escala abriéndose una pantalla
como la siguiente:

Figura 57. Pantalla definir rango y escala en correlación canónica.

Aquí debemos introducir el valor máximo de rangos de nuestra


variable (aparece 1 como mínimo por defecto) y marcamos la
alternativa correspondiente a la naturaleza de nuestra variable,
en el caso del ejemplo 1 la variable IMC es de tipo ordinal.
Presionamos Continuar y volvemos a la pantalla de correlación
canónica. Aquí debemos realizar el mismo proceso anterior por
cada variable del grupo 1.

¾ Paso 2
Una vez definidas todas las variables del grupo 1, presionamos
en Conjunto 1 de 1 la opción Siguiente donde introducimos el
segundo grupo de variables y definimos sus rangos de la misma
manera que para las variables del grupo 1.

¾ Paso 3
En la pantalla de correlación canónica presionamos opciones y
aparece una pantalla como la figura 58. Aquí aparecen por
defecto marcadas las opciones frecuencias, centroides, ajuste
257


FERNANDO MAUREIRA CID

simple y múltiple, cuantificación de categorías,


puntuaciones de los objetos y saturaciones en
componentes. Nosotros colocamos en el cuadro de iteraciones
máximas el número de iteraciones que deseamos realizar y
presionamos Continuar.

Figura 58. Pantalla opciones en correlación canónica.

¾ Paso 4
Volvemos a la pantalla de correlación canónica y presionamos
OK. La hoja de resultados nos entrega varias tablas, pero las
que nos interesan son las siguientes:

258


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La tabla resumen del análisis muestra valores para cada


conjunto de variables ingresadas. Ya que existen 2 dimensiones en
el modelo, el valor máximo del ajuste es de 2,0. En el ejemplo el
ajuste es de 1,990 por lo cual se considera muy bueno (para dos
dimensiones un ajuste menor a 1,0 indicaría que el modelo no es
adecuado). Que el modelo no sea exactamente igual a las
dimensiones se produce por la pérdida de ajuste de ambos
conjuntos, en este caso una media de 0,010 de pérdida que origina
los 1,990 totales.

En la tabla Ajuste se muestra los estadísticos de


discriminación de cada variable analizada. Por ejemplo, IMC y % de
grasa (3,664 y 3,664) discriminan mejor que calidad de vida y
ejercicio físico (2,766 y 2,725 respectivamente).
En la parte derecha de la tabla se observa la perdida simple
por dimensión, aquí valores cercanos a cero muestran un buen
ajuste de modelo.

En el grafico Saturación de componentes se observa la


representación en un plano cartesiano de las variables estudiadas.
En el ejemplo es posible notar que las cuatro variables (IMC, % de
grasa, calidad de vida y práctica de ejercicio físico) se encuentran
agrupadas y por lo tanto, existe una alta correlación entre ellas.

259


FERNANDO MAUREIRA CID

A continuación se presentan tablas con información del aporte


de cada variable al modelo. Por ejemplo, en el IMC el nivel
obesidad y sobrepeso (2,106 y 1,167) aportan en mayor medida
que los niveles bajo y normal de la variable (-0,829 y -0,619).

260


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En la tabla de IMC centroides se muestra la ubicación del


centroide de cada nivel de las variables. Por ejemplo, en el caso del
IMC el nivel normal posee coordenadas de 0,269 en la dimensión 1
y 0,558 en la dimensión dos.

261


FERNANDO MAUREIRA CID

262


ESTADISTICA AVANZADA PARA EDUCACION FISICA

V
ANALISIS DE VARIANZA MULTIPLE
(MANOVA)

El MANOVA es una técnica estadística que estudia la relación


de varias variables dependientes numéricas y varias variables
independientes categóricas. El objetivo del análisis es contrastar si
los vectores de medias de las variables dependientes son
influenciados por las variables independientes. Por ejemplo, un
investigador desea conocer si existen diferencias en las cualidades
físicas y en la motricidad (variables dependientes) de un grupo de
estudiantes universitarios tras la aplicación de dos tipos de
entrenamiento y tres tipos diferentes de alimentación (variables
independientes).
El MANOVA corresponde a una generalización multivariante
del ANOVA.

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON

SUPUESTOS:

x NORMALIDAD MULTIVARIANTE

x HOMOCEDASTICIDAD DE LA MATRIZ DE COVARIANZA DE


TODOS LOS GRUPOS

x INDEPENDENCIA DE LAS OBSERVACIONES

263


FERNANDO MAUREIRA CID

El MANOVA es un método de dependencia, con una relación,


con varias variables dependientes numéricas y con varias variables
independientes categóricas.

Figura 59. Clasificación del MANOVA.

El modelo de MANOVA es el siguiente:

Y1 =XB + E (fórmula 51)

X = matriz de diseño
B = matriz de parámetro de regresión
E = matriz de desviaciones aleatorias

ƒ Ejemplo 1
Un investigador quiere saber si la edad, el sexo y el rendimiento
académico de estudiantes universitarios de educación física
afectan su motivación y percepción positiva por la profesión.

264


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Para ello se evaluaron a 20 estudiantes de 3° año d e la carrera,


con edades de 21 a 40 años, siendo 6 mujeres y 14 hombres. La
edad se clasifico en tres grupos (A=21-25 años; B=26-30 años;
C=>30 años), el sexo en dos (1=femenino; 2=masculino) y el
rendimiento académico en tres (1=” -59; 3=• 
Los resultados de las mediciones fueron los siguientes:

Edad Sexo Notas Motivación Percepción


1 1 1 3 9 5
2 1 2 2 8 4
3 2 1 3 6 3
4 2 2 2 5 2
5 3 2 1 3 1
6 1 1 3 9 5
7 1 2 2 8 4
8 1 1 3 9 5
9 2 2 2 5 2
10 3 2 1 3 1
11 1 1 3 9 5
12 1 2 2 9 4
13 2 2 1 5 2
14 3 1 2 4 2
15 1 1 3 8 5
16 1 2 2 8 5
17 2 1 3 6 3
18 3 2 1 3 1
19 1 2 2 8 4
20 1 2 1 7 3
Motivación puntajes entre 1 y 10; Percepción puntajes entre 1 y 5.

¾ Paso 1
En el programa SPSS vamos a:

>Analizar >Modelo lineal general >Multivariante

265


FERNANDO MAUREIRA CID

Figura 60. Pantalla MANOVA.

En el cuadro superior derecho colocamos las variables


dependientes (en el ejemplo, motivación y percepción) y en el
cuadro Factores fijos introducimos las variables independientes (en
este caso, edad y sexo de la muestra). Presionamos Post Hoc y
aparece una pantalla como la figura 61, donde pasamos nuestras
variables independientes al cuadro de la derecha y marcamos
Tukey. Luego presionamos Continuar.

Figura 61. Pantalla comparaciones múltiples MANOVA.


266


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 2
En la pantalla MANOVA marcamos Opciones apareciendo la
pantalla 62, donde marcamos estadísticos descriptivos y
prueba de homogeneidad. Luego marcamos Continuar.

Figura 62. Pantalla opciones del MANOVA.

¾ Paso 3
En la pantalla MANOVA presionamos OK. La hoja de resultados
nos entrega varias tablas, pero las que nos interesan son las
siguientes:

267


FERNANDO MAUREIRA CID

En la prueba M de Box se observa que las varianzas y


covarianzas de los grupos son iguales (F=0,585; gl1=6;
gl2=1,490E3; p=0,742).

Estadísticos descriptivos
edad sexo Media Desviación Std. N
Motivación 21-25 años femenino 8,8000 ,44721 5
masculino 8,0000 ,63246 6
Total 8,3636 ,67420 11
26-30 años femenino 6,0000 ,00000 2
masculino 5,0000 ,00000 3
Total 5,4000 ,54772 5
>30 años femenino 4,0000 . 1
masculino 3,0000 ,00000 3
Total 3,2500 ,50000 4
Total femenino 7,5000 1,92725 8
masculino 6,0000 2,25630 12
Total 6,6000 2,21003 20
Percepción 21-25 años femenino 5,0000 ,00000 5
masculino 4,0000 ,63246 6
Total 4,4545 ,68755 11
26-30 años femenino 3,0000 ,00000 2
masculino 2,0000 ,00000 3
Total 2,4000 ,54772 5
>30 años femenino 2,0000 . 1
masculino 1,0000 ,00000 3
Total 1,2500 ,50000 4
Total femenino 4,1250 1,24642 8
masculino 2,7500 1,42223 12
Total 3,3000 1,49032 20

En la tabla de estadísticos descriptivos se observan las


medias y desviaciones estándar de las variables dependientes para
cada grupo de edad y sexo de la muestra.
268


ESTADISTICA AVANZADA PARA EDUCACION FISICA

La tabla de contrastes multivariados entrega varias pruebas


para conocer si las variables independientes tienen efectos sobre
las dependientes. Para realizar los contrastes se puede utilizar
cualquiera de ellas, aunque se recomienda usar los valores de la
Traza de Pillai.
La variable edad presenta un valor F=7,568 y un
p=0,000<0,05 por lo cual se rechaza la H0 que plantea que no hay
diferencias en las interacciones de las variables dependientes de
acuerdo a la edad. Misma situación que ocurre con la variable sexo
con un valor F=13,431 y p=0,000<0,05. Finalmente, se observa que
la interacción de las variables edad y sexo presentan un valor
F=0,069 y p=0,991>0,05 por lo cual se acepta la H0 que plantea que
no hay diferencias en las interacciones de las variables
dependientes de acuerdo a la interacción de la edad y sexo.

269


FERNANDO MAUREIRA CID

La prueba de Levene muestra un valor F=0,916 y un


p=0,498>0,05 para la motivación y un valor F=0,980 y un
p=0,464>0,05 para la percepción, por lo que en ambos casos se
acepta la H 0 que plantea que la varianza del error es igual en todos
los grupos de las variables dependientes.

a. R cuadrado= ,970 (R cuadrado corregido= ,959)


b. R cuadrado= ,953 (R cuadrado corregido= ,936)
270


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Con un valor F=171,542 y un valor p=0,000<0,05 se rechaza


la H 0 que plantea que no existen diferencias significativas en la
motivación según los tres grupos de edades.
Con un valor F=96,980 y un valor p=0,000<0,05 se rechaza la
H0 que plantea que no existen diferencias significativas en la
percepción según los tres grupos de edades.
Con un valor F=15,474 y un valor p=0,001<0,05 se rechaza la
H0 que plantea que no existen diferencias significativas en la
motivación según el sexo de la muestra.
Con un valor F=24,868 y un valor p=0,000<0,05 se rechaza la
H0 que plantea que no existen diferencias significativas en la
percepción según el sexo de la muestra.
Con un valor F=0,114 y un valor p=0,893>0,05 se acepta la H0
que plantea que no existen diferencias significativas en la
motivación según la interacción de la edad y el sexo de la muestra.
Con un valor F=0,000 y un valor p=1,000>0,05 se acepta la H 0
que plantea que no existen diferencias significativas en la
percepción según la interacción de la edad y el sexo de la muestra.
Con lo anterior es posible concluir que la edad y el sexo de la
muestra poseen influencia sobre la motivación y percepción de la
misma cuando ambas variables independientes se analizan por
separado. Al estudiar la interacción de la edad y sexo no se observa
influencia sobre las dos variables dependientes.

1. COMPARACIONES MULTIPLES

Tras concluir que existe influencia de las variables


independientes sobre las dependientes debemos analizar las tablas
de las pruebas Post Hoc.
La tabla de comparaciones múltiples de Tukey muestra que
existen diferencias significativas entre el grupo de edad de 21-25
años y 26-30 años (p=0,000), de 21-25 años y más de 30 años
(p=0,000) y de 26-30 años y más de 30 años (p=0,000) para la
variable motivación.

271


FERNANDO MAUREIRA CID

Comparaciones múltiples
Tukey HSD
95% Intervalo de
Diferencia confianza
Variable (I) (J) de medias Error Límite Límite
dependiente edad edad (I-J) Std. Sig. inferior superior
Motivación 21-25 26-30
2,9636* ,24121 ,000 2,3323 3,5949
años años
>30
5,1136* ,26112 ,000 4,4302 5,7971
años
26-30 21-25
-2,9636* ,24121 ,000 -3,5949 -2,3323
años años
>30
2,1500* ,30000 ,000 1,3648 2,9352
años
>30 21-25
-5,1136* ,26112 ,000 -5,7971 -4,4302
años años
26-30
-2,1500* ,30000 ,000 -2,9352 -1,3648
años
Percepción 21-25 26-30
2,0545* ,20386 ,000 1,5210 2,5881
años años
>30
3,2045* ,22068 ,000 2,6270 3,7821
años
26-30 21-25
-2,0545* ,20386 ,000 -2,5881 -1,5210
años años
>30
1,1500* ,25355 ,001 ,4864 1,8136
años
>30 21-25
-3,2045* ,22068 ,000 -3,7821 -2,6270
años años
26-30
-1,1500* ,25355 ,001 -1,8136 -,4864
años
Basado en las medias observadas
El termino de error es la media cuadrática (Error) = ,143
*.Las diferencias de medias son significativas al nivel ,05

La misma tabla muestra que existen diferencias significativas


entre el grupo de edad de 21-25 años y 26-30 años (p=0,000), de

272


ESTADISTICA AVANZADA PARA EDUCACION FISICA

21-25 años y más de 30 años (p=0,000) y de 26-30 años y más de


30 años (p=0,001) para la variable percepción.

Las dos tablas de subconjuntos muestran que el grupo de


edades de 21-25 años posee las puntuaciones mayores para
motivación y percepción, seguida por el grupo de edad de 26-30
años para ambas variables y los puntajes menores son del grupo de
más de 30 años.
273


FERNANDO MAUREIRA CID

1. COMPROBACIÓN DE LOS SUPUESTOS DEL


MODELO DE MANOVA

a) El supuesto de normalidad multivariante se evalúa con pruebas


KS para cada variable y con las pruebas de Mardia de asimetría
y curtosis para el conjunto de variables.

b) El supuesto de homocedasticidad de la matriz de covarianza de


todos los grupos se evalúa con el contraste M de Box (Pág.
245).

c) El supuesto de independencia de las observaciones se logra con


el diseño experimental y con la toma adecuada de datos.

2. MANCOVA

El análisis de covarianzas múltiples (MANCOVA) permite


conocer el efecto de variables independientes (categóricas o
numéricas) sobre variables dependientes (numéricas) controlando
el efecto de otras variables independientes (covariables). En el
ejemplo 1, la edad y el sexo de la muestra afectan a las variables
dependientes motivación y percepción positiva de la profesión. Sin
embargo, es posible que el rendimiento académico sea una variable
interviniente que afecte a las dos dependientes lo que podría
modificar la relación de la edad y sexo sobre la motivación y
percepción, por lo cual el investigador decide controlar el posible
efecto de esta covariable.
Para ello cuando estamos en la pantalla del análisis MANOVA
(Fig. 63), después de introducir las variables dependientes e
independientes, debemos llevar nuestra variable interviniente al
cuadro covariante. Luego presionamos OK.

274


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 63. Pantalla del análisis MANOVA.

La hoja de respuestas del programa entrega una tabla como


la siguiente, donde se observa que:

Con un valor F=4,062 y un valor p=0,065>0,05 se acepta la H 0


que plantea que no existen diferencias significativas en la
motivación según el rendimiento académico de la muestra.
Con un valor F=6,500 y un valor p=0,024<0,05 se rechaza la
H0 que plantea que no existen diferencias significativas en la
percepción según el rendimiento académico de la muestra.
Con un valor F=109,940 y un valor p=0,000<0,05 se rechaza
la H 0 que plantea que no existen diferencias significativas en la
motivación según los tres grupos de edades aislando el efecto del
rendimiento académico.
Con un valor F=72,112 y un valor p=0,000<0,05 se rechaza la
H0 que plantea que no existen diferencias significativas en la
percepción según los tres grupos de edades aislando el efecto del
rendimiento académico.
Con un valor F=0,124 y un valor p=0,730>0,05 se acepta la H 0
que plantea que no existen diferencias significativas en la
motivación según el sexo de la muestra aislando el efecto del
rendimiento académico.
275


FERNANDO MAUREIRA CID

Con un valor F=0,405 y un valor p=0,536>0,05 se acepta la H 0


que plantea que no existen diferencias significativas en la
percepción según el sexo de la muestra aislando el efecto del
rendimiento académico.
Con lo anterior es posible concluir que el rendimiento
académico de la muestra posee influencia sobre la percepción de la
misma y al controlar su influencia, el sexo de los sujetos ya no tiene
efectos sobre las dos variables dependientes, a diferencia de los
resultados del MANOVA. Por otra parte, los efectos de la edad se

276


ESTADISTICA AVANZADA PARA EDUCACION FISICA

mantiene aun controlando el sexo de la muestra. Finalmente, al


igual que el modelo de MANOVA, en el MANCOVA tampoco existen
efectos de la interacción de las dos variables independientes sobre
la motivación y percepción al controlar la influencia de la variable
interviniente.

277


FERNANDO MAUREIRA CID

278


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPÍTULO 7

METODOS DE INTERDEPENDENCIA

I. Métodos de reducción de datos numéricos

II. Método de reducción de datos categóricos

III. Análisis de conglomerados u cluster

IV. Análisis de escalamiento multidimensional

279


FERNANDO MAUREIRA CID

280


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
METODOS DE REDUCCION DE DATOS
NUMERICOS

1. ANALISIS DE COMPONENTES PRINCIPALES

El análisis de componentes principales pertenece a la


categoría de métodos multivariantes de reducción de datos, ya que
permite obtener a partir de un conjunto de variables un número
menor de nuevas variables, siendo estas combinaciones lineales de
las primeras, denominándose estas nuevas variables componentes
principales o factores.
Este análisis se utiliza cuando un investigador cuenta con
información de muchas variables que están relacionadas y eso no
permite explicar con claridad el fenómeno, entonces se genera un
nuevo conjunto de menos variables (que hay que nombrar)
incorreladas entre sí y que se seleccionan en base a la cantidad de
información que posean. Esto último se logra a través de la
varianza, es decir, a mayor varianza mayor información.
Este tipo de análisis obtiene nuevas variables en base a
cálculos matemáticos que son independientes de algún tipo de
relación teórica latente de los datos. Es decir, el análisis de
componentes principales puede generar nuevas variables que
pueden ser útiles o inútiles para la investigación pero
matemáticamente calculables (Pérez, 2004).
Este método corresponde a una técnica de análisis descriptivo
multivariante.

281


FERNANDO MAUREIRA CID

El modelo del análisis de componentes principales es el


siguiente:

Z1i= u11X1i + u12X2i +…u1kXki (fórmula 52)

u = matriz cuyas columnas son los vectores que definen los


componentes principales
X= matriz de datos multivariados

2. ANALISIS FACTORIAL

En análisis factorial es un método de reducción de datos


similar matemáticamente al análisis de componentes principales
pero con objetivos, características y formalizaciones diferentes
(Pérez, 2004). El análisis factorial busca factores no directamente
observables que explique las variables observadas, cuyas
relaciones subyacentes pueden ser explicadas teóricamente. Este
análisis produce una reducción de datos igual que el análisis de
componentes principales, sin embargo, su objetivo es encontrar las
relaciones subyacentes y no directamente reducir las variables. Por
su parte, el objetivo del análisis de componentes principales es
explicar la mayor parte de la variabilidad de un conjunto de
variables con el menor número de componentes.
El análisis factorial corresponde a una técnica de análisis
inferencial multivariante.
El modelo del análisis factorial es el siguiente:

X1= l11F1 + l12F2 +…I1kFk + e1 (fórmula 53)

X= variables observadas
l = carga factorial o saturación de la variable j en el factor h
F= factores comunes
e= factores específicos

282


ESTADISTICA AVANZADA PARA EDUCACION FISICA

El análisis de componentes principales y el análisis factorial


son métodos de interdependencia, con relación entre variables
numéricas.

Figura 64. Clasificación del análisis de componentes principales y


el análisis factorial.

3. APLICACION PRACTICA DE ANALISIS DE


COMPONENTES PRINCIPALES Y ANALISIS
FACTORIAL

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZÓN.

SUPUESTOS:

x DETERMINANTE DE LA CORRELACIÓN DE LA MATRIZ


BAJO.

x ALTAS CORRELACIONES

x HOMOGENEIDAD DE LA MUESTRA

283


FERNANDO MAUREIRA CID

ƒ Ejemplo 1
Un investigador aplicó una encuesta sobre hábitos de estudio a
un grupo de estudiantes. Este instrumento consta de 10
preguntas y el investigador desea reducir la cantidad de
variables originales para elaborar mejor los análisis de los
resultados. La encuesta fue aplicada a 150 estudiantes de
educación física de primer año de tres universidades de
Santiago de Chile. Del total, 50 fueron damas y 100 varones con
edades entre 18 y 21 años. Algunos de los resultados fueron los
siguientes:

P.1 P.2 P.3 P.4 P.5 P.6 P.7 P.8 P.9 P.10
1 5,0 4,0 5,0 4,0 1,0 5,0 4,0 5,0 5,0 1,0
2 5,0 4,0 5,0 1,0 5,0 5,0 4,0 5,0 5,0 1,0
3 5,0 4,0 5,0 5,0 4,0 4,0 4,0 2,0 2,0 3,0
4 5,0 4,0 5,0 4,0 4,0 5,0 5,0 5,0 4,0 5,0
5 5,0 5,0 2,0 3,0 5,0 1,0 4,0 4,0 5,0 5,0
6 4,0 3,0 5,0 4,0 4,0 3,0 3,0 1,0 2,0 3,0
7 5,0 4,0 5,0 5,0 4,0 5,0 3,0 3,0 5,0 5,0
8 5,0 1,0 5,0 2,0 5,0 4,0 5,0 5,0 2,0 5,0
9 5,0 4,0 3,0 4,0 2,0 3,0 4,0 3,0 5,0 2,0
10 5,0 4,0 5,0 5,0 2,0 5,0 5,0 5,0 2,0 3,0
11 4,0 3,0 5,0 3,0 3,0 4,0 2,0 4,0 3,0 2,0
12 4,0 3,0 4,0 5,0 3,0 4,0 4,0 5,0 3,0 4,0
13 4,0 1,0 3,0 2,0 3,0 4,0 3,0 2,0 1,0 2,0
14 4,0 5,0 4,0 3,0 4,0 3,0 3,0 3,0 4,0 3,0
15 4,0 3,0 5,0 3,0 4,0 4,0 5,0 3,0 1,0 3,0
16 5,0 4,0 4,0 5,0 4,0 5,0 4,0 4,0 4,0 5,0
17 4,0 2,0 4,0 5,0 4,0 3,0 4,0 3,0 2,0 2,0
18 4,0 3,0 3,0 4,0 3,0 4,0 4,0 3,0 1,0 3,0
19 5,0 3,0 5,0 5,0 5,0 4,0 5,0 5,0 3,0 2,0
20 5,0 5,0 5,0 5,0 4,0 5,0 5,0 4,0 4,0 5,0
... … … … … … … … … … …
150 5,0 3,0 3,0 5,0 5,0 3,0 5,0 5,0 5,0 4,0

284


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 1

En el programa SPSS vamos a:

>Analizar >Reducción de datos >Factor

Figura 65. Pantalla análisis factorial.

En el cuadro superior derecho variables introducimos nuestras


variables medidas (en este caso las 20 preguntas de la
encuesta). Presionamos Descriptivos y se abre una pantalla
como la figura 66.

Figura 66. Descriptivos análisis factorial.


285


FERNANDO MAUREIRA CID

En esta pantalla aparece marcado el estadístico solución


inicial. Nosotros además marcamos Descriptivo univariantes y
KMO y test de esfericidad de Bartlett. Luego presionamos
Continuar.

¾ Paso 2
En la pantalla análisis factorial presionamos Extracción y
aparece una pantalla como la figura 67. Aquí desplegamos las
opciones del cuadro Método y marcamos Componentes
principales. Luego presionamos Continuar.

Figura 67. Pantalla extracción en el Análisis factorial.

¾ Paso 3
Cuando regresamos a la pantalla de Análisis factorial
presionamos Rotación y se abre una pantalla como la figura 68.
La rotación de factores es un proceso mediante el cual se
pueden obtener factores fácilmente interpretables. Como cada
factor esta correlacionado con una de las variables originales, la
rotación trata de que cada variable tenga una correlación
próxima a 1 con alguno de los factores y correlaciones cercanas
a 0 con el resto de los factores. Esto provocará que las variables
tiendan a agruparse en alguno de los factores, lo que permite
286


ESTADISTICA AVANZADA PARA EDUCACION FISICA

encontrar rasgos comunes a un factor para identificarlo y darle


un nombre (Pérez, 2004).

Existen dos formas de rotar factores:

a) Rotación ortogonal, donde la rotación preserva la incorrelación


entre los factores (los ejes son perpendiculares entre sí), lo que
ayuda a identificar los factores cuando estos no están
fuertemente correlacionados. El método de rotación ortogonal
más usado es el Varimax y otros menos utilizados son
Equamax y Quartimax.

b) Rotación oblicua, donde la rotación no preserva la incorrelación


de los factores, lo que se utiliza cuando los factores están
fuertemente correlacionados lo que puede llevar a que dos o
más factores expliquen a la vez lo mismo. El método de
rotación oblicua más usado es el Oblimin y otros menos
utilizados son Promax, Quartimin, Biquartimin y Covarimin.

Figura 68. Pantalla de rotación en Análisis factorial.

Nosotros marcamos la rotación ortogonal de varimax. Luego


presionamos continuar y volvemos a la pantalla Análisis factorial
donde presionamos OK.
287


FERNANDO MAUREIRA CID

¾ Paso 4
La hoja de resultados nos entrega las siguientes tablas:

En la tabla de estadísticos descriptivos se observa la media y


desviación estándar de cada pregunta de la encuesta, además del
número de sujetos que contestaron cada pregunta.

En la tabla de KMO y prueba de Bartlett se observa la medida


de adecuación muestra KMO que indica que tan adecuados son los
datos para realizar un análisis factorial. Los valores oscilan entre 0 y
1 siendo las puntuaciones de la prueba más cercanas a 1 las más
adecuadas. Valores bajo 0,500 no permiten realizar el análisis

288


ESTADISTICA AVANZADA PARA EDUCACION FISICA

factorial. En el ejemplo el valor KMO fue de 0,813 lo que se


considera como adecuado para continuar con el análisis.
En la misma tabla también se observa la prueba de
esfericidad de Bartlett que permite contrastar la H0 que plantea que
no existen correlaciones entre las variables. Como su valor fue X2 =
796,223 y su valor p=0,000<0,05 es posible rechazar la H 0 y
aceptar que existen correlaciones entre las variables.
Valores bajos del KMO y/o la aceptación de la H0 de las
variables no correlacionadas no permiten continuar con el análisis
factorial.

En la tabla de Comunalidades se muestran dichos valores


(comunalidades=suma de los cuadrados de las cargas factoriales
definidas en la matriz de componentes). La comunalidad es la parte
de la variabilidad de cada variable explicada por los factores. Los
valores para cada variable inicialmente es 1 y tras la extracción es
importante que sigan siendo altos (sobre 0,400). De no ser así
podría ser necesario sacar esa variable del análisis de los datos.

La tabla de varianza total explicada muestra los componentes


iniciales (equivalente a la cantidad de variables, en este caso 10)
con los valores de varianza explicada por cada uno (% de la
289


FERNANDO MAUREIRA CID

varianza) y la varianza acumulada. La suma de los 10 componentes


completa el 100% de la varianza. Al centro de la tabla se observa la
suma de saturaciones al cuadrado de la extracción que corresponde
a los componentes seleccionados por el análisis factorial sin rotar y
que resumen las relaciones subyacentes de las variables y que en
este caso corresponden a 3 factores que explican en conjunto el
56,594% de la varianza (el primer componentes explica el 35,571%,
el segundo el 10,942% y el tercero 10,082%). Es decir, existen 3
factores que subyacen a las 10 preguntas de la encuesta y que
explican más del 50% de las variaciones de los datos.
A la derecha de la tabla se observa la suma de las
saturaciones al cuadrado de la rotación y que corresponde a los
mismos factores anteriores que explican la misma varianza total,
pero con diferentes varianzas individuales tras la rotación (el primer
componentes explica el 24,848%, el segundo el 18,569% y el
tercero 13,177%).

En las tablas de matriz de componentes y matriz de


componentes rotados se observan las saturaciones de las variables
en los diversos factores producto del análisis factorial. Por ejemplo,
la pregunta 1 satura al componente o factor 1 en la matriz sin rotar,
pero en el factor 2 en la matriz rotada. Como la matriz rotada ya

290


ESTADISTICA AVANZADA PARA EDUCACION FISICA

está ajustada, es en base a esta que se realiza la agrupación de las


variables en un factor.

Con el ejemplo podemos notar que en la matriz rotada la


pregunta 1 satura más alto en el componente 2 (0,772), la pregunta
2 en el componente 3 (0,510), la pregunta 3 en el componente 1
(0,657), la pregunta 4 en el componente 1 (0,736), la pregunta 5 en
el componente 1 (0,503), la pregunta 6 en el componente 1 (0,487),
la pregunta 7 en el componente 1 (0,534), la pregunta 8 en el
componente 2 (0,805), la pregunta 9 en el componente 3 (0,935) y
la pregunta 10 en el componente 1 (0,717).
Finalmente, podemos concluir que el componente 1 contiene
a las preguntas 3, 4, 5, 6, 7 y 10. El componente 2 contiene a las
preguntas 1 y 8. El componente 3 contiene a las preguntas 2 y 9.
Ahora es necesario analizar que rasgos tienen en común las

291


FERNANDO MAUREIRA CID

preguntas que se agrupan bajo el mismo factor, así podrá dársele


una denominación a dicho componente.
Una cosa importante a tener en cuenta es la eliminación de
variables del modelo y por ende de su aplicación en la realidad.
Cuando una variable posee comunalidades bajo 0,400, satura en
forma similar en más de un factor (menos de 0,200 de diferencia
entre la saturación a dos factores diferentes) y su extracción permite
aumentar o mantener la confiabilidad (alfa de Cronbach) del
instrumento total es recomendable extraer la variable y realizar
todos los análisis nuevamente.

292


ESTADISTICA AVANZADA PARA EDUCACION FISICA

II
METODO DE REDUCCION DE DATOS
CATEGORICOS

El análisis de correspondencia es una técnica multivariantes


de reducción de datos de tipo categórico, cuyo objetivo es resumir
una gran cantidad de datos en un número reducido de dimensiones.
Es un análisis similar al método factorial, sólo que se utiliza en
variables de tipo nominales.
Cuando los datos a analizar pertenecen a dos variables y
tienen la forma de una tabla de contingencia recibe el nombre de
análisis de correspondencia simple y cuando los datos pertenecen a
tres o más variables recibe el nombre de análisis de
correspondencia múltiple.
El análisis de correspondencia establece la relación entre
variables generalizando las relaciones de variables medidas con la
prueba de Chi-cuadrado. Los datos de partida corresponden a una
matriz n x k que representa las frecuencias absolutas observadas
en una tabla de contingencia que utiliza las frecuencias en cada
casilla para el análisis de datos en lugar de los datos como tal.

NIVEL DE MEDICIÓN: NOMINAL

SUPUESTOS:

x RELACIÓN ENTRE LAS VARIABLES

293


FERNANDO MAUREIRA CID

El análisis de correspondencia es un método de


interdependencia, con relación entre variables categóricas.

Figura 69. Clasificación del análisis de correspondencia.

ƒ Ejemplo 1
Un investigador evaluó tres variables antropométricas en 30
estudiantes de educación física de una Universidad de Santiago
de Chile. Las variables evaluadas fueron la estatura: <1,70
(alternativa 1); 1,70-1,80 (alternativa 2); >1,80 (alternativa 3), el
largo del fémur: 35-37 cms. (alternativa 1); 38-39 cms.
(alternativa 2); 40-41 cms. (alternativa 3) y el largo de la tibia:
27-28 cms (alternativa 1); 29-30 cms (alternativa 2); 31-32 cms.
(alternativa 3). La muestra estuvo constituida exclusivamente por
varones con edades entre 18 y 30 años. Los resultados se
observan en la tabla siguiente:

294


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Estatura Fémur Tibia Estatura Fémur Tibia


1 1 1 1 16 2 2 2
2 1 1 1 17 2 2 3
3 1 1 1 18 2 2 3
4 1 1 1 19 2 3 2
5 1 1 1 20 2 3 2
6 1 2 1 21 3 2 2
7 1 2 2 22 3 2 3
8 2 1 1 23 3 3 3
9 2 1 2 24 3 3 3
10 2 2 2 25 3 3 3
11 2 2 2 26 3 3 3
12 2 2 2 27 3 3 3
13 2 2 2 28 3 3 3
14 2 2 2 29 3 3 3
15 2 2 2 30 3 3 3

1. ANALISIS DE CORRESPONDENCIA SIMPLE

¾ Paso 1

En el programa SPSS vamos a:

>Analizar >Reducción de datos >Análisis de correspondencia

Figura 70. Análisis de correspondencia.

295


FERNANDO MAUREIRA CID

En el cuadro superior derecho Fila introducimos nuestra variable


que corresponderá a las filas en la tabla de contingencia (en
este caso la estatura) y en el cuadro columna introducimos
nuestra segunda variable (largo del fémur). Luego presionamos
Definir rangos y se abre una pantalla como la figura 71. Aquí
definimos el rango menor y mayor de cada variable y
presionando actualizar.

Figura 71. Pantalla definir rangos en análisis de correspondencia.

¾ Paso 2
Al volver a la pantalla Análisis de correspondencia presionamos
OK. La hoja de resultados nos entrega las siguientes tablas:

296


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En la tabla de correspondencia se observan las frecuencias


absolutas (cantidad de sujetos) en cada combinación de opciones
de las dos variables. Por ejemplo, existe 5 sujetos con estatura
menor a 1,70 y largo del fémur de 35-37 cms., 2 sujetos con
estatura de 1,70-1,80 y largo de fémur de 35-37 cms., etc.

La tabla Resumen muestra la existencia de 2 dimensiones. El


valor x2=23,368 y el valor p=0,000 por lo cual se rechaza la H 0 que
plantea que no existe asociación entre la estatura y el largo de
fémur. También se observa la inercia de cada dimensión que
corresponde a las distancias medias de los datos a su centro de
gravedad (centro de un conjunto de puntos representados por los
datos). La primera dimensión explica el 74,7% de la inercia, en tanto
la segunda dimensión explica el 25,3% de la inercia.

297


FERNANDO MAUREIRA CID

La masa representa la influencia de cada variable en el


modelo. En el ejemplo, la estatura entre 1,70 y 1,80 influye en
43,3%, luego la estatura mayor de 1,80 con 33,3% y finalmente la
estatura menor a 1,70 con 23,3%.
En el apartado contribución de los puntos a la inercia de la
dimensión se observa que la dimensión 1 contiene a las categorías
<1,70 y >1,80 por lo que esta dimensión discrimina por los extremos
de la estatura. En tanto la dimensión 2 contiene al categoría 1,70-
1,80 y discrimina por la estatura central.
En el apartado contribución de la dimensión a la inercia de
punto se muestra la clasificación de cada categoría a una
dimensión. Por ejemplo, la categoría estatura <1,70 y estatura
>1,80 se agrupan en la dimensión 1 (0,800 y 0,923
respectivamente), en tanto, la estatura 1,70-1,80 se ubica en la
dimensión 2 (0,885).

En el ejemplo, el largo del fémur entre 38-39 cms influye en


43,3% del modelo, luego el largo de 40-41 cms con 33,3% y el largo
de fémur de 35-37 cms con 23,3%. La categoría largo del fémur de
35-37 cms y 40-41 cms se agrupan en la dimensión 1 (0,800 y
0,923 respectivamente) y la categoría 38-39 cms en la dimensión 2
(0,885).

298


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En el gráfico se observan la cercanía de la categoría estatura


<1,70 y la categoría 35-37 cms fémur. Igualmente la cercanía de
estatura 1,70-180 y 38-39 cms fémur y de estatura >1,80 y 40-41
cms fémur.

2. ANALISIS DE CORRESPONDENCIA MULTIPLE

¾ Paso 1
En el caso de tener tres o más variables el análisis de
correspondencia pasa a ser un modelo múltiple y se trabaja de
forma diferente. En el programa SPSS vamos a:

>Analizar >Reducción de datos >Escalamiento óptimo

En la pantalla de escalamiento óptimo aparece marcada en


forma predefinida todas las variables son nominales
múltiples y Múltiples conjuntos.

299


FERNANDO MAUREIRA CID

Figura 72. Pantalla Escalamiento óptimo

Nosotros presionamos Definir y se abre una pantalla como la


figura 73, donde pasamos nuestras variables al cuadro superior
derecho.

Figura 73. Pantalla análisis de correspondencia múltiple.

En la pantalla de correspondencia múltiple marcamos


Discretizar y aparece una pantalla como la figura 74, donde

300


ESTADISTICA AVANZADA PARA EDUCACION FISICA

marcamos cada variable y en el cuadro agrupación en la sección


Número de categorías colocamos la cantidad de categorías de la
variable. Hacemos lo mismo con cada una. Luego presionamos
Continuar.

Figura 74. Pantalla discretización en el análisis de correspondencia


múltiple.

¾ Paso 2
Al volver a la pantalla análisis de correspondencia múltiple
presionamos OK. La hoja de resultados nos entrega las
siguientes tablas:

301


FERNANDO MAUREIRA CID

En la tabla resumen del modelo se observan las dimensiones


del modelo con los alfas de Cronbach en ellas (dimensión 1=0,927 y
dimensión 2=0,786). También se muestra la varianza explicada que
representa el grado de importancia de cada dimensión en la
solución global, que en el ejemplo son altas (87% y 70%).

La tabla medidas de discriminación muestra la agrupación de las


variables en las dimensiones del modelo. Por ejemplo, la variable
estatura aporta tanto a la dimensión 1 (0,864) como a la 2 (0,725),
la variable fémur a la dimensión 1 (0,839) y la variable tibia aporta a
la dimensión 1 (0,916).

302


ESTADISTICA AVANZADA PARA EDUCACION FISICA

III
ANALISIS DE CONGLOMERADOS O
CLUSTER

El análisis de conglomerados o cluster corresponden a una


técnica multivariante que tiene por objetivo reunir elementos en
diversos grupos en base a las similitudes entre ellos. Las unidades
experimentales de los grupos conformados serán lo más parecido
posible, de manera similar al análisis discriminante, con la diferencia
que en el análisis cluster los grupos no están conformado de
antemano, sino que son generados por el estadístico.
El análisis cluster puede ser: a) Jerárquico, donde las
unidades experimentales son clasificadas en grupos, existiendo
grupos dentro de otros grupos (jerarquías). Por ejemplo, un
conjunto de variables que permita clasificar a un grupo de
deportistas según sus niveles de motivación (jerarquía 1) y luego
dentro de los niveles clasificar a los sujetos según el origen
endógeno o exógeno de su motivación (jerarquía 2). b) No
jerárquico, donde las unidades experimentales son agrupadas
según características en común dentro del grupo y distantes de
otros grupos.
El proceso de agrupación funciona exactamente igual si se
tratan de sujetos o de variables. Para realizar un análisis cluster es
necesario tener en cuenta la selección de variables para crear los
grupos y las medidas de similaridad y proximidad entre las variables
o sujetos, como los coeficiente de Pearson, Spearman y Kendall
que son índices de similaridad y la distancia Euclidea y distancia de
Mahalonabis que sirven para ver las distancias entre variables

303


FERNANDO MAUREIRA CID

numéricas y Russell Rao, Parejas simples, Jaccard, Sokal y Sneth,


etc. para distancias entre variables categóricas.

NIVEL DE MEDICIÓN: NUMERICAS Y CATEGORICAS

SUPUESTOS:

x NO MULTICOLINEALIDAD

El análisis cluster es un método de interdependencia, con


relación entre casos.

Figura 75. Clasificación del análisis cluster.

ƒ Ejemplo 1
Un investigador midió los pliegues tricípitales, subescapulares y
suprailíacos de 15 gimnastas varones con edades entre 15 y 17
años, de tres clubes de Santiago de Chile. Los resultados fueron
los siguientes:

304


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Club Tricípital Subescapular Suprailíaco


1 1 7,2 6,0 4,2
2 1 6,7 5,8 5,0
3 1 6,8 5,0 4,7
4 1 7,0 5,7 4,1
5 2 6,0 6,7 4,3
6 2 6,1 6,2 4,4
7 2 7,3 5,9 4,2
8 2 7,6 5,4 4,6
9 2 6,5 5,7 4,5
10 2 7,4 5,8 4,1
11 2 6,8 6,1 3,9
12 3 7,8 6,0 4,0
13 3 7,4 6,4 4,7
14 3 6,5 5,3 4,3
15 3 7,7 5,4 4,2

1. ANALISIS CLUSTER JERARQUICO

¾ Paso 1

En el programa SPSS vamos a:

>Analizar >Clasificar >Conglomerado jerárquico

En el cuadro superior derecho Variable introducimos nuestras


variables para clasificar (en este caso pliegue tricípital,
subescapular y suprailíaco) y en el cuadro Etiquetar los casos
mediante introducimos nuestra variable para dar nombre a los
casos (en este caso club), si no existe esta variable los casos
serán etiquetas con números. En la sección cluster se puede
marcar si el análisis será de casos o variables. Además por
defecto están marcadas las opciones estadísticos y gráficos.

305


FERNANDO MAUREIRA CID

Figura 76. Pantalla análisis cluster jerárquico.

¾ Paso 2
Presionamos Estadísticos y se abre una pantalla como la figura
77. Aquí aparece marcada la opción historial de
conglomeración y nosotros marcamos Matriz de
proximidades. Luego presionamos continuar.

Figura 77. Pantalla Estadísticos en análisis cluster jerárquico.

306


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 3
Al volver a la pantalla Análisis cluster de k-medias presionamos
Gráficos donde aparece una pantalla como la figura 78, donde
marcamos Dendrograma. Luego presionamos Continuar.

Figura 78. Pantalla gráficos en análisis cluster jerárquico.

¾ Paso 4
En la pantalla análisis cluster jerárquico presionamos OK. La
hoja de resultados nos entrega las siguientes tablas:

Esto es una matriz de disimilaridades

307


FERNANDO MAUREIRA CID

En la tabla matriz de proximidad se observa la cercanía de cada


sujetos con los demás. Por ejemplo, el sujeto 1 que pertenece al
club 1 de gimnasia presenta una distancia menor con el sujeto 7 del
club 2 (0,020), con el sujeto 10 del club 2 (0,090) y el sujeto 4 del
club 1 (0,140). Por el contrario el sujeto 1 presenta mayor distancia
con el sujeto 5 del club 2 (1,940), con el sujeto 3 del club 1 (1,410) y
con el sujeto 6 del club 2 (1,290).
Esto es la base para la estructuración de los grupos.

En la tabla historial de conglomeraciones se observan las


combinaciones más próximas ordenadas de menor a mayor. En el
ejemplo, en primer lugar se observa el sujeto 1 y 7
(distancia=0,020), luego 1 y 10 (0,060), así hasta 1 y 5 (2,166).
En la parte derecha de la tabla se muestra la etapa siguiente
en la cual a cada par de sujetos se le suma otro en su grupo. Por

308


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ejemplo al sujeto 1 y 7 se le suma un nuevo integrante en la etapa


2, a los sujetos 8 y 15 de la etapa 4 se le suma otro sujeto en la
etapa 11, y así sucesivamente.

Dendrograma que utiliza una vinculación media (entre grupos)

Combinación de cluster de distancia escalonada

CASO
Nivel Num

En el gráfico dendrograma se observan las asociaciones de


los sujetos en los diferentes cluster. Los dos primeros grupos
contienen a los demás, lo que muestra la jerarquía de los cluster.
Por ejemplo, en el nivel uno se aprecian dos grupos, uno contiene a
los sujetos 1, 7, 10, 4, 11, 12, 8, 15, 13, 9, 14, 3 y 2 y el otro grupo a
los sujetos 5 y 6. Posteriormente el grupo 1 se subdivide en dos,
estando el grupo 1’ constituido por los sujetos 1, 7, 10, 4, 11, 12, 8,
15 y 13 y el grupo 2’ por 9, 14, 3 y 2.

309


FERNANDO MAUREIRA CID

2. ANALISIS CLUSTER NO JERARQUICO

¾ Paso 1
En el programa SPSS vamos a:

>Analizar >Clasificar >Conglomerado k-medias

Figura 79. Pantalla análisis cluster k-medias.

En el cuadro superior derecho Variable introducimos nuestras


variables para clasificar (en este caso pliegue tricípital,
subescapular y suprailíaco) y en el cuadro Etiquetar los casos
mediante introducimos nuestra variable para dar nombre a los
casos (en este caso club), si no existe esta variable los casos
serán etiquetas con números. Luego en número de cluster
aparece por defecto 2, pero podemos modificarlo según
nuestras necesidades (en este ejemplo el análisis cluster
jerárquico nos entregó una división adecuada de 3 grupos
mediante el dendrograma).

310


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 2
Presionamos Opciones y se abre una pantalla como la figura
80. Aquí aparece marcada la opción centros de
conglomerados iniciales y nosotros marcamos Información
del conglomerado para cada caso. Luego presionamos
continuar.

Figura 80. Pantalla Opciones en análisis cluster k-medias.

¾ Paso 3
Al volver a la pantalla Análisis cluster de k-medias presionamos
OK. La hoja de resultados nos entrega las siguientes tablas:

En la tabla de centros iniciales de los conglomerados se


observan los centroides iniciales (centros de los grupos) donde
comienzan los algoritmos para clasificar a los sujetos en los
distintos grupos.
311


FERNANDO MAUREIRA CID

En la tabla historial de iteraciones se muestran los cambios


que se producen en los centroides durante la ejecución de los
algoritmos. El hecho que en la segunda iteración todos los valores
sean cero indica que ha finalizado el análisis k-medias.

312


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En la tabla pertenencia a los conglomerados se muestra la


clasificación de cada unidad experimental a uno de los grupos. Por
ejemplo, el sujeto 1 pertenece al grupo 1, el sujeto 2 al grupo 3, el
sujeto 3 al grupo 3, etc. También se aprecian las distancias de cada
sujeto al centroide de su grupo.

En la tabla centros de conglomerados finales se muestran los


centroides de cada grupo tras realizar el método de clasificación.
Por ejemplo, el grupo 1 presenta mayor media de pliegue tricípital
que el grupo 2 y 3. El grupo 2 presenta mayor media del pliegue
subescapular y finalmente el grupo 3 presenta mayor media del
pliegue Suprailíaco.

En la tabla distancias entre los centros de los conglomerados


finales se observan las distancias entre los centroides de los
diferentes grupos generados. Por ejemplo, el grupo 1 se encuentra
más lejano del grupo 2 que del grupo 3.
Valores muy bajos podrían indicar una mala elección en la
cantidad de grupos escogidos. Por ejemplo, en la tabla pertenencia
a los conglomerados observamos que la mayor distancia de un
sujeto a su centroide fue el 13 con 0,726 la cual es menor a la

313


FERNANDO MAUREIRA CID

distancia mínima mostrada entre grupos (0,928), por lo tanto


podemos aceptar como correcta la elección de 3 grupos para esta
muestra.

314


ESTADISTICA AVANZADA PARA EDUCACION FISICA

IV
ANALISIS DE ESCALAMIENTO
MULTIDIMENSIONAL

El análisis de escalamiento multidimensional corresponde a


una técnica de interdependencia que tiene por objetivo la
representación gráfica de las percepciones de los sujetos frente a
determinadas situaciones. Estas percepciones o juicios pueden ser
representadas en base a las distancias que las separan en relación
a las demás. Por ejemplo, se le pide a un grupo de estudiantes que
seleccione dentro de un grupo de n deportes los dos que más se
parezcan, el escalamiento multidimensional generará una
representación gráfica de la percepción de los deportes donde los
que fueron considerados más cercanos aparecerán a una distancia
menor que el resto.
Este análisis se basa en la comparación de objetos y no son
necesarias ni categorías, ni conocimiento acabado de los atributos
que los encuestados utilizan para generar la diferencia de los
objetos.

NIVEL DE MEDICIÓN: NUMERICO Y CATEGORICO

SUPUESTOS:

x NO MULTICOLINEALIDAD

315


FERNANDO MAUREIRA CID

El análisis de escalamiento multidimensional es un método de


interdependencia con relación entre objetos.

Figura 81. Clasificación del análisis de escalamiento


multidimensional.

ƒ Ejemplo 1
Un investigador pide a un grupo de estudiantes de educación
física de una Universidad de Santiago de Chile que comparen
los siguientes deportes: fútbol, básquetbol, voleibol, hándbol,
natación, gimnasia artística, tenis y atletismo en base al
conocimiento de los fundamentos técnicos del deporte. Las
tablas de comparación quedan estructuradas de la siguiente
forma:
Conocimientos técnicos
Poco Mucho
Fútbol 1 2 3 4 5
Básquetbol 1 2 3 4 5
Voleibol 1 2 3 4 5

Atletismo 1 2 3 4 5

316


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Este trabajo se pidió realizar a 10 estudiantes (5 varones y 5


damas) con edades entre 18 y 25 años. Los resultados fueron
los siguientes:

Conocimientos técnicos
Sujeto F B V H N GA T A
1 5 5 5 5 3 3 4 5
2 5 5 4 4 4 2 3 4
3 5 3 3 5 3 2 2 4
4 5 3 4 5 4 2 3 5
5 5 4 3 4 3 2 3 5
6 5 4 5 3 3 3 4 4
7 4 4 4 4 2 2 3 3
8 3 3 5 4 3 1 4 4
9 4 2 4 5 3 2 3 3
10 3 3 5 3 3 1 3 4
F=fútbol; B=básquetbol; V=voleibol; H=hándbol; N=natación;
GA=gimnasia artística; T=tenis; A=atletismo

Luego establecemos la similaridad entre los aspectos medidos


mediante el porcentaje que los sujetos evaluaron como iguales cada
par de deportes:

F B V H N GA T A
Fútbol 100 50 40 50 20 0 10 30
Básquetbol 50 100 30 40 30 10 30 20
Voleibol 40 30 100 20 40 0 10 20
Hándbol 50 40 20 100 30 10 20 40
Natación 20 30 40 30 100 30 30 20
Gimnasia 0 10 0 10 30 100 10 0
Tenis 10 30 10 20 30 10 100 40
Atletismo 30 20 20 40 20 0 40 100

Es decir el 50% de los encuestados consideran que su


conocimiento técnico del fútbol es igual al conocimiento técnico del

317


FERNANDO MAUREIRA CID

básquetbol, el 40% de los encuestados considera que su


conocimiento técnico del fútbol es igual al voleibol, etc.
Con estos datos hacemos lo siguiente:

¾ Paso 1

En el programa SPSS vamos a:

>Analizar >Escala >Escalamiento multidimensional


(PROXSCAL)

Figura 82. Pantalla formato de datos del análisis de escalamiento


multidimensional.

La opción de escalamiento multidimensional PROXSCAL se


debe utilizar cuando estudiamos la proximidad de los datos. En
la sección superior Formato de datos marcamos la opción Los
datos son distancias o Crear proximidad de los datos, en el
caso que nuestros datos no sean distancias. Presionamos
Definir y aparece una pantalla como la figura 83, donde
pasamos las variables al cuadro derecho superior.

318


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Figura 83. Pantalla es escalamiento multidimensional

¾ Paso 2
Presionamos Opciones y se abre una pantalla como la figura
84, aquí marcamos Usar actualizaciones relajadas. Luego
presionamos continuar.

Figura 84. Pantalla opciones de escalamiento multidimensional.

¾ Paso 3
Al volver a la pantalla Escalamiento multidimensional
presionamos OK. La hoja de resultados nos entrega las
siguientes tablas:
319


FERNANDO MAUREIRA CID

El Stress es una medida de la no bondad de ajuste del modelo


y Kruskal (1964) entrega la siguiente interpretación de este valor:

x 0,200 = pobre ajuste del modelo


x 0,100 = aceptable ajuste del modelo
x 0,050 = buen ajuste del modelo
x 0,025 = muy buen ajuste del modelo
x 0,000 = excelente ajuste del modelo

La tabla de medida de ajuste y stress nos entrega los índices


de stress del escalamiento multidimensional. El stress normalizado
fue de 0,024 que cae en la categoría de muy buen ajuste del
modelo. Los valores de dispersión explicada y el coeficiente de
congruencia de Tucker deben ser cercanos a 1,0 y en la tabla
observamos valores de 0,975 y 0,987 respectivamente.

En la tabla coordenada finales se observan los puntos en dos


dimensiones de cada variable estudiada (en este caso conocimiento
técnico de cada deporte). Con estos datos podemos construir el
grafico del escalamiento dimensional.

320


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Puntos de objeto
Espacio común

En el gráfico del escalamiento multidimensional del ejemplo se


observa que el conocimiento técnico de la muestra tiende a agrupar
al básquetbol, natación y gimnasia, al hándbol y fútbol, dejando en
321


FERNANDO MAUREIRA CID

forma más aislada al voleibol y tenis. Con esto se puede concluir


que la muestra posee un conocimiento técnico similar del hándbol y
fútbol, pero estos son muy diferentes al conocimiento técnico del
voleibol o tenis.

322


ESTADISTICA AVANZADA PARA EDUCACION FISICA

CAPÍTULO 8

METODOS ESTRUCTURALES

I. Ecuaciones estructurales

323


FERNANDO MAUREIRA CID

324


ESTADISTICA AVANZADA PARA EDUCACION FISICA

I
ECUACIONES ESTRUCTURALES

El método de ecuaciones estructurales (Structural Equation


Modeling SEM) corresponde a una serie de análisis estadísticos
que resultan extensiones de análisis factoriales y de regresión
múltiple. Sin embargo, el SEM posee características particulares
como la estimación y evaluación de constructos no observables
denominadas variables latentes, un constructo supuesto que sólo
puede ser medido con variables observables. Además el SEM
permite controlar el error de medición de cada variable, lo que
permite evaluar la validez de cada constructo medido. De esta
forma el SEM permite evaluar los modelos teóricos, estudiando las
relaciones causales sobre datos no experimentales que poseen una
relación lineal (Cupani, 2012).

1. CONCEPTOS BASICOS

El SEM posee los siguientes tipos de variables:

a) Variable latente: también llamada constructo o factor.


Corresponde al objeto abstracto de análisis (por ejemplo
inteligencia) que sólo puede ser observado indirectamente (por
ejemplo resultados en un test de inteligencia). Estas variables se
dividen a su vez en tres tipos:
x Variable exógena o latente independiente: aquella que afecta a
otras pero no es afectada por ninguna variable.
325


FERNANDO MAUREIRA CID

x Variable endógena o latente dependiente: aquellas que son


afectadas por otras variables.
x Variable error: son las fuentes de variaciones del modelo.

b) Variable observada: es aquella que son medidas para analizar


las variables latentes.

Las representaciones del SEM se realiza en base a cuadros


(variable observada), óvalos (variables latentes) y flechas
(relaciones entre las variables). Estas últimas pueden ser varios
tipos:

V1 V2
Relaciones causales
V1 V2

V1 V2
Relaciones espureas
V3

V1 V2
Relaciones indirectas
V3

En las relaciones causales v1 genera a v2 (pudiendo ser


inversa también v2 causa v1), también la relación causal puede ser
bidireccional. En las relaciones espureas dos variables (V1 y V2) se
relacionan porque ambas tienen una causa en común (V3). Las
relaciones indirectas ocurren cuando V1 y V2 están relacionadas a
una variable interviniente V3.

326


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Los modelos de ecuaciones estructurales pueden ser de dos


tipos:

a) Modelo de medida: muestra la relación entre variables


observadas y variables latentes, donde estas últimas están
relacionadas mediante covarianzas que se grafican con flechas
bidireccionales (fig. 85). En el caso que los indicadores
propuestos correlacionen débilmente entre sí se considera que
el modelo es erróneo.

b) Modelo de relaciones estructurales: muestra la relación y


efecto de variables latentes y los errores de predicción (fig. 86).
Este modelo describe la interrelación entre los constructos,
donde se puede distinguir que variables independientes
predicen cada variable dependiente.

e1 X1
V1
e2 X2

e3 X3
V2
e4 X4

e5 X5
V3
e6 X6

Figura 85. Modelo de ecuación estructural de medida (modificado


de Lara, 2014).

327


FERNANDO MAUREIRA CID

e1 X1
V1
e2 X2 X5 e5
V3
e3 X3 X6 e6
V2
e4 X4

Figura 86. Modelo de ecuación estructural de relaciones


estructurales (modificado de Lara, 2014).

El modelo lineal del SEM de modelo de medida es el


siguiente:

Modelo de medida= X = RX*MLex + eex (fórmula 54)


Y = RY*MLen + een

X= matriz de indicadores exógenos


RX= coeficiente de regresión entre factores exógenos y sus
indicadores.
MLex= matriz de factores latentes exógenos
eex= errores para los indicadores exógenos
Y= matriz de indicadores endógenos
RY= coeficiente de regresión entre factores endógenos y sus
indicadores
MLen= matriz de factores latentes endógenos
een= errores para los indicadores endógenos

El modelo lineal del SEM de modelo de relaciones


estructurales es el siguiente:

328


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Modelo estructural = MR en*MLen + RXY*MLex + CE (fórmula 55)

MRen= matriz de coeficientes de regresión entre variables


endógenas
MLen= matriz de variables latentes endógenas
RXY= coeficiente de regresión entre variables exógenas y
endógenas
MLex= matriz de variables latentes exógenas
CE= coeficientes residuales

2. PASOS EN LA MODELIZACIÓN DE ECUACIONES


ESTRUCTURALES

Para modelar ecuaciones estructurales es necesario realizar


seis pasos:

2.1 Especificación del modelo

Aquí se utiliza la información teórica que hay sobre un


fenómeno para modelar las ecuaciones matemáticas de las
relaciones causales de las variables latentes y las variables
observables. Mientras mayor sea la información teórica será factible
realizar un modelo que se ajuste más con la realidad.

2.2 Identificación del modelo

La identificación del modelo hace referencia a la estimación


de todos los parámetros del mismo, es decir, para cada parámetro
debe existir una expresión algebraica que se exprese en función de
las varianzas y covarianzas muestrales (Cupani, 2012).
La forma más utilizada para identificar un modelo es la regla
de los grados de libertad que se expresa en la formula siguiente:

329


FERNANDO MAUREIRA CID

gl SEM = N*(n + 1) (fórmula 56)


2

N= número de variables observadas


n= número de variables

Por ejemplo, un modelo que contenga 10 variables


observadas y 5 parámetros:

gl SEM = [10*(10+1)] / 2 = 110/2 = 55

Ahora a 55 le restamos los parámetros (5) y obtenemos un gl


SEM de 50.

Valores de gl SEM iguales a cero muestra un ajuste perfecto


del modelo, pero que no permiten generalizarlo. Valores < 0 indican
un modelo infraestimado que significa que tiene más parámetros a
estimar que información disponible. Valores > 0 indican un modelo
sobreidentificado que tiene más información en la matriz de datos
que parámetros a estimar, este es el modelo que busca determinar
un modelamiento de ecuaciones estructurales. Mientras más gl
tiene el modelo mejor se ajustan los datos.

2.3 Evaluación de los datos

Lo primero importante en los datos es el tamaño de la


muestra, la que puede calcularse en base a 10 o 20 participantes
por parámetro, una muestra mínima de 200 sujetos y a mayor
complejidad del modelo mayor muestra.
Otro aspecto importante es la no colinealidad de las variables,
calculada con correlaciones bivariadas con valores menores a 0,85.
En caso que r sea mayor a ese valor se aconseja la eliminación de
una de las variables.
Finalmente los datos deben tener una distribución normal
univariante y multivariante.
330


ESTADISTICA AVANZADA PARA EDUCACION FISICA

2.4 Estimación de parámetros

En el SEM es necesario determinar los parámetros


desconocidos y su error de medición. Los programas estadísticos
utilizan generalmente el método de máxima verosimilitud.

2.5 Bondad de ajuste del modelo

Cuando se trabaja con el SEM es necesario conocer si el


modelo es correcto, es decir, posee las restricciones y supuestos
que se cumplen en la población, además de determinar
correctamente las relaciones de las variables.
Los test de bondad de ajuste permiten decidir si la matriz de
varianzas y covarianzas muestrales son idénticas a la matriz de
varianzas y covarianzas generadas por el modelo. Para el SEM
existen varios índices de bondad de ajuste:

a) x2 de bondad de ajuste: indica si la matriz generada en el


modelo y la matriz original de los datos son diferentes cuando el
valor x2 de los datos es tan alto como el modelo o el p>0,05 el
modelo es aceptado.
b) Razón x2/gl: la relación de estos dos valores debe ser menor a 3
para mostrar un ajuste del modelo.
c) Índice ajustado normado (NFI): que evalúa la disminución del
estadístico x2 del modelo con respecto al modelo nulo. Valores •
0,90 indican un buen ajuste del modelo.
d) Índice de Tucker-Lewis (TLI): que compara el estadístico x2 con
su esperanza, los gl del modelo nulo con el modelo propuesto.
Valores • 0,90 indican un buen ajuste del modelo.
e) Índice de ajuste comparativo (CFI): que compara las
discrepancias entre la matriz de covarianzas que predice el
modelo y la matriz de covarianza observada. Valores • 0,90
indican un buen ajuste del modelo.
f) Raíz del residuo cuadrático promedio (RMR): es el promedio de
los residuos derivados del ajuste de la matriz de varianza y
331


FERNANDO MAUREIRA CID

covarianza del modelo propuesto. Valores próximos a cero


(menores a 0,05) indican un buen ajuste del modelo.
g) Raíz del residuo cuadrático promedio aproximado (RMSEA): que
corresponde al error de aproximación medio por el grado de
libertad. Valores < 0,08 indican un buen ajuste del modelo.

2.6 Reajuste del modelo e interpretación de los resultados

Si el modelo no posee una buena bondad de ajuste es


necesario volver a especificar el modelo, eliminando o añadiendo
parámetros y comenzando con todo el proceso nuevamente.
Una vez especificado un modelo adecuado es posible concluir
las relaciones entre las variables latentes y observadas y contrastar
los resultados con las teorías existentes.

3. EJEMPLO DE ECUACION ESTRUCTURAL

La muestra estuvo constituida por 242 estudiantes de


enseñanza básica de 4 colegios de Santiago de Chile. Del total de
la muestra 114 (47,1%) son damas y 128 (52,9%) varones. 68
estudiantes (28,1%) cursaban 5° básico, 49 (20,2%) sexto básico,
51 (21,2%) 7° básico y 74 (30,6%) 8° básico. Del to tal 212 (87,6%)
asistían a un colegio municipal y 30 (12,4%) a un colegio
subvencionado. La edad media de la muestra fue 11,9 años
(d.e.=1,48).
Se han utilizado dos cuestionarios, el primero mide la
percepción de los estudiantes hacia el profesor de educación física,
la cual se divide en dos sub-escalas: aspectos positivos con 5
preguntas y aspectos negativos con 4 preguntas. Todos los ítems
son tipo Likert con 5 alternativas. También se aplicó un cuestionario
de motivación por la clase de educación física compuesto por 5
ítems tipo Likert de 5 opciones.

332


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 1
Se calculan las medias, desviaciones estándar, índices de
asimetría y curtosis de todas las variables.

Media d.e. Asimetría Error Curtosis Error k2


asimetría curtosis
Xp1 4,35 0,72 -0,128 0,156 0,71 0,312 5,852
Xp2 3,97 0,97 -0,105 0,156 0,094 0,312 0,544
Xp3 3,93 1,02 -0,247 0,156 0,383 0,312 4,014
Xp4 3,89 1,00 -0,335 0,156 -0,21 0,312 5,065
Xp5 3,86 0,98 -0,104 0,156 0,201 0,312 0,859
Xn1 3,35 1,21 -0,284 0,156 -0,429 0,312 5,205
Xn2 2,04 1,08 0,159 0,156 0,059 0,312 1,075
Xn3 1,94 1,23 0,161 0,156 0,241 0,312 1,662
Xn4 1,93 1,23 0,134 0,156 0,12 0,312 0,886
Y1 4,06 0,97 -0,206 0,156 0,162 0,312 2,013
Y2 3,94 0,27 -0,211 0,156 0,185 0,312 2,181
Y3 3,41 1,29 -0,271 0,156 -0,416 0,312 4,796
Y4 3,40 1,42 -0,394 0,156 -0,128 0,312 6,547
Y5 4,02 0,98 0,256 0,156 0,142 0,312 2,900

Las variables Xp1 a Xp6 corresponden a la sub-escala de


percepciones positivas, las variables Xn1 a Xn5 a la sub-escala
percepciones negativas y de las variables Y1 a Y6 a la escala
motivación. Es posible notar que todas las variables poseen
normalidad univariante, además de todas en conjunto poseen
normalidad multivariante.
Recordemos que cada una de estas variables corresponde a
las variables observadas en el modelo de ecuaciones estructurales
(en este caso 17 variables observadas). Por su parte los
constructos no observables son los grupos a las que pertenecen las
variables observadas, es decir, la percepción positiva, la negativa y
la motivación (3 variables latentes).

¾ Paso 2
Se calculan las correlaciones entre las variables observadas.
333


FERNANDO MAUREIRA CID

En la tabla se observan correlaciones positivas y significativas


en todos los pares de ítems de la sub-escala percepción positiva, en
la sub-escala percepciones negativas y en la escala de motivación.
Correlaciones negativas y significativas entre los ítems de las sub-
escalas de percepción positiva y negativa. Correlaciones positivas
entre los ítems de la sub-escala positiva y la escala de motivación.
Finalmente, correlaciones negativas entre los ítems de la sub-
escala percepciones negativas y la escala de motivación.
Si bien existen correlaciones en casi todos los ítems de los
diversos cuestionarios, ninguno supera los 0,85 por lo cual
podemos concluir que no existe colinealidad de las variables.

¾ Paso 3
Se calcula la fiabilidad de las escalas con el alfa de Cronbach.

n° de ítems Alfa de Cronbach


Percepción positiva 5 0,714
Percepción negativa 4 0,712
Motivación 5 0,780
Total 14 0,702

Todas las escalas muestran ser confiables. Además la


eliminación de alguna variable no muestra mejora en los índices de
alfa de Cronbach de ningún cuestionario.
334


ESTADISTICA AVANZADA PARA EDUCACION FISICA

¾ Paso 4
Realizamos el diagrama del modelo.

e1 Xp1

e2 Xp2

e3 Xp3 Percepción
positiva
e4 Xp4

e5 Xp5

e6 Xn1

e7 Xn2 Percepción
negativa
e8 Xn3

e9 Xn4

e10 Y1

e11 Y2

e12 Y3 Motivación

e13 Y4

e14 Y5

¾ Paso 5
Para realizar la identificación el modelo utilizamos la fórmula 56:

335


FERNANDO MAUREIRA CID

gl SEM = [14*(14+1)] / 2 = 105

Ahora a 105 le restamos los parámetros del nuestro modelo


(31) obteniendo un gl SEM de 74, por lo que nuestro modelo es
sobreidentificado.

¾ Paso 6
Introduciendo el modelo ya generado en el paso 4 en el
programa AMOS utilizando el método de mínimos cuadrados
generalizados obtenemos la figura siguiente:

͕ϭϮ

͕ϲϮ
͕Ϭϴ
͕ϰϯ ϭ͕ϬϬ
͕ϭϳ ͕ϯϴ

͕ϱϴ
͕Ϭϰ
͕ϳϲ
͕ϮϬ

͕ϰϴ
͕ϭϴ
͕ϳϬ ϭ͕ϬϬ
͕ϮϮ ͕ϰϰ
͕ϱϮ
͕Ϭϵ ͕ϱϬ

͕ϲϭ
͕ϮϬ

͕ϭϲ ͕ϯϮ

͕ϱϮ
͕Ϯϰ
͕ϰϮ ϭ͕ϬϬ

͕Ϯϭ ͕ϳϴ

͕ϲϬ
͕ϭϰ
͕ϰϵ
͕Ϭϱ

336


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En la imagen entregada por el programa AMOS se observan


valores junto a las flechas que corresponden a las cargas factoriales
de las variables observadas, donde Y3 posee un valor de 0,78 que
es la que aporta más información a su variable latente y Xp3 con
0,38 es la variable que menos aporta a su variable latente (valores
inferiores a 0,1 se considera que aportan muy poca información al
modelo).

Estimaciones de los parámetros


Parámetro Error Proporción P
Std. crítica
Xp1 <…P. positiva 0,62 0,04 15,50 ***
Xp2 <…P. positiva 0,43 0,12 3,58 ***
Xp3 <…P. positiva 0,38 0,02 19,00 ***
Xp4 <…P. positiva 0,58 0,05 11,60 ***
Xp5 <…P. positiva 0,76 0,05 15,20 ***
Xn1 <…P. negativa 0,70 0,11 6,36 ***
Xn2 <…P. negativa 0,44 0,02 22,00 ***
Xn3 <…P. negativa 0,50 0,09 5,56 ***
Xn4 <…P. negativa 0,61 0,10 6,10 ***
Y1 <…Motivación 0,52 0,04 13,00 ***
Y2 <…Motivación 0,42 0,07 6,00 ***
Y3 <…Motivación 0,78 0,08 9,75 ***
Y4 <…Motivación 0,60 0,14 4,29 ***
Y5 <…Motivación 0,49 0,06 8,17 ***

En la tabla Estimaciones de los parámetros se observan los


valores de las cargas factoriales de cada variable observada, el
error estándar, la proporción crítica (cociente entre el parámetro y
su desviación estándar) cuyos valores son altos y por lo cual los
valores p muestran que los valores de los parámetros estimados
son significativos, de no ser así sería recomendable eliminar dicho
parámetro del modelo.

337


FERNANDO MAUREIRA CID

Covarianzas
Parámetro Error Proporción P
Std. crítica
P. positiva <…> P. negativa -0,040 0,02 -2,00 0,329
P. positiva <…> Motivación 0,329 0,14 2,35 ***
P. negativa <…> Motivación -0,067 0,05 -1,34 0,155

Correlaciones
Parámetro
P. positiva <…> P. negativa -0,032
P. positiva <…> Motivación 0,284
P. negativa <…> Motivación -0,046

En las tablas de covarianzas y correlaciones se observan las


relaciones de las variables latentes, teniendo en cuenta todos los
datos de las variables observables de cada uno. Existen
correlaciones negativas entre las percepciones positivas y negativas
y entre las percepciones negativas y motivación. Sólo hay una
relación significativa y positiva entre la percepción positiva y la
motivación.

Índices de bondad de ajuste


Medida de ajuste Modelo por Modelo Modelo de la
defecto saturado independencia
NFI 0,984 1,000 0,000
NNFI 0,963 1,000 0,000
CFI 1,000 1,000 0,000
GFI 0,991 1,000 0,432
RMR 0,041 0,000 1,135
RMSEA 0,000 0,211
LO 90 0,000 0,198
HI 90 0,023 0,256

338


ESTADISTICA AVANZADA PARA EDUCACION FISICA

En la tabla de bondad de ajuste se resumen algunos de los


estadísticos para contrastar la adecuación del modelo planteado.
Los estadísticos NFI, NNFI, CFI y GFI presentan valores sobre 0,90
lo que entrega información sobre la adecuación del modelo.
Además los índices RMR y RMSEA presentan valores cercanos a
cero (menores a 0,05 y 0,08 respectivamente).

339


FERNANDO MAUREIRA CID

340


ESTADISTICA AVANZADA PARA EDUCACION FISICA

Referencias bibliográficas

Campbell, D. & Stanley, J. (1995). Diseños experimentales y


cuasiexperimentales en investigación social. Buenos Aires:
Amorrortu Editores S. A.
Castejón, O. (2011). Diseño y análisis de experimentos con
Statistix. Maracaibo: Universidad Rafael Urdaneta.
Cuadra, C. (2014). Nuevo métodos de análisis multivariantes.
Barcelona: CMC Editions.
Cupani, M. (2012). Análisis de ecuaciones estructurales: conceptos,
etapas de desarrollo y un ejemplo de aplicación. Revista
Tesis, 1, 186-199.
De la Fuente, S. (2011). Análisis discriminante. Disponible en:
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/
SEGMENTACION/DISCRIMINANTE/analisis-
discriminante.pdf [visitado el 02 de febrero, 2016].
Echavarría, H. (2015). Diseño de bloques al azar. Disponible en:
http://www.unalmed.edu.co/~jarueda/bloque.pdf [visitado el
22 de enero, 2015).
Hurtado, J. & Gómez, L. (2015). Diseño experimental. Disponible
en: http://es.scribd.com/doc/12276230/DiseNo-de-
Experimentos-notas-de-Clases#scribd [visitado el 02 de julio,
2015].

Kuehl, R. (2001). Diseño de experimentos. México: Thomson


Learning.

Lara, A. (2014). Introducción a las ecuaciones estructurales en


AMOS y R. Disponible en:
http://masteres.ugr.es/moea/pages/curso201314/tfm1314/tfm-
septiembre1314/memoriamasterantonio_lara_hormigo/!
[visitado el 05 de febrero, 2016].
341


FERNANDO MAUREIRA CID

Levy, J. y Varela, J. (2006). Modelización con estructuras de


covarianzas en ciencias sociales. España: Gesbiblo.

Maureira, F. (2015). Estadística básica para educación física.


Madrid: Editorial Académica Española.
Maureira, F. & Flores, E. (2012). Manual de investigación científica
para estudiantes de educación física. Madrid: Editorial
Académica Española.
Montanero, J. (2008). Análisis multivariante. España: Universidad
de Extremadura.
Montgomery, D. (2004). Diseño de experimentos. México: Limusa
Wiley.
Peña, D. (2002). Análisis de datos multivariantes. Madrid: McGraw-
Hill Interamericana de España.
Pérez, C. (2004). Técnicas de análisis multivariados de datos:
aplicaciones con SPSS. Madrid: Pearson Educación.





342


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ANEXOS

343


FERNANDO MAUREIRA CID

344


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ANEXO 1

n para diferentes niveles de potencia


d ȕ Potencia n d ȕ Potencia n
3,0 0,01 0,99 5 3,0 0,05 0,95 4
2,5 0,01 0,99 6 2,3 0,05 0,95 5
2,1 0,01 0,99 7 2,0 0,05 0,95 6
2,0 0,01 0,99 8 1,8 0,05 0,95 7
1,8 0,01 0,99 9 1,6 0,05 0,95 8
1,6 0,01 0,99 10 1,5 0,05 0,95 9
1,5 0,01 0,99 11 1,4 0,05 0,95 10
1,4 0,01 0,99 12 1,3 0,05 0,95 11
1,3 0,01 0,99 14 1,2 0,05 0,95 13
1,2 0,01 0,99 15 1,1 0,05 0,95 14
1,1 0,01 0,99 18 1,0 0,05 0,95 15
1,0 0,01 0,99 20 0,9 0,05 0,95 20
0,9 0,01 0,99 25 0,8 0,05 0,95 25
0,8 0,01 0,99 30 0,7 0,05 0,95 30
0,7 0,01 0,99 40 0,6 0,05 0,95 40
0,6 0,01 0,99 50 0,5 0,05 0,95 63
0,5 0,01 0,99 88 0,4 0,05 0,95 88
0,4 0,01 0,99 100

d ȕ Potencia n d ȕ Potencia n
3,0 0,10 0,90 4 3,0 0,15 0,85 4
2,0 0,10 0,90 5 1,8 0,15 0,85 5
1,8 0,10 0,90 6 1,6 0,15 0,85 6
1,5 0,10 0,90 7 1,4 0,15 0,85 7
1,4 0,10 0,90 8 1,3 0,15 0,85 8
1,3 0,10 0,90 9 1,2 0,15 0,85 9
1,2 0,10 0,90 10 1,1 0,15 0,85 10
1,1 0,10 0,90 12 1,0 0,15 0,85 12
1,0 0,10 0,90 14 0,9 0,15 0,85 14
0,9 0,10 0,90 15 0,8 0,15 0,85 16
0,8 0,10 0,90 20 0,7 0,15 0,85 20
0,7 0,10 0,90 25 0,6 0,15 0,85 28
0,6 0,10 0,90 30 0,5 0,15 0,85 40
0,5 0,10 0,90 45 0,4 0,15 0,85 50
0,4 0,10 0,90 63 0,3 0,15 0,85 88
0,3 0,10 0,90 100

345


FERNANDO MAUREIRA CID

d ȕ Potencia n
3,0 0,20 0,80 4
1,7 0,20 0,80 5
1,3 0,20 0,80 7
1,0 0,20 0,80 10
0,9 0,20 0,80 13
0,8 0,20 0,80 15
0,7 0,20 0,80 18
0,6 0,20 0,80 25
0,5 0,20 0,80 33
0,4 0,20 0,80 40
0,3 0,20 0,80 75

346


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ANEXO 2

Tabla de valores críticos para la prueba F (Į 


gl 1 2 3 4 5 6 7 8
1 161,45 199,50 215,70 224,58 230,16 233,99 236,77 238,88
2 18,51 19,00 19,16 19,25 19,23 19,33 19,35 19,37
3 10,13 9,55 9,27 9,12 9,01 8,94 8,89 8,85
4 7,71 6,94 6,60 6,39 6,26 6,16 6,09 6,04
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15
7 5,60 4,73 4,35 4,12 3,97 3,87 3,79 3,73
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44
9 5,12 4,23 3,86 3,63 3,48 3,37 3,29 3,23
10 4,97 4,10 3,71 3,45 3,33 3,22 3,14 3,07
11 4,84 3,98 3,59 3,36 3,20 3,10 3,01 2,95
12 4,75 3,89 3,49 3,26 3,11 2,97 2,91 2,85
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59
17 4,45 3,59 3,20 2,97 2,81 2,70 2,61 2,55
18 4,41 3,56 3,16 2,93 2,77 2,66 2,58 2,51
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45
21 4,32 3,47 3,07 2,84 2,69 2,57 2,49 2,42
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,38
24 4,26 3,40 3,01 2,78 2,62 2,51 2,41 2,34
25 4,24 3,39 2,99 2,76 2,60 2,49 2,41 2,34
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27
31 4,16 3,31 2,91 2,68 2,52 2,41 2,32 2,26
32 4,15 3,30 2,90 2,67 2,51 2,40 2,31 2,24
33 4,14 3,29 2,89 2,66 2,50 2,39 2,30 2,24
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23
35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21
37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20

gl 1 2 3 4 5 6 7 8
347


FERNANDO MAUREIRA CID

38 4,10 3,25 2,85 2,62 2,46 2,35 2,26 2,19


39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19
40 4,09 3,23 2,84 2,61 2,45 2,34 2,25 2,18
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06
90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03
120 3,92 3,07 2,69 2,45 2,29 2,18 2,09 2,02
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,99
500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96

Prueba F (continuación)
gl 9 10 15 20 30 40 120 500
1 240,54 241,88 245,95 248,01 250,10 251,14 253,25 254,06
2 19,39 19,40 19,43 19,45 19,46 19,47 19,49 19,49
3 8,81 8,79 8,70 8,66 8,62 8,59 8,55 8,53
4 6,00 5,96 5,86 5,80 5,75 5,72 5,66 5,64
5 4,77 4,74 4,62 4,56 4,50 4,46 4,40 4,37
6 4,10 4,06 3,94 3,87 3,81 3,77 3,71 3,68
7 3,68 3,64 3,51 3,45 3,38 3,34 3,27 3,24
8 3,39 3,35 3,22 3,15 3,08 3,04 2,97 2,94
9 3,18 3,14 3,01 2,94 2,90 2,83 2,75 2,71
10 3,02 2,98 2,85 2,77 2,70 2,66 2,58 2,55
11 2,90 2,86 2,72 2,65 2,57 2,53 2,45 2,42
12 2,80 2,74 2,62 2,54 2,47 2,43 2,34 2,31
13 2,71 2,67 2,53 2,46 2,38 2,34 2,25 2,19
14 2,65 2,60 2,46 2,39 2,31 2,27 2,18 2,14
15 2,59 2,54 2,40 2,33 2,25 2,20 2,11 2,08
16 2,54 2,49 2,35 2,28 2,19 2,15 2,06 2,02
17 2,49 2,45 2,31 2,23 2,15 2,10 2,01 1,97
18 2,46 2,41 2,27 2,19 2,11 2,06 1,97 1,93
19 2,42 2,38 2,23 2,16 2,07 2,03 1,93 1,89
20 2,39 2,35 2,20 2,12 2,04 1,99 1,90 1,86
21 2,37 2,32 2,18 2,10 2,01 1,97 1,87 1,83

gl 9 10 15 20 30 40 120 500

348


ESTADISTICA AVANZADA PARA EDUCACION FISICA

22 2,34 2,30 2,15 2,07 1,98 1,94 1,84 1,80


23 2,32 2,28 2,13 2,05 1,96 1,91 1,81 1,77
24 2,30 2,26 2,11 2,03 1,94 1,89 1,79 1,75
25 2,28 2,24 2,09 2,01 1,92 1,87 1,77 1,73
26 2,27 2,22 2,07 1,99 1,90 1,85 1,75 1,71
27 2,25 2,20 2,06 1,97 1,88 1,84 1,73 1,69
28 2,24 2,19 2,04 1,96 1,87 1,82 1,71 1,67
29 2,22 2,18 2,03 1,95 1,85 1,81 1,70 1,65
30 2,21 2,17 2,02 1,93 1,84 1,79 1,68 1,64
31 2,20 2,15 2,00 1,92 1,83 1,78 1,67 1,62
32 2,19 2,14 1,99 1,91 1,82 1,77 1,66 1,61
33 2,18 2,13 1,98 1,90 1,81 1,76 1,65 1,60
34 2,17 2,12 1,97 1,89 1,80 1,75 1,63 1,59
35 2,16 2,11 1,96 1,88 1,79 1,74 1,62 1,57
36 2,15 2,11 1,95 1,87 1,78 1,73 1,61 1,56
37 2,15 2,10 1,95 1,86 1,77 1,72 1,60 1,55
38 2,14 2,09 1,94 1,85 1,76 1,71 1,59 1,54
39 2,13 2,08 1,93 1,85 1,75 1,70 1,59 1,54
40 2,12 2,07 1,92 1,84 1,74 1,69 1,58 1,53
50 2,07 2,03 1,87 1,78 1,69 1,63 1,51 1,46
60 2,04 1,99 1,84 1,75 1,65 1,59 1,47 1,41
70 2,02 1,97 1,81 1,72 1,62 1,57 1,44 1,37
80 2,00 1,95 1,79 1,70 1,60 1,55 1,41 1,35
90 1,99 1,94 1,78 1,69 1,59 1,53 1,39 1,33
100 1,98 1,93 1,77 1,68 1,57 1,52 1,38 1,31
120 1,96 1,91 1,75 1,66 1,55 1,50 1,35 1,28
200 1,93 1,88 1,72 1,62 1,52 1,46 1,30 1,22
500 1,90 1,85 1,69 1,59 1,48 1,42 1,26 1,16

349


FERNANDO MAUREIRA CID

ANEXO 3

Tabla de valores críticos para la prueba KS


gl 0,05 0,01
1 0,975 0,995
2 0,842 0,929
3 0,708 0,828
4 0,624 0,733
5 0,565 0,669
6 0,521 0,618
7 0,486 0,577
8 0,457 0,543
9 0,432 0,514
10 0,401 0,49
11 0,391 0,468
12 0,375 0,45
13 0,361 0,433
14 0,349 0,418
15 0,338 0,404
16 0,328 0,392
17 0,318 0,382
18 0,309 0,371
19 0,301 0,363
20 0,295 0,356
25 0,27 0,32
30 0,24 0,29
35 0,23 0,27
40 0,21 0,25
45 0,20 0,24
50 0,19 0,23
Para n > 1,36 / n 1,63 / n

350


ESTADISTICA AVANZADA PARA EDUCACION FISICA

ANEXO 4

Tabla de valores críticos para la prueba Q (Tukey-Snedecor)




N° de grupos

gl 2 3 4 5 6 7 8 9
1 17,97 26,98 32,82 37,08 40,41 43.12 45,40 47,36
2 6,08 8,28 9,80 10,89 11,73 12,43 13,03 13,54
3 4,50 5,91 6,83 7,51 8,04 8,47 8,85 9,18
4 3,93 5,04 5,76 6,29 6,70 7,06 7,35 7,60
5 3,64 4,60 5,22 5,67 5,93 6,38 6,58 6,80
6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32
7 3,34 4,16 4,68 5,06 5,35 5,59 5,82 5,99
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77
9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60
10 3,15 3,88 4,33 4,66 4,91 5,12 5,30 5,46
11 3,11 3,82 4,26 4,58 4,82 5,03 5,20 5,35
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27
13 3,06 3,73 4,15 4,46 4,69 4,88 5,05 5,19
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08
16 3,00 3,65 4,05 4,34 4,56 4,74 4,90 5,03
17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99
18 2,97 3,61 4,00 4,28 4,49 4,67 4,83 4,96
19 2,96 2,59 3,98 4,26 4,47 4,64 4,79 4,92
20 2,95 3,58 3,96 4,24 4,45 4,62 4,77 4,90
30 2,89 3,48 3,84 4,11 4,30 4,46 4,60 4,72
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55
120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47
’ 2,77 3,32 3,63 3,86 4,03 4,17 4,29 4,39


351


FERNANDO MAUREIRA CID

ANEXO 5

Tabla de valores críticos para la prueba X2

gl 0,05 0,01 gl 0,05 0,01


1 3,841 6,635 22 33,924 40,289
2 5,991 9,210 23 35,172 41,638
3 7,815 11,345 24 36,415 42,979
4 9,488 13,277 25 37,652 44,314
5 11,070 15,086 26 38,885 45,641
6 12,591 16,811 27 40,113 46,962
7 14,067 18,475 28 41,337 48,278
8 15,507 20,090 29 42,557 49,587
9 16,919 21,666 30 43,773 50,892
10 18,307 23,209 31 44,985 52,191
11 19,675 24,725 32 46,194 53,485
12 21,026 26,217 33 47,399 54,775
13 22,362 27,688 34 48,602 56,060
14 23,684 29,141 35 49,801 57,342
15 24,995 30,577 36 50,998 58,619
16 26,296 31,999 37 52,192 59,892
17 27,587 33,408 38 53,383 61,162
18 28,869 34,805 39 54,572 62,428
19 30,143 36,190 40 55,758 63,690
20 31,410 37,566 50 67,504 76,153
21 32,670 38,932 100 124,342 135,806


352

You might also like