You are on page 1of 8

Anlise fatorial em R

1. Dados
Referem-se a n = 54 observaes de p = 7 variveis apresentadas na Tabela 1.9, p. 44 em
Jonson and !i"ern #$%%7, Applied Multivariate Statisitical Analysis, si&t ed. 'pper (addle River,
)J* +earson,+renti"e -all.. /s dados en"ontram-se na p0ina
ttp*,,111.stat.1is".ed2,3ri",J!4'5T%6dat,T1-9.dat. /s dados s7o de $%%5 e di8em respeito aos
re"ordes femininos em 54 pa9ses, listados na primeira "ol2na do ar:2ivo. ;s demais "ol2nas "ont<m os
res2ltados das se02intes provas #2nidades.* 1%% m #s., $%% m #s., 4%% m #s., =%% m #min., 15%% m
#min., >%%% m #min. e maratona #min.. / "omando para leit2ra dos dados na lina abai&o deve ser
"ompletado. ; "ol2na "om os nomes dos pa9ses ? e&"l29da.
dados <-
dados <- dados[, -1]
p <- ncol(dados)
;l02mas medidas res2mo s7o apresentadas em se02ida. +or en:2anto as variveis s7o
identifi"adas pelos "@di0os A$ #1%% m. a A= #maratona..
summary(dados)
V2 V3 V4 V5
Min. :1.4! Min. :21.34 Min. :4".# Min. :1.$!
1s% &u.:11.12 1s% &u.:22.5" 1s% &u.:4!.!" 1s% &u.:1.!"
M'dian :11.32 M'dian :22.!$ M'dian :51.#5 M'dian :2.5
M'an :11.3# M'an :23.12 M'an :51.!! M'an :2.22
3rd &u.:11.5" 3rd &u.:23.#1 3rd &u.:53.12 3rd &u.:2."
Ma(. :12.52 Ma(. :25.!1 Ma(. :#1.#5 Ma(. :2.2!
V# V" V$
Min. :3.$4 Min. : $.1 Min. :135.2
1s% &u.:4.3 1s% &u.: $.543 1s% &u.:143.5
M'dian :4.1 M'dian : $.$45 M'dian :14$.4
M'an :4.1$! M'an : !.$1 M'an :153.#
3rd &u.:4.33$ 3rd &u.: !.325 3rd &u.:15"."
Ma(. :5.42 Ma(. :13.12 Ma(. :221.1
;s variveis s7o medidas em 2nidades diferentes. ; anlise ser apli"ada B matri8 de "orrelaes
amostral.
Cni"ialmente "al"2lamos a matri8 de "orrelaes amostral.
ma%cor <- cor(dados)
prin%(ma%cor, di)i%s * 2)
V2 V3 V4 V5 V# V" V$
V2 1. .!4 .$" .$1 ."$ ."3 .#"
V3 .!4 1. .!1 .$2 .$ ."3 .#$
V4 .$" .!1 1. .$1 ."2 .#" .#$
V5 .$1 .$2 .$1 1. .!1 .$" .$5
V# ."$ .$ ."2 .!1 1. .!" ."!
V" ."3 ."3 .#" .$" .!" 1. .$
V$ .#" .#$ .#$ .$5 ."! .$ 1.
1
Todas as "orrelaes amostrais s7o positivas e variam de %,67 a %,97, "orrespondendo aos pares #A4,
A7. e #A6, A7., respe"tivamente. /s 0rfi"os de dispers7o e as "orrelaes amostrais est7o
representadas na Di0. 1.
Di02ra 1. 4atri8 de 0rfi"os de dispers7o e "orrelaes amostrais.
'ma matri8 de "orrelaes tamb?m pode ser representada em 2m "or0rama, :2e est
implementado em R na f2n7o corr)ram do pa"ote "orr0ram. )o "omando abai&o o primeiro
ar02mento ? a matri8 de "orrelaes #poderia ser a matri8 de dados n E p.. / se02ndo ar02mento
informa :2e estamos 2sando 2ma matri8 de "orrelaes #%yp' * +cor+..
li,rary(corr)ram)
corr)ram(ma%cor, %yp' * +cor+, lo-'r.pan'l * pan'l.s.ad', upp'r.pan'l * pan'l.pi')
)a Di0. $ todas as "orrelaes est7o em "or a82l por:2e s7o positivas, "om tons mais fortes para as
"orrelaes mais altas. +ara estas, o Fn02lo #sentido orrio. no 0rfi"o de setores do painel s2perior
#upp'r.pan'l * pan'l.pi'. ? maior.
2. Medidas de adequao amostral
(7o 2tili8adas para avaliar se ? ade:2ado analisar os dados "om a t?"ni"a de anlise fatorial.
'ma delas ? o teste de esferi"idade de Gartlett. Haso a ip@tese n2la n7o seIa reIeitada, a t?"ni"a n7o ?
re"omendada.
$
Di02ra $. Hor0rama das variveis.
/2tras medidas s7o baseadas em "oefi"ientes de "orrela7o entre os pares de variveis Xj e Xm,
j m. /s res9d2os da re0ress7o de Xj "omo varivel resposta e Xl, l J j , l J m, "omo variveis
e&pli"ativas s7o denotados por dji, i = 1, ..., n. /s res9d2os da re0ress7o de Xm "omo varivel resposta e
Xl, l J j , l J m, "omo variveis e&pli"ativas s7o denotados por dmi, i = 1, ..., n. / "oefi"iente de
"orrela7o par"ial amostral entre Xj e Xm ? definido "omo sendo o "oefi"iente de "orrela7o linear entre
os res9d2os #dji, dmi., i = 1, ..., n. K denotado por rpjm, "om rpjj = %, j = 1, L, p. )este "l"2lo as
variveis Xl, l J j , l J m, s7o mantidas fi&as #di8emos :2e "ontrolamos estas variveis.. (e o2ver 2ma
asso"ia7o linear e&pressiva entre as variveis, :2e ? deseIvel para 2ma apli"a7o bem s2"edida da
t?"ni"a de anlise fatorial, M rpjm | deve ser pe:2eno "omparado a M rjm |, sendo :2e rjm representa o
"oefi"iente de "orrela7o linear entre Xj e Xm. Da8endo T = R
1
, em :2e R ? a matri8 de "orrelaes
amostral, pode ser provado :2e

'ma medida 0lobal de ade:2a7o amostral ? dada pela estat9sti"a N4/ #Naiser-4eOer-/lPinQ vide
R8i2ban and (irPeO, 1974, Psychological Bulletin =1, >5=S>61., "2Ia e&press7o ?

>
'ma medida de ade:2a7o amostral para a varivel Xj ? dada por

; Tabela 1 apresenta 2ma s9ntese #s20est7o. da ade:2a7o amostral #em trad27o livre..
Tabela 1. ;de:2a7o amostral se02ndo a medida N4/.
N4/ ;de:2a7o
T %,9 U&"elente
#%,=Q %,9V 4erit@ria
#%,7Q %,=V Cntermediria
#%,6Q %,7V 4ed9o"re
#%,5Q %,6V 49sera
W %,5 Cna"eitvel
;s "orrelaes par"iais podem ser "al"2ladas "om a f2n7o par%ial.cor do pa"ote R"mdr.
par%ial.cor <- /unc%ion (0, ...)
1
2 <- cor(0, ...)
23 <- sol4'(2)
5 <- 16s7r%(dia)(23))
2p <- -23 8 (5 9o9 5)
dia)(2p) <-
ro-nam's(2p) <- colnam's(2p) <- colnam's(0)
2p
:
ma%corp <- par%ial.cor(dados)
;0ora podemos obter as estat9sti"as de ade:2a7o N4/ e 4;;. )a primeira lina abai&o,
idia) representa as posies da dia0onal prin"ipal :2ando os elementos de 2ma matri8 p E p s7o
arma8enados em 2m vetor.
idia) <- s'7(1, ,y * p ; 1, l'n)%. * p)
somar2 <- sum((as.num'ric(ma%cor)[-idia)])<2)
ca%(+=n >M? * +,somar2 6 (somar2 ; sum((as.num'ric(ma%corp)[-idia)])<2)))
>M? * .$1#"#5
; ade:2a7o amostral ? a"eitvel #T %,5. e merit@ria. ;s medidas 4;; s7o "al"2ladas para "ada
varivel.
4
/or (@ in 1:p) 1
somar2@ <- sum(ma%cor[@, -@]<2)
ca%(+=n MAA+, @, +*+, somar2@ 6 (somar2@ ; sum(ma%corp[@, -@]<2)))
:
MAA 1 * .$$$1!"" MAA 5 * ."4143
MAA 2 * ."$24#" MAA # * ."5!!!55
MAA 3 * .$5$"344 MAA " * .$""3#4!
MAA 4 * .$4#242#
Todas as variveis t<m ade:2a7o s2perior a %,7.
3. Anlise fatorial
/s fatores ser7o obtidos #o2 e&tra9dos. apli"ando o m?todo dos "omponentes prin"ipais "om a
matri8 de "orrelaes amostral.
acpcor <- prcomp(dados, scal' * B2CD)
summary(acpcor)
3mpor%anc' o/ compon'n%s:
EF1 EF2 EF3 EF4 EF5 EF# EF"
G%andard d'4ia%ion 2.4!! ."!2! .52$5 .352!2 .31# .2334! .11!5!
Eropor%ion o/ Varianc' .$2!" .$!$1 .3!! .1""! .13 .""! .24
Fumula%i4' Eropor%ion .$2!" .!1!4" .!5!4 .!""1" .!!2 .!!"!# 1.
/ primeiro "omponente prin"ipal responde por "er"a de =>X da variFn"ia total dos dados
padroni8ados, ao passo :2e se tomarmos os dois primeiros "omponentes a propor7o ? "er"a de 9$X da
variFn"ia total. / 0rfi"o da Di0. > indi"a :2e dois "omponentes a reter ? 2m nYmero ade:2ado.
plo%(1:ncol(dados), acpcorHsd'4<2, %yp' * +,+, (la, * +Fompon'n%'+,
yla, * +VariIncia+, pc. * 2, c'(.a(is * 1.3, c'(.la, * 1.3)
Di02ra >. Zrfi"o de es"arpa.
5
; anlise fatorial ser baseada em dois fatores, "om "ar0as fatoriais dadas abai&o.
J <- 2
car/a% <- acpcorHro%a%ion[, 1:J] 989 dia)(acpcorHsd'4[1:J])
colnam's(car/a%) <- pas%'(+Ka%or+, 1:J, s'p * + +)
Ka%or 1 Ka%or 2
V2 -.!13"$ .322$53
V3 -.!234!! .32"!#"3
V4 -.$$#!3" .3#4222
V5 -.!513$32 -.12"$522
V# -.!3$$5 -.245"#2
V" -.!#35# -.33554$1
V$ -.$5#43 -.3$#!#
)ota 1. Hal"2le as "ar0as fatoriais de o2tra forma, sem a f2n7o dia).
Hom as "ar0as fatoriais passamos B estima7o das "om2nalidades e das variFn"ias espe"9fi"as.
comum <- ro-Gums(car/a%<2)
4'sp'c <- dia)(ma%cor) - comum
's%ima% <- c,ind(comum, 4'sp'c, dia)(ma%cor))
ro-nam's('s%ima%) <- colnam's(dados)
colnam's('s%ima%) <- c(+Fomunalidad'+, +VariIncia Lnica+, +VariIncia+)
Fomunalidad' VariIncia Lnica VariIncia
V2 .!3325 .##!"!54 1
V3 .!#413 .3!5$"4 1
V4 .!1!33" .$#!#2$ 1
V5 .!214"#2 ."$523"# 1
V# .!45"4 .5!!42#3 1
V" .!34#3! .#5!3#1 1
V$ .$2"!$32 .1"21#"# 1
;s variFn"ias #amostrais. s7o i02ais a 1 por:2e a anlise foi baseada na matri8 de "orrelaes amostral.
/ menor valor de "om2nalidade ? %,=>, de modo :2e temos indi"aes de 2m bom aI2ste do modelo
aos dados.
; matri8 de res9d2os do aI2ste do modelo ? dada por
r'sid <- ma%cor - (car/a% 989 %(car/a%) ; dia)(4'sp'c))
"om elementos na dia0onal prin"ipal i02ais a % #por :2<[. e "om a propriedade
6
)este e&emplo, o lado es:2erdo da e&press7o a"ima vale %,%49 #sum(r'sid<2). e no lado direito
obtemos %,564 #sum(acpcorHsd'4[(J ; 1):p]<2)., "orrespondendo a "er"a de =X da
variFn"ia total #por :2<[.. Temos indi"aes de 2m aI2ste satisfat@rio do modelo.
Aisando a2&iliar na interpreta7o dos fatores, reali8amos 2ma rota7o pelo m?todo varima&. ;
f2n7o 4arima( en"ontra-se no pa"ote stats.
car/a%r <- 4arima((car/a%)
/s 0rfi"os da Di0. 4 mostram as estimativas das "ar0as fatoriais das variveis sem e "om rota7o pelo
m?todo varima&, respe"tivamente.
plo%(car/a%, pc. * 2, col * +r'd+, (la, * +Ka%or 1+, yla, * +Ka%or 2+)
%'(%(car/a%, ro-nam's(car/a%), ad@ * 1)
plo%(car/a%rHloadin)s, pc. * 2, col * +r'd+, (la, * +Ka%or 1+, yla, * +Ka%or 2+)
%'(%(car/a%rHloadin)s, ro-nam's(car/a%), ad@ * 1)
#a.
#b.
Di02ra 4. Har0as dos fatores 1 e $ antes #a. e ap@s rota7o pelo m?todo varima& #b..
Homparando os 0rfi"os da Di0. 4, per"ebemos :2e ap@s a rota7o pelo m?todo varima& 2ma
separa7o mais n9tida das variveis em rela7o aos fatores. )a Di0. 4#b. as variveis A5, ..., A= t<m
"ar0as mais altas #em valor absol2to. no fator 1, ao passo :2e A$, A> e A4 t<m "ar0as mais altas no
fator $. Hons2ltando a des"ri7o das variveis, os fatores podem ser denominados "omo desempeno
em provas de distFn"ias mais "2rtas e desempeno em provas de distFn"ias mais lon0as.
7
)ota $. ;p@s a rota7o varima&, as estimativas das "om2nalidades
#ro-Gums(car/a%rHloadin)s<2). "oin"idem "om as estimativas I obtidas #vide comum.. +or :2<[
)ota >. /btena 2ma sol27o "om o m?todo de rota7o proma& #f2n7o proma(. e "ompare "om a
sol27o a:2i apresentada.
)ota 4. ; f2n7o /ac%anal do pa"ote stats em R permite reali8ar 2ma anlise fatorial a partir de
2ma matri8 de dados n p o2 a partir de 2ma matri8 de "ovariFn"ias #o2 de "orrelaes. p p. /
m?todo de estima7o ? o de m&ima verossimilana apli"ado a 2ma distrib2i7o normal m2ltivariada.
)ota 5. +ro"2re reprod28ir os res2ltados 2tili8ando o2tros pa"otes estat9sti"os #por e&emplo, (;(,
4initab, (+(( e (tatisti"a..
=