Professional Documents
Culture Documents
, de tal forma
que ele, admitindo-se as hipteses 1, 2 e 3, um estimador consistente para os
38
coeficientes populacionais. Se ainda, admitirmos a hiptese de exogeneidade
estrita, ento o estimador de MQO no viesado:
( ) Y X X X ' '
1
= |
(3.3)
3.1.2 A Correo do Vis de Auto-Seleo
Se a amostra observada no for aleatria, os coeficientes deixam de ser no-
viesados. Para estes casos, existe um truncamento incidental da varivel
dependente, causado pela excluso no aleatria de observaes em nossa
amostra (Greene, pg.780-781). O mtodo mais utilizado na literatura, para
corrigir a auto-seleo, o de correo em dois estgios de Heckman (Heckman,
1979) e que ser utilizado neste trabalho.
Os dados do ENEM apresentam esse truncamento, uma vez que a participao
no exame facultativa
3
. O mtodo consiste em estimar duas regresses
subsequentes, sendo a primeira, um modelo probit que calcula a probabilidade do
indivduo entrar na amostra. O segundo modelo consiste em estimar os
coeficientes dos regressores que explicam a varivel dependente por meio do
mtodo de mnimos quadrados ordinrios, corrigido pela propenso do indivduo
no entrar na amostra, isto , a razo inversa de Mills, calculada com base no
primeiro estgio. A seguir o mtodo ser explicado em detalhes.
3.1.2.1 Metodologia da Correo do Vis de Auto-Seleo
Na primeira etapa da correo de Heckman, precisamos de informaes tanto
sobre os candidatos que no fizeram a prova, quanto daqueles que a prestaram.
Nessa etapa, a varivel dependente toma uma forma binria, com valor 1 se o
indivduo fez a prova e valor 0 se no fez a prova. Alm disso, necessrio um
3
A participao dos estudantes no ENEM cresceu consecutivamente em todas as edies, o que
pode atenuar o vis de auto-seleo.
39
vetor de variveis explicativas para que possamos explicar a propenso de
comparecer ao exame como funo destas variveis.
A abordagem da correo de Heckman pressupe que as variveis explicativas
utilizadas no segundo estgio um subgrupo daquelas utilizadas no primeiro
estgio. Como a proposta desta dissertao utilizar variveis diferentes para
cada perodo, ressaltamos que esta metodologia desvia-se, em parte, daquela
originalmente proposta por Heckman (1979). No nosso caso, utilizamos apenas
variveis da escola, que no aparecem no segundo estgio.
Com as informaes da escola, foi estimado um modelo probit para a
probabilidade de o candidato prestar o exame:
i i i
u Z p
1
' *
+ =
(3.4)
) 1 , 0 ( ~
1
N u
i
(3.4b)
Em que
*
i
p
uma varivel latente que representa a propenso do indivduo em
prestar o exame do ENEM, mas que no observada. A informao observada
se o mesmo comparece ao exame ou no. A matriz representa as variveis
explicativas para a presena no exame, o vetor de coeficientes.
Se
0
*
>
i
p
, de modo que
'
1 i i
Z u >
, ento
1 =
i
p
. Dessa forma, considera-
se que o indivduo i compareceu ao exame.
Se
0
*
s
i
p
, de modo que
'
1 i i
Z u s
, ento
0 =
i
p
. Dessa forma, considera-
se que o indivduo i no compareceu ao exame.
No caso da base de dados do ENEM, no temos informaes sobre os jovens
que no se inscreveram no exame, tampouco dos que se inscreveram e no
compareceram prova. Diferentemente, por exemplo, de informaes sobre
migrao, mercado de trabalho ou fecundidade no Censo populacional, em que
temos informao sobre todos os indivduos.
i
Z
40
Os dados no permitem fazer a correo de maneira direta, uma vez que
necessitamos das informaes dos jovens que no prestaram o exame para que
possamos calcular a probabilidade da presena em funo de variveis
observadas. Logo, a estratgia adotada para corrigir o vis de seleo consiste
em trs passos.
O primeiro passo foi calcular, para cada escola, a quantidade de alunos que esto
no 3 ano do ensino mdio e que compareceram ao exame, utilizando o
questionrio do ENEM 2008. Em seguida, calculou-se o nmero total de alunos
no 3 ano do ensino mdio em cada escola por meio do Censo Escolar 2008 e,
por fim, esta informao foi inserida na base de dados do ENEM por meio da
varivel identificadora PK_COD_ENTIDADE, comum a ambas as bases, para
ento, calcular a proporo desejada.
No segundo passo, foram selecionadas aquelas escolas cuja participao
calculada foi inferior a 10%, assumindo que todos os alunos dessa escola no
fizeram a prova. Em seguida, selecionamos aquelas escolas cuja participao foi
superior a 90%, assumindo presena no exame a todos os alunos dela
4
.
Com isso, atribumos ausncia na prova para algumas observaes, ainda que,
artificialmente, com valores vlidos para as variveis explicativas. Esse mtodo
pressupe que as caractersticas de alunos provenientes de escolas com baixo
percentual de presena sejam parecidas.
Com a amostra do primeiro estgio formada, estimou-se a probabilidade do
candidato prestar o exame a partir dos dados da escola que frequenta, obtendo
assim, a probabilidade estimada. Com isso, foi possvel estimar a razo inversa
de Mills, que mede o risco do indivduo no ser selecionado. Heckman (1979,
pg. 156) explica que a razo inversa de Mills uma funo monotonicamente
decrescente da probabilidade de um indivduo ser selecionado para a amostra.
4
A escolha da proporo de 10% e 90% foi baseada nos resultados de vrias estimaes do
modelo de correo de Heckman com propores diferentes. A comparao dos resultados
mostrou que essa relao apresenta uma boa separao entre os grupos, sem que fossem
perdidas muitas observaes no segundo estgio.
41
O ltimo passo foi estimar o segundo estgio, isto , estimar a nota do ENEM em
funo de variveis independentes e relevantes para a proficincia do estudante,
representadas pela matriz
i
X , considerando tambm, o erro do primeiro estgio.
Para corrigir o vis utilizando o modelo do primeiro estgio, utilizou-se a razo
inversa de Mills, denominada por
i
(
)
(
'
'
i
i
i
Z
Z
u
=
(3.7)
= ) , (
2 1 i i
u u corr
(3.8)
Onde (.) | e (.) u representam, respectivamente, a funo de densidade de
probabilidade e funo de probabilidade acumulada da distribuio normal. Com a
introduo da razo inversa de Mills para corrigir o vis de seleo no segundo
estgio, obtemos coeficientes no-viesados para os efeitos marginais da funo
de produo educacional.
Para calcular a correlao entre os erros do primeiro e segundo estgios,
utilizamos o mtodo proposto por Heckman (1979, pg.157), que estima o
coeficiente de correlao consistente. Definindo SQR como a soma do quadrado
dos resduos do segundo estgio, temos que:
( ) o
'
i i i i
Z =
(3.9)
42
N
SQR
N
i
i m
=
+
=
1
2
2
o |
o
(3.10)
o
|
m
=
(3.11)
3.1.3 A Violao da Hiptese de Amostras Independentes e
Identicamente Distribudas
A seguir, foram utilizados modelos hierrquicos lineares para estimar a funo de
produo educacional. A outra caracterstica das bases de dados de educao
que enviesa os coeficientes da regresso linear clssica a sua estrutura
hierrquica. As observaes individuais, em sua maioria, no so totalmente
independentes, como postula uma das hipteses bsicas do mtodo de mnimos
quadrados ordinrios. A consequncia disso que a correlao mdia (ou intra-
classe) entre variveis, considerando estudantes de uma mesma escola, maior
que a correlao mdia entre variveis considerando indivduos de escolas
diferentes (HOX, 2002, pg.05).
A violao da hiptese de independncia dos dados faz com que as estimativas
de erros-padro dos testes estatsticos sejam menores, o que pode resultar em
resultados significativos, porm esprios.
O mtodo dos modelos hierrquicos lineares considera o agrupamento no-
aleatrio dos dados, isto , o fato de que os estudantes no esto igualmente
distribudos na populao, pelo contrrio, frequentam escolas muito distintas.
Assim, no podemos ignorar o fato de que o desempenho de um aluno seja
influenciado pelas caractersticas da escola que freqenta, e que tais fatores
influenciam todos os alunos daquela escola. O uso de modelos de mnimos
quadrados ordinrios pode subestimar o efeito da escola sobre a proficincia
(Albernaz et al., 2002).
A hiptese bsica do modelo que os dados possuem uma hierarquia, no sentido
que os alunos de uma mesma escola fazem uso dos mesmos recursos
43
disponveis, professores, etc. Para deixar mais claro ao leitor como essa hiptese
importante, considere que uma escola siga alguma linha pedaggica distinta
das demais. Com isso, o aprendizado de todos os alunos dessa instituio
diferente das outras, podendo desenvolver atributos diferentes de outros jovens
da mesma coorte.
3.1.3.1 Metodologia dos Modelos Hierrquicos Lineares
O modelo estimado foi composto por dois nveis, considerando as caractersticas
do aluno no primeiro nvel e as caractersticas da escola no segundo nvel. O
modelo multinvel geral para o estudante i (i=1,...,
j
N ) em cada escola j
(j=1,...,J), pode ser descrito como:
ij ij j j ij
u X Y + + =
1 0
| |
(3.12a)
Em que
ij
Y
nota no ENEM do estudante i que frequenta a escola j e
ij
X
a
matriz de vriveis explicativas (nvel 1) da nota do ENEM do estudante i que
frequentou a escola j, e seus coeficientes so considerados fixos. Alm disso,
por hiptese:
) , 0 ( ~
2
o N u
ij
(3.12b)
j j j
e Z
0 01 00 0
+ + = |
(3.13a)
Onde:
2
0
00
) var( o =
j
e
(3.13b)
0 ) , cov(
0
=
ij j
u e
(3.13c)
Com o propsito investigativo, utilizou-se um procedimento de estimao em
etapas, para que seja possvel visualizar possveis mudanas na varincia
explicada por cada nvel, conforme o processo se desenrola. Em outras palavras,
44
primeiro estimou-se o modelo multinvel sem variveis explicativas para quaisquer
nveis, com o objetivo de separar a varincia devida escola e ao aluno, e depois
foram includas as variveis de cada nvel em modelos subsequentes
5
(HOX,
1995). O modelo nulo (HLM0) ou ANOVA, sem variveis explicativas, pode ser
descrito como:
ij j ij
u e Y + + =
0 00
(3.14)
O termo
00
reflete a nota mdia da amostra inteira,
j
e
0
significa o termo
aleatrio para cada escola j e o terceiro termo o erro de cada indivduo. A
varincia explicada pelo nvel da escola
2 2
2
00
00
o o
o
+
=
(variao intra-classe) e a
varincia explicada pelo nvel do aluno (variao inter-classe) igual a
2 2
2
00
1
o o
o
+
=
.
O prximo passo estimar a funo de produo educacional considerando as
variveis do aluno (modelo 1 ou HLM1) ou ANCOVA, assumindo coeficientes
fixos:
ij j ij ij
u e X Y + + + =
0 10 00
(3.15)
Aps a incluso das variveis do candidato, podemos analisar a mudana no
coeficiente de variao intra-classe, que poder indicar se parte da variao que
se observa entre escolas , na verdade, reflexo das caractersticas pessoais e
familiares de seus alunos. Para explicar parte da variao entre escola, foram
includas variveis explicativas da escola (modelo 2 ou HLM2):
ij j ij j ij
u e X Z Y + + + + =
0 10 01 00
(3.16)
5
Poderamos continuar o processo, atribuindo um termo aleatrio ao coeficiente das variveis,
alm do intercepto. Com isso o coeficiente seria uma funo das variveis de segundo nvel e um
efeito aleatrio. No entanto, como o nosso objetivo no investigar nenhuma varivel especfica,
no prosseguimos por esta etapa.
45
Aps a incluso das variveis de segundo nvel, foi possvel mais uma vez
observar a diferena entre os coeficientes de correlao intra-classe e estudar
como tais variveis contribuem para explicar o desempenho dos alunos.
As estimaes com dados empricos sero apresentados no quinto captulo e
possuem um objetivo especfico, o de analisar os determinantes da proficincia
cognitiva. As sees a seguir buscam explicar a metodologia por trs do
procedimento de anlise do objetivo principal, a imputao da nota do ENEM na
base de dados da PME e, consequentemente, a anlise da proficincia imputada
como determinante da situao ocupacional dos jovens brasileiros que esto
concluindo o ensino mdio.
3.1.4 Imputao da Nota Estimada do ENEM na PME
Para investigar a correlao entre a proficincia cognitiva, medida pelo
desempenho na prova objetiva do ENEM, e a situao do indivduo aps a
concluso do ensino mdio, utilizamos duas bases de dados distintas, o ENEM e
a PME. A tentativa de unir duas bases diferentes o maior dos desafios, uma vez
que no podemos identificar o mesmo indivduo nas duas bases de dados.
Para Soares (2010), possvel fazer um pareamento quase exato entre ENEM e
PME utilizando a data de nascimento dos indivduos, sexo, quantidade de
pessoas na famlia e a regio metropolitana. Sendo o ENEM quase censitrio e a
PME amostral, o autor forma a populao-alvo com jovens da PME e busca
indentific-los na base do ENEM, mas essa tentativa reduz a amostra a ser
explorada a cerca de menos de 1% da populao que fez o ENEM entre 2003 a
2007. Na base da PME, restam em torno de 0,2% da base aps o pareamento,
pouco mais de 200 observaes. Dessa forma, outra tcnica que preserve um
maior nmero de observaes poderia ser explorada.
Outros autores utilizam o mtodo de unio de bases para estudar fenmenos
educacionais e produtivos, como Curi e Menezes Filho (2006), em que a nota do
exame de matemtica do SAEB de 1995 estimada em funo de caractersticas
pessoais e escolares disponveis nesta base e na PNAD 1995 em um primeiro
estgio. No segundo estgio, a nota estimada do SAEB, juntamente com o
46
resduo da regresso da funo educacional, foram imputadas na base do
CENSO 2000, tomando os valores mdios das variveis por coorte.
Os autores fizeram uma correo do vis de auto-seleo utilizando a proporo
de jovens nascidos entre 1977 e 1978 que tinham exatamente 10 anos de estudo
em 1995 em relao ao total dessa coorte. No entanto, isso requer assumir certa
homogeneidade da coorte, pois ocorre um agrupamento de pessoas que
compartilham algum critrio relativo a sua idade.
A metodologia de criao de mapas de pobreza desenvolvida por Elbers et al.
(2003) utiliza uma pesquisa do tipo survey e um censo demogrfico para associar
informaes de renda para regies bastante desagregadas para, com isso,
estimando ndices de desigualdade regionais. Este tipo de metodologia leva em
conta a riqueza de informaes das pesquisas do tipo survey com a
representatividade do censo. Ribas e Machado (2010) aplicaram este mtodo
para gerar estimativas de renda do no-trabalho e imput-las na base de dados
da PME, onde no consta esta informao.
O mtodo desta etapa da dissertao segue aquela aplicada por Ribas e
Machado (2010) e consiste, primeiramente, em estimar a nota da prova objetiva
do ENEM
6
como varivel dependente de um vetor de covariaveis comuns a
ambas as bases de dados. Logo, essencial que sejam identificadas as variveis
disponveis para explicar a proficincia em ambas as bases, utilizando a
metodologia apresentada nas sees anteriores, em particular o mtodo de
mnimos quadrados ordinrios.
Como esse mtodo espera-se obter um resultado mais preciso do que se fosse
utilizado o agrupamento por coortes, mas talvez no to preciso quanto o
pareamento quase-exato sugerido por Soares (2010), mas temos a vantagem de
possuir mais observaes do que ambas as alternativas.
6
A deciso de utilizar a nota da prova objetiva do ENEM, ao invs da nota da redao, foi
baseada na comparao do coeficiente de determinao (R) dos modelos MQO estimados no
quinto captulo para a nota da prova objetiva e redao. O modelo para a prova objetiva mostrou-
se superior, no que se refere ao ajuste dos dados, em relao ao modelo cuja varivel dependente
era a redao.
47
Os modelos estimados para a proficincia utilizando a correo de Heckman e os
modelos Hierrquicos mostraram bastante semelhana entre si e com o MQO.
Por isso, e tambm porque no temos como associar as variveis escolares aos
indivduos da PME, utilizamos somente o modelo MQO:
e Q profic + = | ' (3.17)
) , 0 ( ~
2
o N e (3.18)
A metodologia de Elbers et al. (2003) no assume que os erros so
homoscedsticos e prope que este parmetro seja estimado conforme a
equao a seguir:
c o + =
|
|
.
|
\
|
' ln
2
2
W
e A
e
(3.19)
) max( 05 . 1
2
e A= (3.20)
Onde c homoscedstico , A o limite superior da varincia predita, o o vetor
de coeficientes e W o vetor de variveis explicativas. Com isso, o estimador do
desvio-padro, segundo os autores, definido como:
(3.21)
) ' exp( o W B = (3.22)
Dessa forma, o termo aleatrio simulado escrito como ) , 0 ( ~
2
o N e e, aps a
estimao deste parmetro e do vetor de coeficientes |
'
+ = | (3.23)
3.1.5 Estimao da Situao Ocupacional do Indviduo em Funo da
Proficincia
O nosso ltimo objetivo utilizar os dados referentes situao ocupacional dos
jovens, na base de dados da PME, juntamente com a proficincia imputada, e
investigar que papel ela desempenha no status ocupacional dos jovens aps 12
meses.
A varivel dependente aqui a situao ocupacional do jovem aps 12 meses da
sua entrada na pesquisa mensal de emprego, sendo a proficincia cognitiva uma
varivel explicativa para ela. Ainda mais, foram utilizadas quatro amostras
distintas, cada uma delas para a situao inicial declarada pelo indivduo. Foram
utilizados dados da primeira e quinta entrevista do indivduo, de tal forma que o
perodo entre elas de doze meses.
No caso desta dissertao, foram construdas quatro situaes para a varivel
dependente, estando os indviduos sujeitos a alguma delas no perodo analisado:
no trabalham e no estudam (naotrabalha_naoestuda), s trabalham
(sotrabalha), trabalham e estudam (trabalha_estuda) ou s estudam
(soestuda). A metodologia utilizada para estimar a situao ocupacional baseia-
se na estimao de um modelo logit multinomial, pois estamos interessados em
analisar como o aumento da proficincia afeta a probabilidade de transitar de uma
situao para outra.
Os determinantes da transio ocupacional tambm j foram investigados no
Brasil por Curi e Menezes-Filho (2004) por meio do modelo logit multinomial,
7
Onde " "
i
Q um subvetor de " "
i
X , correspondente s variveis utilizadas no quinto captulo
para explicar a proficincia dos estudantes, conforme caractersticas pessoais e familiares que
tambm esto disponveis na PME.
49
utilizando a PME de 1984 a 2001, para investigar a mobilidade dos trabalhadores
entre as categorias de trabalho formal, informal, conta prpria, desempregado e
inativo. Em outro trabalho, Flori e Menezes-Filho (2008), estimam um modelo logit
multinomial para estimar a probabilidade de transio entre ocupaes,
controlando por um vetor de variveis pessoais, utilizando a PME de 1984-1985 e
2000-2001.
Os modelos estimados sero divididos seguindo a metodologia de Curi e
Menezes-Filho (2004) e Flori e Menezes-Filho (2008), que estimam um modelo
logit multinomial para cada subamostra composta pelas pessoas com a mesma
situao inicial.
Como estamos considerando apenas os jovens que esto no ltimo ano do
ensino mdio, existem, inicialmente, apenas duas situaes possveis, trabalhar e
estudar, ou apenas estudar. Por isso, so possveis dois modelos multinomiais,
mas como tambm foram estimados modelos separados para homens e
mulheres, totalizando quatro modelos estimados.
Em nossa anlise, utilizamos dados de indivduos que esto cursando o 3 ano do
ensino mdio. Alm disso, foram utilizadas as bases de dados de 2008 a 2010,
incluindo todos os meses, com a finalidade de garantir mais observaes para as
nossas estimaes. Assim, observamos a situao inicial dos jovens que
entraram na amostra em 2008, e doze meses depois, em 2009. Da mesma forma,
acompanhamos os jovens que entraram na amostra em 2009 e depois de doze
meses, em 2010.
A probabilidade de um dado indivduo i pertencer a uma categoria j, com
i
X denotando o vetor de variveis explicativas do indivduo, pode ser escrita
como:
=
+
= =
3
1
1
) | (
h
x
x
h i
j i
e
e
x j y p
|
|
(3.24)
A soma das probabilidades deve ser igual a unidade e, portanto, assumimos que
uma das categorias possui o coeficiente igual a zero, que ser a chamada de
50
categoria de referncia r. Segundo Wooldridge (2001 p. 498), modelo
estimado por mxima verossimilhana e, para cada indivduo i, a funo de log-
verossimilhana dada pela equao 3.25. Os coeficientes so identificados ao
maximizar a somatria da funo abaixo, considerando todos os indivduos.:
| | ( ) | |
=
= =
J
j
i j i i
x p j y l
0
, log 1 |
(3.25)
O principal objetivo estudar o efeito parcial da proficincia sobre a probabilidade
de transio, segundo cada categoria de referncia. No entanto, os resultados
so discutidos com referncia razo de risco relativo.
A razo de risco relativo (RRR) fornece uma informao sinttica sobre o efeito
marginal da varivel de interesse de forma relativa. Com a razo de risco relativo,
podemos verificar se, para o aumento de um ponto na escala de proficincia
cognitiva do indivduo, ele estar mais propenso a mudar para uma determinada
categoria ou a permanecer na categoria de referncia. A princpio notamos que a
probabilidade relativa, ou risco relativo, de uma categoria, em relao categoria
de referncia dada por:
j
X
e
x r y
x j y
|
=
=
=
) | Pr(
) | Pr(
(3.26)
O interesse principal est em saber se um aumento da proficincia cognitiva
aumenta as chances de um indivduos mudar de posio no perodo em questo.
Assim, para um aumento de um ponto na escala de proficincia, temos que a
razo de risco relativo dada por:
j
e
x r y
x j y
x r y
x j y
RRR
|
=
=
=
+ =
+ =
=
) | Pr(
) | Pr(
) 1 | Pr(
) 1 | Pr(
(3.27)
A razo de risco relativo compara o risco relativo de transio, para um dado
aumento na proficincia. Assim, se ela for maior que a unidade, ento o risco
relativo do indivduo mudar da categoria de referncia r para a categoria j, no
perodo de 12 meses, aumenta com a sua proficincia cognitiva. Por outro lado,
51
se a razo for menor que a unidade, ento o risco relativo de mudar de categoria
diminui conforme a proficincia cognitiva aumenta.
Os resultados da estimao do modelo multinomial so apresentados no captulo
4, bem como a anlise da razo de risco relativo da proficincia cognitiva como
determinante da probabilidade do indivduo transitar entre situaes ocupacionais.
Com isso, o objetivo da nossa anlise concludo e a discusso terica,
levantada no primeiro captulo, juntamente com a anlise dos determinantes da
proficincia cognitiva, apresentados no segundo captulo, propiciam mais uma
viso sobre o processo de acumulao de capital humano.
3.2 Apresentao das Bases de Dados e Variveis Utilizadas na
Estratgia Emprica
A funo de produo educacional foi estimada utilizando a base de dados do
ENEM de 2008 e o primeiro estgio da correo de Heckman utilizou, alm do
ENEM, o Censo Escolar de 2008, para estimar a probabilidade do candidato
comparecer ao exame. Para investigar a situao ocupacional dos jovens aps a
concluso do ensino mdio, utilizamos a Pesquisa Mensa de Emprego (PME) de
2008 a 2010.
Esta seo apresenta as principais caractersticas dessas bases de dados para,
posteriormente, discutir as estatsticas descritivas das variveis utilizadas nos
captulos posteriores.
3.2.1 Descrio da Base de Dados do ENEM e das Variveis da Funo
de Produo Educacional
No Brasil, existem muitos trabalhos sobre capital humano e uma vasta quantidade
de bases de dados sobre atributos socioeconmicos e demogrficos de seus
habitantes produzidos pelo IBGE (Instituto Brasileiro de Geografia e Estatstica) e
bases de dados referentes ao sistema educacional fornecidos pelo INEP (Instituto
Nacional de Pesquisas Educacionais Ansio Teixeira).
52
Os trabalhos sobre desempenho escolar so, em geral, uma aplicao da funo
de produo educacional no Brasil com base no exame do SAEB, disponvel para
a 4 e 8 srie do ensino fundamental e 3 ano do ensino mdio (Barbosa e
Fernandes, 2001; Csar e Soares, 2001; Albernaz et al., 2002; Soares, 2004;
Franco et al.,2007) ou outros exames regionais, como o SIMAVE em Minas
Gerais (Machado et al., 2005; Soares, 2005).
O exame do ENEM, por sua vez, fornece dados importantes para investigao
dos determinantes do desempenho educacional dos jovens brasileiros. Segundo o
Instituto Nacional de Estudos e Pesquisas Educacionais Ansio Teixeira (INEP), o
ENEM pode ser descrito como:
[...] um exame individual e de carter voluntrio, oferecido
anualmente aos concluintes e egressos do ensino mdio, com o
objetivo principal de possibilitar uma referncia para auto-
avaliao, a partir das competncias e habilidades que o
estruturam. Alm disso, ele serve como modalidade alternativa ou
complementar aos processos de seleo para o acesso ao ensino
superior e ao mercado de trabalho. (BRASIL, 2005)
Esse exame tambm diferencia-se do Saeb por sua proposta de mensurar
competncias, ao invs de habilidades propriamente ditas. A diferena entre estes
conceitos, por exemplo no caso da leitura, saber ler uma habilidade, mas
interpretar um texto de forma lgica considerada uma competncia. Assim, de
acordo com BRASIL (2008), so cinco as competncias cerceadas pelo ENEM:
1. Competncia I: Dominar a norma culta da lngua portuguesa e fazer uso
das linguagens matemtica, artstica e cientfica;
2. Competncia II: Construir e aplicar as dimenses de vrias reas do
conhecimento para a compreenso de fenmenos naturais, de processos
histrico-geogrficos, de produo tecnolgica e das manifestaes
artsticas;
3. Competncia III: Selecionar, organizar, relacionar e interpretar dados e
informaes representados de diferentes formas, para tomar decises e
enfrentar decises-problema;
53
4. Competncia IV: Relacionar informaes, representadas de diferentes
formas, e conhecimentos disponveis em situaes concretas, para
construir argumentao consistente;
5. Competncia V: Recorrer aos conhecimentos desenvolvidos na escola para
elaborao de propostas de interveno solidria na realidade, respeitando
os valores humanos e considerando a diversidade sciocultural.
O ENEM fornece um retrato da proficincia cognitiva de muitos estudantes que
possuem o objetivo de ingressar no ensino superior e tambm daqueles que
anseiam por entrar no mercado de trabalho. Assim, fornece informaes ao fim do
ensino bsico para os brasileiros.
A nota da redao do ENEM depende da proficincia que os candidatos possuem
sobre as competncias de dominar a norma culta da lngua escrita, aplicar
conceitos de vrias reas de conhecimento dentro da estrutura do texto, organizar
e interpretar fatos para defesa de um ponto de vista, construir argumentos e
elaborar uma proposta de interveno ao problema apresentado.
A anlise da proficincia tambm ser feita com base na nota de redao do
ENEM. Essa abordagem visa, principalmente, confirmar o resultado encontrado
por Golgher (2010a), que encontrou uma vantagem em proficincia para o sexo
feminino na prova de redao. Ademais, como esse teste possui o mesmo intuito
que a prova objetiva, espera-se obter efeitos similares para a determinao da
proficincia, apesar de que a liberdade de expresso na redao pode resultar
alguma diferena.
Os dados mais recentes, na data em que a anlise foi feita, eram referentes ao
ENEM de 2008, e como o exame vonluntrio, apesar de termos 4.018.070
inscries, muitas no podem ser naturalmente utilizadas em nossa anlise, pois
os candidatos no fizeram a prova e/ou no responderam o questionrio
socioeconmico. Dessa forma, e como estamos interessados em estudar os
jovens que esto terminando o ciclo bsico da educao, foram excludos todos
que no responderam o questionrio socioeconmico e que no tinham previso
de terminar o ensino mdio em 2008.
54
Para concentrar a investigao apenas nos jovens, foram excludos aqueles que
esto muito acima da mdia de idade para cursar o ltimo ano do ensino mdio,
bem como aqueles muito jovens, restringindo a amostra queles cuja idade est
entre entre 15 e 24 anos na poca do exame, o que caracteriza mais de 80%
daqueles candidatos com previso de terminar o ensino mdio nesse ano.
A diferena de proficincia entre diferentes sexos ser captada por uma varivel
indicadora se o candidato do sexo feminino (mulher). A cor/raa do indviduo
tambm pode influenciar o seu desempenho, ainda mais quando h uma
concentrao de algumas delas em diferentes camadas sociais, e por esse
motivo, a varivel (nao_branco) indica se o candidato declararou-se preto/pardo,
ao invs de branco/amarelo.
Alm dessas variveis pessoais, utilizamos outras que podem ser importantes
determinantes da proficincia, em razo da alocao do tempo do estudante. A
primeira delas se ele estuda no perodo noturno (noturno) e a segunda se ele
trabalha (trabalha).
Assim como em Golgher (2010b, pg.21) e Andrade e Laros (2007), a varivel
indicadora se o candidato trabalha foi includa na anlise por explicar parte do
prejuzo sobre o aprendizado do estudante, principalmente por causa do menor
tempo disponvel aos estudos e tambm, pode indicar a carncia de recursos
familiares que possibilitem ao aluno dedicar-se inteiramente aos estudos.
Com respeito aos determinantes escolares, utilizamos dummies para a rede
administrativa da escola em que o estudante cursa oensino mdio. A varivel de
referncia a da rede estadual (esc_estad) e as outras so: rede municipal
(esc_munic), rede federal (esc_fed) e rede privada (esc_priv). Alm disso,
controlamos pela varivel dummy indicativa do estudante frequentar curso
preparatrio de vestibular (cursinho).
Ao considerar a estrutura familiar e seus recursos destinados educao de seus
filhos, consideramos identificar o efeito de dividir o domiclio com irmos
(irmaos_m), por justificar a alocao e diluio de tais recursos entre os filhos.
Esta varivel pode apresentar um vis da forma como ela construda, pois o
questionrio do ENEM pergunta se o candidato mora com irmos, mas no se ele
55
possui irmos, os quais poderiam no compartilhar o mesmo domiclio, mas dividir
os recursos mesmo assim. Por fim, podemos considerar tambm o nmero de
moradores dentro do domiclio, porque os recursos destinados educao podem
diluir-se medida que ela no a nica demanda familiar.
No mbito familiar, as duas outras variveis utilizadas foram a renda familiar e a
escolaridade da me. A renda familiar inclui a renda obtida de todas as fontes dos
moradores do domiclio, e esta dividida em faixas: o domiclio no possui renda
(renda0sm), renda at 1 salrio mnimo (renda1sm), renda de 1 a 2 salrios
mnimos inclusive (renda1a2sm), renda de 2 a 5 salrios mnimos inclusive
(renda2a5sm), renda de 5 a 10 salrios mnimos inclusive (renda5a10sm) e
renda acima de 10 salrios mnimos (renda10sm).
A escolaridade da me foi dividida tambm em ciclos, pois o questionrio do
ENEM no pergunta a escolaridade em anos de ensino. Logo, temos diversas
dummies que informam o nvel mximo de escolaridade da me: se no
frequentou a escola (mae_naoestudou), se desconhece a escolaridade da me
(mae_naosabe), 1 a 4 srie do ensino fundamental (mae_fund1a4), 5 a 8
srie do ensino fundamental (mae_fund5a8), ensino mdio incompleto
(mae_em1), ensino mdio completo (mae_em2), ensino superior incompleto
(mae_sup1), ensino superior completo (mae_sup2) e ps-graduao (mae_pos).
O sucesso escolar do aluno um indicador central do seu desempenho escolar, e
assim, incluiu-se uma varivel da idade do candidato (idade) centralizada na
idade considerada normal para quem est no 3 ano do ensino mdio (17 anos).
Essa varivel se justifica por sintetizar o baixo aproveitamento que o estudante
em atraso escolar e que sinaliza dois problemas recorrentes no sistema
educacional, as taxas de abandono e repetncia.
A restrio da anlise apenas s regies metropolitanas tambm implica a
desconsiderao daqueles que se declararam indgenas, por representarem uma
proporo muito pequena da amostra e no pertencerem ao foco deste trabalho,
que a compatibilizao das bases de dados do ENEM e PME. Aps todas as
excluses, consideramos apenas candidatos residentes das seis regies
metropolitanas presentes na PME (Salvador, Recife, Porto Alegre, Belo Horizonte,
56
So Paulo, Rio de Janeiro), representadas, respectivamente, pelas variveis:
reg_sa, reg_re, reg_pa, reg_bh, reg_sp e reg_rj. Com isso, ficamos com
159.104 observaes vlidas. Elas incluem os candidatos brancos, negros,
amarelos e pardos, que vivem em uma das seis regies metropolitanas acima
mencionadas, que esto na faixa etria de 17 a 24 anos e que responderam ao
questionrio socioeconmico.
3.2.2 Descrio da Base de Dados do Censo Escolar e das Variveis
Utilizadas na Correo de Heckman
O Censo Escolar uma levantamento feito anualmente pelo Instituto Nacional de
Estudos e pesquisas Educacionais Ansio Teixeira (INEP) e abrange todas as
instituies de educao bsica de todas as redes administrativas. As
informaes que constam na pesquisa se referem, em linhas gerais, a
infraestrutura escolar, tipo de ensino oferecido, caractersticas pessoais dos
alunos, caractersticas pessoais dos docentes e a sua escolaridade, e tambm,
informaes referentes a turmas. Como j foi explicado na seo 3.1.2, utilizamos
as variveis do censo escolar no durante o processo de correo do vis de auto-
seleo.
O primeiro estgio da correo de Heckman estima a probabilidade do indviduo
entrar na amostra e, para isso, selecionamos aquelas variveis que julgamos
importantes para determinar a qualidade das escolas. Como estamos tratando de
escolas situadas em regies metropolitanas, as escolas possuem um nvel de
urbanizao bastante elevado, de tal maneira que todas possuem uma
infraestrutura de saneamento bsico adequado. Por isso, no convm explorar
caractersticas bsicas de funcionamento, como eletricidade, esgoto, gua, etc.
Para o nosso objetivo, selecionamos variveis referentes a docentes, importantes
na diferenciao da qualidade das escolas, em particular, a idade mdia dos
docentes de cada escola e a proporo de docentes na escola com alguma ps-
graduao.
Em relao s variveis de infraestrutura educacional, identificamos as seguintes:
presena de laboratrio de informtica, presena de laboratrio de cincias,
57
biblioteca, acesso internet para os alunos e presena banda larga. A anlise
descritiva detalhada dessas variveis ser feita no prximo captulo.
3.2.3 Descrio da Base de Dados da PME Utilizada para a Estimao
da Situao Ocupacional dos Indivduos
A seguir so apresentadas as variveis utilizadas para a imputao da nota do
ENEM na base de dados da PME. Mas antes, devemos fazer algumas
consideraes sobre a Pesquisa Mensal de Emprego.
A PME possui o objetivo de produzir indicadores sobre o mercado de trabalho de
seis regies metropolitanas: Salvador, Recife, Porto Alegre, Belo Horizonte, Rio
de Janeiro e So Paulo. As informaes so coletadas de cada indivduo, sendo
este a unidade de investigao, que mora em uma unidade domiciliar selecionada
(BRASIL, 2007). Logo, caso uma mesma famlia permanea no domiclio por
tempo suficiente, podemos observar o mesmo indivduo em dois momentos
distintos.
Alguns problemas de atrito so encontrados nesta base de dados e resumem-se
a trs principais: a migrao de domiclio, a recusa de entrevista e a resposta
inadequada em diferentes entrevistas posteriores (o que impossibilita identificar
com exatido o mesmo indivduo em diversos perodos de tempo).
Para diminuir a perda de informao por atrito, foi utilizado um algoritmo de
emparelhamento avanado, proposto por Ribas & Soares (2008), cujo objetivo
reduzir a taxa de falso atrito, devido impreciso das informaes fornecidas
por um domiclio, que uma das causas de perda de observaes na base de
dados. Assim, o mtodo sugerido pelos autores, que consiste em buscar a
mesma pessoa em diferentes perodos de tempo, foi utilizado com a finalidade de
melhorar a qualidade das informaes discutidas neste trabalho.
Uma outra caracterstica da base de dados da PME o seu desenho amostral.
Isso significa que a forma como ela montada pode atribuir diferentes pesos para
cada observao, uma vez que cada domiclio no possui a mesma probabilidade
de ser selecionado:
58
A PME utiliza uma amostra probabilstica de domiclios, estratifi
cada e conglomerada em dois estgios, para cada regio
metropolitana de abrangncia da pesquisa. Na PME, os
municpios e pseudomunicpios (conjuntos de municpios de
menor porte em quantidade de domiclios segundo o Censo
Demogrfico 2000) correspondem, cada um, a estratos
independentes de seleo, garantindo assim o espalhamento da
amostra pela regio metropolitana.
Dentro de cada municpio ou pseudomunicpio feita a seleo
das unidades primrias de amostragem - UPAs e, posteriormente,
das unidades secundrias de amostragem - USAs. As unidades
primrias de amostragem da pesquisa so os setores censitrios,
enquanto as unidades secundrias de amostragem so as
unidades domiciliares. (BRASIL, 2007, pg. 28-29)
A estratificao da amostra induz ao uso de pesos para estimar parmetros
populacionais, porque a distribuio das variveis pode diferir entre os subgrupos,
de forma que a hiptese das amostras identicamente distribudas falha. No
entanto, a estratificao da PME no foi feita com base na varivel dependente
que utilizamos. Por isso e com base em Ciol et al. (2006), e pelo fato de no
estirmarmos um parmetro regional que represente a populao, no utilizamos a
expanso das observaes
8
.
As variveis disponveis na PME so, em sua maioria, referentes posio e
rendimento no mercado de trabalho, e poucas se referentem a caractersticas
pessoais dos indivduos. Apesar disso, as variveis pessoais disponveis
permitem estimar a proficincia cognitiva, que o nosso objetivo.
A PME composta por diferentes grupos rotativos, dentro dos quais so
observados os domiclios de reas censitrias de seis regies metropolitanas
brasileiras, a saber: So Paulo, Rio de Janeiro, Porto Alegre, Belo Horizonte,
Recife e Salvador. A coleta das informaes feita, ento, com os moradores
destes domiclios.
Para que a nossa anlise seja feita de maneira parcimoniosa, optamos por utilizar
apenas alguns desses grupos rotativos. Ao considerar apenas os estudantes que
8
Para fins de investigao, o modelo logit multinomial foi estimado com a amostra expandida, e
comprovamos que os coeficientes no apresentaram nenhuma alterao em seu sentido. No
entanto, como a expanso multiplica os casos existentes, muitos coeficientes tornaram-se
estatisticamente significativos.
59
esto concluindo o ensino mdio na base de dados do ENEM 2008, a
preocupao inicial foi selecionar na PME os indivduos tal que as amostras de
ambas as bases fosse o mais homogneo possvel.
A imputao da nota do Enem foi feita com base na prova realizada em agosto de
2008, considerando apenas os estudantes que esto concluindo o ensino mdio
nesse ano. Sendo assim, buscaram-se indivduos cuja primeira entrevista na PME
aconteceu entre janeiro de 2008 e dezembro de 2009, isto , consideramos que a
proficincia cognitiva estimada por meio dos indivduos que prestaram o exame
em agosto de 2008, na base do ENEM, pode ser atribuda queles que esto
cursando o ltimo ano do ensino mdio em 2008 e 2009, na base da PME, sem
perda de generalidade.
A hiptese que a proficincia cognitiva, da maneira como ela foi estimada, no
possui grandes variaes no curto prazo, tornando possvel imputar um nvel de
proficincia para os estudantes de 2009 com base nas informaes de 2008.
Com o intuito de adicionar mais observaes e diminuir o atrito que ocorre ao
longo de um ano na PME, devido mudana de domiclio por parte das pessoas
que respondem pesquisa, optou-se, tambm, por utilizar os grupos rotacionais
que entraram na pesquisa janeiro de 2008 a dezembro de 2009, respectivamente,
os grupos rotativos L4 at O3.
Ademais, como estamos interessados em estudar a influncia da proficincia
cognitiva dos jovens sobre a insero no mercado de trabalho no prazo de 12
meses, foram excludos os indviduos com menos de 17 anos ou maiores de 24
anos, que representavam 9% das 2019 observaes, restando 1838 casos. O
quadro 2 mostra o nmero de observaes vlidas, de acordo com o ms e ano
em que o indivduo entrou na amostra da PME
9
:
9
Foi utilizado apenas a primeira e quinta entevista de cada indivduo, de forma que observamos
sua situao quando entrou na amostra e doze meses aps a entrada.
60
QUADRO 2 - Nmero de indivduos por ms e ano de entrada na PME
Em primeiro lugar, investigamos esse grupo de indivduos e como eles esto
inseridos no mercado de trabalho (trabalhando ou procurando emprego) e se
esto estudando. Descartamos de nossa anlise aqueles que repetiram o ltimo
ano do ensino mdio e consideramos, na mesma categoria, os jovens que esto
no primeiro ano da faculdade ou frequentando um curso pr-vestibular, porque,
apesar de no estarem no ensino superior aps o trmino do ensino mdio,
mostram-se interessados em continuar sua educao formal.
A pessoas foram distribudas em duas situaes iniciais. A primeira situao
aquela em que o jovem est ativo no mercado de trabalho e est estudando, a
outra ocorre quando o jovem est apenas estudando. As situaes finais so
divididas em quatro diferentes situaes: no estuda e no est ativo no mercado
de trabalho (1), est ativo no mercado de trabalho e no estuda (2), est ativo no
mercado de trabalho e estuda (3), estuda e no est ativo no mercado de trabalho
(4).
61
4 ANLISE DESCRITIVA DAS VARIVEIS UTILIZADAS
NA ESTRATGIA EMPRICA
Neste captulo, apresentamos as estatsticas descritivas das variveis do ENEM
2008 utilizadas para estimar a funo de produo educacional, juntamente com
aquelas variveis do Censo Escolar 2008 utilizadas no primeiro estgio da
correo de Heckman.
Alm disso, comparamos as variveis comuns s bases de dados do ENEM 2008
e PME 2008-2009, que foram utilizadas na etapa de imputao da proficincia.
Por fim, descrevemos a varivel de situao ocupacional disponvel na PME que
ser usada para investigar a importncia da proficincia cognitiva como
determinante da mobilidade ocupacional dos jovens.
4.1 Anlise Descritiva das Variveis Utilizadas na Estimao da
Funo de Produo Educacional
As variveis utilizadas nessa etapa foram apresentadas no terceiro captulo e a
Tabela 1 mostra um resumo das principais estatsticas descritivas das variveis
que foram usadas para estimar a funo de produo educacional, para as
159.104 observaes utilizadas inicialmente na aplicao do MQO. Sobre a
descrio destes resultados, em primeiro lugar, a varivel que identifica o sexo
demonstra que 61,1% dos indivduos do sexo feminino e a varivel de cor/raa
mostra que 44,7% declarou ser negro/pardo. A distribuio dessas duas variveis
dentro de cada regio metropolitana ser discutida adiante.
Os indivduos que trabalham, enquanto estudam no 3 ano do ensino mdio,
representam 23,8% da amostra. A proporo de candidatos que trabalham
baixa entre aqueles cuja renda familiar mais alta. Isto , a condio de trabalho
entre os estudantes mais presente nas famlias menos favorecidas. As regies
metropolitanas que concentram uma maior proporo de jovens que trabalhavam
enquanto estudavam so as do Sul e Sudeste do pas, respectivamente, Porto
Alegre (31,9%), So Paulo (30%) e Belo Horizonte (24,8%).
62
TABELA 1 Resumo das estatsticas descritivas de todas as variveis
utilizadas na estimao da funo de produo educacional
Varivel Mdia Desvio-Padro Mnimo Mximo
nota 46,72 16,51 0 98,41
idade 0,768 1,17 -2 7
mulher 0,611 0,49 0 1
nao_branco 0,447 0,50 0 1
trabalha 0,238 0,43 0 1
irmaos_m 0,758 0,43 0 1
noturno 0,241 0,43 0 1
cursinho 0,172 0,38 0 1
esc_munic 0,023 0,15 0 1
esc_fed 0,017 0,13 0 1
esc_priv 0,288 0,45 0 1
renda1sm 0,093 0,29 0 1
renda1a2sm 0,289 0,45 0 1
renda2a5sm 0,345 0,48 0 1
renda5a10sm 0,140 0,35 0 1
renda10sm 0,125 0,33 0 1
mae_fund1a4 0,158 0,37 0 1
mae_fund5a8 0,183 0,39 0 1
mae_em1 0,085 0,28 0 1
mae_em2 0,280 0,45 0 1
mae_sup1 0,055 0,23 0 1
mae_sup2 0,147 0,35 0 1
mae_pos 0,055 0,23 0 1
moradoresXrenda1sm 0,360 1,21 0 7
moradoresXrenda1a2sm 1,188 2,00 0 7
moradoresXrenda2a5sm 1,451 2,12 0 7
moradoresXrenda5a10sm 0,573 1,48 0 7
moradoresXrenda10sm 0,507 1,39 0 7
reg_sa 0,062 0,24 0 1
reg_re 0,079 0,27 0 1
reg_rj 0,198 0,40 0 1
reg_sp 0,470 0,50 0 1
reg_pa 0,063 0,24 0 1
Fonte: Elaborao prpria com dados do ENEM 2008
A varivel indicativa cursinho mostra que 17% frequenta algum tipo de curso
preparatrio para o vestibular e/ou ENEM. Mas como esses cursos geralmente
so privados, as famlias mais pobres podem no conseguir arcar com o seu
custo. Por isso, observamos que a frequncia de candidatos que frequentam um
curso preparatrio pertencem tambm a famlias com renda mais elevada.
A varivel indicativa residir com irmos mostra que 75,8% dos jovens mora com
irmos, e ela foi usada para estimar o efeito de dividir recursos econmicos entre
63
eles. Na anlise da varivel por faixa de renda familiar, notamos no haver grande
diferena entre famlias ricas e pobres.
Os estudantes do perodo noturno somam 24% da amostra, e a proporo destes
que tambm trabalham de pouco mais da metade (52%). Assim, uma grande
parcela dos estudantes do optaram pelo perodo noturno, mas esto ocupando o
dia com outras atividades que no o trabalho. Alm disso, a relao entre entudar
noite e a renda familiar inversamente proporcional, com pouqussimos casos
para estudantes na faixa de renda mais elevada.
A idade do estudante mais um fator preponderante na determinao da sua
proficincia cognitiva, cabendo assim, analisar como a sua distribuio na
amostra aliada a outras variveis. Em primeiro lugar, identificamos que a rede
privada concentra menos estudantes com atraso escolar, em comparao s
redes pblicas. O Grfico N 1 mostra como a diferena de idade se distribui de
forma diferenciada conforme a rede administrativa da escola que o aluno
frequenta:
GRFICO 1 - Distribuio acumulada da idade dos candidatos por rede de
ensino
64
A idade avanada no final do ensino mdio tambm pode apontar possveis
restries que o jovem enfrenta durante sua vida escolar. Como j foi explorado
anteriormente, a famlia proporciona ao jovem capital econmico e cultural para
sua formao educacional, e a presena destes atributos em quantidades
pequenas pode ter um impacto negativo sobre o seu aproveitamento.
Dessa forma, considerando que a escolaridade da me um fator positivamente
correlacionado com o nvel socioeconmico familiar, podemos ver pelo Grfico N
2 que o atraso escolar maior entre aqueles cuja famlia possui condies sociais
mais precrias, notando que a relao entre escolaridade da me e atraso escolar
possui uma relao no-linear.
GRFICO 2 - Distribuio acumulada da idade dos candidatos que esto no
3 ano do ensino mdio segundo a escolaridade da me.
A seguir descrevemos a varivel de renda familiar, que segue a resposta
fornecida pelo questionrio e indica a renda familiar do candidato por faixas de
salrios mnimos, como pode ser observada no Tabela N 2: se a famlia no
possui renda (renda0sm), renda familiar at 01 salrio mnimo inclusive
65
(renda1sm), renda familiar de 01 a 02 salrios mnimos inclusive (renda1a2sm),
renda familiar de 02 a 05 salrios mnimos inclusive (renda2a5sm), renda familiar
de 05 a 10 salrios mnimos inclusive (renda5a10sm) ou renda familiar acima de
10 salrios mnimos (renda10sm).
TABELA 2 Distribuio total e por regio metropolitana dos candidatos
segundo a renda familiar
O grfico abaixo mostra uma diferena ntida no que diz respeito s alternativas
educacionais das mulheres e homens segundo o seu nvel scioeconmico.
Podemos observar a maior proporo de mulheres prestando o ENEM em
famlias cuja renda domiciliar pequena, fato que poderia ser influenciado pela
deciso dos homens de famlias mais pobres de antecipar a entrada no mercado
de trabalho.
66
GRFICO 3 - Proporo de candidatos ao ENEM segundo gnero e faixa de
renda familiar
Apesar de muitos trabalhos utilizarem anos de estudo como varivel, a base de
dados do ENEM no permite essa construo devido pergunta feita ao
candidato. Posto isso, e dado que a escolaridade do pai e da me so
positivamente correlacionadas, optou-se por utilizar somente a educao da me
da forma como foi apresentada no captulo anterior. A distribuio dos estudantes
segundo a escolaridade da me pode ser vista na Tabela N 3:
67
TABELA 3 Distribuio dos candidatos por RM segundo escolaridade da
me
As regies metropolitanas, por sua vez, possuem polticas educacionais e
caractersticas sociais diferenciadas e que podem influenciar o desempenho de
habitar certa localidade. Assim, foram includas seis variveis dummies regionais,
referentes s regies metropolitanas de Recife (reg_re), Salvador (reg_sa), Porto
Alegre (reg_pa), Rio de Janeiro (reg_rj), So Paulo (reg_sp) e Belo Horizonte
(reg_bh).
QUADRO 3 - Estatsticas descritivas sobre gnero e cor/raa por regio
metropolitana
Por fim, temos as variveis que identificam a rede administrativa da escola que o
candidato frequentou durante o ensino mdio. A rede Federal (esc_fed) compe
apenas 2% da amostra, o que demonstra seu tamanho pequeno em relao s
68
outras redes, as escolas estaduais (esc_estad) a origem predominante na
amostra, de cerca de 67% dos candidatos do exame, a rede privada (esc_priv)
agrega 29% dos candidatos. A rede municipal (esc_munic) possui 2% da
amostra e sua representao pequena se deve ao fato de existirem poucas
escolas municipais que oferecem o ensino mdio, a maioria das escolas dessa
rede possui apenas o ensino fundamental disponvel
10
.
4.2 Anlise Descritiva das Variveis Escolares utilizadas na Correo
do Vis de Auto-Seleo
A principal dificuldade de implementar a correo de Heckman a necessidade
de se possuir informaes sobre as pessoas as quais no possumos a nota do
exame. Contudo, as pessoas sem nota no exame so justamente aquelas que
no forneceram quaisquer outras informaes sociodemogrficas, isto , no
sabemos nada sobre elas. Assim, foi necessrio uma estratgia de identificar,
pelo menos aproximadamente, esse grupo de pessoas ausentes no exame, com
base em informaes disponveis de pessoas presentes na prova.
As variveis utilizadas no primeiro estgio so todas referentes escola em que o
candidato est concluindo o ensino mdio e devem permitir, em algum grau, uma
separao dos estudantes que fizeram a prova, daqueles que teoricamente no a
fizeram. A nossa hiptese que a homogeneidade dos alunos de uma escola
pode ser usada para determinar as caractersticas dos ausentes. Assim, os
candidatos de uma escola com baixa participao no ENEM podem ser
semelhantes aos seus colegas de turma que no compareceram ao exame.
Com respeito s caractersticas dos docentes das escolas, , a porcentagem
destes com nvel superior de ensino e com licenciatura de quase 100%, de
modo que tanto escolas pouco eficientes como as mais eficientes possuem quase
10
Segundo a Lei de Diretrizes e Bases da Educao Bsica (LDB), os municpios devem incumbir-
se de oferecer a educao infantil e o ensino fundamental, com a possibilidades de ofertar o
ensino mdio somente quando houver recursos suficientes e as necessidades da sua rea de
competncia estiverem supridas BRASIL (1996).
69
a mesma proporo de docentes com licenciatura, o que torna esta varivel
pouco eficiente na discriminao dos estudantes.
A idade dos docentes, por sua vez, varia bastante entre instituies de ensino e
tambm entre regies metropolitanas, e pode ser uma influncia importante, como
motivao e preocupao, sobre todos os alunos de uma mesma escola. A idade
mnima observada, considerando apenas as escolas que esto situadas nas
regies metropolitanas trabalhadas, de 18 anos, e a idade mxima entre os
docentes de 80 anos. O quadro a seguir mostra as estatsticas descritivas da
idade dos docentes, sem considerar o agrupamento por escola, por regio
metropolitana. Dentre as regies metropolitanas, a de Belo Horizonte se destaca
pela maior concentrao de professores jovens.
Tabela 4 - Estatsticas descritivas da idade dos docentes por regio
metropolitana
Uma outra caracterstica dos docentes que influencia na qualidade das aulas e,
consequentemente, sobre a acumulao de capital humano dos alunos, a sua
qualificao profissional, que foi medida pela posse de um ttulo de ps-
graduao e reflete o seu domnio sobre os assuntos lecionados. Dentre os ttulos
de ps-graduao que os docentes declararam possuir, o de especializao foi o
mais recorrente e, em seguida, o de mestrado e o de doutorado. A expectativa
que as escolas com maior nmero de professores qualificados transmitam a seus
alunos mais conhecimento. Com isso, calculamos a razo entre o nmero de
docentes com algumas ps-graduao (especializao, mestrado ou doutorado)
sobre o total de docentes, por instituio de ensino.
70
Tabela 5 - Estatsticas descritivas da proporo de docentes com ps-
graduao nas Escolas por regio metropolitana
Para Soares (2008), o papel da escola na educao dos estudantes no se limita
em oferecer professores qualificados e bem motivados, como j foi discutido no
segundo captulo. A infraestrutura adequada permite que o docente consiga
explorar melhor diversas maneiras para transmitir o conhecimento e o aluno, por
sua vez, pode se sentir mais motivados em estudar em um ambiente agradvel
com recursos que facilitem o seu aprendizado.
Por outro lado, a infraestrutura direcionada para os recursos pedaggicos pode
influenciar a maneira como os estudantes interagem com os professores,
facilitando aquilo que aprendido em sala de aula. Por isso, inclumos em nossa
anlise caractersticas de escola que incluem a existncia de: laboratrio de
informtica, laboratrio de cincias, biblioteca, acesso internet e banda larga
disponvel. A tabela a seguir resume a proporo de escolas que possuem cada
um desses quesitos:
71
Tabela 6 - Proporo total das escolas por tipo de infraestrutura
4.3 Anlise Descritiva das Variveis Utilizadas na Imputao da
Proficincia Cognitiva do ENEM para a PME
Nesta seo, foram analisadas as variveis comuns a ambas as bases de dados,
que foram utilizadas em nosso modelo de imputao da nota do ENEM para os
indivduos da PME. O nosso objetivo com a descrio das variveis apresentar
possveis discrepncias referentes distribuio de caractersticas entre os
indivduos das duas amostras.
Em primeiro lugar, consideramos a idade do indivduo. Na base de dados do
ENEM de 2008, restringimos a amostra aos indivduos que estavam cursando o
ltimo ano do ensino mdio em 2008. Apesar disso, a idade dos indivduos gira
em torno dos 17 anos, idade considerada normal para o final do ensino bsico.
O grfico 4 mostra a comparao de idade entre as duas bases de dados, e
aponta uma discrepncia na distribuio dos indivduos. Podemos observar
claramente que existe um vis na amostra do ENEM, pois os indivduos com
idade entre 17 e 18 anos aparecem mais na base do ENEM do que na PME. Isso
, no entanto, natural, uma vez que, enquanto a PME construda como uma
amostra aleatria, a amostra do ENEM possui uma seleo positivamente
correlacionada com essa faixa etria.
A diferena na distribuio de observaes por idade no muito grande, sendo
assim, esperamos que ela no seja um problema no processo de imputao da
72
proficincia cognitiva na PME, desde que a distribuio condicional seja
semelhante.
GRFICO 4 - Distribuio dos indivduos por idade na base de dados do
ENEM e PME
Em relao ao sexo dos indivduos nas duas bases de dados, considerando o
perodo analisado, a presena do sexo feminino muito maior no ENEM (61,3%),
do que na PME 2008 (50,2%) e na PME 2009 (55,1%). Com respeito a cor/raa
dos indivduos, existe uma proporo menor de pessoas que se declararam
pretas ou pardas no ENEM (44,7%), do que na PME 2008 (51,7%) e na PME
2009 (49,1%).
Em seguida, comparamos as variveis familiares que influenciam a proficincia do
indivduo, em especial, a escolaridade da me, a renda familiar e a quantidade de
pessoas que moram no mesmo domiclio.
73
A escolaridade da me, na PME, foi medida pela escolaridade da pessoa de
referncia ou se cnjuge, sendo do sexo feminino. Com isso, foi possvel construir
a varivel da maneira como est disponvel no questionrio do ENEM, para que
pudssemos utiliz-la na imputao. Os valores possveis para escolaridade da
me, assim como a distribuio percentual para os indivduos das duas amostras
podem ser visualizadas no grfico N 5.
GRFICO 5 - Distribuio dos indivduos segundo escolaridade da me na
base de dados do ENEM e PME
No grfico acima, podemos destacar que, na base de dados do ENEM 2008,
existe uma concentrao de indivduos cuja me possui um grau de escolaridade
mais elevado, quando comparamos com os dados da PME. Isso pode ser uma
fonte de vis de seleo, j que os indivduos com mes mais escolarizadas esto
mais propensos a comparecer ao exame do ENEM.
A renda familiar, por sua vez, destaca-se como uma das variveis mais
importantes para explicar a proficincia cognitiva dos jovens e tambm pode ser
muito importante para a situao ocupacional dos mesmos. Por hiptese, ela
pode garantir uma maior segurana aos jovens em suas decises, permitindo-lhes
arriscar mais sem sofrer grandes consequncias econmicas. Alm disso, pode
74
postergar a sada do jovem da casa dos pais e, com isso, tambm a entrada do
mesmo no mercado de trabalho por necessidade (CARVALHO, 2009).
Sobre a construo da varivel de renda familiar, no questionrio socioeconmico
do ENEM, obtivemos a renda agregada do domiclio, isto , de todos que moram
com o jovem, sem fazer nenhum tipo de distino quanto origem da renda, que
pode ser fruto do trabalho, aluguis, aplicaes, penses, etc. Por outro lado, o
questionrio da PME possui uma informao incompleta, referente renda
proveniente do trabalho.
Para corrigir esse problema, utlizamos o mtodo proposto por Machado & Ribas
(2009), e imputamos a renda do no-trabalho na PME de 2008 e 2009, utilizando
a PNAD do mesmo ano, cujas variveis possibilitaram estimar a renda de todas
as fontes
11
. Aps a imputao da renda do no-trabalho na PME, a renda foi
deflacionada para agosto/2008
12
e separada em faixas, para equipar-la entre os
indivduos da PME e do ENEM.
O grfico N 6 mostra a distribuio percentual dos indivduos segundo as faixas
de renda e deixa claro que existe uma concentrao maior de jovens de renda
familiar mais baixa na base de dados do ENEM, quando comparamos com a
PME. Novamente, os mecanismos de incentivo da prova do ENEM podem estar
atuando de forma a atrair uma proporo maior de pessoas de baixa renda, como
o uso da nota do exame como vestibular na concesso de bolsas a estudantes de
baixa renda pelo ProUni (Programa Universidade para Todos).
11
A densidade de kernel foi estimada para o logaritmo da renda total na PNAD e na PME, para os
anos de 2008 e 2009, como forma de analisar o ajustamento dos dados. O grfico da dsitribuio
pode ser visualizado no grfico A.1 em anexo.
12
O indivduo na base do ENEM respondeu o questionrio com base em valores de agosto de
2008, quando o exame foi realizado. Os indivduos na PME, por sua vez, responderam com base
na poca da pesquisa, isto , em janeiro, maio e setembro de 2009. Por isso, utilizamos o deflator
sugerido por Corseuil & Foquel (2002) para as pesquisas do IBGE, em especial, para a PME.
75
GRFICO 6 - Distribuio percentual dos indivduos segundo faixa de renda
familiar na base de dados da PME e ENEM
A ltima varivel familiar considerada nas duas bases de dados o nmero de
pessoas que habitam o mesmo domiclio que o jovem. No questionrio do ENEM,
esse nmero vai de um, se a pessoa mora sozinha, at seis, se a pessoa mora
com seis ou mais pessoas, ou seja, existe um truncamento neste valor.
Na PME, possvel contar quantas pessoas moram com os indivduos, no
existindo truncamento, mas, para efeito de igualdade das variveis, optou-se por
constru-la da mesma forma. O grfico 7 sintetiza essa varivel para ambas as
bases de dados e mostra que a distribuio da varivel indicativa do nmero de
moradores por domiclio
13
bastante similar para as duas bases de dados.
13
Os dados excluem aqueles jovens que moram sozinhos. Isso aconteceu porque identificamos os
jovens que esto na condio familiar de filho segundo o questionrio da PME. Dessa forma,
deve existir um chefe de famlia no domiclio, o que exclui a possibilidade do jovem morar sozinho.
Para manter a homogeneidade das observaes, no foram considerados tais casos na base do
ENEM.
76
GRFICO 7 - Distribuio percentual dos indivduos segundo a quantidade
de moradores no domiclio na base de dados da PME e ENEM
Por fim, analisamos a distribuio dos indivduos segundo a regio metropolitana
em que residem. O grfico N 8 mostra algumas divergncias considerveis na
distribuio dos indivduos entre as duas bases de dados. Existe uma
concentrao muito grande de indivduos na regio metropolitana de So Paulo,
na base de dados do ENEM, comparativamente PME.
A frequncia de indivduos na regio metropolitana do Rio de Janeiro mostrou-se
a mais estvel entre as bases. Contudo, essa divergncia na varivel indicativa da
regio pode ocorrer como causa do desenho amostral da PME, que feito com
base em uma amostra aleatria de estratos na regio metropolitana (municpios e
pseudomunicpios), alguns setores dentro dos estratos e algumas unidades
domiciliares dentre dos setores. Se considerarmos a expanso da amostra da
PME pela varivel que pondera pelo desenho amostral, ento a divergncia entre
77
a distribuio de indivduos na PME e no ENEM, para as seis regies
metropolitanas, praticamente desaparece
14
.
GRFICO 8 - Distribuio percentual dos indivduos segundo a regio
metropolitana em que mora
A anlise descritiva das variveis possibilitou observar que existe uma
concentrao de indivduos, com determinadas caractersticas, em uma base de
dados, que no observada na outra. A causa dessas divergncias pode ser a
auto-seleo que ocorre na base de dados do ENEM.
Como j foi dito anteriormente, a PME tem caracterstica aleatria, enquanto que
o ENEM a porta de entrada do jovem para o ensino superior, tanto por ser parte
14
A distribuio percentual dos indivduos por regio metropolitana utilizando a amostra expandida
da PME, que pondera as observaes com base no desenho amostral da pesquisa, pode ser
conferida no grfico anexo A.2
78
do vestibular de algumas instituies de ensino, como por ser utilizado para a
concesso de bolsas de estudos, alm de ser voluntrio.
Essa diferena na distribuio de observaes entre as bases de dados pode
configurar em uma diferena na distribuio da nota do ENEM e da nota imputada
na PME.
Ao observar os grficos anteriores, podemos notar que existe, de fato, um vis de
seleo na amostra do ENEM, quando comparamos com os dados da PME. No
captulo anterior, utilizamos o modelo de correo de Heckman para testar essa
hiptese, a qual comprovamos como afirmativa, dispondo de certas hipteses
para a estimao do modelo.
Ao contrrio da base de dados do ENEM, que permite vincular informaes do
Censo Escolar, o qual nos baseamos para construir a base de dados do primerio
estgio de Heckman, essa possibilidade inexiste na PME. Dessa forma, optando
pela parcimnia na aplicao dos mtodos, apontamos a existncia do vis de
seleo do ENEM, que pode enviesar as nossas estimaes. Contudo, a anlise
grfica mostra que a diferena no demasiadamente grande, e a incluso de
uma correo do vis de seleo demandaria outras hipteses para a sua
viabilidade na PME, diferentes daquelas feitas no terceiro captulo.
4.4 Anlise Descritiva da Varivel de Situao Ocupacional na Base de
Dados da PME
O objetivo de investigar como a proficincia influencia a situao ocupacional dos
jovens, doze meses aps a concluso do ensino mdio, feita por meio da
varivel que indica a frequencia do jovem em uma instituio de ensino e de outra
que indica se ele est ativo no mercado de trabalho. A varivel de situao
ocupacional, reelembrando, formada por quatro categorias, so elas: no
trabalha e no estuda (1), trabalha e no estuda (2), trabalha e estuda (3), no
trabalha e estuda (4).
Uma leitura mais clara da varivel dependente feita em termos percentuais,
como em uma matriz de transio. No quadro N 4, as linhas se referem
79
situao inicial em 2008 ou 2009, e as colunas, por sua vez, se referem
situao final em 2009 ou 2010. A diferena observada entre 2008 e 2009
pequena, como se pode observar no quadro abaixo.
Quadro 4: Matriz de transio da situao ocupacional em doze meses
Na situao de quem estuda e trabalha ao mesmo tempo, observamos uma
tendncia mais acentuada dos jovens no continuarem os estudos e se
dedicarem inteiramente ao trabalho (58% em 2008 e 56% em 2009). Outro ponto
interessante o acentudo nmero de jovens que tornam-se inativos e param de
estudar. Ao considerar a soma da frequncia das duas situaes em que o jovem
no estuda, 73% e 70% parou de estudar aps a concluso do ensino mdio,
respectivamente, em 2008 e 2009.
Na situao de quem apenas estuda, os dados mostram um cenrio similarmente
adverso. A soma da frequncia relativa das duas situaes finais, em que o jovem
no estuda, teremos 57% e 61%, respectivamente, para quem concluiu o ensino
mdio em 2008 e 2009. Ou seja, dos jovens que esto terminando o ciclo bsico
educacional, mais da metade interrompeu os estudos.
Esse fenmeno pode ser reflexo do custo direto e indireto de aumentar a
escolaridade. A existncia de restries oramentrias e/ou individuais, podem
fazer com que o jovem deixe de estudar. Alm disso, mostra que uma parcela
considervel da populao no est acumulando capital humano, o que pode
influenciar na oferta de mo-de-obra qualificada no mercado de trabalho.
80
5. FUNO DE PRODUO EDUCACIONAL
A funo de produo educacional estimada tem, por objetivo, identificar os
fatores associados proficincia cognitiva dos jovens concluintes do ensino
mdio e que possuiam entre 15 e 24 anos em 2008, considerando caractersticas
individuais, familiares e escolares. A finalidade deste captulo apresentar ao
leitor os resultados dos modelos economtricos utilizados para estimar a funo
de produo educacional.
O primeiro modelo de regresso apresentado estimado utilizando o mtodo de
mnimos quadrados ordinrios (MQO) para explicar a nota da prova objetiva e,
posteriormente, a nota da redao, com variveis explicativas pessoais, familiares
e escolares, sendo que o resultado obtido condiz com o encontrado em trabalhos
com o mesmo interesse. Posteriormente, so apresentados os resultados obtidos
pela estimao do modelo de correo de Heckman para o vis de auto-seleo e
pelos modelos hierrquicos lineares, utilizados para corrigir a quebra de hiptese
das amostras independentes e identicamente distribudas.
5.1 Estimao da Funo de Produo Educacional por MQO
Os resultados da regresso linear por MQO, para a prova objetiva, podem ser
analisados na Tabela N 7, onde a nota desta prova do ENEM 2008 a varivel
dependente e as variveis pessoais, familiares e escolares so independentes.
importante ressaltar que, salvo a varivel idade, que foi centralizada, todas as
demais so variveis dicotmicas e seus coeficientes devem ser interpretados
como diferenas em relao categoria de referncia.
A varivel indicadora da idade do candidato foi centralizada em 17 anos,
considerada normal para o final do ensino mdio, e seu coeficiente sobre a
proficincia negativo e estatisticamente significativo. Por isso, segundo o
modelo estimado, os candidatos possuem 1,33 ponto a menos que a mdia, na
prova objetiva, para cada ano adicional superior a 17 anos.
81
Esse efeito parcial negativo pode ser associado ao atraso escolar, causado por
alguma interrupo intermitente ou repetncia, ou candidatos que terminaram o
ensino mdio a mais tempo e voltaram a estudar. O avano etrio, relativamente
srie cursada, parece ser um obstculo ao aprendizado, refletido no baixo
aproveitamento do aluno, mesmo sabendo que a relao entre idade e
proficincia possa ser simultnea. Neste caso, a causa da idade avanada pode
ser justamente o baixo rendimento escolar. O mesmo resultado foi encontrado por
Sampaio (2009) com dados do ENEM 2005 e 2006, e tambm por Golgher (2010)
para o ENEM 2005.
A escolaridade da me se mostrou um fator determinante para a proficincia
escolar dos filhos, uma vez que a aquisio de capital humano na famlia pode
depender, em parte, da escolaridade dos pais. O modelo estimado deixa claro
que a proficincia dos filhos cresce de forma no linear conforme a escolaridade
da me aumenta, quando comparamos com aqueles cuja me nunca frequentou
a escola, que a categoria de referncia. A exceo o candidato que
desconhece a escolaridade da me, para o qual o efeito no difere
estatisticamente da categoria base.
O efeito da renda familiar (apenas de quem mora no mesmo domiclio) sobre a
proficincia, positivo e no linear com respeito s diferentes faixas de renda,
mesmo controlando pela escolaridade da me, que, por hiptese, positivamente
correlacionada com a renda permanente da famlia. Essa observao confirma a
relao positiva entre o nvel socioeconmico e o desenvolvimento educacional
das pessoas discutida no segundo captulo.
No entanto, afirmou-se anteriormente que morar com irmos acarreta um menor
aproveitamento escolar pelo fato da diviso dos recursos destinados a sua
educao. O fato que o tamanho da famlia no domiclio diminui a quantidade
total de recursos financeiros disponveis para a educao de uma maneira geral,
de modo que este fique abaixo do patamar ideal. Para tentar captar o efeito da
quantidade de moradores no domiclio do candidato sobre a distribuio de renda
intrafamiliar, foram calculadas as interaes de cada faixa de renda com a
quantidade de moradores no domiclio.
82
A varivel moradoresXrenda1sm, por exemplo, refere-se interao entre a
quantidade de moradores no domiclio cuja renda familiar de at 1 salrio
mnimo, e o seu coeficiente negativo deixa evidente que a vantagem dessa renda
familiar sobre a proficincia, em relao categoria de referncia (nenhuma
renda familiar), decresce conforme o aumento na quantidade de moradores no
domiclio.
O mesmo efeito acontece para famlias com faixas de renda mais elevadas,
exceto quando a renda excede 10 salrios mnimos, para o qual o coeficiente da
varivel moradoresXrenda10sm no estatisticamente diferente de zero. Este
resultado pode sugerir que, para nveis de renda bastante elevados, a demanda
educacional dos entes mais jovens da famlia suprida financeiramente em sua
totalidade, no sendo limitada por uma restrio oramentria da famlia e as
suas decises de alocao de recursos entre os membros.
Quanto ao sexo do candidato, observamos que a nota mdia da prova objetiva
dos homens superior das mulheres, indicado pelo coeficiente negativo e
significativo para o sexo feminino na regresso linear por MQO. Em contrapartida,
o sexo feminino obteve melhor resultado na prova de redao, como fica evidente
na Tabela N 8, que mostra os resultados obtidos utilizando a nota da redao
como varivel dependente. Esse resultado complementa a discusso do segundo
captulo, sobre a diferena de desempenho entre sexos, tendo os homens maior
vantagem em questes lgicas, e as mulheres maior vantagem em provas
argumentativas.
Os indivduos pretos/pardos demonstraram menor nvel de proficincia do que
brancos/amarelos, e aponta a sua maior desvantagem em termos de sucesso
escolar. Embora a sua causa possa vir da maior concentrao de candidatos de
cor preta/parda nas faixas de renda familiar mais baixas, estamos controlando
pelo nvel de escolaridade da me e pela renda familiar, de modo que existem
outros fatores, ligados cor/raa, que explicam essa desigualdade tnica sobre a
proficincia educacional dos jovens.
A varivel indicativa de trabalho do jovem registra um efeito negativo e
significativo, que pode ser uma consequncia do menor tempo disponvel
83
dedicado educao, reduzindo o aproveitamento escolar. Ressaltando que
estamos controlando a proficincia pela renda familiar do candidato, de tal forma
que essas variveis captam o efeito parcial do nvel socioeconmico sobre a
educao. No entanto, como a varivel de renda domiciliar categorizada, pode
existir uma certa correlao dentro de cada categoria de renda com essa varivel.
A frequncia a cursos preparatrios aumenta diretamente o aproveitamento no
exame, uma vez que eles so organizados com esse objetivo. Tais cursos podem
corrigir o desempenho escolar pfio de um aluno que obteve educao prvia de
baixa qualidade, mas como os jovens que frequentam uma escola de baixa
qualidade so tambm aqueles que no podem pagar por um ensino de
qualidade, tambm pouco provvel que possuam recursos financeiros para
adquirir este servio.
A varivel noturno apresenta um coeficiente negativo, indicando uma
desvantagem para aqueles que estudam no perodo noturno, em relao aos que
estudam no perodo diurno, mesmo controlando pela rede de ensino. Apesar de
uma parte considervel dos candidatos que afirmam estudar no perodo noturno
no trabalhar, tais indivduos podem alocar o seu tempo em outras atividades,
como trabalho informal ou domstico, o que pode revelar a menor prioridade
educao.
Os resultados mostram que existem diferenas entre as redes de ensino sobre a
proficincia mdia de seus alunos. O sinal positivo dos coeficientes da rede
municipal, federal e privada mostra que todas so melhores, em termos de nota
no ENEM, do que a rede estadual (categoria de referncia). Alm disso, podemos
notar que, apesar da diferena entre a rede municipal e a estadual, os candidatos
que estudaram nessas redes possuem, em mdia, uma proficincia abaixo
daquela obtida por alunos provenientes da rede particular ou federal, um sinal da
qualidade do ensino oferecido por cada uma destas ltimas.
A rede particular de ensino diferencia-se por sua maior autonomia e agilidade na
implementao de polticas educativas, e por deterem incentivo maior para atingir
taxas de aprovao em vestibulares do que as redes estaduais e municipais,
como consequncia da concorrncia do mercado.
84
A rede federal se destaca em relao s demais, contudo, a vantagem dos alunos
dessa rede sobre o desempenho no exame pode no ser um reflexo direto da
escola. Em geral, a rede federal possui processos seletivos para admisso de
alunos, em que apenas os melhores colocados conseguem se matricular. Isso
pode ser um indicativo de fatores no-observveis, uma vez que controlamos por
outros fatores pessoais e familiares.
Os resultados no rejeitam a hiptese de que haja uma alocao de recursos
intrafamiliares disponveis para a educao, seja financeiro ou at mesmo a
ateno dos pais, entre filhos. Esse fenmeno foi medido pela varivel indicativa
de morar com irmos, e que apresenta um coeficiente negativo, justificando o
disposto no segundo captulo, que o menor aproveitamento escolar de jovens que
moram com irmos pode ser visto como uma consequncia da diviso dos
recursos educacionais entre eles.
Por fim, foram observadas diferenas entre as regies metropolitanas, por
diversas razes. De acordo com o modelo contextual apresentado na Figura N 1,
as escolas de regies diferentes podem estar sujeitas a polticas educacionais,
valores socioculturais e religiosos, legislao diferenciada e demandas sociais
diferentes, o que influencia a quantidade de recursos que as escolas pblicas
recebem e as diretrizes de gesto desses recursos por cada escola.
A regio metropolitana de Belo Horizonte apresentou resultado mdio superior ao
das demais regies metropolitanas, como pode ser visto pelo coeficiente negativo
de todas as variveis regionais, tomando a regio metropolitana de Belo
Horizonte como referncia. Um resultado similar resultado obtido por Golgher
(2010a), que introduz uma varivel dummy para cada UF do Brasil para estimar a
nota do ENEM 2005, obtendo coeficientes negativos para todos os Estados,
tomando Minas Gerais como UF de referncia.
Com respeito aos determinantes da nota de redao estimados por MQO, as
regies metropolitanas de Salvador e Porto Alegre mostraram-se superiores de
Belo Horizonte, em termos de proficincia mdia, como pode ser visto na Tabela
N 8, diferente do ocorrido quando analisamos a prova objetiva.
85
Os resultados da regresso linear por MQO para a nota de redao apontam
algumas diferenas entre esta e a prova objetiva. J foi dito anteriormente que o
sexo feminino se saiu melhor na prova de redao, enquanto o sexo masculino
obteve mehor resultado na prova objetiva. Alm disso, os resultados obtidos para
a prova de redao mostram que os fatores a ela associados possuem menor
impacto sobre a sua nota, quando comparados com o impacto que estas mesmas
variveis possuem sobre a nota da prova objetiva.
A escolaridade da me e a renda familiar, importantes para explicar a nota da
prova objetiva, possuem um efeito relativamente menor sobre a proficincia
medida pela redao. O papel dos fatores no-observados do candidato parece
ser maior quando ele possui liberdade para expressar o seu pensamento.
A varivel indicadora se o candidato fez cursinho mostrou-se relevante tanto para
a parte objetiva, quanto para a discursiva, mas o seu coeficiente para a redao
relativamente menor. Os cursos preparatrios possuem uma curta durao,
geralmente inferior a um ano, e possvel que eles consigam treinar os
candidatos para responder a questes objetivas, mas no consigam ensin-los a
desenvolver um raciocnio lgico discursivo.
Isso pode significar que o desenvolvimento cognitivo, como requerido pela prova
de redao, pode ser resultado de uma educao que se desenvolve na pessoa a
mdio ou longo prazo. O baixo poder explicativo das variveis independentes
para a nota de redao, mesmo controlando por atributos pessoais, familiares e
escolares, pode indicar que a competncia de expressar as ideias depende
fortemente de fatores no observveis.
5.2 Funo de Produo Educacional com Correo para o Vis de
Auto-Seleo do ENEM
O ENEM um exame voluntrio e, no caso desse ano, como j dito
anteriormente, apenas a metade dos candidatos compareceu no dia da prova, h
um problema de auto-seleo que surge pela no aleatoriedade na ausncia do
exame. Se houver um vis no sentido de que aqueles cujo rendimento escolar
mais elevado sejam mais propensos a fazer o exame, ento deixamos de
86
observar o resultado de jovens menos preparados e, dessa forma, podemos
subestimar os fatores que determinam a proficincia.
Por meio do Censo Escolar 2008, foi possvel calcular a quantidade de alunos do
3 ano do ensino mdio em cada escola do pas e, anexando esse dado com a
quantidade de candidatos que fizeram a prova do ENEM em 2008, calculamos o
percentual de adeso de cada escola, referente a essa populao de alunos. O
resultado de uma anlise de correlao da nota e o percentual de adeso mostra
que existe uma relao positiva entre essas variveis.
Ao ignorar esse vis de seleo da amostra, a regresso por MQO produz
coeficientes que podem enviesar os reais efeitos dos determinantes da
proficincia escolar, caso exista uma auto-seleo do tipo no-aleatria. Para
corrigir esse vis, foi utilizado o modelo de Heckman em dois estgios.
No primeiro estgio, calculou-se a probabilidade de um indivduo comparecer ao
exame, com base em caractersticas da rede de ensino que frequentou. No
segundo estgio, a proficincia cognitiva foi estimada com base nas mesmas
variveis explicativas utilizadas no modelo de regresso linear por MQO, mas
agora o erro foi corrigido com a incluso da razo inversa de Mills, obtida do
primeiro estgio.
O fato do banco de dados no possuir nenhuma caracterstica dos candidatos que
no prestaram o exame demanda uma estratgia de identificao desse grupo
para que a correo de Heckman possa ser feita.
Portanto, com base na presena relativa dos alunos do 3 ano do ensino mdio de
cada escola, selecionamos aquelas escolas cuja presena foi inferior a 10%, e
assumimos que todos os estudantes dessas escolas faltaram ao exame, depois
selecionamos as escolas com ndice de participao superior a 90%, assumindo
que os alunos dessas escolas compareceram ao exame.
A estratgia mostrou-se consoante ao fato de que as escolas com menor
participao no exame tambm so aquelas cujos alunos possuem desempenho
abaixo da mdia. Por fim, das 159.104 observaes vlidas utilizadas pelo
modelo MQO, foram considerados como ausentes 5.521 candidatos, e como
87
presentes 2.081 candidatos, totalizando 7.602 observaes usadas no primeiro
estgio da correo de Heckman.
A correo do vis de seleo para a prova objetiva torna a leitura dos
coeficientes menos distorcida e sublinha algumas mudanas em relao aos
resultados obtidos via MQO em cujo vis est presente. Em primeiro lugar, o
modelo de Heckman aponta que a correlao do erro do primeiro com o segundo
estgio positiva, indicando que os fatores no-observveis que definem a
propenso do indivduo em comparecer ao exame so positivamente
correlacionados com os fatores no-observveis que explicam sua proficincia no
exame.
Ao analisar o segundo estgio do modelo de Heckman na Tabela N 7, corrigido o
vis pelo primeiro estgio, o efeito da idade sobre a nota ligeiramente maior que
no modelo MQO e o efeito da cor/raa permanece praticamente inalterado. Isso
pode indicar que estes coeficientes no estariam sendo enviesados ao considerar
o problema da auto-seleo.
A varivel indicadora de residir com irmos permanece significante, quando
comparada ao coeficiente obtido por MQO, sugerindo que a alocao de recursos
entre irmos explica a proficincia, mesmo consideramos uma amostra sem vis.
Entretanto, a significncia desta varivel para a amostra auto-selecionada pode
indicar que a alocao talvez seja relevante para a parcela dos candidatos mais
capacitada.
O efeito da escolaridade da me no modelo de Heckman diminui para todos os
nveis educacionais sobre a proficincia do filho, em relao ao modelo MQO. Ao
considerar a amostra sem vis, observamos que a escolaridade da me estava
sendo superestimada, no deixando de apontar que a vida educacional dos filhos
muito influenciada pela educao da me. Mais uma vez, destaca-se o papel da
escolaridade dos pais na formao de capital humano na famlia.
O efeito de cada rede administrativa da escola tambm muda, pois agora
frequentar uma escola federal ou privada garante um acrscimo maior na nota do
candidato em relao aos estudantes da rede estadual, quando comparamos aos
modelos anteriores. A rede municipal apresentou um coeficiente menor do que no
88
modelo MQO, isto , ele estava sendo superestimado. Isso pode estar associado
a maior chance de insucesso dos alunos de escolas pblicas estaduais em
relao aos oriundos das redes privada, federal, ou mesmo municipal.
As diferenas regionais tornaram-se menos acentuadas quando comparadas
regio metropolitana de Belo Horizonte. A menor diferena tambm corresponde
ao fato de que o vis menor na regio de Belo Horizonte, por agrupar o menor
nmero de jovens que estudam em escolas cuja participao no exame no
excede 5% da turma. Em outras palavras, a presena do estudante da regio
metropolitana de Belo Horizonte no ENEM 2008 foi mais efetiva.
Na estimao do modelo de Heckman para a nota de redao utilizamos o
mesmo mtodo para criao artificial da subamostra necessria ao primeiro
estgio, que estima a propenso do indivduo em fazer a redao. No entanto,
somamos a esta subamostra o grupo de candidatos que fizeram a prova objetiva,
mas no fizeram a redao.
Um dos principais resultados desta regresso que a escolaridade da me como
determinante da nota da redao menor que no modelo MQO, exceto quando a
me possui ensino superior completo ou ps-graduao. A varivel cursinho
tambm apresenta um coeficiente maior, mostrando que o modelo MQO estava
subestimando tais coeficientes.
O coeficiente estimado da razo inversa de Mills, utilizada no segundo estgio
para a correo do vis de auto-seleo, apresentou um coeficiente positivo, bem
como o coeficiente de correlao ( ) entre os erros do primeiro e do segundo
estgio. Em outras palavras, os fatores no-observveis que explicam a
participao na prova de redao, so positivamente correlacionados com os
fatores no-observveis que explicam o rendimento do candidato na redao.
5.3 Estimao da Funo de Produo Educacional por meio de
Modelos Hierrquicos Lineares
A outra caracterstica das bases de dados de educao que enviesa os
coeficientes da regresso linear clssica a sua estrutura hierrquica. As
89
observaes individuais, em sua maioria, no so totalmente independentes,
como postula uma das hipteses bsicas do mtodo de mnimos quadrados
ordinrios. A consequncia disso que a correlao mdia (ou intra-classe) entre
variveis, considerando estudantes de uma mesma escola, maior que a
correlao mdia entre variveis considerando indivduos de escolas diferentes. A
violao da hiptese de independncia dos dados faz com que as estimativas de
erros-padro dos testes estatsticos sejam muito pequenos, o que pode resultar
em resultados significativos, porm esprios. (HOX, 2002, pg.05)
O primeiro passo foi estimar o modelo nulo HLM0, como discutido no terceiro
captulo, que tem como objetivo estimar as varincias relativas a cada nvel, aluno
e escola, as quais podem ser analisadas pelo ndice de correlao intra-classe
(ICC). O ICC estimado indica que 40,59% da varincia total da nota explicada
por caractersticas do nvel da escola e 59,41% explicada por fatores
pessoais/familiares de cada candidato.
O modelo nulo utilizado para estimar a nota de redao como varivel
dependente mostra um resultado um pouco diferente. O ndice de correlao
intra-classe de cerca de 13%, isto , a varincia da nota de redao explicada
pelos fatores escolares so baixos, quando comparamos com o resultado da
prova objetiva.
Ao analisar o SIMAVE, Soares (2005) estima um modelo com trs nveis (alunos,
turmas e escolas), e seu modelo nulo apresenta ICC de 12% em relao
variao devida escola, para alunos da 4 srie. Por outro lado, Machado et. al.
(2008) estimam um modelo hierrquico com trs nveis (aluno, escola e
municpio) utilizando a mesma base de dados, e encontra um ICC de 12,5% para
a escola, quando considerados os alunos do 3 ano do ensino mdio.
Em trabalhos que buscam o mesmo objetivo, mas por meio do Saeb, destacam-
se os resultados obtidos por Albernaz et. Al. (2003), cujo modelo nulo para
explicar a nota da prova de matemtica do Saeb 1999 apresentou ICC de 28%.
Para Csar & Soares (2001), estimam o ICC em 35,1%, considerando um modelo
nulo em trs nveis (alunos, escolas e UF). No entanto, como estes trabalhos
90
citados utilizam bases de dados diferentes e nveis diferentes de hierrquia, eles
no podem ser diretamente comparveis.
Um trabalho que se assemelha bastante ao nosso, por estudar alunos do 3 ano
do ensino mdio, por meio do Saeb 2001, e por utilizar um modelo hierrquico
com a mesma estrutura que a nossa, e o de Andrade & Laros (2007), cujo ICC
estimado no modelo nulo foi de 46%.
Em seguida, foi estimado outro modelo hierrquico, para a prova objetiva (modelo
HLM1 na Tabela N 7) e para a redao (modelo HLM1r na tabela N 8), contendo
as variveis de primeiro nvel, referentes ao candidato. O resultado indica uma
diferena em relao aos coeficientes estimados pelos modelos de MQO e
Heckman.
No modelo HLM1, para a prova objetiva, a incluso das variveis de primeiro nvel
faz com que o ndice de correlao intra-classe (ICC) diminua em relao ao
modelo nulo, com uma queda aproximada de dezesseis pontos percentuais.
Mesmo assim, cerca de 24% da varincia continua a ser atribuda a fatores de
segundo nvel, isto , mesmo controlando fatores individuais, a escola ainda faz
diferena na proficincia mdia de seus alunos. Como exposto no segundo
captulo, a escola possui uma srie de atributos que influencia seus alunos, como
a gesto dos recursos, programa pedaggico, etc. Tais fatores podem contribuir
para a diferena de proficincia entre escolas, mesmo que estas sejam similares
em alguns aspectos.
A incluso das variveis de primeiro nvel para explicar a nota da redao, no
modelo HLM1r da Tabela 8, ajuda a explicar parte da varincia devida
originalmente escola, e esta se reduz em aproximadamente 23%. Quando
comparamos este resultado com os modelos estimados para a prova objetiva,
observamos que a escola parece ter um papel maior sobre o sucesso em exames
padronizados com questes de mltipla escolha, do que na redao, onde o
candidato livre para expressar seu raciocnio. No resultado obtido por Andrade
& Laros (2007), para os alunos do 3 ano do ensino mdio na prova de
matemtica e lngua portuguesa do Saeb 2001, aps a incluso das variveis de
primeiro nvel, o ICC encontrado foi de 17%.
91
No terceiro modelo hierrquico (HLM2 na tabela 7 e HLM2r na tabela 8), foram
includas, alm das variveis de primeiro nvel, variveis do nvel da escola, como
a rede administrativa e a regio metropolitana em que ela se situa. A incluso
dessas variveis tem por objetivo explicar parte da varincia referente escola e
que no foi explicada pelas variveis de primeiro nvel.
A escolaridade da me possui menos influncia quando consideramos o efeito da
escola sobre seus alunos. possvel afirmar que existe uma concentrao de
alunos, cujo nvel socioeconmico est acima da mdia, em escolas privadas, e
alunos de famlias menos favorecidas em escolas pblicas estaduais/municipais.
Dessa maneira, o estoque de capital econmico/humano dos pais pode
determinar a escolha da escola frequentada pelos filhos, bem como essa pode ser
uma causa pela qual as escolas que apresentam resultados mais prximos aos
esperados so mais disputadas pelas famlias mais ricas.
Em relao influncia da renda familiar sobre a proficincia, vemos que o efeito
da famlia estar entre as duas faixas de renda mais elevadas se reduz, em
comparao ao modelo de regresso linear e de Heckman. Isso pode sinalizar
que a escola substitui, em algum nvel, o benefcio do capital econmico sobre o
aprendizado dos jovens, por diversos motivos.
Neste caso, a escola pode oferecer um conhecimento que outrora seria possvel
somente por meio do investimento direto da famlia, que por sua vez, depende da
renda disponvel. Quando observamos a interao entre renda familiar e a
quantidade de moradores no domiclio, notamos que a diviso de recursos intra-
domiclio parece influenciar negativamente a proficincia, assim como nos outros
modelos.
As famlias de classe social mais elevada possuem recursos suficientes para
atender demanda educacional dos filhos at o nvel desejado. O modelo
hierrquico tambm atribui maior proficincia aos candidatos que pertencem a
famlias mais abastadas, bem como foi estimado pelas regresses anteriores
utilizando MQO e Heckman.
A diferena entre a rede estadual e municipal de ensino diminui, quando utilizado
o modelo hierrquico. A varivel esc_munic, indicadora de o aluno frequentar a
92
rede municipal de ensino, deixa de ser positiva e passa a ser estatisticamente no
significativa, sugerindo que a qualidade desta rede se equipara com a da rede
estadual de ensino. Como explicado no terceiro captulo, a desconsiderao da
estrutura hierrquica dos dados pode acarretar em coeficientes erroneamente
significativos e diferentes de zero.
Em relao s diferenas entre regies metropolitanas, a de Belo Horizonte
continua sendo a melhor em termos de proficincia mdia, mesmo controlando a
proficincia por outras variveis. A diferena das outras em relao a esta mudou
quando comparamos os coeficientes do modelo hierrquico com o MQO ou
Heckman. Algumas regies metropolitanas apresentam uma diferena de
resultados, como So Paulo e Porto Alegre, cujos efeitos so menores do que em
outros modelos, sinal de que a qualidade das escolas destas regies
metropolitanas no se distancia tanto das escolas da regio metropolitana de Belo
Horizonte.
A incluso das variveis de segundo nvel contribui para explicar a
heterogeneidade entre escolas. O ICC do modelo HLM2 apresentou uma
diferena negativa de cerca de dez pontos percentuais em relao ao modelo
anterior. Assim, pouco mais de 13% da varincia da nota se deve a fatores
escolares, enquanto que 87% da varincia explicada por atributos do primeiro
nvel. Este resultado similar ao encontrado por Andrade & Laros (2007) para o
Saeb 2001, no qual o modelo hierrquico com dois nveis (alunos e escolas)
resultou em um ICC de 13,1%, depois de consideradas as variveis de primeiro e
segundo nvel no modelo.
A estimao do modelo hierrquico, cujos resultados esto disponveis na Tabela
8, considera as variveis de primeiro e segundo nvel para a prova de redao
(HLM2r). O seu resultado mostra que, diferente da prova objetiva, a regio
metropolitana de Salvador no estatisticamente diferente da de Belo Horizonte.
Do mesmo modo, a regio metropolitana de Porto Alegre, que possui um
rendimento mdio inferior, em relao categoria de referncia, na prova
objetiva, possui uma nota mdia superior na prova de redao. Isso mostra que
as escolas da RM de Porto Alegre preparam melhor seus estudantes com
93
respeito ao conjunto de competncia de compreenso escrita, argumentao e
utilizao do conhecimento prvio.
Ao comparar o sinal das variveis de todos os modelos estimados, podemos
concluir que, apesar da correo dos vieses encontrados, a maioria das variveis
possui o mesmo sinal, independente do mtodo economtrico utilizado.
O sinal dos coeficientes que so significativos, ao nvel de 5%, para explicar a
nota da prova objetiva e da redao, diverge quanto ao gnero dos candidatos,
pois o sexo feminino obteve melhor desempenho na redao em relao ao sexo
masculino, mas o mesmo no ocorre na prova objetiva.
A regio metropolitana de Porto Alegre apresentou uma nota mdia menor que
Belo Horizonte na prova objetiva, ocorrendo o contrrio na prova de redao. A
regio metropolitana de Salvador tambm apresentou sinal divergente, com efeito
positivo para a prova de redao, e negativo para a prova objetiva. No entanto,
ela no estatisticamente significante para o modelo hierrquico.
Dessa forma, nossas estimaes comprovam a importncia de certas variveis
para explicar a proficincia cognitiva dos jovens, mesmo na ausncia de vieses,
que poderiam ocultar ou distorcer a importncia de cada uma delas. Assim como
encontrado pelos trabalhos citados ao longo do captulo, os fatores
socioeconmicos possuem grande influncia sobre o aproveitamento escolar e
aquisio de capital humano por parte dos jovens em idade escolar. Com relao
ao efeito estimado dos fatores familiares, a escolaridade da me e a renda
familiar, apesar de serem positivamente correlacionadas, possuem efeitos que se
sobrepe aos demais em questo de proficincia dos filhos.
Ao considerar o efeito das escolas, posto o que j foi dito acerca da qualidade das
istituies de ensino, uma escola de boa qualidade pode acarretar uma boa
formao cognitiva. Contudo, fatores no-cognitivos podem influenciar a
proficincia dos alunos, mas no podem ser diretamente observados.
94
TABELA 7 - Resultado dos modelos economtricos estimados para funo
de produo educacional da nota da prova objetiva no ENEM 2008
idade -1,330*** -1,464*** -1,433*** -1,386***
mulher -4,119*** -4,163*** -4,015*** -4,014***
nao_branco -1,988*** -1,989*** -1,359*** -1,253***
trabalha -1,579*** -1,586*** -1,063*** -0,987***
irmaos_m -0,348*** -0,334*** -0,379*** -0,325***
noturno -2,741*** -2,714*** -2,164*** -1,823***
cursinho 3,162*** 3,144*** 3,113*** 3,078***
mae_naosei -0,225 -0,272 -0,462 -0,554*
mae_fund1a4 0,560** 0,519* 0,509** 0,492**
mae_fund5a8 0,772*** 0,702*** 0,660*** 0,614***
mae_em1 1,512*** 1,440*** 1,249*** 1,140***
mae_em2 2,295*** 2,201*** 1,768*** 1,572***
mae_sup1 4,383*** 4,228*** 3,172*** 2,821***
mae_sup2 5,994*** 5,839*** 3,663*** 3,296***
mae_pos 7,450*** 7,282*** 4,368*** 4,018***
renda1sm 2,185*** 1,828*** 2,383*** 2,431***
renda1a2sm 4,060*** 3,848*** 3,857*** 3,742***
renda2a5sm 6,498*** 6,189*** 5,719*** 5,273***
renda5a10sm 9,052*** 8,695*** 6,708*** 5,919***
renda10sm 12,451*** 11,982*** 7,088*** 6,488***
moradoresXrenda1sm -0,483*** -0,457*** -0,420*** -0,395***
moradoresXrenda1a2sm -0,510*** -0,524*** -0,413*** -0,385***
moradoresXrenda2a5sm -0,428*** -0,418*** -0,307*** -0,248***
moradoresXrenda5a10sm -0,380*** -0,368*** -0,146** -0,08
moradoresXrenda10sm -0,025 -0,01 0,165** 0,161*
esc_munic 1,799*** 1,770*** 0,831
esc_fed 18,839*** 18,993*** 21,754***
esc_priv 8,207*** 8,481*** 10,056***
reg_sa -3,723*** -3,691*** -3,977***
reg_re -4,944*** -5,095*** -5,446***
reg_rj -4,008*** -4,304*** -4,037***
reg_sp -3,064*** -3,188*** -2,908***
reg_pa -1,522*** -1,449*** -1,045***
Razo Inversa de Mills 1,442***
constante 44,929*** 43,775*** 44,166*** 44,141*** 43,700***
Mills (rho) 0,11
ICC 40,59% 24,27% 13,78%
N Observaes 159104 153134 173567 159104 159104
Nota: *: significante a 10%; **: significante a 5%; ***: significante a 1%.
Fonte dos dados bsicos: INEP - ENEM 2008.
MQO HECKMAN HLM0 HLM1 HLM2
95
TABELA 8 - Resultado dos modelos economtricos estimados para funo
de produo educacional da nota da prova de redao do ENEM 2008
idade -1,339*** -1,162*** -1,313*** -1,288***
mulher 2,907*** 2,919*** 2,933*** 2,916***
nao_branco -0,765*** -0,732*** -0,642*** -0,482***
trabalha -0,709*** -0,547*** -0,367*** -0,387***
irmaos_m -0,135 -0,11 -0,200** -0,139
noturno -1,577*** -1,353*** -1,661*** -1,455***
cursinho 0,820*** 1,653*** 1,491*** 1,488***
mae_naosei -0,475 -0,153 -0,329 -0,442
mae_fund1a4 1,181*** 0,964*** 1,221*** 1,164***
mae_fund5a8 1,135*** 0,837*** 1,013*** 0,964***
mae_em1 1,393*** 1,060*** 1,193*** 1,113***
mae_em2 1,787*** 1,424*** 1,429*** 1,306***
mae_sup1 2,039*** 1,874*** 1,815*** 1,516***
mae_sup2 2,031*** 2,229*** 1,718*** 1,369***
mae_pos 2,298*** 2,828*** 1,807*** 1,477***
renda1sm 1,702*** 1,831*** 2,210*** 2,139***
renda1a2sm 1,675*** 2,465*** 2,640*** 2,274***
renda2a5sm 3,273*** 3,603*** 3,874*** 3,259***
renda5a10sm 3,609*** 3,864*** 4,071*** 3,034***
renda10sm 5,780*** 5,048*** 4,660*** 3,662***
moradoresXrenda1sm -0,200** -0,404*** -0,364*** -0,295***
moradoresXrenda1a2sm -0,120** -0,261*** -0,168*** -0,124**
moradoresXrenda2a5sm -0,258*** -0,247*** -0,211*** -0,161***
moradoresXrenda5a10sm -0,274*** -0,176** -0,194** -0,121
moradoresXrenda10sm -0,517*** -0,122 -0,215** -0,209**
esc_munic 0,605** 0,628*** 0,672
esc_fed 8,475*** 8,458*** 9,354***
esc_priv 2,167*** 3,541*** 3,408***
reg_sa 0,784*** 0,973*** 0,388
reg_re -12,954*** -3,673*** -9,571***
reg_rj -0,499*** -0,998*** -0,893***
reg_sp -0,929*** -0,967*** -0,784***
reg_pa 1,300*** 1,308*** 1,718***
Razo Inversa de Mills 0,403***
constante 57,251*** 56,826*** 58,913*** 55,476*** 55,842***
Mills (rho) 0,034
ICC 13,13% 10,05% 6,91%
N Observaes 159159 149145 173628 159159 159159
Nota: *: significante a 10%; **: significante a 5%; ***: significante a 1%.
Fonte dos dados bsicos: INEP - ENEM 2008.
MQO HECKMAN HLM0r HLM1r HLM2r
96
6 A RELAO ENTRE PROFICINCIA COGNITIVA E
SITUAO OCUPACIONAL DOS JOVENS
Os objetivos deste captulo so, em primeiro lugar, apresentar os resultados da
imputao da proficincia cognitiva, medida pela nota do ENEM, para os
indivduos que esto terminando o ensino mdio na base de dados da PME. Com
isso, avaliamos a consistncia do resultado mediante os dados utilizados.
Em segundo lugar, investigamos a situao ocupacional desses jovens doze
meses aps a primeira entrada na pesquisa da PME, explorando a proficincia
estimada como fator associado. Com isso, analisamos se esta varivel influencia
a insero dos jovens no mercado de trabalho, como proposto por Hanushek
(2009) e analisado por Soares (2010).
6.1 Imputao da Proficincia Cognitiva do ENEM para a PME
A imputao da nota do Enem para os indivduos na PME foi feita conforme a
metodologia de Elbers et al. (2003) e utitizou as variveis descritas anteriormente
e que so comuns a ambas as bases de dados. Apesar da nota do ENEM estar
no intervalo de 0 a 100 na escala do exame, nada garante que esses limites
sejam respeitados quando estimamos a varivel com outra amostra.
Por essa razo, os valores da nota imputada foram truncados para esses limites,
mesmo porque tais casos foram minoria em nossa estimao, com apenas uma
observao abaixo do limite inferior e nove acima do limite superior, de um total
de 1838 observaes. Os coeficientes estimados na base de dados do ENEM e
que foram utilizados na imputao da nota na PME podem ser conferidos na
tabela 9, onde foi estimado uma regresso para cada idade:
97
TABELA 9 - Resultado da estimao do modelo (3.17) para a imputao da
nota do ENEM para os indivduos da PME por idade
A tabela 10 mostra o resultado da imputao da nota do ENEM 2008 na PME
2008 e 2009 e que foi descrita pela varivel profic. A mdia amostral do ENEM
ficou entre as mdias amostrais da nota imputada para os anos de 2008 e 2009
da PME, com um desvio-padro um pouco maior.
98
TABELA 10 Estatsticas descritivas da nota do ENEM e da proficincia
imputada na bases de dados da PME
O grfico 9 aponta para a existncia de uma diferena na distribuio de
proficincia entre as amostras. Pelo grfico, podemos observar que o valor modal
da nota imputada maior que a calculada na base do ENEM. Alm disso,
notamos que existe uma concentrao de indivduos que obtiveram a sua
proficincia estimada ao mximo, o que no observado na base original.
GRFICO 9 - Distribuio da nota do ENEM 2008 e da nota imputada na PME
2008-2009
99
Essa distoro pode ser resultado da distribuio desproporcional das variveis
dependentes em ambas as bases de dados, conforme foi discutido ao final da
seo anterior. Aparentemente, os indivduos menos proficientes esto em maior
nmero na amostra do ENEM, mas, por exemplo, existem muito mais indivduos
com renda familiar elevada na PME do que na base de dados do ENEM e, como
essa varivel possui impacto positivo sobre a proficincia, a nota estimada para
os indivduos na PME tende a ser maior, considerando este efeito parcial. O
mesmo acontece pela participao diferenciada de indivduos nas regies
metropolitanas, que pode ser fruto do vis de auto-seleo da amostra do ENEM.
6.2 Anlise dos Determinantes da Mobilidade Ocupacional dos Jovens
O principal objetivo deste captulo investigar se a proficincia cognitiva funciona
como um determinante da mobilidade ocupacional dos jovens, no perodo de 12
meses, sendo que entre as possveis situaes ocupacionais, o jovem pode
deixar de estudar e estar economicamente inativo (que inclui no trabalhar nem
procurar emprego), pode estar no mercado de trabalho e deixar de estudar, pode
estar ativo no mercado de trabalho e estudando ou, por fim, pode dedicar-se
apenas aos estudos e ficar inativo no mercado de trabalho.
A estimao do modelo logit multinomial foi feita separadamente para homens e
mulheres, considerando cada situao inicial como uma amostra parte, o que
resultou em quatro modelos estimados utilizando quatro subamostras
15
. Conforme
mostrado pela descrio dos dados do quadro n 4, existe uma tendncia dos
indivduos transitarem para a situao de trabalho, deixando a escola, aps o
perodo de 12 meses.
Queremos investigar se a incluso da varivel indicativa da proficincia cognitiva
altera a probabilidade de transio entre as categorias. Para controlar pelo ano
15
Em busca de um melhor ajuste dos dados, tentamos estimar o modelo de transio ocupacional
utilizando outros recortes amostrais, separando os indivduos por sexo e regio metropolitana ou
agregando pelas regies sul, sudeste e nordeste. Apesar disso, os resultados foram insatisfatrios
ou pouco informativos diante nossos de objetivos, com poucas observaes em algumas
categorias, o que resultava na no convergncia de alguns modelos.
100
em que o indivduo entrar na amostra, acrescentamos a varivel binria v2009,
que indica se o mesmo entrou na amostra em 2009 ou, caso contrrio, em 2008.
As tabelas 11 e 12 apresentam as razes de risco relativo estimadas pelos
modelos economtricos, para as duas situaes iniciais possveis (ativo do
mercado de trabalho e estuda; inativo no mercado de trabalho e estuda),
respectivamente. Cada coluna representa o resultado de um modelo estimado
para homens e mulheres.
A princpio, como observado na parte inferior das tabelas de resultados, o ajuste
do modelo cuja subamostra foi composta por indivduos os quais a situao inicial
era estudar e trabalhar, mostrou-se pouco significativo. O p-valor do teste Qui-
Quadrado, que compara o modelo estimado ao modelo nulo, sem variveis, ficou
bastante elevado, nessas amostras, tanto para homens (0,484), quanto para
mulheres (0,715), quando comparados ao nvel de 5% de significncia.
Em outras palavras, por exemplo, ao nvel de 5% de significncia, no possvel
rejeitar a hiptese nula, de que os coeficientes do modelo so todos
simultaneamente iguais a zero, no havendo efeito estatisticamente significativo
pelas variveis independentes. Ou seja, a proficincia cognitiva, nesse caso, no
possui efeito algum sobre o risco relativo de mudar de situao, ela no um
agente de mudana para os indivduos, para nenhuma situao.
Com respeito aos modelos estimados para a subamostra daqueles indivduos que
apenas estudavam no perodo inicial (no trabalha e estuda), o teste Qui-
Quadrado rejeita a hiptese nula, tanto para homens quanto para mulheres.
Assim, podemos afirmar que pelo menos um dos coeficientes de cada modelos
difere estatisticamente de zero, ambos ao nvel de 5% de significncia.
A razo de risco relativo mostra se, para um aumento marginal na proficincia
cognitiva, o indivduo est mais (ou menos) propenso a transitar da categoria de
referncia. Quando o seu valor do coeficiente da varivel maior do que a
unidade, ento existe uma propenso de mobilidade da categoria de referncia
para a outra situao, considerando a variao de um ponto na escala de
proficincia estimada pela nota do ENEM. Se o coeficiente for menor do que a
101
unidade, a propenso de que o indivduo permanea na categoria de referncia
maior, quanto maior a proficincia.
102
TABELA 11 - Razo de risco relativo para as situaes ocupacionais
estimadas pelo modelo logit multinomial para a situao inicial "Trabalha e
Estuda"
103
TABELA 12 - Razo de risco relativo para as situaes ocupacionais
estimadas pelo modelo logit multinomial para a situao inicial "No
Trabalha e Estuda"
104
Ao considerar apenas os modelos estimados para os indivduos que apenas
estudavam, aqueles que se apresentaram estatisticamente significativos no teste
qui-quadrado, nas tabelas 11 e 12, podemos observar que, quanto maior a
proficincia, menor o risco relativo do indivduo passar para uma situao em que
ele no estuda. A afirmao anterior fica comprovada pelos valores dos
coeficientes da proficincia menores que a unidade para a primeira e segunda
categoria da varivel dependente, para ambos os sexos.
A razo de risco relativo devida ao aumento de um ponto na escala de
proficincia cognitiva estimada para a situao (no trabalha e no estuda)
relativa situao (no trabalha e estuda), dado que as outras variveis foram
mantidas constantes, foi de 0,987 para os homens e de 0,986 para as mulheres.
Em outras palavras, com aumento da proficincia cognitiva, aumenta-se a
expectativa de que o indivduo permanea na situao de referncia, o que
parece bastate razovel, uma vez que ele estar ocupando todo o seu tempo
continuao de sua formao escolar.
A interpretao do coeficiente da proficincia cognitiva para a situao trabalha e
no estuda, tando como referncia a situao no trabalha e estuda
semelhante. Como o valor inferior a um, para ambos os sexos, significa que
quanto maior a proficincia cognitiva, menores so as chances de que o jovem
deixe de estudar para apenas trabalhar.
O coeficiente da varivel proficincia para a situao do jovem trabalhar e estudar
no apresentou um valor estatisticamente diferente de um. Isto , um aumento na
proficincia cognitiva no aumenta ou diminui o risco relativo de um indivduo que
estava cursando o ltimo ano do ensino mdio e no trabalhava, passar a
trabalhar e continuar a sua educao formal.
Assim, o valor dos coeficientes da proficincia cognitiva no modelo logit
multinomial estimado para explicar a mobilidade ocupacional dos jovens, pelo
menos no prazo de doze meses, pode indicar como verdadeira a hiptese de que
o aumento da proficincia cognitiva pode induzir a situao ocupacional dos
jovens.
105
A matriz de transio apresentada no quadro N4 mostrou que grande parte dos
jovens cessa os estudos aps a concluso do ensino mdio. No entanto, o
modelo estimado prope que, quanto maior a proficincia cognitiva, maior a
probabilidade de o jovem continuar estudando e, consequentemente, acumulando
capital humano.
As bases de dados utilizadas so consistentes, no sentido de que servem
finalidade a que se destinam, apesar do ENEM apresentar um vis de auto-
seleo, no representando fielmente a populao composta por todos os
concluientes do ensino mdio, o que pode afetar os nossos resultados e distorcer,
pelo menos em parte, a nossa anlise. A metodologia de compatibilizao das
bases buscou apresentar uma alternativa eficaz para estudar como a proficincia
cognitiva induz a situao ocupacional dos jovens.
Os resultados diferem daqueles obtidos por Soares (2010, p.106-110), que
tambm utilizou o modelo logit multinomial para explicar a situao ocupacional
dos jovens, utilizando a PME (2003-2008) e o ENEM (2003-2007), mas valeu-se
de outra metodologia de compatibilizao para imputao da nota do ENEM para
os indivduos da PME. O autor concluiu que um aumento na nota do ENEM
aumenta as chances de estar empregado, aps o trmino do ensino mdio, mas
no possui influncia sobre a probabilidade do jovem entrar no ensino superior ou
estar em um curso preparatrio para vestibulares.
Os resultados poderiam ter uma significncia estatstica maior, ou at mesmo um
efeito diferente, se houvesse a possibilidade de acompanhar os indivduos por um
perodo superior a doze meses em uma base longitudinal, considerando, assim, a
situao ocupacional no longo prazo. Utilizamos a base de dados do ENEM 2008,
pois ela foi a base mais atualizada com disponibilidade de dados relativos a
pessoas que esto terminando o ensino mdio. Contudo, uma possibilidade de
extenso deste trabalho seria investigar o problema aqui levantado por um
perodo maior, utilizando vrias edies do ENEM e da PME.
106
7 CONCLUSO
A proficincia cognitiva um fator importante na vida dos indivduos e o seu nvel
determinado por fatores pessoais, familiares e escolares, entre outros. Os
trabalhos resenhados no segundo captulo mostraram a relevncia do tema para
entender a desigualdade de renda entre as pessoas sob a luz da teoria do Capital
Humano e a crtica da teoria da Sinalizao sobre o papel da escola.
Por meio do mtodo de mnimos quadrados ordinrios, foi possvel trabalhar em
torno do nosso primeiro objetivo, o de estimar e analisar a funo de produo
educacional, utilizando a base de dados do ENEM 2008. Com o mtodo de
Heckman em dois estgios, testamos e no rejeitamos a hiptese do vis de
seleo da amostra. Ademais, buscamos corrig-lo. Por fim, os modelos
hierrquicos estimados foram teis para observar que as escolas possuem um
efeito sobre todos os seus alunos, mas que a diferena da proficincia entre as
instituies se deve, em grande parte, a caractersticas pessoais e familiares dos
alunos.
A anlise dos modelos estimados possibilitou verificar que a renda familiar foi o
determinante mais importante da nota do ENEM, juntamente com a escolaridade
da me. Dentre os fatores pessoais, destacamos que os negros/pardos possuem
um desempenho inferior aos brancos/amarelos. As mulheres possuem uma
desvantagem na prova objetiva, mas possuem vantagem na prova de redao,
em relao ao sexo masculino.
A nota do ENEM, tomada como medida de proficincia cognitiva, foi imputada
para os indivduos na base de dados da PME, seguindo a metodologia de criao
de mapas de pobreza. O resultado foi satisfatrio, tendo em vista a carncia de
trabalhos com o mesmo objetivo, principalmente pela inexistncia de uma base de
dados que alie tanto informaes sobre proficincia cognitiva quanto variveis de
status ocupacional.
107
Com respeito ao objetivo principal desta dissertao, a investigao do efeito da
proficincia cognitiva do jovem sobre a sua situao ocupacional, o resultado
obtido confirmou aquilo que j foi discutido pela teoria.
Os resultados mostram que quanto maior a proficincia cognitiva, maiores so as
chances dos indivduos continuarem os estudos no ensino superior, e isso
verdade para os jovens que no trabalhavam durante o trmino do ensino mdio,
isto , maiores as chances de manter o status de estudante. Assim, os indivduos
com maior proficincia cognitiva tenham, talvez, um custo de oportunidade menor
que os demais, em relao a uma atividade que envolva aprendizado.
Em face aos determinantes da proficincia cognitiva, vimos que a renda familiar
possui grande influencia, de forma que alguns jovens com baixa renda familiar
tm suas escolhas limitadas muito antes da poca em que devem prestar o
vestibular. Por esta razo, o Estado poderia intensificar o investimento na
qualidade do ensino bsico, como forma de competir com o ensino privado e
garantir aos alunos da rede pblica de ensino, que concentra a maioria dos jovens
de baixa renda, chances de competir pelo seu futuro educacional.
Por outro lado, a escolha de interromper os estudos e entrar no mercado de
trabalho pode ser aquela que os jovens realmente desejem. Neste contexto, para
o jovem que faz esta opo, o Estado deveria reorientar o contedo programtico
do ensino bsico, que, atualmente, excessivamente cientfico-acadmico,
(exceto no caso de escolas tcnicas), desenvolvendo habilidades voltadas
diretamente para mercado de trabalho. Por exemplo, alguns pases oferecem um
contedo mais tcnico, como o caso da Alemanha, que permite melhor
adaptao dinmica do mercado de trabalho. Sendo assim, o Estado poderia
intensificar o investimento tambm em educao tcnica, no s nos institutos
federais e estaduais, mas promover disciplinas vocacionais, como atividades
extracurriculares, para as redes pblicas de ensino.
Por fim, cabe ressaltar que existem poucos trabalhos fundamentados na
compatibilizao de bases de dados para estudar a situao ocupacional dos
jovens no Brasil com base na proficincia cognitiva. Os resultados sugerem que a
108
sua acumulao possui diversos determinantes, que podem refletir na sua
situao ocupacional e nas oportunidades de geraes futuras.
A inexistncia de uma base de dados que alie informaes de proficincia
cognitiva e mercado de trabalho foi uma das causas para as vrias hipteses que
foram assumidas como verdadeiras neste trabalho. Como proposta de uma
agenda futura de pesquisa, propomos avanar em estudos empricos que
aprimorem a compatibilizao de bases de dados educacionais e de mercado de
trabalho, bem como testes que possibilitem discutir a robustez de tais medidas.
109
REFERNCIAS BIBLIOGRFICAS
ALBERNAZ, A.; FERREIRA, F.H.G.; FRANCO, C. Qualidade e equidade no
ensino fundamental brasileiro. 2002. Disponvel em:
http://www.ppe.ipea.gov.br/index.php/ppe/article/view/139/74. Acesso em:
09/05/2011.
ANDRADE, R.J. Qualidade e equidade na educao bsica brasileira: as
evidncias do Saeb 1995-2003. 2008. 230f. Dissertao (Mestrado em Educao)
Faculdade de Edcuao, Universidade Federal de Minas Gerais, Belo
Horizonte, 2008.
ANDRADE, J.M.; LAROS, J.A. Fatores associados ao desempenho escolar:
Estudo Multinvel com os dados do SAEB/2001. 2007. Disponvel em: <
http://www.scielo.br/pdf/ptp/v23n1/a05v23n1.pdf>. Acesso em: 24 fev 2012.
ASSUNO, J.J.; ALVES, L.S. Restries de crdito e decises intra-familiares.
RBE, v.61, n.2, p. 201-229, abr./jun. 2007.
ASTONE, N.M.; MCLANAHAN, S.S. Family structure, residential mobility, and
school dropout: a research note. 1994. Disponvel em:<
http://www.jstor.org/stable/2061791>. Acesso em 17/05/2011.
BARBOSA, M.E.F.; FERNANDES, C. A escola brasileira faz diferena? Uma
investigao dos efeitos da escola na proficincia em matemtica em alunos da 4
srie. 2001. Disponvel em: <http://www.educacion.gob.es/
cide/espanol/investigacion/rieme/documentos/files/barbosa/Barbosa.pdf>. Acesso
em: 10/05/2011.
BARROS, R.P.; MACHADO, A.F.; MENDONA, R.S.P. A desigualdade da
pobreza: estratgias ocupacionais e diferenciais por genro. 1997. Disponvel em:
< http://desafios2.ipea.gov.br/pub/td/1997/td_0453.pdf >. Acesso em 11 jan. 2012.
BECKER, G.S. Investment in Human Capital: A Theoretical Analysis. The
Journal of Political Economy, Vol. 70, No. 5, Part 2: Investment in Human
Beings(Oct., 1962), pp. 9-49. Disponvel em: <
http://www.jstor.org/stable/1829103>. Acesso em: 16 fev 2011.
BEN-PORATH, Y. The Production of Human Capital and the Life Cycle of
Earnings. The Journal of Political Economy, Vol. 75, No. 4, Part 1 (Aug., 1967),
pp. 352-365. Disponvel em: < http://www.jstor.org/stable/1828596>. Acesso em:
16 fev. 2011.
BLAUG, M. The economic value of education: studies in the economics of
education. Editora Aldershot: 1992.
110
BOWLES, S., GINTIS, H., OSBORNE, M. The Determinants of Earnings: A
Behavioral Approach. Journal of Economic Literature, Vol. 39, No. 4 (Dec., 2001),
pp. 1137-1176. Disponvel em: < http://www.jstor.org/stable/2698522>. Acesso
em: 12 mar. 2011.
BRASIL, 1996. Lei n 9394, de 20 de dezembro de 1996.
BRASIL, 2005. Exame Nacional do Ensino Mdio (ENEM): Fundamentao
Terico-Metodolgica. Disponvel em: < http://historico.enem.inep.gov.br >.
Acesso em: 17 jan. 2012.
BRASIL, 2007. Pesquisa mensal de emprego: Srie relatrios metodolgicos.
Disponvel em: < www.ibge.gov.br/home/estatistica/indicadores/.../srmv23pme.pdf
>. Acesso em: 09 nov. 2011.
CAMERON, A.C.; TRIVEDI, P.K. Microeconometrics: Methods and Applications.
Cambridge: Cambridge University Press, 2005. Cap.15. Multinomial models.
p.490-528.
CARVALHO, R.L. Casa, comida e roupa lavada: fatores associados sada
do jovem brasileiro do domiclio de origem. 2009. 95f. Dissertao.
CEDEPLAR, UFMG, Belo Horizonte.
CSAR, C.C.; SOARES, J.F. Desigualdades acadmicas induzidas pelo contexto
escolar. 2001. Disponvel em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol18_n1e2_2001/vol18_n1e2_200
1_6artigo_97_110.pdf>. Acesso em: 10/05/2011.
CIOL, M.A.; HOFFMAN, J.M.; DUDGEON, B.J.; SHUMWAY-COOK,
A.YORKSTON, K.M.; CHAN, L. Understanding the use of weights in the analysis
of data from multistage surveys. 2006. Disponvel em: <
http://www.sciencedirect.com/science/article/pii/S0003999305012840>. Acesso
em: 28 fev 2012
COLEMAN, J.S.; CAMPBEL, E.Q.; HOBSON, C.J.; MCPARTLAN, J.;MOOD,
A.M.; WEINFELD, F.D.; YORK, R.L. Equality of educational opportunity. 1966.
Disponvel em: < http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/06389>.
Acesso em: 18 out. 2011.
COLLIER, W.; VALBUENA, J.; ZHU, Y.What determines post-compulsory
educational choices? Evidence from the longitudinal survey of young people in
England. 2011. Disponvel em: < ideas.repec.org/p/ukc/ukcedp/1112.html>.
Acesso em: 13 jan. 2012.
CLARK, K.B.; SUMMERSL.H. The dynamics of youth unemployment. 1982.
Disponvel em: < www.nber.org/chapters/c7875.pdf >. Acesso em: 03 jan. 2012.
CRESPO, A; REIS, M.C. O efeito diploma no Brasil. 2006. Disponvel em: <
http://www.ipea.gov.br/agencia/images/stories/PDFs/mercadodetrabalho/08Nota2
_Anna_Mauricio.pdf>. Acesso em: 12/05/2011.
111
CRESPO, A; REIS, M.C.Sheepskin effects and the relationship between earnings
and education: analyzing their evolution over time in Brazil. 2009. Disponvel em:
<http://www.scielo.br/scielo.php?pid=S0034-1402009000300002&script
=sci_arttext>. Acesso em: 11/05/2011.
CURI, A.Z.; MENEZES-FILHO, N.A. A relao entre o desempenho escolar e
os salrios no Brasil. 2006. Disponvel em: <
www.anpec.org.br/encontro2005/artigos/A05A158.pdf >. Acesso em: 17 jan. 2012.
CURI, A.Z.; MENEZES-FILHO, N.A. Os determinantes das transies
ocupacionais no mercado de trabalho brasileiro. 2004. Disponvel em:
<ww.anpec.org.br/encontro2004/artigos/A04A141.pdf >. Acesso em: 19 jan 2012.
ECKSTEIN, Z.; WOLPIN, K.I. Why youth drop out of high school: the impact of
preferences, opportunities, and abilities. Econometrica, v. 67, n.6, p. 1295-1339,
nov. 1999.
ELBERS, C.; LANJOUW, J.O.; LANJOUW P. Micro-level estimation of poverty
and inequality. 2003. Disponvel em: < are.berkeley.edu/~ligon/.../elbers-
etal03.pdf >. Acesso em: 21 ago. 2011.
FERRO, M.E.; BELTRO, K.I.; SANTOS, D.P. Polticas de no-repetncia e a
qualidade da educao: evidncias obtidas a partir da modelagem dos dados da
4 srie do Saeb-99. 2002. Disponvel em: <
www.fcc.org.br/pesquisa/publicacoes/eae/arquivos/1179/1179.pdf> . Acesso em:
04 jan. 2012.
FERREIRA, R.A. Desigualdade de desempenho escolar dos alunos do ensino
fundamental do estado de So Paulo: uma anlise de decomposio. 2008. 85f.
Dissertao (mestrado em economia) Universidade de So Paulo, Ribeiro
Preto, 2008.
FERREIRA, S.G.; VELOSO F.A. Mobilidade intergeracional de educao no
Brasil. Pesquisa e Planejamento Econmico. v.33, n.3, dez. 2003.
FLEISCHHAUER, K.J. A Review of Human capital Theory: Microeconomics.
University of St. Garden, 2007. Disponvel em: <
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=957993 >. Acesso em: 12 jan.
2011.
FLORI, P.M.; MENEZES-FILHO, N.A. Mobilidade entre ocupaes e efeitos
salariais. 2008. Disponvel em:
<www.anpec.org.br/encontro2008/artigos/200807171058080-.pdf >. Acesso em:
19 jan. 2012.
FRANCO, C.; ORTIGO, I.; ALBERNAZ, A.; BONAMINO, A.; AGUIAR, G.;
ALVES, F.; STYRO N. Qualidade e equidade em educao: reconsiderando o
significado de fatores intra-escolares. 2007. Disponvel em: <
http://www.scielo.br/scielo.php?pid=S0104-40362007000200007&script=sci_
arttext&tlng=pt>. Acesso em: 03/05/2011.
112
GHEZ, J. Education, the price of time, and lyfe-cycle consumption. In JUSTER,
F.T. (Org.) Education, Income and Human Behavior. Mcgraw-Hill Books
Company: 1975. p.295-312.
GOLDIN, C. The Human Capital Century and American Leadership: virtues of the
past. Disponvel em:
<http://www.economics.harvard.edu/faculty/goldin/files/humancap.pdf>. Acesso
em: 02 abr 2012.
GOLGHER, A. Dilogos com o Ensino Mdio 5: A Escola de Ensino Mdio no
Brasil Analisada a Partir de Dados do INEP. 2010a. Disponvel em: <
www.cedeplar.ufmg.br/pesquisas/td/TD%20395.pdf >. Acesso em: 12 jan. 2012.
GOLGHER, A. Dilogos com o Ensino Mdio 6: A Escola de Ensino Mdio no
Brasil Analisada a Partir de Dados do INEP. 2010b. Disponvel em: <
www.cedeplar.ufmg.br/pesquisas/td/TD%20396.pdf >. Acesso em: 12 jan. 2012.
GONALVES, F.O.; FRANA, M.T.A. Transmisso intergeracional de
desigualdade e qualidade educacional: avaliando o sistema educacional brasileiro
a partir do SAEB 2003. Ensaio: avaliao de polticas pblicas educacionais. v.16,
n. 61, p. 639-662, out./dez. 2008.
GREENE W.H. Econometric analysis. New Jersey: Prentice Hall, 2003. Cap.22.
Limited dependent variable and duration models. p.756-802.
GUIMARES, R.R.M., RIOS-NETO, E.L.G. Desigualdades de oportunidades
educacionais: seletividade e progresso por srie no Brasil, 1986 a 2008. Belo
Horizonte: UFMG/CEDEPLAR, 2010. Disponvel em: <
http://ufmg.academia.edu/RaquelGuimaraes/Talks/27454/Desigualdade_de_oport
unidades_educacionais_Seletividade_e_progressao_por_serie_no_Brasil_1986_a
_2008>. Acesso em: 12 mar. 2011.
HALEY, W.J. Human Capital: The Choice between Investment and Income. The
American Economic Review, Vol. 63, No. 5 (Dec., 1973), pp. 929-944. Disponvel
em: < http://www.jstor.org/stable/1813915>. Acesso em: 16 fev 2011.
HANUSHEK, E.A. Sample selectivity and the validity of international student
achievement tests in economic research. 2010. Disponvel em:
<http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6V84-51C9JYF-
7-1&_cdi=5860&_user=686413&_pii=S0165176510003605&_
origin=gateway&_coverDate=02%2F28%2F2011&_sk=998899997&view=c&wchp
=dGLzVzb-zSkzk&md5=a3363b06c1a0a28700e20cd4a68ec47
f&ie=/sdarticle.pdf>. Acesso em: 13/05/2011.
HANUSHEK, E.A. The trade-off between child quantity and quality. The
Journal of Political Economy, Vol. 100, No. 1 (Feb., 1992), pp. 84-117. Disponvel
em: < http://www.jstor.org/stable/2138807>. Acesso em: 11 mar. 2011.
HANUSHEK, E.A. The economic value of education and cognitive skills. In:
SYKES, D.; SCHNEIDER, B.; PLANK, D.N. (Eds.) Handbook of education policy
research. Washington: AERA. 2009. p.39-56.
113
HARDIE, J.H. Making it? Paths to achieving and not achieving aspirations in the
transition to adulthood. 2009. Disponvel em:
<http://paa2009.princeton.edu/download.aspx?submissionId=91113>. Acesso em:
09 mar 2012.
HECKMAN, J.J. Sample selection bias as a specification error. 1979. Disponvel
em: < http://www.jstor.org/stable/1912352 >. Acesso em: 18 fev. 2011.
HECKMAN, J.J., RUBINSTEIN, Y. The Importance of noncognitive Skills:
Lessons from GED Testing Program. The American Economic Review, Vol. 91,
No. 2, Papers and Proceedings of the Hundred Thirteenth Annual Meeting of the
American Economic Association (May, 2001), pp. 145-149. Disponvel em: <
http://www.jstor.org/stable/2677749>. Acesso em: 11 abr. 2011.
HECKMAN, J.J.; MASTEROV, D.V. The productivity argument for investing in
young children. 2005. Disponvel em: < http://jenni.uchicago.edu/human-
inequality/papers/Heckman_final_all_wp_2007-03-22c_jsb.pdf>. Acesso em: 19
jan. 2012.
HOX, J. Multilevel analysis: Techniques and applications. New Jersey: Laurence
Erlbaum Associates, 2002. Cap. 1. Introduction to multilevel analysis, p. 1-10.
LAM, D. MARTELETO, L. A Dinmica da Escolaridade das Crianas Brasileiras
durante a Transio Demogrfica: Aumento no Tamanho da Coorte versus
Diminuio no Tamanho da Famlia. 2002. Disponvel em:
<http://www.abep.nepo.unicamp.br/docs/anais/pdf/2002/Com_EDU_ST16_Lam_te
xto.pdf>. Acesso em: 16/11/2010.
LAYARD, R., PSACHAROLOUPOS, G. The Screening Hypothesis and the
Returns to Education. The Journal of Political Economy, Vol. 82, No. 5 (Sep. -
Oct., 1974), pp. 985-998. Disponvel em: < http://www.jstor.org/stable/1829179>.
Acesso em: 13 abr. 2011.
MACHADO , A.F.; MORO, S.; MARTINS, L.; RIOS, J. Qualidade do Ensino em
Matemtica: Determinantes do Desempenho de Alunos em Escolas Pblicas
Estaduais Mineiras. 2008. Disponvel em: <
http://www.anpec.org.br/revista/vol9/vol9n1p23_45.pdf >. Acesso em: 04 mai.
2011.
MARTELETO, L. O papel do tamanho da famlia na escolaridade dos jovens.
2002. Revista Brasileira de Estudos de Populao, v.19, n.2, jul./dez. Disponvel
em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol19_n2_2002/vol19_n2_2002_10
artigo_p159a178.pdf> Acesso em: 11 abr. 2011.
MEDEIROS, M., OSRIO, R. Mudanas nas Famlias Brasileiras: A
Composio dos Arranjos Familiares entre 1978 e 1998. Disponvel em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol17_n1e2_2000/vol17_n1e2_200
0_4artigo_67_85.pdf>. Acesso em: 01 mai. 2011.
114
MENEZES-FILHO, N. Os Determinantes do Desempenho Escolar do Brasil.
2007. Disponvel em:<
http://www.cepe.ecn.br/seminarioiv/download/menezes_filho.pdf>. Acesso em:
07/05/2011.
MINCER, J. Investment in human Capital and Personal Income Distribution.
The Journal of Political Economy, Vol. 66, No. 4 (Aug., 1958), pp. 281-302.
Disponvel em: < http://www.jstor.org/stable/1827422 > . Acesso em: 18 fev. 2011.
ORDINE, P.; ROSE, G. Inefficient self-selection into education and wage
inequality. 2011. Disponvel em:<
http://www.aiel.it/bacheca/SASSARI/papers/ordine_rose.pdf >. Acesso em: 04 mar
2012.
PATRINOS, H.A., PSACHARAPOULOS, G. Family Size, Schooling and Child
Labor in Peru An Empirical Analysis. Disponvel em: <
http://link.springer.de/link/service/journals/00148/papers/7010004/70100387.pdf >.
Acesso em: 11 abr. 2011.
PISA. The Programme for International Student Assessment. 2006. Disponvel
em: < http://www.pisa.oecd.org >. Acesso em 11 jan. 2012.
RIANI, J.L.R.; RIOS-NETO, E.L.G. Background familiar versus perfil escolar do
municpio: qual possui maior impacto na resultado educacional dos alunos
brasileiros?. 2008. Disponvel em: < http://www.scielo.br/scielo.php?pid=S0102-
30982008000200004&script=sci_arttext&tlng=es>. Acesso em: 17/05/2011.
RIBAS, R.P.; MACHADO, A.F. A imputao da renda do no trabalho na
pesquisa mensal de emprego. 2009. Disponvel em:
http://www.ppe.ipea.gov.br/index.php/ppe/article/viewFile/1157/1062. Acesso em:
10 fev. 2011.
RIBAS, R.P.; SOARES, S.S.D. Sobre o painel da pesquisa mensal de emprego
(PME) do IBGE. 2008. Disponvel em:<
www.ipea.gov.br/sites/000/2/publicacoes/tds/td_1348.pdf >. Acesso em: 08 ago.
2011.
SAMPAIO, C.E.M. Situao ocupacional dos jovens brasileiros na faixa etria de
15 a 17 anos. 2009. Disponvel em: <http://www.publicacoes.inep.gov.br>. Acesso
em: 12 mar 2012.
SCHOON I.; POLEK, E. Tennage career aspirations and adult career attainment:
the role of gender, social background and general cognitive ability. 2011.
Disponvel em:< http://jbd.sagepub.com/content/35/3/210>. Acesso em: 09 dez.
2011.
SCHULTZ, T.W. Investment in Human Capital. The American Economic Review,
Vol. 51, No. 1 (Mar., 1961), pp. 1-17. Disponvel em:
<http://www.jstor.org/stable/1818907>. Acesso em: 16 fev 2011.
115
SILVA, N.V., HASENBALG, C. Recursos Familiares e transies
Educacionais. Disponvel em: < http://www.scielo.br/pdf/csp/v18s0/13794.pdf>.
Acesso em: 01 mai. 2011.
SOARES, J.F. Avaliao da qualidade da educao escolar brasileira. 2008.
Manuscrito. apud ANDRADE, R.J. Qualidade e equidade na educao bsica
brasileira: as evidncias do Saeb 1995-2003. 2008. 230f. Dissertao (Mestrado
em Educao) Faculdade de Edcuao, Universidade Federal de Minas Gerais,
Belo Horizonte, 2008.
SOARES, J.F. O efeito da escola sobre o desempenho cognitivo dos alunos.
2004. Disponvel em:
<http://www.ppe.ipea.gov.br/index.php/ppe/article/view/139/74>. Acesso em:
02/04/2011.
SOARES, S.S.D. O bnus demogrfico relativo e absoluto no acesso
escola. 2008. Disponvel em: <www.ipea.gov.br/sites/000/2/publicacoes/tds/
td_1340.pdf>. Acesso em: 11 fev. 2011.
SOARES, S.S.D. O Contedo Econmico da Educao. 2010. 146f. Tese
(Doutorado em Economia) Programa de Ps-Graduao em Economia,
Universidade de Braslia, Distrito Federal, 2010.
SOARES, T.M. Modelo de trs nveis hierrquicos para aproficincia dos
alunos de 4a srie avaliadosno teste de lngua portuguesa do
SIMAVE/PROEB-2002. 2005. Disponvel em:
<http://www.fcc.org.br/pesquisa/publicacoes/eae/arquivos/1112/1112.pdf>.
Acesso em: 08/04/2011.
SPENCE, M. Job market Signalling. The Quarterly Journal of Economics, Vol.
87, No. 3 (Aug., 1973), pp. 355-374. Disponvel em:
<http://www.jstor.org/stable/1882010>. Acesso em: 11 mar. 2011.
WOOLDRIDGE, J.M. Econometric Analysis of cross section and panel data.
Cambridge: The MIT Press, 2001. Cap.4. The single-equation linear model and
OLS estimation. p.49-76.
116
ANEXOS
Quadro A.1: Variveis utilizadas no processo de imputao da nota do
ENEM na PME
117
GRFICO A.1 - Distribuio do log da renda per capita na base de dados da
PNAD e PME
118
GRFICO A.2 - Distribuio percentual dos indivduos segundo a regio
metropolitana em que reside, pela base de dados do ENEM e da PME com
expanso da amostra
119
TABELA A.1 - Primeiro estgio de Heckman - modelo Probit para a
probabilidade do indivduo comparecer prova objetiva do ENEM
120
TABELA A.2 - Primeiro estgio de Heckman - modelo Probit para a
probabilidade do indivduo comparecer prova de redao do ENEM
121
TABELA A.3 - Resultado do modelo (3.19) que estima o erro do modelo de
imputao da nota do ENEM na base da PME por idade