You are on page 1of 121

Victor Haselmann Arakawa

Concluintes do Ensino Mdio: a


Qualidade da Educao e a Situao
Ocupacional dos Jovens no Brasil
Metropolitano










Belo Horizonte, MG
UFMG/Cedeplar
2012
ii
Victor Haselmann Arakawa






Concluintes do Ensino Mdio: a Qualidade da
Educao e a Situao Ocupacional dos Jovens no
Brasil Metropolitano



Dissertao apresentada ao curso de mestrado em
economia do Centro de Desenvolvimento e Planejamento
Regional da Faculdade de Cincias Econmicas da
Universidade Federal de Minas Gerais, como requisito
parcial obteno do Ttulo de Mestre em Economia.
Orientador: Prof. Dr. Andr Braz Golgher
Co-orientadora: Prof. Dr Ana Flvia Machado




Belo Horizonte, MG
Centro de Desenvolvimento e Planejamento Regional
Faculdade de Cincias Econmicas - UFMG
2012
iii
Folha de Aprovao




















iv

















Ao meu av Mansueto Paulo e minha av
Judith Haselmann Paulo
v
AGRADECIMENTOS
Agradeo em primeiro lugar ao Cedeplar, pela oportunidade de participar de um
ambiente de conhecimento amplamente reconhecido pela sua qualidade e
comprometimento com o avano terico e aplicado da cincia econmica.
Agradeo ao colegiado do programa de ps-graduao, por prezar pela solidez do
curso e cuidado com todos, incluindo alunos, professores e pesquisadores. A
CAPES tambm merece reconhecimento pela bolsa concedida, que possibilitou
minha mudana de So Paulo para Belo Horizonte, com dedicao exclusiva ao
curso.
Os professores ligados coordenao do curso foram atenciosos durante todo o
meu contato com a parte institucional e, por isso, gostaria de agradecer ao apoio
de Frederico Gonzaga Jayme Junior e Ana Maria Hermeto Camilo de Oliveira.
Agradeo a Rodrigo Ferreira Simes pela ateno institucional durante a poca
em que fui monitor do curso de relaes econmicas internacionais e professor
substituto de microeconomia. A oportunidade de poder lecionar em uma
instituio como a UFMG algo nico e que certamente me recordarei
positivamente.
Sou muito agradecido a todos os professores que se dedicaram para transmitir o
seu conhecimento aos alunos. Gostaria de lembrar dos professores Cssio
Maldonado Turra e Simone Wajnman, do programa de ps-graduao em
Demografia, pelas aulas de demografia econmica que foram fundamentais para
a discusso deste trabalho.
Agradeo a professora Ana Maria Hermeto Camilo de Oliveira pela ateno fora
da sala de aula, para orientao sobre o rumo acadmico dos alunos, e por
aceitar o convite para fazer parte da banca de defesa desta dissertao. Da
mesma maneira, agradeo Sergei Soares por tambm aceitar o convite para
participar da banca examinadora.
Agradeo enormemente minha coorientadora Ana Flvia Machado, pelo
interesse e comentrios sobre a ideia principal sobre educao, to ampla e
vi
interessante, bem como a orientao sobre a manipulao da base de dados da
PME, que pode ser um trabalho homrico.
Ao meu orientador, Andr Braz Golgher, agradeo pela enorme disponibilidade
em discutir todos os pontos do trabalho, sugerindo alternativas criativas para
problemas nem um pouco triviais. A oportunidade de trabalhar junto, tambm
como seu monitor, foi uma boa experincia que certamente contribuiu para a
minha formao.
A todos aqueles que compartilharam os desafios do nivelamento e do primeiro
semestre, gostaria de agradecer pela amizade que certamente levarei de Minas
Gerais. Obrigado aos colegas de mestrado e de doutorado.
Agradeo minha famlia, pela educao que me deu e pelo apoio na mudana
de So Paulo. Por fim, agradeo minha esposa Luzia Maria Cavalcante de
Melo, que amo e que conheci no CEDEPLAR e que foi compreensiva com a
dedicao de grande parte do nosso tempo concluso deste trabalho.


vii
SUMRIO
1 INTRODUO .................................................................................................. 14
2 REVISO BIBLIOGRFICA .............................................................................. 17
2.1 Sobre a Teoria do Capital Humano e suas Crticas ....................................... 17
2.2 Fatores Associados ao Desempenho Escolar ................................................ 20
2.2.1 Caractersticas Pessoais ............................................................................. 23
2.2.2 Nvel Socioeconmico ................................................................................. 26
2.2.3 Estrutura e Arranjo Familiar ......................................................................... 27
2.3 Determinantes Escolares da Proficincia Cognitiva ....................................... 29
2.4 Determinantes Ocupacionais ps-Ensino Mdio ............................................ 31
3 METODOLOGIA ................................................................................................ 35
3.1 Estratgia Emprica ........................................................................................ 37
3.1.1 Estimao da Funo de Produo Educacional ........................................ 37
3.1.2 A Correo do Vis de Auto-Seleo .......................................................... 38
3.1.2.1 Metodologia da Correo do Vis de Auto-Seleo ................................. 38
3.1.3 A Violao da Hiptese de Amostras Independentes e Identicamente
Distribudas .......................................................................................................... 42
3.1.3.1 Metodologia dos Modelos Hierrquicos Lineares ..................................... 43
3.1.4 Imputao da Nota Estimada do ENEM na PME ........................................ 45
3.1.5 Estimao da Situao Ocupacional do Indviduo em Funo da Proficincia
............................................................................................................................. 48
3.2 Apresentao das Bases de Dados e Variveis Utilizadas na Estratgia
Emprica ............................................................................................................... 51
3.2.1 Descrio da Base de Dados do ENEM e das Variveis da Funo de
Produo Educacional ......................................................................................... 51
3.2.2 Descrio da Base de Dados do Censo Escolar e das Variveis Utilizadas
na Correo de Heckman .................................................................................... 56
viii
3.2.3 Descrio da Base de Dados da PME Utilizada para a Estimao da
Situao Ocupacional dos Indivduos .................................................................. 57
4 ANLISE DESCRITIVA DAS VARIVEIS UTILIZADAS NA ESTRATGIA
EMPRICA ....................................................................................................... 61
4.1 Anlise Descritiva das Variveis Utilizadas na Estimao da Funo de
Produo Educacional ......................................................................................... 61
4.2 Anlise Descritiva das Variveis Escolares utilizadas na Correo do Vis de
Auto-Seleo ........................................................................................................ 68
4.3 Anlise Descritiva das Variveis Utilizadas na Imputao da Proficincia
Cognitiva do ENEM para a PME .......................................................................... 71
4.4 Anlise Descritiva da Varivel de Situao Ocupacional na Base de Dados da
PME ..................................................................................................................... 78
5. FUNO DE PRODUO EDUCACIONAL .................................................... 80
5.1 Estimao da Funo de Produo Educacional por MQO ........................... 80
5.2 Funo de Produo Educacional com Correo para o Vis de Auto-Seleo
do ENEM .............................................................................................................. 85
5.3 Estimao da Funo de Produo Educacional por meio de Modelos
Hierrquicos Lineares .......................................................................................... 88
6 A RELAO ENTRE PROFICINCIA COGNITIVA E SITUAO
OCUPACIONAL DOS JOVENS ...................................................................... 96
6.1 Imputao da Proficincia Cognitiva do ENEM para a PME .......................... 96
6.2 Anlise dos Determinantes da Mobilidade Ocupacional dos Jovens ............. 99
7 CONCLUSO .................................................................................................. 106
REFERNCIAS BIBLIOGRFICAS ................................................................... 109
ANEXOS ............................................................................................................ 116


ix
LISTA DE ILUSTRAES
FIGURA 1 - MODELO CONCEITUAL EXPLICATIVO DA PROFICINCIA
COGNITIVA .................................................................................................... 22
QUADRO 1 ESTUDOS DE PERSISTNCIA INTERGERACIONAL DE
EDUCAO .................................................................................................... 25
QUADRO 2 - NMERO DE INDIVDUOS POR MS E ANO DE ENTRADA
NA PME .......................................................................................................... 60
TABELA 1 RESUMO DAS ESTATSTICAS DESCRITIVAS DE TODAS AS
VARIVEIS UTILIZADAS NA ESTIMAO DA FUNO DE
PRODUO EDUCACIONAL ........................................................................ 62
GRFICO 1 - DISTRIBUIO ACUMULADA DA IDADE DOS CANDIDATOS
POR REDE DE ENSINO ................................................................................. 63
GRFICO 2 - DISTRIBUIO ACUMULADA DA IDADE DOS CANDIDATOS
QUE ESTO NO 3 ANO DO ENSINO MDIO SEGUNDO A
ESCOLARIDADE DA ME. ............................................................................ 64
TABELA 2 DISTRIBUIO TOTAL E POR REGIO METROPOLITANA
DOS CANDIDATOS SEGUNDO A RENDA FAMILIAR .................................. 65
GRFICO 3 - PROPORO DE CANDIDATOS AO ENEM SEGUNDO
GNERO E FAIXA DE RENDA FAMILIAR ..................................................... 66
TABELA 3 DISTRIBUIO DOS CANDIDATOS POR RM SEGUNDO
ESCOLARIDADE DA ME ............................................................................. 67
QUADRO 3 - ESTATSTICAS DESCRITIVAS SOBRE GNERO E
COR/RAA POR REGIO METROPOLITANA .............................................. 67
TABELA 4 - ESTATSTICAS DESCRITIVAS DA IDADE DOS DOCENTES
POR REGIO METROPOLITANA .................................................................. 69
TABELA 5 - ESTATSTICAS DESCRITIVAS DA PROPORO DE
DOCENTES COM PS-GRADUAO NAS ESCOLAS POR REGIO
METROPOLITANA ......................................................................................... 70
x
TABELA 6 - PROPORO TOTAL DAS ESCOLAS POR TIPO DE
INFRAESTRUTURA ....................................................................................... 71
GRFICO 4 - DISTRIBUIO DOS INDIVDUOS POR IDADE NA BASE DE
DADOS DO ENEM E PME ............................................................................. 72
GRFICO 5 - DISTRIBUIO DOS INDIVDUOS SEGUNDO
ESCOLARIDADE DA ME NA BASE DE DADOS DO ENEM E PME ........... 73
GRFICO 6 - DISTRIBUIO PERCENTUAL DOS INDIVDUOS
SEGUNDO FAIXA DE RENDA FAMILIAR NA BASE DE DADOS DA
PME E ENEM ................................................................................................. 75
GRFICO 7 - DISTRIBUIO PERCENTUAL DOS INDIVDUOS
SEGUNDO A QUANTIDADE DE MORADORES NO DOMICLIO NA
BASE DE DADOS DA PME E ENEM ............................................................. 76
GRFICO 8 - DISTRIBUIO PERCENTUAL DOS INDIVDUOS
SEGUNDO A REGIO METROPOLITANA EM QUE MORA ......................... 77
QUADRO 4: MATRIZ DE TRANSIO DA SITUAO OCUPACIONAL EM
DOZE MESES ................................................................................................ 79
TABELA 7 - RESULTADO DOS MODELOS ECONOMTRICOS
ESTIMADOS PARA FUNO DE PRODUO EDUCACIONAL DA
NOTA DA PROVA OBJETIVA NO ENEM 2008 .............................................. 94
TABELA 8 - RESULTADO DOS MODELOS ECONOMTRICOS
ESTIMADOS PARA FUNO DE PRODUO EDUCACIONAL DA
NOTA DA PROVA DE REDAO DO ENEM 2008 ....................................... 95
TABELA 9 - RESULTADO DA ESTIMAO DO MODELO (3.17) PARA A
IMPUTAO DA NOTA DO ENEM PARA OS INDIVDUOS DA PME
POR IDADE .................................................................................................... 97
TABELA 10 ESTATSTICAS DESCRITIVAS DA NOTA DO ENEM E DA
PROFICINCIA IMPUTADA NA BASES DE DADOS DA PME ...................... 98
GRFICO 9 - DISTRIBUIO DA NOTA DO ENEM 2008 E DA NOTA
IMPUTADA NA PME 2008-2009 ..................................................................... 98
xi
TABELA 11 - RAZO DE RISCO RELATIVO PARA AS SITUAES
OCUPACIONAIS ESTIMADAS PELO MODELO LOGIT MULTINOMIAL
PARA A SITUAO INICIAL "TRABALHA E ESTUDA" ............................... 102
TABELA 12 - RAZO DE RISCO RELATIVO PARA AS SITUAES
OCUPACIONAIS ESTIMADAS PELO MODELO LOGIT MULTINOMIAL
PARA A SITUAO INICIAL "NO TRABALHA E ESTUDA" ...................... 103
QUADRO A.1: VARIVEIS UTILIZADAS NO PROCESSO DE IMPUTAO
DA NOTA DO ENEM NA PME ...................................................................... 116
GRFICO A.1 - DISTRIBUIO DO LOG DA RENDA PER CAPITA NA
BASE DE DADOS DA PNAD E PME ............................................................ 117
GRFICO A.2 - DISTRIBUIO PERCENTUAL DOS INDIVDUOS
SEGUNDO A REGIO METROPOLITANA EM QUE RESIDE, PELA
BASE DE DADOS DO ENEM E DA PME COM EXPANSO DA
AMOSTRA .................................................................................................... 118
TABELA A.1 - PRIMEIRO ESTGIO DE HECKMAN - MODELO PROBIT
PARA A PROBABILIDADE DO INDIVDUO COMPARECER PROVA
OBJETIVA DO ENEM ................................................................................... 119
TABELA A.2 - PRIMEIRO ESTGIO DE HECKMAN - MODELO PROBIT
PARA A PROBABILIDADE DO INDIVDUO COMPARECER PROVA
DE REDAO DO ENEM ............................................................................. 120
TABELA A.3 - RESULTADO DO MODELO (3.19) QUE ESTIMA O ERRO
DO MODELO DE IMPUTAO DA NOTA DO ENEM NA BASE DA PME
POR IDADE .................................................................................................. 121
xii
RESUMO
Esta dissertao investiga os determinantes da proficincia cognitiva dos
estudantes do ltimo ano do ensino mdio, nas regies metropolitanas de Belo
Horizonte, So Paulo, Rio de Janeiro, Salvador, Recife e Porto Alegre. Alm
disso, investiga a importncia da proficincia como determinante da situao
ocupacional dos jovens aps a concluso da educao bsica.
O mtodo primrio utilizado para estimar a funo de produo educacional, com
base no ENEM 2008 e no Censo Escolar 2008, foi o de mnimos quadrados
ordinrios. A presena do vis de auto-seleo da amostra e do vis de
dependncia das amostras foram testadas e corrigidas, respectivamente, pelo
mtodo em dois estgios de Heckman (1979) e pelo mtodo dos modelos
hierrquicos lineares.
A imputao da nota do ENEM 2008 na PME 2008-2009 foi baseada na
metodologia de criao de mapas de pobreza. Aps a imputao da varivel de
proficincia, utilizou-se o modelo probabilstico multinomial logit para estimar a
probabilidade de transio entre situaes ocupacionais, tendo a proficincia
cognitiva como determinante, utilizando a PME de 2008 a 2010.
Como resultado dos principais determinantes da nota do ENEM em 2008, a renda
familiar e o nvel educacional da me do estudante foram os mais importantes.
Alm disso, negros/pardos possuem notas menores que brancos/amarelos, as
mulheres possuem desempenho inferior que os homens na prova objetiva, mas
obtm melhores resultados na redao. Considerando as diferenas regionais, a
regio metropolitana de Belo Horizonte possui uma nota mdia superior que todas
as demais.
O resultado do modelo probabilstico para a situao ocupacional dos jovens
mostrou que no existe muita diferena entre sexos, mas a proficincia cognitiva
aumenta a probabilidade do indivduo continuar estudando.

Palavras-chave: proficincia cognitiva, imputao de dados, situao
ocupacional.
xiii
ABSTRACT
This dissertation investigates the determinants of cognitive proficiency of students
in their final year of high school in the metropolitan area of Belo Horizonte, So
Paulo, Rio de Janeiro, Salvador, Recife and Porto Alegre. Furthermore, it
investigates the importance of cognitive proficiency as a determinant of
occupational status of young people after completion of basic education.
The primary method used to estimate the educational production function, based
on the ENEM and School Census databases of 2008, was the ordinary least
squares. The presence of self-selection bias in the sample and the bias of non
i.i.d. samples were fixed with, respectively, the method of two stage of Heckman
(1979) and the method of hierarchical linear models.
The imputation of ENEM scores in PME was based on the methodology of poverty
maps creation. After the imputation of the cognitive proficiency variable, we used
the multinomial logit model to estimate the probability of transition between
occupational status, with cognitive proficiency as a determinant, using the PME
from 2008 to 2010.
As a result of the main determinants of the ENEM score in 2008, we can point
family income and educational level of student's mother as the most important. In
addition, black students have lower grades than white or asian students, women
have lower performance than men in the objective test, but perform better in
writing. Considering regional differences, the metropolitan area of Belo Horizonte
has an average score higher than all others.
The result of the probabilistic model for the occupation of young people showed
that there is not much difference between sexes, but the cognitive proficiency
increases the probability of an individual to continue studying in higher education.


Keywords: cognitive proficiency, data mashup, occupational status.
14
1 INTRODUO
A influncia da educao dos indivduos sobre as suas oportunidades no mercado
de trabalho e sobre como o mercado de trabalho valoriza a educao faz parte de
uma ampla discusso terica e emprica no ramo da economia e outras cincias
sociais, sendo esta, a principal motivao para este trabalho.
A maioria dos indivduos reserva boa parte da juventude dedicada ao sistema
educacional formal. Tal sistema deve proporcionar aos indivduos o
desenvolvimento das suas faculdades cognitivas, utilizadas no processamento de
informaes, relacionadas ao raciocnio lgico e, paralelamente, instigar o
desenvolvimento de habilidades no-cognitivas, ligadas principalmente
sociabilidade e sensibilidade humana. Assim, a qualidade da formao
educacional pode influenciar a insero no mercado de trabalho, uma vez que
este valoriza tais habilidades pessoais.
Alguns economistas (MINCER, 1958; BECKER, 1962; HANUSCHEK, 2009;
HALEY, 1973), por meio da Teoria do Capital Humano, afirmam que a
escolaridade afeta a renda dos indivduos, mas no deixam claro se isso decorre
da habilidade cognitiva adquirida na escola, apesar de ser este o argumento
subjacente na teoria. Alm disso, talvez, o simples fato das pessoas freqentarem
a escola seja to importante quanto o seu contedo propriamente dito (BOWLES
et. al, 2001; HECKMAN & RUBINSTEIN, 2001). O ambiente escolar pode
proporcionar ao estudante no apenas a capacitao intelectual, mas tambm
desenvolvimento de uma rede de amizades e habilidades sociais, fruto da
interao interpessoal.
Nesse contexto, o foco deste trabalho concentra-se no estudo da relao entre as
habilidades cognitivas de um indivduo e a sua posio no mercado de trabalho
aps a concluso do ensino mdio, medidas, respectivamente, por meio de sua
proficincia no Exame Nacional do Ensino Mdio (ENEM) de 2008 e a situao
ocupacional (somente estuda, somente trabalha, estuda e trabalha ou nenhuma
15
das opes) inicial e final, na periodicidade de 12 meses, utilizando a Pesquisa
Mensal de Emprego (PME) de 2008 a 2010.
Nosso objetivo principal estudar a relao entre a posio dos indivduos no
mercado de trabalho, doze meses aps a concluso do ensino mdio, e a sua
proficincia cognitiva. Para isso, imputamos a nota estimada do ENEM para os
indivduos na base de dados da PME de 2008 e 2009, segundo caractersticas
comuns a ambas as bases.
Para se alcanar este objetivo principal, precisamos, em primeiro lugar, levantar
os principais trabalhos relacionados ao tema e, a partir dessa discusso, estimar
e analisar a funo de produo educacional, utilizando a nota do ENEM 2008 e
os seus determinantes (caractersticas pessoais, background familiar e escolar),
que faz parte do nosso objetivo secundrio.
As hipteses principais so de que a renda familiar, a educao dos pais e a
frequncia de uma escola de melhor qualidade e a no competio entre o tempo
de estudos com o trabalho auxiliam na proficincia dos estudantes. Alm disso,
espera-se que a maior proficincia cognitiva dos recm egressos do ensino mdio
aumente a probabilidade de que eles busquem dar continuidade aos estudos no
ensino superior, pela diminuio do custo de aprendizado.
Nesse caso, a compatibilizao da base do ENEM com a PME fundamental
para alcanar os objetivos da dissertao, uma vez que cada uma delas possui
uma parte essencial para a investigao emprica da influncia da proficincia
escolar nas decises de alocao do tempo dos jovens.
A compatibilizao que se busca neste trabalho no trivial, uma vez que no
observamos os mesmos indivduos nas duas amostras e, tambm, porque podem
existir vieses, que so discutidos nos captulos subsequentes. Os trabalhos
pioneiros (MINCER, 1958; BECKER, 1962) estimaram a relao causal entre
escolaridade, medida em anos de estudo, e renda do indivduo, mas atualmente,
a disponibilidade de dados de exames de proficincia abriu novas portas para
estudar as habilidades cognitivas, a renda e a posio dos indivduos no mercado
de trabalho.
16
Esta dissertao est dividida da seguinte forma: no segundo captulo, feita uma
reviso bibliogrfica sobre trabalhos considerados relevantes para os objetivos da
anlise, tanto em termos tericos quanto aplicados, com a finalidade de situar
nossos objetivos e contribuies. No terceiro captulo, descrevemos a
metodologia, detalhando as bases de dados e as variveis a serem utilizadas em
cada etapa da dissertao. No quarto captulo, apresentamos a anlise descritiva
das variveis que foram utilizadas na estratgia emprica.
No quinto captulo, estimou-se a funo de produo educacional utilizando o
mtodo de mnimos quadrados ordinrios (MQO), a correo de Heckman para o
problema de vis de auto-seleo e os modelos hierrquicos para o problema de
independncia das amostras. Os determinantes da proficincia cognitiva dos
jovens que esto no ltimo ano do ensino mdio e que residem nas regies
metropolitanas de Belo Horizonte, So Paulo, Rio de Janeiro, Salvador, Recife e
Porto Alegre foram discutidos luz dos resultados obtidos.
No sexto captulo, a nota do ENEM 2008 foi imputada para os indivduos que
entraram na base de dados da PME entre 2008 e 2009, utilizando a metodologia
de Elbers et al (2003) e adaptada por Ribas e Machado (2009). Os resultados da
foram apresentados, discutidos e, posteriormente, utilizados para estimar o
modelo probabilstico multinomial logit, para a transio da situao ocupacional
dos jovens. Com isso, podemos discutir a influncia da proficincia cognitiva dos
mesmos sobre a sua situao no mercado de trabalho e sobre a continuao dos
estudos no ensino superior.
Por fim, temos a concluso no stimo captulo, onde os principais resultados
foram sumarizados e as consideraes finais foram feitas.
17
2 REVISO BIBLIOGRFICA
Esse captulo busca fazer uma reviso bibliogrfica dos trabalhos que
contriburam para o entendimento e avano da economia da educao e est
dividido em duas partes. A primeira discute os pontos principais da Teoria do
Capital Humano, bem como as crticas feitas a ela. A segunda parte trata dos
fatores associados proficincia escolar dos estudantes, com base na habilidade
cognitiva e no-cognitiva dos mesmos, tendo-se por referncia a funo de
produo educacional.
2.1 Sobre a Teoria do Capital Humano e suas Crticas
O papel que alguns atributos pessoais podem exercer sobre as escolhas dos
indivduos, bem como a determinao de sua renda, um tema muito discutido e
fundamentado na literatura econmica. Em especial, podemos destacar o papel
que a educao formal possui sobre as decises e oportunidades pessoais ao
longo da vida.
O modelo elaborado por Mincer (1958) introduziu a ideia de que a diferena de
renda entre trabalhadores determinada por trs fatores: a quantidade de
treinamento e a sua experincia profissional. A experincia seria funo da idade
e do tempo de profisso, mas possui rendimentos marginais decrescentes
devidos, principalmente, ao avano tecnolgico e tambm ao desgaste natural
biolgico que afeta os seres humanos. Logo, o autor destaca que existe uma
diferena de renda entre ocupaes que demandam nveis educacionais
diferenciados e, ainda, uma diferena de renda dentro de uma mesma ocupao,
devido experincia e idade.
Alguns anos depois, Becker (1962) sugeriu a importncia da escolaridade para
explicar a desigualdade de renda entre indivduos. Essa ideia foi inovadora em
relao a outras de sua poca porque, geralmente, a riqueza pessoal era
18
vinculada posse de capital fsico, e assim, essa era considerada a principal
fonte de desigualdade de renda entre as famlias.
A principal contribuio de Becker para o estudo do capital humano foi a
elaborao do conceito da taxa de retorno da educao sobre o rendimento dos
indivduos. Se o investimento presente em educao reverte-se em renda futura,
ento a taxa de retorno uma medida de custo-benefcio que o investimento
monetrio e custos de oportunidades durante o perodo escolar propiciam aps a
insero do indivduo no mercado de trabalho.
A discusso terica da contribuio do conhecimento na determinao de salrios
bastante rica. De um lado, temos a abordagem do capital humano que
apresenta a sade, habilidade, experincia e escolaridade como pontos centrais
para explicar a desigualdade de renda entre os indivduos com nveis
educacionais diferentes. No entanto, existem trabalhos (BOWLES et. al, 2001;
HECKMAN & RUBINSTEIN, 2001) que identificam o problema da educao e da
distribuio de salrios no mercado de trabalho tambm por meio de outros
mecanismos, chamados de habilidades no-cognitivas, que diferenciam
indivduos no mercado de trabalho.
A ideia desses autores que, como os indivduos passam boa parte de sua
juventude na escola, pode haver o desenvolvimento de outras habilidades
individuais, que dependem de sua presena na turma. A vivncia com pessoas da
mesma coorte, provenientes de classes sociais diferentes e com alunos mais
habilidosos, forma a rede social de amizades e influncia mtua que,
posteriormente, pode influenciar a insero no mercado de trabalho muito mais do
que as habilidades cognitivas desenvolvidas na escola.
Para Heckman & Rubinstein (2001), as pessoas com alto nvel de QI (Quociente
de Inteligncia) podem no alcanar sucesso em vida por no possuir disciplina
ou concentrao suficiente para resolver problemas. Nesse sentido, um alto nvel
de escolaridade pode sinalizar que os indivduos so mais perseverantes que os
demais. Para os autores, se a formao das habilidades cognitivas das pessoas
se completa at uma idade precoce, seria demasiadamente ineficaz investir
somente na dimenso cognitiva ao longo de todo ciclo escolar, enquanto que o
19
custo de aprendizado de habilidades no-cognitivas em idades mais avanadas
menor.
A principal crtica Teoria do Capital Humano, no entanto, baseia-se na Teoria da
Sinalizao no mercado de trabalho, de Spence (1973). O seu principal interesse
recai sobre as relaes de trabalho pela ptica da assimetria de informao entre
trabalhadores e firmas atuando no mercado de trabalho.
O autor explica que o empregador no conhece de fato as reais caractersticas,
que so pertinentes ao trabalho, do candidato vaga de emprego e nem como
ele se comportar aps sua possvel admisso. O candidato, por sua vez, possui
traos pessoais imutveis, como sexo, raa e, principalmente, habilidade cognitiva
inata, bem como caractersticas sob seu controle, como a educao, que so
observveis pelo empregador durante uma entrevista.
O fato de alguns candidatos possurem mais escolaridade que outros, para
Spence (1973), sinaliza que estes possuem mais habilidade cognitiva, sendo este
um atributo pessoal constante ao longo do tempo, correlacionado positivamente
com a escolaridade. A habilidade cognitiva garante um menor custo de concluir
ciclos de educao formal. Assim, o autor considera que a escolaridade a
melhor credencial sobre a aptido do candidato, apesar de outros traos serem
importantes, mas no observveis at o momento da contratao.
O chamado sheepskin effect, ou efeito diploma, derivado da teoria da sinalizao,
significa que a renda do indivduo aumenta segundo sua escolaridade por
discriminar a habilidade, mas aumenta mais quando esse ano adicional coincide
com a obteno de um diploma de concluso. Isso significa uma relao no
linear e descontnua entre educao e a renda (CRESPO & REIS, 2006, pg.25).
Para o caso brasileiro, Crespo e Reis (2009) encontram um efeito diploma
positivo, ainda que demonstrem que o efeito diminuiu no perodo analisado (1982
a 2004), conforme o aumento da oferta de educao no pas.
A afirmao de que a nica funo da educao diferenciar pessoas com
habilidades (inatas) que so valorizadas pelo mercado de trabalho criticada,
pois, caso seja verdadeira, poderia existir um mecanismo mais barato do que o
sistema educacional para identificar trabalhadores habilidosos. Assim, no
20
podemos afirmar que os indivduos nascem com certo nvel de habilidade e
passam pelo sistema educacional sem serem afetados pelo mesmo, tampouco
podemos afirmar que o sistema de ensino unicamente aprimora as habilidades
cognitivas que so valorizadas no mercado de trabalho (BLAUG, 1992; LAYARD
& PASCHAROPOULOS, 1974).
2.2 Fatores Associados ao Desempenho Escolar
A proficincia escolar possui uma correlao positiva com o salrio do
trabalhador, e possui vrios determinantes, bem como pode funcionar como
motivadora de uma srie de outras escolhas dos indivduos. A escolha
ocupacional, a residncia em locais diferenciados, os padres de consumo e a
escolha dos amigos so exemplos de tais escolhas (GHEZ, 1975). Como a
educao possui um papel to vital para as pessoas, devemos investigar os
determinantes para se investir tempo e recursos monetrios nesse processo, para
entender porque as pessoas simplesmente no optam por completar o ciclo de
educao formal.
Segundo Hanushek (2010), a medida mais comumente usada como produto
educacional a escolaridade do indivduo, isto , a quantidade de anos de
estudos completos. Contudo, essa medida simplesmente contabiliza os anos
cursados, sem considerar a qualidade do ensino. Assim, uma mtrica mais
adequada seria a utilizao de resultados individuais de exames padronizados de
proficincia para explicar o conhecimento adquirido na escola.
Os fatores que afetam a proficincia dos alunos em sua vida acadmica so
muitos e, por vezes, correlacionados entre si. Como exemplo, citamos a relao
entre um produto educacional, explicada por um vetor de variveis pessoais
(sexo, gnero, cor, etc.), familiares (nvel socioeconmico familiar, arranjo familiar,
nmero de moradores no mesmo domiclio) e insumos escolares (escolaridade
dos professores, infraestrutura da escola, etc.).
A funo de produo educacional que explica a escolaridade E do estudante
com por meio de fatores cognitivos C, como a proficincia ou escolaridade, e
no-cognitivos N, como gnero, cor/raa, idade, background familiar e insumos
21
escolares, somado a um erro aleatrio v, como explica Soares (2010), pode ser
escrita da seguinte maneira:
v C N E
c n
+ + =
(2.1)
A escolaridade em si pode no ser o objetivo da existncia do sistema
educacional. O foco das polticas de ensino seria produzir capital humano, isto ,
aumentar a proficincia cognitiva dos alunos a cada ano adicional de
escolaridade. Assim, muitos autores utilizam a funo de produo educacional
como uma forma de expressar o desempenho escolar, e no a escolaridade, em
funo de fatores cognitivos e no-cognitivos, como explica Albernaz et al. (2002):
) , , , , ( s p g m c F y =
(2.2)
Nesse caso, y significa o desempenho do aluno, medido em alguma escala de
proficincia, c representa caractersticas pessoais, m os fatores familiares, g
a influncia dos colegas de classe, p as variveis ligadas aos professores e s
as caractersticas da escola que o aluno frequenta.
No caso brasileiro, existem diversos trabalhos, como Barbosa e Fernandes
(2001), Csar e Soares (2001), Albernaz et al. (2002), Soares (2004) e Franco et
al. (2007) que utilizam a nota obtida no Saeb (Sistema de Avaliao da Educao
Bsica) para alunos da 4 e 8 srie
1
do ensino fundamental, para estimar o
desempenho escolar do aluno em funo de variveis pessoais e da escola. No
caso de Minas Gerais, Machado et al. (2005) e Soares (2005) utilizam uma base
de avaliao especfica do Estado, o SIMAVE (Sistema Mineiro de Avaliao da
Educao Pblica), para o mesmo objetivo.
Para estimar os fatores associados proficincia dos alunos, Golgher (2010)
utiliza a base de dados do ENEM, agregando diversos atributos pessoais por
meio de anlise multivariada e estuda sua influncia na proficincia dos alunos no
exame, por meio do mtodo de MQO e de Heckman. O seu resultado mostra que

1
Equivalentes, respectivamente, ao 5 e 9 ano do ensino fundamental, segundo o novo formato
do ensino fundamental.
22
o vis de seleo menor em escolas privadas e federais, e os fatores no-
observveis que esto associados com a maior probabilidade de presena do
aluno no exame tambm esto associados com maiores notas na prova.
No contexto da realidade brasileira, queremos investigar quais so os
determinantes do desempenho dos alunos, isto , estimar a funo de produo
educacional. Dessa forma, a Figura 1 apresenta o fluxo de relaes de influncia
entre fatores de diferentes instituies que podem determinar a proficincia do
estudante e que so discutidos em separado a seguir:
Figura 1 - Modelo conceitual explicativo da proficincia cognitiva

A legislao educacional, bem como os costumes e valores da sociedade
brasileira influenciam, possivelmente, a forma de funcionamento institucional das
escolas, a satisfao dos pais de estudantes e estes prprios sobre o que se
aprende na escola e o valor desse conhecimento. Embora sua importncia seja
fundamental, o papel das variveis relativas sociedade, de pouco controle dos
23
estudantes e de seus pais, foge ao escopo deste trabalho. Assim, buscamos
concentrar nas dimenses mais prximas da realidade dos jovens, como suas
prprias caractersticas, a famlia e a escola que ele frequenta.
2.2.1 Caractersticas Pessoais
As caractersticas pessoais dos estudantes, tais como sexo, raa, sade e
habilidades inatas podem influenciar em seu resultado educacional (proficincia)
de diversas maneiras. Muitos trabalhos baseados no Saeb (ANDRADE R.J.,
2008; ALBERNAZ et al., 2002; CSAR & SOARES, 2001; FRANCO et al., 2007)
apresentam uma correlao significativa entre desempenho escolar e gnero,
mas ainda que no sejam unnimes com respeito aos alunos da 4 srie,
apontam que os alunos do sexo masculino da 8 srie de ensino fundamental e 3
ano do ensino mdio possuem uma vantagem em relao ao sexo oposto quando
testados sobre conhecimentos de matemtica.
Um outro exemplo da diferena de desempenho entre sexos pode ser identificado
no PISA (Programme for International Student Assessment) realizado,
trienalmente, pela OCDE (Organizao para Cooperao e Desenvolvimento
Econmico). Considerando a edio de 2006, foram testados mais de
quatrocentos mil jovens de 57 pases diferentes (PISA, 2006). O resultado do
exame de leitura do PISA 2006 apontou um desempenho melhor para o sexo
feminino em todos os pases participantes do exame. No entanto, na prova de
matemtica, observa-se que, em 31 dos 57 pases participantes, o sexo
masculino apresentou um desempenho superior ao feminino, e em 21 outros
pases no houve diferena. No Brasil, o sexo feminino apresentou um
desempenho melhor na prova de leitura e compreenso do PISA 2006, mas, na
prova de matemtica, ocorreu o contrrio (PISA, 2006).
Com respeito desigualdade de proficincia e oportunidades de estudo de pretos
e pardos, em relao a brancos e amarelos, a maioria dos trabalhos inclui essa
varivel como determinante do desempenho do estudante, mesmo que haja um
erro de medida por auto-atribuio, uma vez que o candidato livre para
responder o que quiser, segundo Andrade (2008). As causas pelas quais a raa
24
interfere na proficincia do aluno podem refletir as desigualdades sociais as quais
pretos e pardos enfrentam, desde oportunidades de trabalho, nvel
socioeconmico familiar ou residncia em locais de pior acesso a escolas de
qualidade.
O resultado encontrado sistematicamente para diversas edies do exame do
Saeb foi uma correlao negativa entre a declarao do aluno ser preto ou pardo
e a sua nota no exame, em relao a brancos e amarelos, para qualquer srie
cursada, tanto em escolas pblicas quanto em escolas privadas (ANDRADE,
2008; ALBERNAZ et al., 2002; CSAR & SOARES, 2001; FERRO et al, 2002;
GONALVES & FRANA, 2008; FERREIRA, 2008; FRANCO, 2009). De acordo
com os resultados obtidos por ALBERNAZ et al. (2002), isto pode indicar que a
desigualdade de proficincia entre brancos e no-brancos no decorrida apenas
da desigualdade de oportunidades, mas podem haver outros fatores.
Ao aprofundar a investigao do efeito da cor/raa sobre a vida escolar dos
indivduos, Guimares & Rios-Neto (2010) investigam, no Brasil, a hiptese de
que as origens sociais determinam a probabilidade de transitar entre sries
escolares. Uma consequncia de sua afirmao seria um efeito causal declinante
da raa sobre a transio escolar ao longo dos anos, devido seleo a cada fim
de ano letivo.
A confirmao dessa hiptese teria como resultado, ao final do ciclo bsico de
ensino, a presena de uma certa homogeneidade das caractersticas pessoais
dos estudantes no ltimo ano. No entanto, os autores afirmam que no possvel
postular que essa hiptese seja correta, isto , o efeito no declinante, apesar
de outros estudos citados pelos autores encontrarem um resultado contrrio.
A respeito dos estudos similares obtidos por meio do exame do ENEM de 2005,
Golgher (2010) apresenta resultados que corroboram o fato de que no-brancos
possuem menor rendimento escolar que os brancos, ressaltando que estes
formam a maioria nas redes de ensino privada e federal e, aqueles nas redes
estadual e municipal.
A comparao da transmisso intergeracional de educao entre negros e
brancos comprova a maior persistncia entre negros. Em outras palavras, a
25
probabilidade de uma pessoa cujo pai no frequentou a escola tambm no
frequentar, maior entre negros do que entre brancos. Se considerarmos as
diferenas regionais brasileiras, a maior persistncia observada no Nordeste em
relao ao Sudeste est fortemente associada maior probabilidade, na primeira
regio, de um pai sem escolaridade transmitir essa condio a seus filhos
(FERREIRA & VELOSO, 2003).
A hiptese da transmisso intergeracional da educao postula, ento, que a
educao dos filhos determinada pela educao dos pais. Alm de influenciar
diretamente na nota do exame de proficincia, este atributo tambm afeta o
desempenho escolar dos filhos de outras maneiras. De acordo com Hanushek
(2008), os estudantes cujos pais possuem relativamente mais escolaridade que
outros tendem a prolongar sua formao acadmica e ascender de nvel
socioeconmico porque o nvel educacional dos pais positivamente
correlacionado com a renda permanente da famlia.
A mobilidade intergeracional de educao de diferentes pases pode ser
observada no quadro 1, onde Ferreira & Veloso (2003) resumem os resultados de
diversos outros trabalhos que estimam o grau de persistncia educacional, os
coeficientes de MQO da escolaridade dos pais como variveis explicativas para a
escolaridade dos filhos. A principal concluso que tal persistncia maior na
Amrica Latina e, no Brasil, uma caracterstica bastante marcante.
QUADRO 1 Estudos de persistncia intergeracional de educao


26
Muitos trabalhos comprovam empiricamente a influncia positiva da educao dos
pais como determinante da educao dos filhos. Esse o caso de Marteleto
(2002), utilizando dados da PNAD de 1977 a 1997 para estudar a influncia da
escolaridade da me em diferentes coortes, bem como os trabalhos que estimam
a influncia direta deste fator sobre a proficincia do aluno, por meio de funes
de produo educacional, como Riani e Rios-Neto (2008), Menezes-Filho (2007) e
Machado et al. (2008).
Em suma, como explica Ferreira & Veloso (2003), a persistncia da educao dos
pais sobre os filhos existe no Brasil, e bastante forte nos extremos da
distribuio de escolaridade. Isto , pais com pouca ou nenhuma instruo
transmitem sua posio aos seus filhos mais fortemente do que aqueles que
possuem uma escolaridade mdia. Por outro lado, para os pais que se encontram
no topo da distribuio de escolaridade, que completaram nivel muito elevado no
sistema educacional, a probabilidade de que seus filhos alcancem tal nvel
maior que a mdia.
2.2.2 Nvel Socioeconmico
No que se refere aos recursos familiares disposio de seus membros mais
jovens, Silva e Hasenbalg (2002) distinguem pelo menos dois canais de influncia
da educao dos pais sobre a educao de seus filhos. O primeiro seria a renda
familiar e condies de moradia, que podem propiciar ao jovem um bom ambiente
de estudos, acesso ao ensino de qualidade. O segundo seria a valorizao da
educao dos filhos como um bem final, devido ao maior capital humano na
famlia, o que poderia aumentar a sua demanda educacional.
Ao considerar a importncia do capital econmico familiar sobre o aprendizado e
capacitao de seus membros, devemos considerar a existncia de uma
demanda por um mercado de crdito, onde as pessoas podem tomar recursos
para financiar sua educao, sob o ponto de vista que este um investimento em
capital humano. Desse modo, a eficincia do mercado de crdito tambm
direciona as decises intrafamiliares. Para Assuno e Alves (2007), a deciso
dos pais em investir em educao dos filhos depende dessa eficincia, e se
27
baseia na apreciao do valor presente lquido do custo de estudar e da renda
futura. Se o mercado de capitais operar ineficientemente, o investimento passa a
depender mais fortemente da riqueza familiar disponvel.
O trabalho dos autores discute uma vasta literatura sobre restries de crdito e
trabalho infantil, a qual afirma que o trabalho infantil pode ser usado para
compensar choques econmicos adversos dentro da famlia, ou seja, o fato de um
dos pais ficar desempregado pode aumentar a probabilidade dos filhos deixarem
a escola e entrarem no mercado de trabalho. Alm disso, utilizando a PNAD
(Pesquisa Nacional por Amotra de Domiclios) de 1981 a 2001 para estudar a
relao entre restrio de crdito e investimento em educao intrafamiliar, eles
concluem que a qualidade da educao infantil e a eficincia do mercado de
crdito se correlacionam na mesma direo.
2.2.3 Estrutura e Arranjo Familiar
A famlia possui uma grande influncia sobre as decises de seus membros e, por
isso, talvez ela seja um dos fatores de maior peso sobre o desempenho dos
indivduos na escola. Para Astone e Mclanahan (1994), Silva & Hasenbalg (2002)
e Heckman & Masterov (2005), os laos familiares importam para o
aproveitamento escolar de seus membros e uma ruptura no arranjo familiar tpico,
em que a criana mora com ambos os pais, pode influenciar negativamente o
desempenho do mesmo na escola, sendo o efeito potencializado caso a famlia
esteja exposta aos fatores de restries oramentrias.
Dentro da estrutura de um domiclio, as pessoas podem ter diferentes posies
familiares. Geralmente, o estudante vive em um domiclio juntamente com os pais
e/ou outros parentes. Alm disso, ele pode dividir o domiclio com irmos, que
podem influenciar a alocao de recursos educacionais dentro da famlia. Isso
poderia resultar em um estoque de capital humano disponvel para cada jovem de
forma diferenciada dentro da mesma residncia, ou de forma igualitria, mas em
menor nvel, acarretando em uma correlao negativa entre o nmero de irmos
que um indivduo possui e seu desempenho escolar (HANUSHEK, 1992;
PATRINOS & PASHAROPOULOS, 1997).
28
Para Patrinos e Pasharopoulos (1997), a relao negativa entre tamanho da
famlia e rendimento escolar, identificado em pases em desenvolvimento, fruto
do mecanismo de diluio de recursos entre irmos. Isso pode ser um fator
determinante da escolha alocativa dos pais em relao ao trabalho e estudo dos
filhos e, assim, eles incentivam alguns dos filhos a trabalhar, enquanto outros
somente a estudar. Nesse caso, a famlia maximiza a utilidade total do grupo, o
que significa uma alocao maior de recursos para aqueles filhos que possuem
um maior retorno futuro sobre a educao, causando um subinvestimento nos
menos aptos.
Este caso, o do investimento desigual entre filhos, seria o mais comum no Brasil,
segundo Patrinos & Pasharopoulos (1997) e Marteleto (2002), ainda que no
exista um padro bem definido para esta relao, considerando outros pases em
desenvolvimento. Apesar disso, Hanushek (1992) aponta outras duas alternativas
de investimento intrafamiliar. A famlia pode no discriminar a alocao de tempo
entre os filhos e, ento, uma quantidade maior de filhos dilui o tempo gasto com
cada um individualmente, mantendo constante o tempo disponvel para cuidar dos
filhos.
A outra situao, de acordo com o autor, ocorre se os pais fizerem uma alocao
compensatria do tempo gasto individualmente entre os filhos, movida por foras
contrrias. Uma dessas foras a maximizao do desempenho mdio dos filhos,
que proporciona maior investimento nos mais aptos. A outra fora a
minimizao da varincia, que transfere parte do tempo disponibilizado dos mais
aos menos aptos. No entanto, em qualquer situao, o ajuste compensatrio
menor quanto maior for a famlia, devido justamente ao estoque limitado de tempo
destinado educao dos filhos.
O autor tambm destaca a influncia da ordem de nascimento dos filhos dentro
da famlia como determinantes de seu desempenho escolar. Em famlias grandes,
o desempenho dos filhos menor, quanto mais irmos mais novos eles
possurem, e menor quanto mais prxima for a idade entre eles, devido
disputa dos recursos educacionais.
29
2.3 Determinantes Escolares da Proficincia Cognitiva
As instituies de ensino que compem o sistema educacional brasileiro tm por
objetivo incentivar a gerao de habilidades cognitivas na forma de conhecimento
tcnico ou acadmico-cientfico, sendo este ltimo o contedo prevalecente.
Conforme Goldin (2001), outros pases, como a Alemanha, oferecem modelidades
majoritariamente tcnicas de ensino mdio, ou os Estados Unidos, que mistura o
ensino acadmico, genrico, com disciplinas prticas ao mercado de trabalho.
As escolas brasileiras utilizam-se de sua infraestrutura e docentes, cujas
qualidades variam, que podem influenciar todos os seus alunos. Uma das
primeiras obras da literatura sobre qualidade da educao a inspecionar tais
influncias foi o relatrio Coleman et al. (1966), que apontou como o sistema
educacional norte-americano produzia desigualdades entre estudantes de nveis
scioeconmicos diferentes dentro da mesma escola, bem como a existncia de
uma possvel relao entre a heterogeneidade dos alunos e seu rendimento
escolar.
Para estudar a importncia desses determinantes no Brasil, Albernaz et al. (2002)
estimaram uma funo de produo educacional da proficincia do indivduo em
funo de caractersticas pessoais e escolares por meio de modelos lineares
hierrquicos. O principal resultado encontrado foi que o melhor desempenho no
Saeb 1999 pertencia a escolas que concentravam alunos com nvel
socioeconmico acima da mdia, o que reflete a existncia de uma auto-seleo
nas escolas.
O nvel socioeconmico tambm influencia o aproveitamento do aluno na escola,
e mais uma vez, isso se reflete em sua proficincia. A influncia da escolaridade
do professor sobre a proficincia do aluno crescente em relao ao nvel
socioeconmico do aluno. Alm disso, controlando por todos esses efeitos, as
escolas privadas obtiveram vantagem em relao s pblicas. As variveis de
controle da escola, como infraestrutura, caractersticas do diretor e do professor
possuem pouca ifluncia sobre a proficincia dos alunos, apesar do salrio dos
docentes ser importante na rede privada e o nmero de horas-aula ter um efeito
positivo sobre o desempenho dos alunos (ALBERNAZ et al., 2002).
30
Os modelos hierrquicos estimados por Cesar e Soares (2001) para o Saeb 1999
reforam essa relao. As escolas concentram alunos de nvel scioeconmico
parecidos, mais ainda, quanto maior o desvio no nvel social de um aluno em
relao mdia de sua escola, maior o seu aproveitamento, o que pode ser
caracterizado como um efeito gerador de desigualdades de aprendizado dentro
da escola. Os resultados do autor quanto ao efeito positivo da heterogeneidade
na sala de aula tambm so pouco otimistas: o aluno pobre na escola rica
beneficiado pelo meio. Entretanto, o ganho do aluno pobre muito inferior perda
do aluno rico (CESAR & SOARES, 2001, pg.108).
Ao tentar dividir a variao devida a fatores escolares e pessoais, Menezes-Filho
(2007) mostra que a varincia da nota do Saeb 1999 que explicada por fatores
escolares difere entre Estados. Assim, existe uma diferena regional para a
qualidade das escolas medidas em termos da nota do estudante, e aponta que as
escolas do Distrito Federal so as mais homogneas do pas, enquanto que as
escolas do Tocantins possuem um grau de heterogeneidade bastante elevado.
O autor estima um modelo somente com variveis da escola e outro com
variveis pessoais e escolares e afirma que, ao incluir as caractersticas pessoais
e familiares em seu exerccio economtrico, a parcela da variao explicada por
atributos escolares decresce. Isso decorre do fato de que algumas escolas
recebem alunos cujo nvel socioeconmico est acima da mdia populacional e,
por isso, a diferena da nota mdia de uma escola pode refletir, na verdade, o
nvel socioeconmico mdio daquela instituio.
No que diz respeito s diferenas de escolas pblicas de Estados diferentes, no
possvel afirmar que a quantidade de recursos financeiros destinados a polticas
educacionais esteja relacionada com o desempenho dos alunos das escolas
dessa regio. No entanto, a gesto pblica dos recursos destinados educao
pode ter mais peso sobre a eficincia do ensino pblico estadual do que a
magnitude dos recursos financeiros (MENEZES-FILHO,2007).
31
2.4 Determinantes Ocupacionais ps-Ensino Mdio
As aspiraes educacionais e ocupacionais dos jovens so temas atuais e
recorrentes no debate econmico (Hardie, 2009; Schoon & Polek, 2011; Collier et
al, 2011). Os indivduos que possuem metas mais ambiciosas para sua prpria
educao e ocupao acabam por conseguir um nvel educacional e ocupacional
elevado, quando comparados mdia dos jovens, assim como a elevada
proficincia escolar aumenta a probabilidade do estudante optar por uma trajetria
que envolva mais estudos aps o trmino do ciclo bsico de educao.
Na literatura internacional, Collier et al. (2011) investigam a relao entre o
desempenho de alunos da Inglaterra e pas de Gales em exames de proficincia
prestados ao trmino do ciclo obrigatrio de ensino e sua escolha sobre o tipo de
educao aps essa etapa. Os estudantes podem escolher entre o ensino
profissionalizante e o acadmico, que exigido para o ingresso no ensino
superior. Para este objetivo, os autores utilizaram o mtodo de variveis
instrumentais para controlar o problema de endogeneidade entre a escolha
educacional e a proficincia.
Os autores observaram que a proficincia no exame feito ao trmino do ciclo
obrigatrio bastante correlacionada com a escolha acadmica, mas o
background familiar possui pouco poder explicativo. Isso aconteceria porque os
pais influenciam a escolaridade e a proficincia dos filhos durante as etapas mais
precoces da sua vida escolar e no diretamente a proficincia no exame e/ou a
escolha no mercado de trabalho.
O sucesso nos exames de proficincia pode direcionar as decises sobre o futuro
dos jovens, mas tais decises podem tambm influenciar o resultado nos exames.
Se a escolha futura exigir um alto nvel de capital humano, de tal forma que o
jovem se prepara com antecedncia, ento tal preparao captada por tais
exames. Se as escolhas dependem de um processo seletivo, para o qual o exame
de proficincia utilizado, ento as decises sobre o futuro influenciam no
resultado do exame.
32
A relao entre o desempenho em exames de proficincia e a deciso do aluno
em continuar seus estudos, cria um vis de simultaneidade. Tanto avanar no
ciclo de educao formal, quanto o desejo de cursar o ensino superior afetam o
resultado obtido nos exames (COLLIER et al., 2011, pg.16).
O trabalho de Hardie (2009) utiliza dados de painel representativos de jovens de
14 a 22 anos, de 1979 a 1994, para os Estados Unidos, com o objetivo de estimar
a influncia do background familiar, eventos crticos (casamento, filhos, divrcio,
doenas e priso) e outras variveis de controle sobre a falha em conseguir
alcanar seus planos educacionais e ocupacionais. O resultado evidencia que a
situao ocupacional dos pais acarreta efeitos positivos sobre a ocupao dos
filhos. No entanto, a escolaridade dos pais possui pouca correlao com a
assertividade das suas escolhas ocupacionais, exceto quando eles possuem
baixa escolaridade, caso em que a assertividade dos objetivos dos filhos
bastante reduzida. Por fim, a proficincia educacional dos alunos positivamente
correlacionada com a propenso a atingirem suas metas ocupacionais.
Por meio de dois painis representativos para o Reino Unido, Schoon & Polek
(2011) afirmam que as aspiraes so determinadas pela sua insero na escola
e no trabalho, bem como o nvel socioeconmico, capacidade cognitiva e
proficincia escolar. As expectativas dos adolescentes so importantes previsores
de seu status futuro, e assim, os mais ambiciosos so mais propensos a
conseguirem uma posio diferenciada no mercado de trabalho. Os resultados
encontrados mostram que, para as coortes mais jovens, o papel da capacidade
cognitiva e do status social familiar possui maior peso na formao dessa
ambio.
A educao promove a elevao da renda dos indivduos, mas de forma lenta, se
considerarmos todo o ciclo pelo qual as pessoas passam no ensino fundamental,
mdio e superior. O trabalho de Barros et al. (1997) investiga por que pessoas
com grau de escolaridade baixo conseguem ultrapassar a linha da pobreza no
Brasil, e afirma que existem fatores que contribuem para formar uma
heterogeneidade entre trabalhadores dentro do subgrupo com baixa escolaridade
que similar heterogeneidade de renda encontrada na populao. Para
entender como funciona a heterogeneidade de ocupaes entre pessoas com o
33
mesmo grau de instruo, os autores citam trs situaes que explicariam essas
diferenas.
Na primeira delas, pessoas com as mesmas oportunidades de acesso s
diferentes ocupaes possuem rendas diferenciadas. Isso seria o caso em que
cada pessoa escolhe a ocupao que mais lhe satisfaz e remunerado de acordo
com as caractersticas daquela funo. Na segunda situao, ocorreria
heterogeneidade por meio de discriminao ou acesso privilegiado ao mercado de
trabalho, limitando as opes de escolha de certos grupos de pessoas.
Por fim, podemos considerar uma situao em que os trabalhadores possuem
produtividades diferenciadas, e isso influenciaria o acesso a certas ocupaes
para um subgrupo composto por pessoas que detm certos atributos produtivos
necessrios para a execuo da funo.
Ao estudar a escolha de alocao do tempo do jovem entre educao, trabalho e
lazer, devemos considerar que algumas caractersticas pessoais podem
influenciar esta deciso. Neste aspecto, os fatores cognitivos e no-cognitivos
podem determinar o custo de alocar o tempo em determinada atividade. Segundo
Ordine e Rose (2011), se a utilidade de um indivduo determinada pela alocao
do tempo entre escola e trabalho, devemos considerar o custo desse indivduo
trabalhar e estudar, bem como as habilidades individuais (congitivas e no-
cognitivas) que diminuem esse custo.
No que diz respeito relao entre proficincia escolar e mercado de trabalho,
Curi & Menezes Filho (2006) constroem um pseudo-painel para estudar a
proficincia mdia da coorte nascida entre 1977 e 1978 que fizeram a prova do
SAEB em 1995 e os salrios mdios da coorte cinco anos depois, utilizando uma
imputao da nota estimada do SAEB no CENSO 2000. O resultado encontrado
foi que a proficincia mdia da coorte, bem como insumos escolares, so
positivamente correlacionados com o salrio daquela coorte cinco anos aps
deixarem o ensino mdio.
Para Soares (2010), que utilizou um mtodo de imputao da nota do ENEM
(2003 a 2007) na PME (2003-2008) e estimou um modelo probabilstico para o
comportamento dos jovens ao longo de doze meses, a proficincia cognitiva
34
eficaz em aumentar a probabilidade do jovem trabalhar, mas no dele continuar
estudando. Alm disso, os retornos econmicos da educao, por via da
proficincia, so positivos, mas baixos, quando comparados com outros pases
em desenvolvimento.
Segundo Eckstein e Wolpin (1999), o mercado de trabalho oferece salrios que
podem ou no ser correlacionados com o desempenho escolar. Segundo a
anlise dos autores, os jovens que deixam a escola so menos motivados e
possuem uma menor habilidade escolar, justamente aquela que diminui o custo
de frequentar a escola e, por isso, so mais propensos em entrar precocemente
no mercado de trabalho.
O fluxo de entrada e sada de jovens no mercado de trabalho pode ser elevado,
como afirmam Clark e Summers (1982), e isso pode ser mais intenso entre os
jovens que esto estudando, uma vez que podem deixar de trabalhar e continuar
na situao de estudante, ao invs de desempregado.
Considerando toda discusso sobre educao anterior, a proposta desta
dissertao investigar empiricamente os determinantes da proficincia cognitiva
utilizando a base de dados do ENEM 2008, cujo uso para este fim recente. Alm
disso, estudamos como a proficincia cognitiva influencia a situao ocupacional
aps a concluso do ciclo bsico de educao, como investigado por Soares
(2010).

35
3 METODOLOGIA
A funo de produo educacional relaciona a proficincia com fatores pessoais,
familiares e escolares. Matematicamente, ela possui carter aditivo em relao ao
efeito de cada varivel, o que nos permite identificar o impacto parcial de cada
fator sobre a proficincia do jovem.
Ao observar os dados declarados pelos jovens no questionrio do ENEM, temos
que considerar a existncia de um agrupamento no-aleatrio de alunos dentro
da mesma escola, que pode influenciar todos os seus alunos de uma maneira
homognea. Outro ponto relevante em nossa anlise o aspecto auto-seletivo da
prova do ENEM, j que os estudantes no so obrigados a prestar o exame, o
que pode ser uma fonte de vis, caso essa ausncia no seja aleatria entre os
indivduos.
O nosso objetivo de estimar a funo de produo educacional foi alcanado pelo
mtodo dos mnimos quadrados ordinrios (MQO), a princpio, para uma anlise
preliminar dos dados, desconsiderando as fontes de vis citadas. A extenso
natural da nossa anlise foi introduzir mtodos que permitissem corrigir o vis de
auto-seleo e de agrupamento no-aleatrio nas escolas.
Para o tratamento do possvel vis de auto-seleo, utilizou-se o mtodo de
correo de Heckman em dois estgios. Este mtodo consiste em estimar, em
primeiro lugar, a probabilidade de o candidato comparecer ao exame, por meio de
um modelo Probit, em funo de variveis explicativas cuja varivel dependente
binria e referente presena na prova. Em seguida, estima-se uma regresso
linear da nota do ENEM em funo de uma srie de variveis explicativas, em que
o vis corrigido por meio da introduo da razo inversa de Mills, calculada com
base no primeiro estgio, como uma varivel do modelo.
Por fim, considerando a quebra de uma das hipteses do MQO, a de que as
amostras so independentes e identicamente distribudas, pelo agrupamento de
jovens com caractersticas semelhantes na mesma instituio de ensino, foram
estimados modelos de regresso hierrquico linear (HLM).
36
A lgica desses modelos a seguinte: se fosse estimado um modelo MQO para
cada escola, teramos um coeficiente que representaria a nota mdia daquela
escola, mas como no estamos interessados em cada escola em particular, os
modelos HLM fornecem uma maneira sinttica de atribuir um efeito aleatrio
nota media, que se refere diferena de cada escola, e tambm permitem
explorar o uso de variveis explicativas do nvel escolar sobre os seus alunos
2
.
A etapa seguinte refere-se imputao da nota da prova objetiva do ENEM 2008
aos indivduos que esto cursando o ltimo ano do ensino mdio na PME de 2008
e 2009. Esse objetivo foi alcanado por meio da metodologia a ser discutida,
permitindo, com isso, estudar a relao entre a proficincia cognitiva e a posio
no mercado de trabalho.
A princpio, so identificadas variveis comuns a ambas as bases de dados. A
nota da prova objetiva do ENEM estimada por um subgrupo das variveis
utilizadas na anlise anterior. Em seguida, os coeficientes foram utilizados para
estimar a proficincia dos indivduos na base da PME. Assim, consideramos que
no h, pelo menos no prazo de um ano, diferenas significativas, entre 2008 e
2009, sobre o efeito das variveis utilizadas na imputao, uma vez que a
proficincia estimada para os indivduos em 2009 feita com base nas
informaes do ENEM 2008.
Por fim a proficincia cognitiva estimada entra como uma varivel explicativa do
modelo logit multinomial, que foi usado para estimar a probabilidade de transio
de estudantes do ensino mdio entre diferentes formas de insero no mercado
de trabalho e para a continuidade da educao.
O trabalho de Soares (2010) utiliza outra metodologia para o mesmo fim. O autor
afirma que possvel fazer uma identificao quase exata dos indivduos nas
duas bases, por meio das variveis de regio metropolitana, data de nascimento,
sexo e nmero de pessoas no domiclio. No entanto, esse mtodo no garante a
identificao exata e o nmero de observaes se reduz consideravelmente.

2
Tentou-se tambm utilizar a razo inversa de Mills no contexto dos modelos hierrquicos com o
objetivo de corrigir ambos os vieses. Contudo, pela falta de trabalhos tericos acerca de um
modelo desse tipo, optamos por ocultar esses resultados.
37
3.1 Estratgia Emprica
As prximas sees apresentam a estratgia emprica adotada para alcanar os
nossos objetivos. Os modelos economtricos foram estimados utilizando as bases
de dados discutidas nos subcaptulos anteriores, por meio do software estatstico
STATA verso 11.2.
3.1.1 Estimao da Funo de Produo Educacional
A regresso linear clssica faz uso do mtodo de mnimos quadrados ordinrios
(MQO), que se baseia no princpio de que o estimador minimiza a soma do
quadrado dos resduos. O modelo populacional linear nos parmetros
(Wooldridge, 2001, pg.49) e pode ser escrito, no nosso caso, como:
i i i
u X Y + = |
'
(3.1)
) , 0 ( ~
2
o N u
(3.2)
A expresso acima descreve a nota e o vetor X, de dimenso kx1, como
variveis de cada candidato i cujos valores so observados em uma amostra
aleatria da populao e
i
u o erro aleatrio no-observvel. O vetor
|
, de
dimenso kx1, denota os coeficientes de cada varivel explicativa que devem ser
estimados. As hipteses bsicas para que os coeficientes sejam identificados, e
que minimizem o erro quadrtico mdio, podem ser escritas da seguinte maneira:
Hiptese 1:
) , (
i i
X Y
independente e identicamente distribuda.
Hiptese 2:
| | 0 ' = u X E

Hiptese 3: A matriz
| | X X E '
possui posto completo
Com essas hipteses, podemos estimar o vetor de estimadores
|

, de tal forma
que ele, admitindo-se as hipteses 1, 2 e 3, um estimador consistente para os
38
coeficientes populacionais. Se ainda, admitirmos a hiptese de exogeneidade
estrita, ento o estimador de MQO no viesado:
( ) Y X X X ' '

1
= |
(3.3)
3.1.2 A Correo do Vis de Auto-Seleo
Se a amostra observada no for aleatria, os coeficientes deixam de ser no-
viesados. Para estes casos, existe um truncamento incidental da varivel
dependente, causado pela excluso no aleatria de observaes em nossa
amostra (Greene, pg.780-781). O mtodo mais utilizado na literatura, para
corrigir a auto-seleo, o de correo em dois estgios de Heckman (Heckman,
1979) e que ser utilizado neste trabalho.
Os dados do ENEM apresentam esse truncamento, uma vez que a participao
no exame facultativa
3
. O mtodo consiste em estimar duas regresses
subsequentes, sendo a primeira, um modelo probit que calcula a probabilidade do
indivduo entrar na amostra. O segundo modelo consiste em estimar os
coeficientes dos regressores que explicam a varivel dependente por meio do
mtodo de mnimos quadrados ordinrios, corrigido pela propenso do indivduo
no entrar na amostra, isto , a razo inversa de Mills, calculada com base no
primeiro estgio. A seguir o mtodo ser explicado em detalhes.
3.1.2.1 Metodologia da Correo do Vis de Auto-Seleo
Na primeira etapa da correo de Heckman, precisamos de informaes tanto
sobre os candidatos que no fizeram a prova, quanto daqueles que a prestaram.
Nessa etapa, a varivel dependente toma uma forma binria, com valor 1 se o
indivduo fez a prova e valor 0 se no fez a prova. Alm disso, necessrio um

3
A participao dos estudantes no ENEM cresceu consecutivamente em todas as edies, o que
pode atenuar o vis de auto-seleo.
39
vetor de variveis explicativas para que possamos explicar a propenso de
comparecer ao exame como funo destas variveis.
A abordagem da correo de Heckman pressupe que as variveis explicativas
utilizadas no segundo estgio um subgrupo daquelas utilizadas no primeiro
estgio. Como a proposta desta dissertao utilizar variveis diferentes para
cada perodo, ressaltamos que esta metodologia desvia-se, em parte, daquela
originalmente proposta por Heckman (1979). No nosso caso, utilizamos apenas
variveis da escola, que no aparecem no segundo estgio.
Com as informaes da escola, foi estimado um modelo probit para a
probabilidade de o candidato prestar o exame:
i i i
u Z p
1
' *
+ =
(3.4)
) 1 , 0 ( ~
1
N u
i
(3.4b)
Em que
*
i
p
uma varivel latente que representa a propenso do indivduo em
prestar o exame do ENEM, mas que no observada. A informao observada
se o mesmo comparece ao exame ou no. A matriz representa as variveis
explicativas para a presena no exame, o vetor de coeficientes.
Se
0
*
>
i
p
, de modo que

'
1 i i
Z u >
, ento
1 =
i
p
. Dessa forma, considera-
se que o indivduo i compareceu ao exame.
Se
0
*
s
i
p
, de modo que

'
1 i i
Z u s
, ento
0 =
i
p
. Dessa forma, considera-
se que o indivduo i no compareceu ao exame.
No caso da base de dados do ENEM, no temos informaes sobre os jovens
que no se inscreveram no exame, tampouco dos que se inscreveram e no
compareceram prova. Diferentemente, por exemplo, de informaes sobre
migrao, mercado de trabalho ou fecundidade no Censo populacional, em que
temos informao sobre todos os indivduos.
i
Z

40
Os dados no permitem fazer a correo de maneira direta, uma vez que
necessitamos das informaes dos jovens que no prestaram o exame para que
possamos calcular a probabilidade da presena em funo de variveis
observadas. Logo, a estratgia adotada para corrigir o vis de seleo consiste
em trs passos.
O primeiro passo foi calcular, para cada escola, a quantidade de alunos que esto
no 3 ano do ensino mdio e que compareceram ao exame, utilizando o
questionrio do ENEM 2008. Em seguida, calculou-se o nmero total de alunos
no 3 ano do ensino mdio em cada escola por meio do Censo Escolar 2008 e,
por fim, esta informao foi inserida na base de dados do ENEM por meio da
varivel identificadora PK_COD_ENTIDADE, comum a ambas as bases, para
ento, calcular a proporo desejada.
No segundo passo, foram selecionadas aquelas escolas cuja participao
calculada foi inferior a 10%, assumindo que todos os alunos dessa escola no
fizeram a prova. Em seguida, selecionamos aquelas escolas cuja participao foi
superior a 90%, assumindo presena no exame a todos os alunos dela
4
.
Com isso, atribumos ausncia na prova para algumas observaes, ainda que,
artificialmente, com valores vlidos para as variveis explicativas. Esse mtodo
pressupe que as caractersticas de alunos provenientes de escolas com baixo
percentual de presena sejam parecidas.
Com a amostra do primeiro estgio formada, estimou-se a probabilidade do
candidato prestar o exame a partir dos dados da escola que frequenta, obtendo
assim, a probabilidade estimada. Com isso, foi possvel estimar a razo inversa
de Mills, que mede o risco do indivduo no ser selecionado. Heckman (1979,
pg. 156) explica que a razo inversa de Mills uma funo monotonicamente
decrescente da probabilidade de um indivduo ser selecionado para a amostra.

4
A escolha da proporo de 10% e 90% foi baseada nos resultados de vrias estimaes do
modelo de correo de Heckman com propores diferentes. A comparao dos resultados
mostrou que essa relao apresenta uma boa separao entre os grupos, sem que fossem
perdidas muitas observaes no segundo estgio.
41
O ltimo passo foi estimar o segundo estgio, isto , estimar a nota do ENEM em
funo de variveis independentes e relevantes para a proficincia do estudante,
representadas pela matriz
i
X , considerando tambm, o erro do primeiro estgio.
Para corrigir o vis utilizando o modelo do primeiro estgio, utilizou-se a razo
inversa de Mills, denominada por
i

, inserindo-a como uma varivel explicativa


no segundo estgio:
i i i
X nota | + =
'
(3.5)

i i m i
u
2
+ = |
(3.6)
) , 0 ( ~
2
2
o N u
i
(3.6b)

)

(
)

(
'
'

i
i
i
Z
Z
u
=
(3.7)
= ) , (
2 1 i i
u u corr
(3.8)
Onde (.) | e (.) u representam, respectivamente, a funo de densidade de
probabilidade e funo de probabilidade acumulada da distribuio normal. Com a
introduo da razo inversa de Mills para corrigir o vis de seleo no segundo
estgio, obtemos coeficientes no-viesados para os efeitos marginais da funo
de produo educacional.
Para calcular a correlao entre os erros do primeiro e segundo estgios,
utilizamos o mtodo proposto por Heckman (1979, pg.157), que estima o
coeficiente de correlao consistente. Definindo SQR como a soma do quadrado
dos resduos do segundo estgio, temos que:
( ) o

'
i i i i
Z =
(3.9)
42
N
SQR
N
i
i m
=
+
=
1
2
2

o |
o
(3.10)
o
|

m
=
(3.11)
3.1.3 A Violao da Hiptese de Amostras Independentes e
Identicamente Distribudas
A seguir, foram utilizados modelos hierrquicos lineares para estimar a funo de
produo educacional. A outra caracterstica das bases de dados de educao
que enviesa os coeficientes da regresso linear clssica a sua estrutura
hierrquica. As observaes individuais, em sua maioria, no so totalmente
independentes, como postula uma das hipteses bsicas do mtodo de mnimos
quadrados ordinrios. A consequncia disso que a correlao mdia (ou intra-
classe) entre variveis, considerando estudantes de uma mesma escola, maior
que a correlao mdia entre variveis considerando indivduos de escolas
diferentes (HOX, 2002, pg.05).
A violao da hiptese de independncia dos dados faz com que as estimativas
de erros-padro dos testes estatsticos sejam menores, o que pode resultar em
resultados significativos, porm esprios.
O mtodo dos modelos hierrquicos lineares considera o agrupamento no-
aleatrio dos dados, isto , o fato de que os estudantes no esto igualmente
distribudos na populao, pelo contrrio, frequentam escolas muito distintas.
Assim, no podemos ignorar o fato de que o desempenho de um aluno seja
influenciado pelas caractersticas da escola que freqenta, e que tais fatores
influenciam todos os alunos daquela escola. O uso de modelos de mnimos
quadrados ordinrios pode subestimar o efeito da escola sobre a proficincia
(Albernaz et al., 2002).
A hiptese bsica do modelo que os dados possuem uma hierarquia, no sentido
que os alunos de uma mesma escola fazem uso dos mesmos recursos
43
disponveis, professores, etc. Para deixar mais claro ao leitor como essa hiptese
importante, considere que uma escola siga alguma linha pedaggica distinta
das demais. Com isso, o aprendizado de todos os alunos dessa instituio
diferente das outras, podendo desenvolver atributos diferentes de outros jovens
da mesma coorte.
3.1.3.1 Metodologia dos Modelos Hierrquicos Lineares
O modelo estimado foi composto por dois nveis, considerando as caractersticas
do aluno no primeiro nvel e as caractersticas da escola no segundo nvel. O
modelo multinvel geral para o estudante i (i=1,...,
j
N ) em cada escola j
(j=1,...,J), pode ser descrito como:
ij ij j j ij
u X Y + + =
1 0
| |
(3.12a)
Em que
ij
Y
nota no ENEM do estudante i que frequenta a escola j e
ij
X
a
matriz de vriveis explicativas (nvel 1) da nota do ENEM do estudante i que
frequentou a escola j, e seus coeficientes so considerados fixos. Alm disso,
por hiptese:
) , 0 ( ~
2
o N u
ij
(3.12b)
j j j
e Z
0 01 00 0
+ + = |
(3.13a)
Onde:
2
0
00
) var( o =
j
e
(3.13b)
0 ) , cov(
0
=
ij j
u e
(3.13c)
Com o propsito investigativo, utilizou-se um procedimento de estimao em
etapas, para que seja possvel visualizar possveis mudanas na varincia
explicada por cada nvel, conforme o processo se desenrola. Em outras palavras,
44
primeiro estimou-se o modelo multinvel sem variveis explicativas para quaisquer
nveis, com o objetivo de separar a varincia devida escola e ao aluno, e depois
foram includas as variveis de cada nvel em modelos subsequentes
5
(HOX,
1995). O modelo nulo (HLM0) ou ANOVA, sem variveis explicativas, pode ser
descrito como:
ij j ij
u e Y + + =
0 00

(3.14)
O termo
00
reflete a nota mdia da amostra inteira,
j
e
0
significa o termo
aleatrio para cada escola j e o terceiro termo o erro de cada indivduo. A
varincia explicada pelo nvel da escola
2 2
2
00
00
o o
o

+
=
(variao intra-classe) e a
varincia explicada pelo nvel do aluno (variao inter-classe) igual a
2 2
2
00
1
o o
o

+
=
.
O prximo passo estimar a funo de produo educacional considerando as
variveis do aluno (modelo 1 ou HLM1) ou ANCOVA, assumindo coeficientes
fixos:
ij j ij ij
u e X Y + + + =
0 10 00

(3.15)
Aps a incluso das variveis do candidato, podemos analisar a mudana no
coeficiente de variao intra-classe, que poder indicar se parte da variao que
se observa entre escolas , na verdade, reflexo das caractersticas pessoais e
familiares de seus alunos. Para explicar parte da variao entre escola, foram
includas variveis explicativas da escola (modelo 2 ou HLM2):
ij j ij j ij
u e X Z Y + + + + =
0 10 01 00

(3.16)

5
Poderamos continuar o processo, atribuindo um termo aleatrio ao coeficiente das variveis,
alm do intercepto. Com isso o coeficiente seria uma funo das variveis de segundo nvel e um
efeito aleatrio. No entanto, como o nosso objetivo no investigar nenhuma varivel especfica,
no prosseguimos por esta etapa.
45
Aps a incluso das variveis de segundo nvel, foi possvel mais uma vez
observar a diferena entre os coeficientes de correlao intra-classe e estudar
como tais variveis contribuem para explicar o desempenho dos alunos.
As estimaes com dados empricos sero apresentados no quinto captulo e
possuem um objetivo especfico, o de analisar os determinantes da proficincia
cognitiva. As sees a seguir buscam explicar a metodologia por trs do
procedimento de anlise do objetivo principal, a imputao da nota do ENEM na
base de dados da PME e, consequentemente, a anlise da proficincia imputada
como determinante da situao ocupacional dos jovens brasileiros que esto
concluindo o ensino mdio.
3.1.4 Imputao da Nota Estimada do ENEM na PME
Para investigar a correlao entre a proficincia cognitiva, medida pelo
desempenho na prova objetiva do ENEM, e a situao do indivduo aps a
concluso do ensino mdio, utilizamos duas bases de dados distintas, o ENEM e
a PME. A tentativa de unir duas bases diferentes o maior dos desafios, uma vez
que no podemos identificar o mesmo indivduo nas duas bases de dados.
Para Soares (2010), possvel fazer um pareamento quase exato entre ENEM e
PME utilizando a data de nascimento dos indivduos, sexo, quantidade de
pessoas na famlia e a regio metropolitana. Sendo o ENEM quase censitrio e a
PME amostral, o autor forma a populao-alvo com jovens da PME e busca
indentific-los na base do ENEM, mas essa tentativa reduz a amostra a ser
explorada a cerca de menos de 1% da populao que fez o ENEM entre 2003 a
2007. Na base da PME, restam em torno de 0,2% da base aps o pareamento,
pouco mais de 200 observaes. Dessa forma, outra tcnica que preserve um
maior nmero de observaes poderia ser explorada.
Outros autores utilizam o mtodo de unio de bases para estudar fenmenos
educacionais e produtivos, como Curi e Menezes Filho (2006), em que a nota do
exame de matemtica do SAEB de 1995 estimada em funo de caractersticas
pessoais e escolares disponveis nesta base e na PNAD 1995 em um primeiro
estgio. No segundo estgio, a nota estimada do SAEB, juntamente com o
46
resduo da regresso da funo educacional, foram imputadas na base do
CENSO 2000, tomando os valores mdios das variveis por coorte.
Os autores fizeram uma correo do vis de auto-seleo utilizando a proporo
de jovens nascidos entre 1977 e 1978 que tinham exatamente 10 anos de estudo
em 1995 em relao ao total dessa coorte. No entanto, isso requer assumir certa
homogeneidade da coorte, pois ocorre um agrupamento de pessoas que
compartilham algum critrio relativo a sua idade.
A metodologia de criao de mapas de pobreza desenvolvida por Elbers et al.
(2003) utiliza uma pesquisa do tipo survey e um censo demogrfico para associar
informaes de renda para regies bastante desagregadas para, com isso,
estimando ndices de desigualdade regionais. Este tipo de metodologia leva em
conta a riqueza de informaes das pesquisas do tipo survey com a
representatividade do censo. Ribas e Machado (2010) aplicaram este mtodo
para gerar estimativas de renda do no-trabalho e imput-las na base de dados
da PME, onde no consta esta informao.
O mtodo desta etapa da dissertao segue aquela aplicada por Ribas e
Machado (2010) e consiste, primeiramente, em estimar a nota da prova objetiva
do ENEM
6
como varivel dependente de um vetor de covariaveis comuns a
ambas as bases de dados. Logo, essencial que sejam identificadas as variveis
disponveis para explicar a proficincia em ambas as bases, utilizando a
metodologia apresentada nas sees anteriores, em particular o mtodo de
mnimos quadrados ordinrios.
Como esse mtodo espera-se obter um resultado mais preciso do que se fosse
utilizado o agrupamento por coortes, mas talvez no to preciso quanto o
pareamento quase-exato sugerido por Soares (2010), mas temos a vantagem de
possuir mais observaes do que ambas as alternativas.

6
A deciso de utilizar a nota da prova objetiva do ENEM, ao invs da nota da redao, foi
baseada na comparao do coeficiente de determinao (R) dos modelos MQO estimados no
quinto captulo para a nota da prova objetiva e redao. O modelo para a prova objetiva mostrou-
se superior, no que se refere ao ajuste dos dados, em relao ao modelo cuja varivel dependente
era a redao.
47
Os modelos estimados para a proficincia utilizando a correo de Heckman e os
modelos Hierrquicos mostraram bastante semelhana entre si e com o MQO.
Por isso, e tambm porque no temos como associar as variveis escolares aos
indivduos da PME, utilizamos somente o modelo MQO:
e Q profic + = | ' (3.17)
) , 0 ( ~
2
o N e (3.18)
A metodologia de Elbers et al. (2003) no assume que os erros so
homoscedsticos e prope que este parmetro seja estimado conforme a
equao a seguir:
c o + =
|
|
.
|

\
|

' ln
2
2
W
e A
e
(3.19)
) max( 05 . 1
2
e A= (3.20)
Onde c homoscedstico , A o limite superior da varincia predita, o o vetor
de coeficientes e W o vetor de variveis explicativas. Com isso, o estimador do
desvio-padro, segundo os autores, definido como:
(3.21)
) ' exp( o W B = (3.22)
Dessa forma, o termo aleatrio simulado escrito como ) , 0 ( ~
2
o N e e, aps a
estimao deste parmetro e do vetor de coeficientes |

, obtido pelo modelo de


MQO, utilizamos as caractersticas observadas dos indivduos
i
Q em sua
48
primeira apario na PME durante 2008 e 2009
7
, para estimar a sua proficincia
cognitiva:
i i
e Q

'
+ = | (3.23)
3.1.5 Estimao da Situao Ocupacional do Indviduo em Funo da
Proficincia
O nosso ltimo objetivo utilizar os dados referentes situao ocupacional dos
jovens, na base de dados da PME, juntamente com a proficincia imputada, e
investigar que papel ela desempenha no status ocupacional dos jovens aps 12
meses.
A varivel dependente aqui a situao ocupacional do jovem aps 12 meses da
sua entrada na pesquisa mensal de emprego, sendo a proficincia cognitiva uma
varivel explicativa para ela. Ainda mais, foram utilizadas quatro amostras
distintas, cada uma delas para a situao inicial declarada pelo indivduo. Foram
utilizados dados da primeira e quinta entrevista do indivduo, de tal forma que o
perodo entre elas de doze meses.
No caso desta dissertao, foram construdas quatro situaes para a varivel
dependente, estando os indviduos sujeitos a alguma delas no perodo analisado:
no trabalham e no estudam (naotrabalha_naoestuda), s trabalham
(sotrabalha), trabalham e estudam (trabalha_estuda) ou s estudam
(soestuda). A metodologia utilizada para estimar a situao ocupacional baseia-
se na estimao de um modelo logit multinomial, pois estamos interessados em
analisar como o aumento da proficincia afeta a probabilidade de transitar de uma
situao para outra.
Os determinantes da transio ocupacional tambm j foram investigados no
Brasil por Curi e Menezes-Filho (2004) por meio do modelo logit multinomial,

7
Onde " "
i
Q um subvetor de " "
i
X , correspondente s variveis utilizadas no quinto captulo
para explicar a proficincia dos estudantes, conforme caractersticas pessoais e familiares que
tambm esto disponveis na PME.
49
utilizando a PME de 1984 a 2001, para investigar a mobilidade dos trabalhadores
entre as categorias de trabalho formal, informal, conta prpria, desempregado e
inativo. Em outro trabalho, Flori e Menezes-Filho (2008), estimam um modelo logit
multinomial para estimar a probabilidade de transio entre ocupaes,
controlando por um vetor de variveis pessoais, utilizando a PME de 1984-1985 e
2000-2001.
Os modelos estimados sero divididos seguindo a metodologia de Curi e
Menezes-Filho (2004) e Flori e Menezes-Filho (2008), que estimam um modelo
logit multinomial para cada subamostra composta pelas pessoas com a mesma
situao inicial.
Como estamos considerando apenas os jovens que esto no ltimo ano do
ensino mdio, existem, inicialmente, apenas duas situaes possveis, trabalhar e
estudar, ou apenas estudar. Por isso, so possveis dois modelos multinomiais,
mas como tambm foram estimados modelos separados para homens e
mulheres, totalizando quatro modelos estimados.
Em nossa anlise, utilizamos dados de indivduos que esto cursando o 3 ano do
ensino mdio. Alm disso, foram utilizadas as bases de dados de 2008 a 2010,
incluindo todos os meses, com a finalidade de garantir mais observaes para as
nossas estimaes. Assim, observamos a situao inicial dos jovens que
entraram na amostra em 2008, e doze meses depois, em 2009. Da mesma forma,
acompanhamos os jovens que entraram na amostra em 2009 e depois de doze
meses, em 2010.
A probabilidade de um dado indivduo i pertencer a uma categoria j, com
i
X denotando o vetor de variveis explicativas do indivduo, pode ser escrita
como:

=
+
= =
3
1
1
) | (
h
x
x
h i
j i
e
e
x j y p
|
|
(3.24)
A soma das probabilidades deve ser igual a unidade e, portanto, assumimos que
uma das categorias possui o coeficiente igual a zero, que ser a chamada de
50
categoria de referncia r. Segundo Wooldridge (2001 p. 498), modelo
estimado por mxima verossimilhana e, para cada indivduo i, a funo de log-
verossimilhana dada pela equao 3.25. Os coeficientes so identificados ao
maximizar a somatria da funo abaixo, considerando todos os indivduos.:
| | ( ) | |

=
= =
J
j
i j i i
x p j y l
0
, log 1 |
(3.25)
O principal objetivo estudar o efeito parcial da proficincia sobre a probabilidade
de transio, segundo cada categoria de referncia. No entanto, os resultados
so discutidos com referncia razo de risco relativo.
A razo de risco relativo (RRR) fornece uma informao sinttica sobre o efeito
marginal da varivel de interesse de forma relativa. Com a razo de risco relativo,
podemos verificar se, para o aumento de um ponto na escala de proficincia
cognitiva do indivduo, ele estar mais propenso a mudar para uma determinada
categoria ou a permanecer na categoria de referncia. A princpio notamos que a
probabilidade relativa, ou risco relativo, de uma categoria, em relao categoria
de referncia dada por:
j
X
e
x r y
x j y
|
=
=
=
) | Pr(
) | Pr(
(3.26)
O interesse principal est em saber se um aumento da proficincia cognitiva
aumenta as chances de um indivduos mudar de posio no perodo em questo.
Assim, para um aumento de um ponto na escala de proficincia, temos que a
razo de risco relativo dada por:
j
e
x r y
x j y
x r y
x j y
RRR
|
=
=
=
+ =
+ =
=
) | Pr(
) | Pr(
) 1 | Pr(
) 1 | Pr(
(3.27)
A razo de risco relativo compara o risco relativo de transio, para um dado
aumento na proficincia. Assim, se ela for maior que a unidade, ento o risco
relativo do indivduo mudar da categoria de referncia r para a categoria j, no
perodo de 12 meses, aumenta com a sua proficincia cognitiva. Por outro lado,
51
se a razo for menor que a unidade, ento o risco relativo de mudar de categoria
diminui conforme a proficincia cognitiva aumenta.
Os resultados da estimao do modelo multinomial so apresentados no captulo
4, bem como a anlise da razo de risco relativo da proficincia cognitiva como
determinante da probabilidade do indivduo transitar entre situaes ocupacionais.
Com isso, o objetivo da nossa anlise concludo e a discusso terica,
levantada no primeiro captulo, juntamente com a anlise dos determinantes da
proficincia cognitiva, apresentados no segundo captulo, propiciam mais uma
viso sobre o processo de acumulao de capital humano.
3.2 Apresentao das Bases de Dados e Variveis Utilizadas na
Estratgia Emprica
A funo de produo educacional foi estimada utilizando a base de dados do
ENEM de 2008 e o primeiro estgio da correo de Heckman utilizou, alm do
ENEM, o Censo Escolar de 2008, para estimar a probabilidade do candidato
comparecer ao exame. Para investigar a situao ocupacional dos jovens aps a
concluso do ensino mdio, utilizamos a Pesquisa Mensa de Emprego (PME) de
2008 a 2010.
Esta seo apresenta as principais caractersticas dessas bases de dados para,
posteriormente, discutir as estatsticas descritivas das variveis utilizadas nos
captulos posteriores.
3.2.1 Descrio da Base de Dados do ENEM e das Variveis da Funo
de Produo Educacional
No Brasil, existem muitos trabalhos sobre capital humano e uma vasta quantidade
de bases de dados sobre atributos socioeconmicos e demogrficos de seus
habitantes produzidos pelo IBGE (Instituto Brasileiro de Geografia e Estatstica) e
bases de dados referentes ao sistema educacional fornecidos pelo INEP (Instituto
Nacional de Pesquisas Educacionais Ansio Teixeira).
52
Os trabalhos sobre desempenho escolar so, em geral, uma aplicao da funo
de produo educacional no Brasil com base no exame do SAEB, disponvel para
a 4 e 8 srie do ensino fundamental e 3 ano do ensino mdio (Barbosa e
Fernandes, 2001; Csar e Soares, 2001; Albernaz et al., 2002; Soares, 2004;
Franco et al.,2007) ou outros exames regionais, como o SIMAVE em Minas
Gerais (Machado et al., 2005; Soares, 2005).
O exame do ENEM, por sua vez, fornece dados importantes para investigao
dos determinantes do desempenho educacional dos jovens brasileiros. Segundo o
Instituto Nacional de Estudos e Pesquisas Educacionais Ansio Teixeira (INEP), o
ENEM pode ser descrito como:
[...] um exame individual e de carter voluntrio, oferecido
anualmente aos concluintes e egressos do ensino mdio, com o
objetivo principal de possibilitar uma referncia para auto-
avaliao, a partir das competncias e habilidades que o
estruturam. Alm disso, ele serve como modalidade alternativa ou
complementar aos processos de seleo para o acesso ao ensino
superior e ao mercado de trabalho. (BRASIL, 2005)
Esse exame tambm diferencia-se do Saeb por sua proposta de mensurar
competncias, ao invs de habilidades propriamente ditas. A diferena entre estes
conceitos, por exemplo no caso da leitura, saber ler uma habilidade, mas
interpretar um texto de forma lgica considerada uma competncia. Assim, de
acordo com BRASIL (2008), so cinco as competncias cerceadas pelo ENEM:
1. Competncia I: Dominar a norma culta da lngua portuguesa e fazer uso
das linguagens matemtica, artstica e cientfica;
2. Competncia II: Construir e aplicar as dimenses de vrias reas do
conhecimento para a compreenso de fenmenos naturais, de processos
histrico-geogrficos, de produo tecnolgica e das manifestaes
artsticas;
3. Competncia III: Selecionar, organizar, relacionar e interpretar dados e
informaes representados de diferentes formas, para tomar decises e
enfrentar decises-problema;
53
4. Competncia IV: Relacionar informaes, representadas de diferentes
formas, e conhecimentos disponveis em situaes concretas, para
construir argumentao consistente;
5. Competncia V: Recorrer aos conhecimentos desenvolvidos na escola para
elaborao de propostas de interveno solidria na realidade, respeitando
os valores humanos e considerando a diversidade sciocultural.
O ENEM fornece um retrato da proficincia cognitiva de muitos estudantes que
possuem o objetivo de ingressar no ensino superior e tambm daqueles que
anseiam por entrar no mercado de trabalho. Assim, fornece informaes ao fim do
ensino bsico para os brasileiros.
A nota da redao do ENEM depende da proficincia que os candidatos possuem
sobre as competncias de dominar a norma culta da lngua escrita, aplicar
conceitos de vrias reas de conhecimento dentro da estrutura do texto, organizar
e interpretar fatos para defesa de um ponto de vista, construir argumentos e
elaborar uma proposta de interveno ao problema apresentado.
A anlise da proficincia tambm ser feita com base na nota de redao do
ENEM. Essa abordagem visa, principalmente, confirmar o resultado encontrado
por Golgher (2010a), que encontrou uma vantagem em proficincia para o sexo
feminino na prova de redao. Ademais, como esse teste possui o mesmo intuito
que a prova objetiva, espera-se obter efeitos similares para a determinao da
proficincia, apesar de que a liberdade de expresso na redao pode resultar
alguma diferena.
Os dados mais recentes, na data em que a anlise foi feita, eram referentes ao
ENEM de 2008, e como o exame vonluntrio, apesar de termos 4.018.070
inscries, muitas no podem ser naturalmente utilizadas em nossa anlise, pois
os candidatos no fizeram a prova e/ou no responderam o questionrio
socioeconmico. Dessa forma, e como estamos interessados em estudar os
jovens que esto terminando o ciclo bsico da educao, foram excludos todos
que no responderam o questionrio socioeconmico e que no tinham previso
de terminar o ensino mdio em 2008.
54
Para concentrar a investigao apenas nos jovens, foram excludos aqueles que
esto muito acima da mdia de idade para cursar o ltimo ano do ensino mdio,
bem como aqueles muito jovens, restringindo a amostra queles cuja idade est
entre entre 15 e 24 anos na poca do exame, o que caracteriza mais de 80%
daqueles candidatos com previso de terminar o ensino mdio nesse ano.
A diferena de proficincia entre diferentes sexos ser captada por uma varivel
indicadora se o candidato do sexo feminino (mulher). A cor/raa do indviduo
tambm pode influenciar o seu desempenho, ainda mais quando h uma
concentrao de algumas delas em diferentes camadas sociais, e por esse
motivo, a varivel (nao_branco) indica se o candidato declararou-se preto/pardo,
ao invs de branco/amarelo.
Alm dessas variveis pessoais, utilizamos outras que podem ser importantes
determinantes da proficincia, em razo da alocao do tempo do estudante. A
primeira delas se ele estuda no perodo noturno (noturno) e a segunda se ele
trabalha (trabalha).
Assim como em Golgher (2010b, pg.21) e Andrade e Laros (2007), a varivel
indicadora se o candidato trabalha foi includa na anlise por explicar parte do
prejuzo sobre o aprendizado do estudante, principalmente por causa do menor
tempo disponvel aos estudos e tambm, pode indicar a carncia de recursos
familiares que possibilitem ao aluno dedicar-se inteiramente aos estudos.
Com respeito aos determinantes escolares, utilizamos dummies para a rede
administrativa da escola em que o estudante cursa oensino mdio. A varivel de
referncia a da rede estadual (esc_estad) e as outras so: rede municipal
(esc_munic), rede federal (esc_fed) e rede privada (esc_priv). Alm disso,
controlamos pela varivel dummy indicativa do estudante frequentar curso
preparatrio de vestibular (cursinho).
Ao considerar a estrutura familiar e seus recursos destinados educao de seus
filhos, consideramos identificar o efeito de dividir o domiclio com irmos
(irmaos_m), por justificar a alocao e diluio de tais recursos entre os filhos.
Esta varivel pode apresentar um vis da forma como ela construda, pois o
questionrio do ENEM pergunta se o candidato mora com irmos, mas no se ele
55
possui irmos, os quais poderiam no compartilhar o mesmo domiclio, mas dividir
os recursos mesmo assim. Por fim, podemos considerar tambm o nmero de
moradores dentro do domiclio, porque os recursos destinados educao podem
diluir-se medida que ela no a nica demanda familiar.
No mbito familiar, as duas outras variveis utilizadas foram a renda familiar e a
escolaridade da me. A renda familiar inclui a renda obtida de todas as fontes dos
moradores do domiclio, e esta dividida em faixas: o domiclio no possui renda
(renda0sm), renda at 1 salrio mnimo (renda1sm), renda de 1 a 2 salrios
mnimos inclusive (renda1a2sm), renda de 2 a 5 salrios mnimos inclusive
(renda2a5sm), renda de 5 a 10 salrios mnimos inclusive (renda5a10sm) e
renda acima de 10 salrios mnimos (renda10sm).
A escolaridade da me foi dividida tambm em ciclos, pois o questionrio do
ENEM no pergunta a escolaridade em anos de ensino. Logo, temos diversas
dummies que informam o nvel mximo de escolaridade da me: se no
frequentou a escola (mae_naoestudou), se desconhece a escolaridade da me
(mae_naosabe), 1 a 4 srie do ensino fundamental (mae_fund1a4), 5 a 8
srie do ensino fundamental (mae_fund5a8), ensino mdio incompleto
(mae_em1), ensino mdio completo (mae_em2), ensino superior incompleto
(mae_sup1), ensino superior completo (mae_sup2) e ps-graduao (mae_pos).
O sucesso escolar do aluno um indicador central do seu desempenho escolar, e
assim, incluiu-se uma varivel da idade do candidato (idade) centralizada na
idade considerada normal para quem est no 3 ano do ensino mdio (17 anos).
Essa varivel se justifica por sintetizar o baixo aproveitamento que o estudante
em atraso escolar e que sinaliza dois problemas recorrentes no sistema
educacional, as taxas de abandono e repetncia.
A restrio da anlise apenas s regies metropolitanas tambm implica a
desconsiderao daqueles que se declararam indgenas, por representarem uma
proporo muito pequena da amostra e no pertencerem ao foco deste trabalho,
que a compatibilizao das bases de dados do ENEM e PME. Aps todas as
excluses, consideramos apenas candidatos residentes das seis regies
metropolitanas presentes na PME (Salvador, Recife, Porto Alegre, Belo Horizonte,
56
So Paulo, Rio de Janeiro), representadas, respectivamente, pelas variveis:
reg_sa, reg_re, reg_pa, reg_bh, reg_sp e reg_rj. Com isso, ficamos com
159.104 observaes vlidas. Elas incluem os candidatos brancos, negros,
amarelos e pardos, que vivem em uma das seis regies metropolitanas acima
mencionadas, que esto na faixa etria de 17 a 24 anos e que responderam ao
questionrio socioeconmico.
3.2.2 Descrio da Base de Dados do Censo Escolar e das Variveis
Utilizadas na Correo de Heckman
O Censo Escolar uma levantamento feito anualmente pelo Instituto Nacional de
Estudos e pesquisas Educacionais Ansio Teixeira (INEP) e abrange todas as
instituies de educao bsica de todas as redes administrativas. As
informaes que constam na pesquisa se referem, em linhas gerais, a
infraestrutura escolar, tipo de ensino oferecido, caractersticas pessoais dos
alunos, caractersticas pessoais dos docentes e a sua escolaridade, e tambm,
informaes referentes a turmas. Como j foi explicado na seo 3.1.2, utilizamos
as variveis do censo escolar no durante o processo de correo do vis de auto-
seleo.
O primeiro estgio da correo de Heckman estima a probabilidade do indviduo
entrar na amostra e, para isso, selecionamos aquelas variveis que julgamos
importantes para determinar a qualidade das escolas. Como estamos tratando de
escolas situadas em regies metropolitanas, as escolas possuem um nvel de
urbanizao bastante elevado, de tal maneira que todas possuem uma
infraestrutura de saneamento bsico adequado. Por isso, no convm explorar
caractersticas bsicas de funcionamento, como eletricidade, esgoto, gua, etc.
Para o nosso objetivo, selecionamos variveis referentes a docentes, importantes
na diferenciao da qualidade das escolas, em particular, a idade mdia dos
docentes de cada escola e a proporo de docentes na escola com alguma ps-
graduao.
Em relao s variveis de infraestrutura educacional, identificamos as seguintes:
presena de laboratrio de informtica, presena de laboratrio de cincias,
57
biblioteca, acesso internet para os alunos e presena banda larga. A anlise
descritiva detalhada dessas variveis ser feita no prximo captulo.
3.2.3 Descrio da Base de Dados da PME Utilizada para a Estimao
da Situao Ocupacional dos Indivduos
A seguir so apresentadas as variveis utilizadas para a imputao da nota do
ENEM na base de dados da PME. Mas antes, devemos fazer algumas
consideraes sobre a Pesquisa Mensal de Emprego.
A PME possui o objetivo de produzir indicadores sobre o mercado de trabalho de
seis regies metropolitanas: Salvador, Recife, Porto Alegre, Belo Horizonte, Rio
de Janeiro e So Paulo. As informaes so coletadas de cada indivduo, sendo
este a unidade de investigao, que mora em uma unidade domiciliar selecionada
(BRASIL, 2007). Logo, caso uma mesma famlia permanea no domiclio por
tempo suficiente, podemos observar o mesmo indivduo em dois momentos
distintos.
Alguns problemas de atrito so encontrados nesta base de dados e resumem-se
a trs principais: a migrao de domiclio, a recusa de entrevista e a resposta
inadequada em diferentes entrevistas posteriores (o que impossibilita identificar
com exatido o mesmo indivduo em diversos perodos de tempo).
Para diminuir a perda de informao por atrito, foi utilizado um algoritmo de
emparelhamento avanado, proposto por Ribas & Soares (2008), cujo objetivo
reduzir a taxa de falso atrito, devido impreciso das informaes fornecidas
por um domiclio, que uma das causas de perda de observaes na base de
dados. Assim, o mtodo sugerido pelos autores, que consiste em buscar a
mesma pessoa em diferentes perodos de tempo, foi utilizado com a finalidade de
melhorar a qualidade das informaes discutidas neste trabalho.
Uma outra caracterstica da base de dados da PME o seu desenho amostral.
Isso significa que a forma como ela montada pode atribuir diferentes pesos para
cada observao, uma vez que cada domiclio no possui a mesma probabilidade
de ser selecionado:
58
A PME utiliza uma amostra probabilstica de domiclios, estratifi
cada e conglomerada em dois estgios, para cada regio
metropolitana de abrangncia da pesquisa. Na PME, os
municpios e pseudomunicpios (conjuntos de municpios de
menor porte em quantidade de domiclios segundo o Censo
Demogrfico 2000) correspondem, cada um, a estratos
independentes de seleo, garantindo assim o espalhamento da
amostra pela regio metropolitana.
Dentro de cada municpio ou pseudomunicpio feita a seleo
das unidades primrias de amostragem - UPAs e, posteriormente,
das unidades secundrias de amostragem - USAs. As unidades
primrias de amostragem da pesquisa so os setores censitrios,
enquanto as unidades secundrias de amostragem so as
unidades domiciliares. (BRASIL, 2007, pg. 28-29)
A estratificao da amostra induz ao uso de pesos para estimar parmetros
populacionais, porque a distribuio das variveis pode diferir entre os subgrupos,
de forma que a hiptese das amostras identicamente distribudas falha. No
entanto, a estratificao da PME no foi feita com base na varivel dependente
que utilizamos. Por isso e com base em Ciol et al. (2006), e pelo fato de no
estirmarmos um parmetro regional que represente a populao, no utilizamos a
expanso das observaes
8
.
As variveis disponveis na PME so, em sua maioria, referentes posio e
rendimento no mercado de trabalho, e poucas se referentem a caractersticas
pessoais dos indivduos. Apesar disso, as variveis pessoais disponveis
permitem estimar a proficincia cognitiva, que o nosso objetivo.
A PME composta por diferentes grupos rotativos, dentro dos quais so
observados os domiclios de reas censitrias de seis regies metropolitanas
brasileiras, a saber: So Paulo, Rio de Janeiro, Porto Alegre, Belo Horizonte,
Recife e Salvador. A coleta das informaes feita, ento, com os moradores
destes domiclios.
Para que a nossa anlise seja feita de maneira parcimoniosa, optamos por utilizar
apenas alguns desses grupos rotativos. Ao considerar apenas os estudantes que

8
Para fins de investigao, o modelo logit multinomial foi estimado com a amostra expandida, e
comprovamos que os coeficientes no apresentaram nenhuma alterao em seu sentido. No
entanto, como a expanso multiplica os casos existentes, muitos coeficientes tornaram-se
estatisticamente significativos.
59
esto concluindo o ensino mdio na base de dados do ENEM 2008, a
preocupao inicial foi selecionar na PME os indivduos tal que as amostras de
ambas as bases fosse o mais homogneo possvel.
A imputao da nota do Enem foi feita com base na prova realizada em agosto de
2008, considerando apenas os estudantes que esto concluindo o ensino mdio
nesse ano. Sendo assim, buscaram-se indivduos cuja primeira entrevista na PME
aconteceu entre janeiro de 2008 e dezembro de 2009, isto , consideramos que a
proficincia cognitiva estimada por meio dos indivduos que prestaram o exame
em agosto de 2008, na base do ENEM, pode ser atribuda queles que esto
cursando o ltimo ano do ensino mdio em 2008 e 2009, na base da PME, sem
perda de generalidade.
A hiptese que a proficincia cognitiva, da maneira como ela foi estimada, no
possui grandes variaes no curto prazo, tornando possvel imputar um nvel de
proficincia para os estudantes de 2009 com base nas informaes de 2008.
Com o intuito de adicionar mais observaes e diminuir o atrito que ocorre ao
longo de um ano na PME, devido mudana de domiclio por parte das pessoas
que respondem pesquisa, optou-se, tambm, por utilizar os grupos rotacionais
que entraram na pesquisa janeiro de 2008 a dezembro de 2009, respectivamente,
os grupos rotativos L4 at O3.
Ademais, como estamos interessados em estudar a influncia da proficincia
cognitiva dos jovens sobre a insero no mercado de trabalho no prazo de 12
meses, foram excludos os indviduos com menos de 17 anos ou maiores de 24
anos, que representavam 9% das 2019 observaes, restando 1838 casos. O
quadro 2 mostra o nmero de observaes vlidas, de acordo com o ms e ano
em que o indivduo entrou na amostra da PME
9
:

9
Foi utilizado apenas a primeira e quinta entevista de cada indivduo, de forma que observamos
sua situao quando entrou na amostra e doze meses aps a entrada.
60
QUADRO 2 - Nmero de indivduos por ms e ano de entrada na PME

Em primeiro lugar, investigamos esse grupo de indivduos e como eles esto
inseridos no mercado de trabalho (trabalhando ou procurando emprego) e se
esto estudando. Descartamos de nossa anlise aqueles que repetiram o ltimo
ano do ensino mdio e consideramos, na mesma categoria, os jovens que esto
no primeiro ano da faculdade ou frequentando um curso pr-vestibular, porque,
apesar de no estarem no ensino superior aps o trmino do ensino mdio,
mostram-se interessados em continuar sua educao formal.
A pessoas foram distribudas em duas situaes iniciais. A primeira situao
aquela em que o jovem est ativo no mercado de trabalho e est estudando, a
outra ocorre quando o jovem est apenas estudando. As situaes finais so
divididas em quatro diferentes situaes: no estuda e no est ativo no mercado
de trabalho (1), est ativo no mercado de trabalho e no estuda (2), est ativo no
mercado de trabalho e estuda (3), estuda e no est ativo no mercado de trabalho
(4).
61
4 ANLISE DESCRITIVA DAS VARIVEIS UTILIZADAS
NA ESTRATGIA EMPRICA
Neste captulo, apresentamos as estatsticas descritivas das variveis do ENEM
2008 utilizadas para estimar a funo de produo educacional, juntamente com
aquelas variveis do Censo Escolar 2008 utilizadas no primeiro estgio da
correo de Heckman.
Alm disso, comparamos as variveis comuns s bases de dados do ENEM 2008
e PME 2008-2009, que foram utilizadas na etapa de imputao da proficincia.
Por fim, descrevemos a varivel de situao ocupacional disponvel na PME que
ser usada para investigar a importncia da proficincia cognitiva como
determinante da mobilidade ocupacional dos jovens.
4.1 Anlise Descritiva das Variveis Utilizadas na Estimao da
Funo de Produo Educacional
As variveis utilizadas nessa etapa foram apresentadas no terceiro captulo e a
Tabela 1 mostra um resumo das principais estatsticas descritivas das variveis
que foram usadas para estimar a funo de produo educacional, para as
159.104 observaes utilizadas inicialmente na aplicao do MQO. Sobre a
descrio destes resultados, em primeiro lugar, a varivel que identifica o sexo
demonstra que 61,1% dos indivduos do sexo feminino e a varivel de cor/raa
mostra que 44,7% declarou ser negro/pardo. A distribuio dessas duas variveis
dentro de cada regio metropolitana ser discutida adiante.
Os indivduos que trabalham, enquanto estudam no 3 ano do ensino mdio,
representam 23,8% da amostra. A proporo de candidatos que trabalham
baixa entre aqueles cuja renda familiar mais alta. Isto , a condio de trabalho
entre os estudantes mais presente nas famlias menos favorecidas. As regies
metropolitanas que concentram uma maior proporo de jovens que trabalhavam
enquanto estudavam so as do Sul e Sudeste do pas, respectivamente, Porto
Alegre (31,9%), So Paulo (30%) e Belo Horizonte (24,8%).
62
TABELA 1 Resumo das estatsticas descritivas de todas as variveis
utilizadas na estimao da funo de produo educacional
Varivel Mdia Desvio-Padro Mnimo Mximo
nota 46,72 16,51 0 98,41
idade 0,768 1,17 -2 7
mulher 0,611 0,49 0 1
nao_branco 0,447 0,50 0 1
trabalha 0,238 0,43 0 1
irmaos_m 0,758 0,43 0 1
noturno 0,241 0,43 0 1
cursinho 0,172 0,38 0 1
esc_munic 0,023 0,15 0 1
esc_fed 0,017 0,13 0 1
esc_priv 0,288 0,45 0 1
renda1sm 0,093 0,29 0 1
renda1a2sm 0,289 0,45 0 1
renda2a5sm 0,345 0,48 0 1
renda5a10sm 0,140 0,35 0 1
renda10sm 0,125 0,33 0 1
mae_fund1a4 0,158 0,37 0 1
mae_fund5a8 0,183 0,39 0 1
mae_em1 0,085 0,28 0 1
mae_em2 0,280 0,45 0 1
mae_sup1 0,055 0,23 0 1
mae_sup2 0,147 0,35 0 1
mae_pos 0,055 0,23 0 1
moradoresXrenda1sm 0,360 1,21 0 7
moradoresXrenda1a2sm 1,188 2,00 0 7
moradoresXrenda2a5sm 1,451 2,12 0 7
moradoresXrenda5a10sm 0,573 1,48 0 7
moradoresXrenda10sm 0,507 1,39 0 7
reg_sa 0,062 0,24 0 1
reg_re 0,079 0,27 0 1
reg_rj 0,198 0,40 0 1
reg_sp 0,470 0,50 0 1
reg_pa 0,063 0,24 0 1
Fonte: Elaborao prpria com dados do ENEM 2008

A varivel indicativa cursinho mostra que 17% frequenta algum tipo de curso
preparatrio para o vestibular e/ou ENEM. Mas como esses cursos geralmente
so privados, as famlias mais pobres podem no conseguir arcar com o seu
custo. Por isso, observamos que a frequncia de candidatos que frequentam um
curso preparatrio pertencem tambm a famlias com renda mais elevada.
A varivel indicativa residir com irmos mostra que 75,8% dos jovens mora com
irmos, e ela foi usada para estimar o efeito de dividir recursos econmicos entre
63
eles. Na anlise da varivel por faixa de renda familiar, notamos no haver grande
diferena entre famlias ricas e pobres.
Os estudantes do perodo noturno somam 24% da amostra, e a proporo destes
que tambm trabalham de pouco mais da metade (52%). Assim, uma grande
parcela dos estudantes do optaram pelo perodo noturno, mas esto ocupando o
dia com outras atividades que no o trabalho. Alm disso, a relao entre entudar
noite e a renda familiar inversamente proporcional, com pouqussimos casos
para estudantes na faixa de renda mais elevada.
A idade do estudante mais um fator preponderante na determinao da sua
proficincia cognitiva, cabendo assim, analisar como a sua distribuio na
amostra aliada a outras variveis. Em primeiro lugar, identificamos que a rede
privada concentra menos estudantes com atraso escolar, em comparao s
redes pblicas. O Grfico N 1 mostra como a diferena de idade se distribui de
forma diferenciada conforme a rede administrativa da escola que o aluno
frequenta:
GRFICO 1 - Distribuio acumulada da idade dos candidatos por rede de
ensino


64
A idade avanada no final do ensino mdio tambm pode apontar possveis
restries que o jovem enfrenta durante sua vida escolar. Como j foi explorado
anteriormente, a famlia proporciona ao jovem capital econmico e cultural para
sua formao educacional, e a presena destes atributos em quantidades
pequenas pode ter um impacto negativo sobre o seu aproveitamento.
Dessa forma, considerando que a escolaridade da me um fator positivamente
correlacionado com o nvel socioeconmico familiar, podemos ver pelo Grfico N
2 que o atraso escolar maior entre aqueles cuja famlia possui condies sociais
mais precrias, notando que a relao entre escolaridade da me e atraso escolar
possui uma relao no-linear.
GRFICO 2 - Distribuio acumulada da idade dos candidatos que esto no
3 ano do ensino mdio segundo a escolaridade da me.


A seguir descrevemos a varivel de renda familiar, que segue a resposta
fornecida pelo questionrio e indica a renda familiar do candidato por faixas de
salrios mnimos, como pode ser observada no Tabela N 2: se a famlia no
possui renda (renda0sm), renda familiar at 01 salrio mnimo inclusive
65
(renda1sm), renda familiar de 01 a 02 salrios mnimos inclusive (renda1a2sm),
renda familiar de 02 a 05 salrios mnimos inclusive (renda2a5sm), renda familiar
de 05 a 10 salrios mnimos inclusive (renda5a10sm) ou renda familiar acima de
10 salrios mnimos (renda10sm).
TABELA 2 Distribuio total e por regio metropolitana dos candidatos
segundo a renda familiar

O grfico abaixo mostra uma diferena ntida no que diz respeito s alternativas
educacionais das mulheres e homens segundo o seu nvel scioeconmico.
Podemos observar a maior proporo de mulheres prestando o ENEM em
famlias cuja renda domiciliar pequena, fato que poderia ser influenciado pela
deciso dos homens de famlias mais pobres de antecipar a entrada no mercado
de trabalho.


66
GRFICO 3 - Proporo de candidatos ao ENEM segundo gnero e faixa de
renda familiar


Apesar de muitos trabalhos utilizarem anos de estudo como varivel, a base de
dados do ENEM no permite essa construo devido pergunta feita ao
candidato. Posto isso, e dado que a escolaridade do pai e da me so
positivamente correlacionadas, optou-se por utilizar somente a educao da me
da forma como foi apresentada no captulo anterior. A distribuio dos estudantes
segundo a escolaridade da me pode ser vista na Tabela N 3:




67
TABELA 3 Distribuio dos candidatos por RM segundo escolaridade da
me

As regies metropolitanas, por sua vez, possuem polticas educacionais e
caractersticas sociais diferenciadas e que podem influenciar o desempenho de
habitar certa localidade. Assim, foram includas seis variveis dummies regionais,
referentes s regies metropolitanas de Recife (reg_re), Salvador (reg_sa), Porto
Alegre (reg_pa), Rio de Janeiro (reg_rj), So Paulo (reg_sp) e Belo Horizonte
(reg_bh).
QUADRO 3 - Estatsticas descritivas sobre gnero e cor/raa por regio
metropolitana

Por fim, temos as variveis que identificam a rede administrativa da escola que o
candidato frequentou durante o ensino mdio. A rede Federal (esc_fed) compe
apenas 2% da amostra, o que demonstra seu tamanho pequeno em relao s
68
outras redes, as escolas estaduais (esc_estad) a origem predominante na
amostra, de cerca de 67% dos candidatos do exame, a rede privada (esc_priv)
agrega 29% dos candidatos. A rede municipal (esc_munic) possui 2% da
amostra e sua representao pequena se deve ao fato de existirem poucas
escolas municipais que oferecem o ensino mdio, a maioria das escolas dessa
rede possui apenas o ensino fundamental disponvel
10
.
4.2 Anlise Descritiva das Variveis Escolares utilizadas na Correo
do Vis de Auto-Seleo
A principal dificuldade de implementar a correo de Heckman a necessidade
de se possuir informaes sobre as pessoas as quais no possumos a nota do
exame. Contudo, as pessoas sem nota no exame so justamente aquelas que
no forneceram quaisquer outras informaes sociodemogrficas, isto , no
sabemos nada sobre elas. Assim, foi necessrio uma estratgia de identificar,
pelo menos aproximadamente, esse grupo de pessoas ausentes no exame, com
base em informaes disponveis de pessoas presentes na prova.
As variveis utilizadas no primeiro estgio so todas referentes escola em que o
candidato est concluindo o ensino mdio e devem permitir, em algum grau, uma
separao dos estudantes que fizeram a prova, daqueles que teoricamente no a
fizeram. A nossa hiptese que a homogeneidade dos alunos de uma escola
pode ser usada para determinar as caractersticas dos ausentes. Assim, os
candidatos de uma escola com baixa participao no ENEM podem ser
semelhantes aos seus colegas de turma que no compareceram ao exame.
Com respeito s caractersticas dos docentes das escolas, , a porcentagem
destes com nvel superior de ensino e com licenciatura de quase 100%, de
modo que tanto escolas pouco eficientes como as mais eficientes possuem quase

10
Segundo a Lei de Diretrizes e Bases da Educao Bsica (LDB), os municpios devem incumbir-
se de oferecer a educao infantil e o ensino fundamental, com a possibilidades de ofertar o
ensino mdio somente quando houver recursos suficientes e as necessidades da sua rea de
competncia estiverem supridas BRASIL (1996).
69
a mesma proporo de docentes com licenciatura, o que torna esta varivel
pouco eficiente na discriminao dos estudantes.
A idade dos docentes, por sua vez, varia bastante entre instituies de ensino e
tambm entre regies metropolitanas, e pode ser uma influncia importante, como
motivao e preocupao, sobre todos os alunos de uma mesma escola. A idade
mnima observada, considerando apenas as escolas que esto situadas nas
regies metropolitanas trabalhadas, de 18 anos, e a idade mxima entre os
docentes de 80 anos. O quadro a seguir mostra as estatsticas descritivas da
idade dos docentes, sem considerar o agrupamento por escola, por regio
metropolitana. Dentre as regies metropolitanas, a de Belo Horizonte se destaca
pela maior concentrao de professores jovens.
Tabela 4 - Estatsticas descritivas da idade dos docentes por regio
metropolitana

Uma outra caracterstica dos docentes que influencia na qualidade das aulas e,
consequentemente, sobre a acumulao de capital humano dos alunos, a sua
qualificao profissional, que foi medida pela posse de um ttulo de ps-
graduao e reflete o seu domnio sobre os assuntos lecionados. Dentre os ttulos
de ps-graduao que os docentes declararam possuir, o de especializao foi o
mais recorrente e, em seguida, o de mestrado e o de doutorado. A expectativa
que as escolas com maior nmero de professores qualificados transmitam a seus
alunos mais conhecimento. Com isso, calculamos a razo entre o nmero de
docentes com algumas ps-graduao (especializao, mestrado ou doutorado)
sobre o total de docentes, por instituio de ensino.
70
Tabela 5 - Estatsticas descritivas da proporo de docentes com ps-
graduao nas Escolas por regio metropolitana

Para Soares (2008), o papel da escola na educao dos estudantes no se limita
em oferecer professores qualificados e bem motivados, como j foi discutido no
segundo captulo. A infraestrutura adequada permite que o docente consiga
explorar melhor diversas maneiras para transmitir o conhecimento e o aluno, por
sua vez, pode se sentir mais motivados em estudar em um ambiente agradvel
com recursos que facilitem o seu aprendizado.
Por outro lado, a infraestrutura direcionada para os recursos pedaggicos pode
influenciar a maneira como os estudantes interagem com os professores,
facilitando aquilo que aprendido em sala de aula. Por isso, inclumos em nossa
anlise caractersticas de escola que incluem a existncia de: laboratrio de
informtica, laboratrio de cincias, biblioteca, acesso internet e banda larga
disponvel. A tabela a seguir resume a proporo de escolas que possuem cada
um desses quesitos:
71
Tabela 6 - Proporo total das escolas por tipo de infraestrutura

4.3 Anlise Descritiva das Variveis Utilizadas na Imputao da
Proficincia Cognitiva do ENEM para a PME
Nesta seo, foram analisadas as variveis comuns a ambas as bases de dados,
que foram utilizadas em nosso modelo de imputao da nota do ENEM para os
indivduos da PME. O nosso objetivo com a descrio das variveis apresentar
possveis discrepncias referentes distribuio de caractersticas entre os
indivduos das duas amostras.
Em primeiro lugar, consideramos a idade do indivduo. Na base de dados do
ENEM de 2008, restringimos a amostra aos indivduos que estavam cursando o
ltimo ano do ensino mdio em 2008. Apesar disso, a idade dos indivduos gira
em torno dos 17 anos, idade considerada normal para o final do ensino bsico.
O grfico 4 mostra a comparao de idade entre as duas bases de dados, e
aponta uma discrepncia na distribuio dos indivduos. Podemos observar
claramente que existe um vis na amostra do ENEM, pois os indivduos com
idade entre 17 e 18 anos aparecem mais na base do ENEM do que na PME. Isso
, no entanto, natural, uma vez que, enquanto a PME construda como uma
amostra aleatria, a amostra do ENEM possui uma seleo positivamente
correlacionada com essa faixa etria.
A diferena na distribuio de observaes por idade no muito grande, sendo
assim, esperamos que ela no seja um problema no processo de imputao da
72
proficincia cognitiva na PME, desde que a distribuio condicional seja
semelhante.
GRFICO 4 - Distribuio dos indivduos por idade na base de dados do
ENEM e PME

Em relao ao sexo dos indivduos nas duas bases de dados, considerando o
perodo analisado, a presena do sexo feminino muito maior no ENEM (61,3%),
do que na PME 2008 (50,2%) e na PME 2009 (55,1%). Com respeito a cor/raa
dos indivduos, existe uma proporo menor de pessoas que se declararam
pretas ou pardas no ENEM (44,7%), do que na PME 2008 (51,7%) e na PME
2009 (49,1%).
Em seguida, comparamos as variveis familiares que influenciam a proficincia do
indivduo, em especial, a escolaridade da me, a renda familiar e a quantidade de
pessoas que moram no mesmo domiclio.
73
A escolaridade da me, na PME, foi medida pela escolaridade da pessoa de
referncia ou se cnjuge, sendo do sexo feminino. Com isso, foi possvel construir
a varivel da maneira como est disponvel no questionrio do ENEM, para que
pudssemos utiliz-la na imputao. Os valores possveis para escolaridade da
me, assim como a distribuio percentual para os indivduos das duas amostras
podem ser visualizadas no grfico N 5.
GRFICO 5 - Distribuio dos indivduos segundo escolaridade da me na
base de dados do ENEM e PME

No grfico acima, podemos destacar que, na base de dados do ENEM 2008,
existe uma concentrao de indivduos cuja me possui um grau de escolaridade
mais elevado, quando comparamos com os dados da PME. Isso pode ser uma
fonte de vis de seleo, j que os indivduos com mes mais escolarizadas esto
mais propensos a comparecer ao exame do ENEM.
A renda familiar, por sua vez, destaca-se como uma das variveis mais
importantes para explicar a proficincia cognitiva dos jovens e tambm pode ser
muito importante para a situao ocupacional dos mesmos. Por hiptese, ela
pode garantir uma maior segurana aos jovens em suas decises, permitindo-lhes
arriscar mais sem sofrer grandes consequncias econmicas. Alm disso, pode
74
postergar a sada do jovem da casa dos pais e, com isso, tambm a entrada do
mesmo no mercado de trabalho por necessidade (CARVALHO, 2009).
Sobre a construo da varivel de renda familiar, no questionrio socioeconmico
do ENEM, obtivemos a renda agregada do domiclio, isto , de todos que moram
com o jovem, sem fazer nenhum tipo de distino quanto origem da renda, que
pode ser fruto do trabalho, aluguis, aplicaes, penses, etc. Por outro lado, o
questionrio da PME possui uma informao incompleta, referente renda
proveniente do trabalho.
Para corrigir esse problema, utlizamos o mtodo proposto por Machado & Ribas
(2009), e imputamos a renda do no-trabalho na PME de 2008 e 2009, utilizando
a PNAD do mesmo ano, cujas variveis possibilitaram estimar a renda de todas
as fontes
11
. Aps a imputao da renda do no-trabalho na PME, a renda foi
deflacionada para agosto/2008
12
e separada em faixas, para equipar-la entre os
indivduos da PME e do ENEM.
O grfico N 6 mostra a distribuio percentual dos indivduos segundo as faixas
de renda e deixa claro que existe uma concentrao maior de jovens de renda
familiar mais baixa na base de dados do ENEM, quando comparamos com a
PME. Novamente, os mecanismos de incentivo da prova do ENEM podem estar
atuando de forma a atrair uma proporo maior de pessoas de baixa renda, como
o uso da nota do exame como vestibular na concesso de bolsas a estudantes de
baixa renda pelo ProUni (Programa Universidade para Todos).


11
A densidade de kernel foi estimada para o logaritmo da renda total na PNAD e na PME, para os
anos de 2008 e 2009, como forma de analisar o ajustamento dos dados. O grfico da dsitribuio
pode ser visualizado no grfico A.1 em anexo.
12
O indivduo na base do ENEM respondeu o questionrio com base em valores de agosto de
2008, quando o exame foi realizado. Os indivduos na PME, por sua vez, responderam com base
na poca da pesquisa, isto , em janeiro, maio e setembro de 2009. Por isso, utilizamos o deflator
sugerido por Corseuil & Foquel (2002) para as pesquisas do IBGE, em especial, para a PME.

75
GRFICO 6 - Distribuio percentual dos indivduos segundo faixa de renda
familiar na base de dados da PME e ENEM

A ltima varivel familiar considerada nas duas bases de dados o nmero de
pessoas que habitam o mesmo domiclio que o jovem. No questionrio do ENEM,
esse nmero vai de um, se a pessoa mora sozinha, at seis, se a pessoa mora
com seis ou mais pessoas, ou seja, existe um truncamento neste valor.
Na PME, possvel contar quantas pessoas moram com os indivduos, no
existindo truncamento, mas, para efeito de igualdade das variveis, optou-se por
constru-la da mesma forma. O grfico 7 sintetiza essa varivel para ambas as
bases de dados e mostra que a distribuio da varivel indicativa do nmero de
moradores por domiclio
13
bastante similar para as duas bases de dados.


13
Os dados excluem aqueles jovens que moram sozinhos. Isso aconteceu porque identificamos os
jovens que esto na condio familiar de filho segundo o questionrio da PME. Dessa forma,
deve existir um chefe de famlia no domiclio, o que exclui a possibilidade do jovem morar sozinho.
Para manter a homogeneidade das observaes, no foram considerados tais casos na base do
ENEM.
76
GRFICO 7 - Distribuio percentual dos indivduos segundo a quantidade
de moradores no domiclio na base de dados da PME e ENEM

Por fim, analisamos a distribuio dos indivduos segundo a regio metropolitana
em que residem. O grfico N 8 mostra algumas divergncias considerveis na
distribuio dos indivduos entre as duas bases de dados. Existe uma
concentrao muito grande de indivduos na regio metropolitana de So Paulo,
na base de dados do ENEM, comparativamente PME.
A frequncia de indivduos na regio metropolitana do Rio de Janeiro mostrou-se
a mais estvel entre as bases. Contudo, essa divergncia na varivel indicativa da
regio pode ocorrer como causa do desenho amostral da PME, que feito com
base em uma amostra aleatria de estratos na regio metropolitana (municpios e
pseudomunicpios), alguns setores dentro dos estratos e algumas unidades
domiciliares dentre dos setores. Se considerarmos a expanso da amostra da
PME pela varivel que pondera pelo desenho amostral, ento a divergncia entre
77
a distribuio de indivduos na PME e no ENEM, para as seis regies
metropolitanas, praticamente desaparece
14
.
GRFICO 8 - Distribuio percentual dos indivduos segundo a regio
metropolitana em que mora

A anlise descritiva das variveis possibilitou observar que existe uma
concentrao de indivduos, com determinadas caractersticas, em uma base de
dados, que no observada na outra. A causa dessas divergncias pode ser a
auto-seleo que ocorre na base de dados do ENEM.
Como j foi dito anteriormente, a PME tem caracterstica aleatria, enquanto que
o ENEM a porta de entrada do jovem para o ensino superior, tanto por ser parte

14
A distribuio percentual dos indivduos por regio metropolitana utilizando a amostra expandida
da PME, que pondera as observaes com base no desenho amostral da pesquisa, pode ser
conferida no grfico anexo A.2
78
do vestibular de algumas instituies de ensino, como por ser utilizado para a
concesso de bolsas de estudos, alm de ser voluntrio.
Essa diferena na distribuio de observaes entre as bases de dados pode
configurar em uma diferena na distribuio da nota do ENEM e da nota imputada
na PME.
Ao observar os grficos anteriores, podemos notar que existe, de fato, um vis de
seleo na amostra do ENEM, quando comparamos com os dados da PME. No
captulo anterior, utilizamos o modelo de correo de Heckman para testar essa
hiptese, a qual comprovamos como afirmativa, dispondo de certas hipteses
para a estimao do modelo.
Ao contrrio da base de dados do ENEM, que permite vincular informaes do
Censo Escolar, o qual nos baseamos para construir a base de dados do primerio
estgio de Heckman, essa possibilidade inexiste na PME. Dessa forma, optando
pela parcimnia na aplicao dos mtodos, apontamos a existncia do vis de
seleo do ENEM, que pode enviesar as nossas estimaes. Contudo, a anlise
grfica mostra que a diferena no demasiadamente grande, e a incluso de
uma correo do vis de seleo demandaria outras hipteses para a sua
viabilidade na PME, diferentes daquelas feitas no terceiro captulo.
4.4 Anlise Descritiva da Varivel de Situao Ocupacional na Base de
Dados da PME
O objetivo de investigar como a proficincia influencia a situao ocupacional dos
jovens, doze meses aps a concluso do ensino mdio, feita por meio da
varivel que indica a frequencia do jovem em uma instituio de ensino e de outra
que indica se ele est ativo no mercado de trabalho. A varivel de situao
ocupacional, reelembrando, formada por quatro categorias, so elas: no
trabalha e no estuda (1), trabalha e no estuda (2), trabalha e estuda (3), no
trabalha e estuda (4).
Uma leitura mais clara da varivel dependente feita em termos percentuais,
como em uma matriz de transio. No quadro N 4, as linhas se referem
79
situao inicial em 2008 ou 2009, e as colunas, por sua vez, se referem
situao final em 2009 ou 2010. A diferena observada entre 2008 e 2009
pequena, como se pode observar no quadro abaixo.
Quadro 4: Matriz de transio da situao ocupacional em doze meses

Na situao de quem estuda e trabalha ao mesmo tempo, observamos uma
tendncia mais acentuada dos jovens no continuarem os estudos e se
dedicarem inteiramente ao trabalho (58% em 2008 e 56% em 2009). Outro ponto
interessante o acentudo nmero de jovens que tornam-se inativos e param de
estudar. Ao considerar a soma da frequncia das duas situaes em que o jovem
no estuda, 73% e 70% parou de estudar aps a concluso do ensino mdio,
respectivamente, em 2008 e 2009.
Na situao de quem apenas estuda, os dados mostram um cenrio similarmente
adverso. A soma da frequncia relativa das duas situaes finais, em que o jovem
no estuda, teremos 57% e 61%, respectivamente, para quem concluiu o ensino
mdio em 2008 e 2009. Ou seja, dos jovens que esto terminando o ciclo bsico
educacional, mais da metade interrompeu os estudos.
Esse fenmeno pode ser reflexo do custo direto e indireto de aumentar a
escolaridade. A existncia de restries oramentrias e/ou individuais, podem
fazer com que o jovem deixe de estudar. Alm disso, mostra que uma parcela
considervel da populao no est acumulando capital humano, o que pode
influenciar na oferta de mo-de-obra qualificada no mercado de trabalho.
80
5. FUNO DE PRODUO EDUCACIONAL
A funo de produo educacional estimada tem, por objetivo, identificar os
fatores associados proficincia cognitiva dos jovens concluintes do ensino
mdio e que possuiam entre 15 e 24 anos em 2008, considerando caractersticas
individuais, familiares e escolares. A finalidade deste captulo apresentar ao
leitor os resultados dos modelos economtricos utilizados para estimar a funo
de produo educacional.
O primeiro modelo de regresso apresentado estimado utilizando o mtodo de
mnimos quadrados ordinrios (MQO) para explicar a nota da prova objetiva e,
posteriormente, a nota da redao, com variveis explicativas pessoais, familiares
e escolares, sendo que o resultado obtido condiz com o encontrado em trabalhos
com o mesmo interesse. Posteriormente, so apresentados os resultados obtidos
pela estimao do modelo de correo de Heckman para o vis de auto-seleo e
pelos modelos hierrquicos lineares, utilizados para corrigir a quebra de hiptese
das amostras independentes e identicamente distribudas.
5.1 Estimao da Funo de Produo Educacional por MQO
Os resultados da regresso linear por MQO, para a prova objetiva, podem ser
analisados na Tabela N 7, onde a nota desta prova do ENEM 2008 a varivel
dependente e as variveis pessoais, familiares e escolares so independentes.
importante ressaltar que, salvo a varivel idade, que foi centralizada, todas as
demais so variveis dicotmicas e seus coeficientes devem ser interpretados
como diferenas em relao categoria de referncia.
A varivel indicadora da idade do candidato foi centralizada em 17 anos,
considerada normal para o final do ensino mdio, e seu coeficiente sobre a
proficincia negativo e estatisticamente significativo. Por isso, segundo o
modelo estimado, os candidatos possuem 1,33 ponto a menos que a mdia, na
prova objetiva, para cada ano adicional superior a 17 anos.
81
Esse efeito parcial negativo pode ser associado ao atraso escolar, causado por
alguma interrupo intermitente ou repetncia, ou candidatos que terminaram o
ensino mdio a mais tempo e voltaram a estudar. O avano etrio, relativamente
srie cursada, parece ser um obstculo ao aprendizado, refletido no baixo
aproveitamento do aluno, mesmo sabendo que a relao entre idade e
proficincia possa ser simultnea. Neste caso, a causa da idade avanada pode
ser justamente o baixo rendimento escolar. O mesmo resultado foi encontrado por
Sampaio (2009) com dados do ENEM 2005 e 2006, e tambm por Golgher (2010)
para o ENEM 2005.
A escolaridade da me se mostrou um fator determinante para a proficincia
escolar dos filhos, uma vez que a aquisio de capital humano na famlia pode
depender, em parte, da escolaridade dos pais. O modelo estimado deixa claro
que a proficincia dos filhos cresce de forma no linear conforme a escolaridade
da me aumenta, quando comparamos com aqueles cuja me nunca frequentou
a escola, que a categoria de referncia. A exceo o candidato que
desconhece a escolaridade da me, para o qual o efeito no difere
estatisticamente da categoria base.
O efeito da renda familiar (apenas de quem mora no mesmo domiclio) sobre a
proficincia, positivo e no linear com respeito s diferentes faixas de renda,
mesmo controlando pela escolaridade da me, que, por hiptese, positivamente
correlacionada com a renda permanente da famlia. Essa observao confirma a
relao positiva entre o nvel socioeconmico e o desenvolvimento educacional
das pessoas discutida no segundo captulo.
No entanto, afirmou-se anteriormente que morar com irmos acarreta um menor
aproveitamento escolar pelo fato da diviso dos recursos destinados a sua
educao. O fato que o tamanho da famlia no domiclio diminui a quantidade
total de recursos financeiros disponveis para a educao de uma maneira geral,
de modo que este fique abaixo do patamar ideal. Para tentar captar o efeito da
quantidade de moradores no domiclio do candidato sobre a distribuio de renda
intrafamiliar, foram calculadas as interaes de cada faixa de renda com a
quantidade de moradores no domiclio.
82
A varivel moradoresXrenda1sm, por exemplo, refere-se interao entre a
quantidade de moradores no domiclio cuja renda familiar de at 1 salrio
mnimo, e o seu coeficiente negativo deixa evidente que a vantagem dessa renda
familiar sobre a proficincia, em relao categoria de referncia (nenhuma
renda familiar), decresce conforme o aumento na quantidade de moradores no
domiclio.
O mesmo efeito acontece para famlias com faixas de renda mais elevadas,
exceto quando a renda excede 10 salrios mnimos, para o qual o coeficiente da
varivel moradoresXrenda10sm no estatisticamente diferente de zero. Este
resultado pode sugerir que, para nveis de renda bastante elevados, a demanda
educacional dos entes mais jovens da famlia suprida financeiramente em sua
totalidade, no sendo limitada por uma restrio oramentria da famlia e as
suas decises de alocao de recursos entre os membros.
Quanto ao sexo do candidato, observamos que a nota mdia da prova objetiva
dos homens superior das mulheres, indicado pelo coeficiente negativo e
significativo para o sexo feminino na regresso linear por MQO. Em contrapartida,
o sexo feminino obteve melhor resultado na prova de redao, como fica evidente
na Tabela N 8, que mostra os resultados obtidos utilizando a nota da redao
como varivel dependente. Esse resultado complementa a discusso do segundo
captulo, sobre a diferena de desempenho entre sexos, tendo os homens maior
vantagem em questes lgicas, e as mulheres maior vantagem em provas
argumentativas.
Os indivduos pretos/pardos demonstraram menor nvel de proficincia do que
brancos/amarelos, e aponta a sua maior desvantagem em termos de sucesso
escolar. Embora a sua causa possa vir da maior concentrao de candidatos de
cor preta/parda nas faixas de renda familiar mais baixas, estamos controlando
pelo nvel de escolaridade da me e pela renda familiar, de modo que existem
outros fatores, ligados cor/raa, que explicam essa desigualdade tnica sobre a
proficincia educacional dos jovens.
A varivel indicativa de trabalho do jovem registra um efeito negativo e
significativo, que pode ser uma consequncia do menor tempo disponvel
83
dedicado educao, reduzindo o aproveitamento escolar. Ressaltando que
estamos controlando a proficincia pela renda familiar do candidato, de tal forma
que essas variveis captam o efeito parcial do nvel socioeconmico sobre a
educao. No entanto, como a varivel de renda domiciliar categorizada, pode
existir uma certa correlao dentro de cada categoria de renda com essa varivel.
A frequncia a cursos preparatrios aumenta diretamente o aproveitamento no
exame, uma vez que eles so organizados com esse objetivo. Tais cursos podem
corrigir o desempenho escolar pfio de um aluno que obteve educao prvia de
baixa qualidade, mas como os jovens que frequentam uma escola de baixa
qualidade so tambm aqueles que no podem pagar por um ensino de
qualidade, tambm pouco provvel que possuam recursos financeiros para
adquirir este servio.
A varivel noturno apresenta um coeficiente negativo, indicando uma
desvantagem para aqueles que estudam no perodo noturno, em relao aos que
estudam no perodo diurno, mesmo controlando pela rede de ensino. Apesar de
uma parte considervel dos candidatos que afirmam estudar no perodo noturno
no trabalhar, tais indivduos podem alocar o seu tempo em outras atividades,
como trabalho informal ou domstico, o que pode revelar a menor prioridade
educao.
Os resultados mostram que existem diferenas entre as redes de ensino sobre a
proficincia mdia de seus alunos. O sinal positivo dos coeficientes da rede
municipal, federal e privada mostra que todas so melhores, em termos de nota
no ENEM, do que a rede estadual (categoria de referncia). Alm disso, podemos
notar que, apesar da diferena entre a rede municipal e a estadual, os candidatos
que estudaram nessas redes possuem, em mdia, uma proficincia abaixo
daquela obtida por alunos provenientes da rede particular ou federal, um sinal da
qualidade do ensino oferecido por cada uma destas ltimas.
A rede particular de ensino diferencia-se por sua maior autonomia e agilidade na
implementao de polticas educativas, e por deterem incentivo maior para atingir
taxas de aprovao em vestibulares do que as redes estaduais e municipais,
como consequncia da concorrncia do mercado.
84
A rede federal se destaca em relao s demais, contudo, a vantagem dos alunos
dessa rede sobre o desempenho no exame pode no ser um reflexo direto da
escola. Em geral, a rede federal possui processos seletivos para admisso de
alunos, em que apenas os melhores colocados conseguem se matricular. Isso
pode ser um indicativo de fatores no-observveis, uma vez que controlamos por
outros fatores pessoais e familiares.
Os resultados no rejeitam a hiptese de que haja uma alocao de recursos
intrafamiliares disponveis para a educao, seja financeiro ou at mesmo a
ateno dos pais, entre filhos. Esse fenmeno foi medido pela varivel indicativa
de morar com irmos, e que apresenta um coeficiente negativo, justificando o
disposto no segundo captulo, que o menor aproveitamento escolar de jovens que
moram com irmos pode ser visto como uma consequncia da diviso dos
recursos educacionais entre eles.
Por fim, foram observadas diferenas entre as regies metropolitanas, por
diversas razes. De acordo com o modelo contextual apresentado na Figura N 1,
as escolas de regies diferentes podem estar sujeitas a polticas educacionais,
valores socioculturais e religiosos, legislao diferenciada e demandas sociais
diferentes, o que influencia a quantidade de recursos que as escolas pblicas
recebem e as diretrizes de gesto desses recursos por cada escola.
A regio metropolitana de Belo Horizonte apresentou resultado mdio superior ao
das demais regies metropolitanas, como pode ser visto pelo coeficiente negativo
de todas as variveis regionais, tomando a regio metropolitana de Belo
Horizonte como referncia. Um resultado similar resultado obtido por Golgher
(2010a), que introduz uma varivel dummy para cada UF do Brasil para estimar a
nota do ENEM 2005, obtendo coeficientes negativos para todos os Estados,
tomando Minas Gerais como UF de referncia.
Com respeito aos determinantes da nota de redao estimados por MQO, as
regies metropolitanas de Salvador e Porto Alegre mostraram-se superiores de
Belo Horizonte, em termos de proficincia mdia, como pode ser visto na Tabela
N 8, diferente do ocorrido quando analisamos a prova objetiva.
85
Os resultados da regresso linear por MQO para a nota de redao apontam
algumas diferenas entre esta e a prova objetiva. J foi dito anteriormente que o
sexo feminino se saiu melhor na prova de redao, enquanto o sexo masculino
obteve mehor resultado na prova objetiva. Alm disso, os resultados obtidos para
a prova de redao mostram que os fatores a ela associados possuem menor
impacto sobre a sua nota, quando comparados com o impacto que estas mesmas
variveis possuem sobre a nota da prova objetiva.
A escolaridade da me e a renda familiar, importantes para explicar a nota da
prova objetiva, possuem um efeito relativamente menor sobre a proficincia
medida pela redao. O papel dos fatores no-observados do candidato parece
ser maior quando ele possui liberdade para expressar o seu pensamento.
A varivel indicadora se o candidato fez cursinho mostrou-se relevante tanto para
a parte objetiva, quanto para a discursiva, mas o seu coeficiente para a redao
relativamente menor. Os cursos preparatrios possuem uma curta durao,
geralmente inferior a um ano, e possvel que eles consigam treinar os
candidatos para responder a questes objetivas, mas no consigam ensin-los a
desenvolver um raciocnio lgico discursivo.
Isso pode significar que o desenvolvimento cognitivo, como requerido pela prova
de redao, pode ser resultado de uma educao que se desenvolve na pessoa a
mdio ou longo prazo. O baixo poder explicativo das variveis independentes
para a nota de redao, mesmo controlando por atributos pessoais, familiares e
escolares, pode indicar que a competncia de expressar as ideias depende
fortemente de fatores no observveis.
5.2 Funo de Produo Educacional com Correo para o Vis de
Auto-Seleo do ENEM
O ENEM um exame voluntrio e, no caso desse ano, como j dito
anteriormente, apenas a metade dos candidatos compareceu no dia da prova, h
um problema de auto-seleo que surge pela no aleatoriedade na ausncia do
exame. Se houver um vis no sentido de que aqueles cujo rendimento escolar
mais elevado sejam mais propensos a fazer o exame, ento deixamos de
86
observar o resultado de jovens menos preparados e, dessa forma, podemos
subestimar os fatores que determinam a proficincia.
Por meio do Censo Escolar 2008, foi possvel calcular a quantidade de alunos do
3 ano do ensino mdio em cada escola do pas e, anexando esse dado com a
quantidade de candidatos que fizeram a prova do ENEM em 2008, calculamos o
percentual de adeso de cada escola, referente a essa populao de alunos. O
resultado de uma anlise de correlao da nota e o percentual de adeso mostra
que existe uma relao positiva entre essas variveis.
Ao ignorar esse vis de seleo da amostra, a regresso por MQO produz
coeficientes que podem enviesar os reais efeitos dos determinantes da
proficincia escolar, caso exista uma auto-seleo do tipo no-aleatria. Para
corrigir esse vis, foi utilizado o modelo de Heckman em dois estgios.
No primeiro estgio, calculou-se a probabilidade de um indivduo comparecer ao
exame, com base em caractersticas da rede de ensino que frequentou. No
segundo estgio, a proficincia cognitiva foi estimada com base nas mesmas
variveis explicativas utilizadas no modelo de regresso linear por MQO, mas
agora o erro foi corrigido com a incluso da razo inversa de Mills, obtida do
primeiro estgio.
O fato do banco de dados no possuir nenhuma caracterstica dos candidatos que
no prestaram o exame demanda uma estratgia de identificao desse grupo
para que a correo de Heckman possa ser feita.
Portanto, com base na presena relativa dos alunos do 3 ano do ensino mdio de
cada escola, selecionamos aquelas escolas cuja presena foi inferior a 10%, e
assumimos que todos os estudantes dessas escolas faltaram ao exame, depois
selecionamos as escolas com ndice de participao superior a 90%, assumindo
que os alunos dessas escolas compareceram ao exame.
A estratgia mostrou-se consoante ao fato de que as escolas com menor
participao no exame tambm so aquelas cujos alunos possuem desempenho
abaixo da mdia. Por fim, das 159.104 observaes vlidas utilizadas pelo
modelo MQO, foram considerados como ausentes 5.521 candidatos, e como
87
presentes 2.081 candidatos, totalizando 7.602 observaes usadas no primeiro
estgio da correo de Heckman.
A correo do vis de seleo para a prova objetiva torna a leitura dos
coeficientes menos distorcida e sublinha algumas mudanas em relao aos
resultados obtidos via MQO em cujo vis est presente. Em primeiro lugar, o
modelo de Heckman aponta que a correlao do erro do primeiro com o segundo
estgio positiva, indicando que os fatores no-observveis que definem a
propenso do indivduo em comparecer ao exame so positivamente
correlacionados com os fatores no-observveis que explicam sua proficincia no
exame.
Ao analisar o segundo estgio do modelo de Heckman na Tabela N 7, corrigido o
vis pelo primeiro estgio, o efeito da idade sobre a nota ligeiramente maior que
no modelo MQO e o efeito da cor/raa permanece praticamente inalterado. Isso
pode indicar que estes coeficientes no estariam sendo enviesados ao considerar
o problema da auto-seleo.
A varivel indicadora de residir com irmos permanece significante, quando
comparada ao coeficiente obtido por MQO, sugerindo que a alocao de recursos
entre irmos explica a proficincia, mesmo consideramos uma amostra sem vis.
Entretanto, a significncia desta varivel para a amostra auto-selecionada pode
indicar que a alocao talvez seja relevante para a parcela dos candidatos mais
capacitada.
O efeito da escolaridade da me no modelo de Heckman diminui para todos os
nveis educacionais sobre a proficincia do filho, em relao ao modelo MQO. Ao
considerar a amostra sem vis, observamos que a escolaridade da me estava
sendo superestimada, no deixando de apontar que a vida educacional dos filhos
muito influenciada pela educao da me. Mais uma vez, destaca-se o papel da
escolaridade dos pais na formao de capital humano na famlia.
O efeito de cada rede administrativa da escola tambm muda, pois agora
frequentar uma escola federal ou privada garante um acrscimo maior na nota do
candidato em relao aos estudantes da rede estadual, quando comparamos aos
modelos anteriores. A rede municipal apresentou um coeficiente menor do que no
88
modelo MQO, isto , ele estava sendo superestimado. Isso pode estar associado
a maior chance de insucesso dos alunos de escolas pblicas estaduais em
relao aos oriundos das redes privada, federal, ou mesmo municipal.
As diferenas regionais tornaram-se menos acentuadas quando comparadas
regio metropolitana de Belo Horizonte. A menor diferena tambm corresponde
ao fato de que o vis menor na regio de Belo Horizonte, por agrupar o menor
nmero de jovens que estudam em escolas cuja participao no exame no
excede 5% da turma. Em outras palavras, a presena do estudante da regio
metropolitana de Belo Horizonte no ENEM 2008 foi mais efetiva.
Na estimao do modelo de Heckman para a nota de redao utilizamos o
mesmo mtodo para criao artificial da subamostra necessria ao primeiro
estgio, que estima a propenso do indivduo em fazer a redao. No entanto,
somamos a esta subamostra o grupo de candidatos que fizeram a prova objetiva,
mas no fizeram a redao.
Um dos principais resultados desta regresso que a escolaridade da me como
determinante da nota da redao menor que no modelo MQO, exceto quando a
me possui ensino superior completo ou ps-graduao. A varivel cursinho
tambm apresenta um coeficiente maior, mostrando que o modelo MQO estava
subestimando tais coeficientes.
O coeficiente estimado da razo inversa de Mills, utilizada no segundo estgio
para a correo do vis de auto-seleo, apresentou um coeficiente positivo, bem
como o coeficiente de correlao ( ) entre os erros do primeiro e do segundo
estgio. Em outras palavras, os fatores no-observveis que explicam a
participao na prova de redao, so positivamente correlacionados com os
fatores no-observveis que explicam o rendimento do candidato na redao.
5.3 Estimao da Funo de Produo Educacional por meio de
Modelos Hierrquicos Lineares
A outra caracterstica das bases de dados de educao que enviesa os
coeficientes da regresso linear clssica a sua estrutura hierrquica. As
89
observaes individuais, em sua maioria, no so totalmente independentes,
como postula uma das hipteses bsicas do mtodo de mnimos quadrados
ordinrios. A consequncia disso que a correlao mdia (ou intra-classe) entre
variveis, considerando estudantes de uma mesma escola, maior que a
correlao mdia entre variveis considerando indivduos de escolas diferentes. A
violao da hiptese de independncia dos dados faz com que as estimativas de
erros-padro dos testes estatsticos sejam muito pequenos, o que pode resultar
em resultados significativos, porm esprios. (HOX, 2002, pg.05)
O primeiro passo foi estimar o modelo nulo HLM0, como discutido no terceiro
captulo, que tem como objetivo estimar as varincias relativas a cada nvel, aluno
e escola, as quais podem ser analisadas pelo ndice de correlao intra-classe
(ICC). O ICC estimado indica que 40,59% da varincia total da nota explicada
por caractersticas do nvel da escola e 59,41% explicada por fatores
pessoais/familiares de cada candidato.
O modelo nulo utilizado para estimar a nota de redao como varivel
dependente mostra um resultado um pouco diferente. O ndice de correlao
intra-classe de cerca de 13%, isto , a varincia da nota de redao explicada
pelos fatores escolares so baixos, quando comparamos com o resultado da
prova objetiva.
Ao analisar o SIMAVE, Soares (2005) estima um modelo com trs nveis (alunos,
turmas e escolas), e seu modelo nulo apresenta ICC de 12% em relao
variao devida escola, para alunos da 4 srie. Por outro lado, Machado et. al.
(2008) estimam um modelo hierrquico com trs nveis (aluno, escola e
municpio) utilizando a mesma base de dados, e encontra um ICC de 12,5% para
a escola, quando considerados os alunos do 3 ano do ensino mdio.
Em trabalhos que buscam o mesmo objetivo, mas por meio do Saeb, destacam-
se os resultados obtidos por Albernaz et. Al. (2003), cujo modelo nulo para
explicar a nota da prova de matemtica do Saeb 1999 apresentou ICC de 28%.
Para Csar & Soares (2001), estimam o ICC em 35,1%, considerando um modelo
nulo em trs nveis (alunos, escolas e UF). No entanto, como estes trabalhos
90
citados utilizam bases de dados diferentes e nveis diferentes de hierrquia, eles
no podem ser diretamente comparveis.
Um trabalho que se assemelha bastante ao nosso, por estudar alunos do 3 ano
do ensino mdio, por meio do Saeb 2001, e por utilizar um modelo hierrquico
com a mesma estrutura que a nossa, e o de Andrade & Laros (2007), cujo ICC
estimado no modelo nulo foi de 46%.
Em seguida, foi estimado outro modelo hierrquico, para a prova objetiva (modelo
HLM1 na Tabela N 7) e para a redao (modelo HLM1r na tabela N 8), contendo
as variveis de primeiro nvel, referentes ao candidato. O resultado indica uma
diferena em relao aos coeficientes estimados pelos modelos de MQO e
Heckman.
No modelo HLM1, para a prova objetiva, a incluso das variveis de primeiro nvel
faz com que o ndice de correlao intra-classe (ICC) diminua em relao ao
modelo nulo, com uma queda aproximada de dezesseis pontos percentuais.
Mesmo assim, cerca de 24% da varincia continua a ser atribuda a fatores de
segundo nvel, isto , mesmo controlando fatores individuais, a escola ainda faz
diferena na proficincia mdia de seus alunos. Como exposto no segundo
captulo, a escola possui uma srie de atributos que influencia seus alunos, como
a gesto dos recursos, programa pedaggico, etc. Tais fatores podem contribuir
para a diferena de proficincia entre escolas, mesmo que estas sejam similares
em alguns aspectos.
A incluso das variveis de primeiro nvel para explicar a nota da redao, no
modelo HLM1r da Tabela 8, ajuda a explicar parte da varincia devida
originalmente escola, e esta se reduz em aproximadamente 23%. Quando
comparamos este resultado com os modelos estimados para a prova objetiva,
observamos que a escola parece ter um papel maior sobre o sucesso em exames
padronizados com questes de mltipla escolha, do que na redao, onde o
candidato livre para expressar seu raciocnio. No resultado obtido por Andrade
& Laros (2007), para os alunos do 3 ano do ensino mdio na prova de
matemtica e lngua portuguesa do Saeb 2001, aps a incluso das variveis de
primeiro nvel, o ICC encontrado foi de 17%.
91
No terceiro modelo hierrquico (HLM2 na tabela 7 e HLM2r na tabela 8), foram
includas, alm das variveis de primeiro nvel, variveis do nvel da escola, como
a rede administrativa e a regio metropolitana em que ela se situa. A incluso
dessas variveis tem por objetivo explicar parte da varincia referente escola e
que no foi explicada pelas variveis de primeiro nvel.
A escolaridade da me possui menos influncia quando consideramos o efeito da
escola sobre seus alunos. possvel afirmar que existe uma concentrao de
alunos, cujo nvel socioeconmico est acima da mdia, em escolas privadas, e
alunos de famlias menos favorecidas em escolas pblicas estaduais/municipais.
Dessa maneira, o estoque de capital econmico/humano dos pais pode
determinar a escolha da escola frequentada pelos filhos, bem como essa pode ser
uma causa pela qual as escolas que apresentam resultados mais prximos aos
esperados so mais disputadas pelas famlias mais ricas.
Em relao influncia da renda familiar sobre a proficincia, vemos que o efeito
da famlia estar entre as duas faixas de renda mais elevadas se reduz, em
comparao ao modelo de regresso linear e de Heckman. Isso pode sinalizar
que a escola substitui, em algum nvel, o benefcio do capital econmico sobre o
aprendizado dos jovens, por diversos motivos.
Neste caso, a escola pode oferecer um conhecimento que outrora seria possvel
somente por meio do investimento direto da famlia, que por sua vez, depende da
renda disponvel. Quando observamos a interao entre renda familiar e a
quantidade de moradores no domiclio, notamos que a diviso de recursos intra-
domiclio parece influenciar negativamente a proficincia, assim como nos outros
modelos.
As famlias de classe social mais elevada possuem recursos suficientes para
atender demanda educacional dos filhos at o nvel desejado. O modelo
hierrquico tambm atribui maior proficincia aos candidatos que pertencem a
famlias mais abastadas, bem como foi estimado pelas regresses anteriores
utilizando MQO e Heckman.
A diferena entre a rede estadual e municipal de ensino diminui, quando utilizado
o modelo hierrquico. A varivel esc_munic, indicadora de o aluno frequentar a
92
rede municipal de ensino, deixa de ser positiva e passa a ser estatisticamente no
significativa, sugerindo que a qualidade desta rede se equipara com a da rede
estadual de ensino. Como explicado no terceiro captulo, a desconsiderao da
estrutura hierrquica dos dados pode acarretar em coeficientes erroneamente
significativos e diferentes de zero.
Em relao s diferenas entre regies metropolitanas, a de Belo Horizonte
continua sendo a melhor em termos de proficincia mdia, mesmo controlando a
proficincia por outras variveis. A diferena das outras em relao a esta mudou
quando comparamos os coeficientes do modelo hierrquico com o MQO ou
Heckman. Algumas regies metropolitanas apresentam uma diferena de
resultados, como So Paulo e Porto Alegre, cujos efeitos so menores do que em
outros modelos, sinal de que a qualidade das escolas destas regies
metropolitanas no se distancia tanto das escolas da regio metropolitana de Belo
Horizonte.
A incluso das variveis de segundo nvel contribui para explicar a
heterogeneidade entre escolas. O ICC do modelo HLM2 apresentou uma
diferena negativa de cerca de dez pontos percentuais em relao ao modelo
anterior. Assim, pouco mais de 13% da varincia da nota se deve a fatores
escolares, enquanto que 87% da varincia explicada por atributos do primeiro
nvel. Este resultado similar ao encontrado por Andrade & Laros (2007) para o
Saeb 2001, no qual o modelo hierrquico com dois nveis (alunos e escolas)
resultou em um ICC de 13,1%, depois de consideradas as variveis de primeiro e
segundo nvel no modelo.
A estimao do modelo hierrquico, cujos resultados esto disponveis na Tabela
8, considera as variveis de primeiro e segundo nvel para a prova de redao
(HLM2r). O seu resultado mostra que, diferente da prova objetiva, a regio
metropolitana de Salvador no estatisticamente diferente da de Belo Horizonte.
Do mesmo modo, a regio metropolitana de Porto Alegre, que possui um
rendimento mdio inferior, em relao categoria de referncia, na prova
objetiva, possui uma nota mdia superior na prova de redao. Isso mostra que
as escolas da RM de Porto Alegre preparam melhor seus estudantes com
93
respeito ao conjunto de competncia de compreenso escrita, argumentao e
utilizao do conhecimento prvio.
Ao comparar o sinal das variveis de todos os modelos estimados, podemos
concluir que, apesar da correo dos vieses encontrados, a maioria das variveis
possui o mesmo sinal, independente do mtodo economtrico utilizado.
O sinal dos coeficientes que so significativos, ao nvel de 5%, para explicar a
nota da prova objetiva e da redao, diverge quanto ao gnero dos candidatos,
pois o sexo feminino obteve melhor desempenho na redao em relao ao sexo
masculino, mas o mesmo no ocorre na prova objetiva.
A regio metropolitana de Porto Alegre apresentou uma nota mdia menor que
Belo Horizonte na prova objetiva, ocorrendo o contrrio na prova de redao. A
regio metropolitana de Salvador tambm apresentou sinal divergente, com efeito
positivo para a prova de redao, e negativo para a prova objetiva. No entanto,
ela no estatisticamente significante para o modelo hierrquico.
Dessa forma, nossas estimaes comprovam a importncia de certas variveis
para explicar a proficincia cognitiva dos jovens, mesmo na ausncia de vieses,
que poderiam ocultar ou distorcer a importncia de cada uma delas. Assim como
encontrado pelos trabalhos citados ao longo do captulo, os fatores
socioeconmicos possuem grande influncia sobre o aproveitamento escolar e
aquisio de capital humano por parte dos jovens em idade escolar. Com relao
ao efeito estimado dos fatores familiares, a escolaridade da me e a renda
familiar, apesar de serem positivamente correlacionadas, possuem efeitos que se
sobrepe aos demais em questo de proficincia dos filhos.
Ao considerar o efeito das escolas, posto o que j foi dito acerca da qualidade das
istituies de ensino, uma escola de boa qualidade pode acarretar uma boa
formao cognitiva. Contudo, fatores no-cognitivos podem influenciar a
proficincia dos alunos, mas no podem ser diretamente observados.


94
TABELA 7 - Resultado dos modelos economtricos estimados para funo
de produo educacional da nota da prova objetiva no ENEM 2008
idade -1,330*** -1,464*** -1,433*** -1,386***
mulher -4,119*** -4,163*** -4,015*** -4,014***
nao_branco -1,988*** -1,989*** -1,359*** -1,253***
trabalha -1,579*** -1,586*** -1,063*** -0,987***
irmaos_m -0,348*** -0,334*** -0,379*** -0,325***
noturno -2,741*** -2,714*** -2,164*** -1,823***
cursinho 3,162*** 3,144*** 3,113*** 3,078***
mae_naosei -0,225 -0,272 -0,462 -0,554*
mae_fund1a4 0,560** 0,519* 0,509** 0,492**
mae_fund5a8 0,772*** 0,702*** 0,660*** 0,614***
mae_em1 1,512*** 1,440*** 1,249*** 1,140***
mae_em2 2,295*** 2,201*** 1,768*** 1,572***
mae_sup1 4,383*** 4,228*** 3,172*** 2,821***
mae_sup2 5,994*** 5,839*** 3,663*** 3,296***
mae_pos 7,450*** 7,282*** 4,368*** 4,018***
renda1sm 2,185*** 1,828*** 2,383*** 2,431***
renda1a2sm 4,060*** 3,848*** 3,857*** 3,742***
renda2a5sm 6,498*** 6,189*** 5,719*** 5,273***
renda5a10sm 9,052*** 8,695*** 6,708*** 5,919***
renda10sm 12,451*** 11,982*** 7,088*** 6,488***
moradoresXrenda1sm -0,483*** -0,457*** -0,420*** -0,395***
moradoresXrenda1a2sm -0,510*** -0,524*** -0,413*** -0,385***
moradoresXrenda2a5sm -0,428*** -0,418*** -0,307*** -0,248***
moradoresXrenda5a10sm -0,380*** -0,368*** -0,146** -0,08
moradoresXrenda10sm -0,025 -0,01 0,165** 0,161*
esc_munic 1,799*** 1,770*** 0,831
esc_fed 18,839*** 18,993*** 21,754***
esc_priv 8,207*** 8,481*** 10,056***
reg_sa -3,723*** -3,691*** -3,977***
reg_re -4,944*** -5,095*** -5,446***
reg_rj -4,008*** -4,304*** -4,037***
reg_sp -3,064*** -3,188*** -2,908***
reg_pa -1,522*** -1,449*** -1,045***
Razo Inversa de Mills 1,442***
constante 44,929*** 43,775*** 44,166*** 44,141*** 43,700***
Mills (rho) 0,11
ICC 40,59% 24,27% 13,78%
N Observaes 159104 153134 173567 159104 159104
Nota: *: significante a 10%; **: significante a 5%; ***: significante a 1%.
Fonte dos dados bsicos: INEP - ENEM 2008.
MQO HECKMAN HLM0 HLM1 HLM2


95
TABELA 8 - Resultado dos modelos economtricos estimados para funo
de produo educacional da nota da prova de redao do ENEM 2008
idade -1,339*** -1,162*** -1,313*** -1,288***
mulher 2,907*** 2,919*** 2,933*** 2,916***
nao_branco -0,765*** -0,732*** -0,642*** -0,482***
trabalha -0,709*** -0,547*** -0,367*** -0,387***
irmaos_m -0,135 -0,11 -0,200** -0,139
noturno -1,577*** -1,353*** -1,661*** -1,455***
cursinho 0,820*** 1,653*** 1,491*** 1,488***
mae_naosei -0,475 -0,153 -0,329 -0,442
mae_fund1a4 1,181*** 0,964*** 1,221*** 1,164***
mae_fund5a8 1,135*** 0,837*** 1,013*** 0,964***
mae_em1 1,393*** 1,060*** 1,193*** 1,113***
mae_em2 1,787*** 1,424*** 1,429*** 1,306***
mae_sup1 2,039*** 1,874*** 1,815*** 1,516***
mae_sup2 2,031*** 2,229*** 1,718*** 1,369***
mae_pos 2,298*** 2,828*** 1,807*** 1,477***
renda1sm 1,702*** 1,831*** 2,210*** 2,139***
renda1a2sm 1,675*** 2,465*** 2,640*** 2,274***
renda2a5sm 3,273*** 3,603*** 3,874*** 3,259***
renda5a10sm 3,609*** 3,864*** 4,071*** 3,034***
renda10sm 5,780*** 5,048*** 4,660*** 3,662***
moradoresXrenda1sm -0,200** -0,404*** -0,364*** -0,295***
moradoresXrenda1a2sm -0,120** -0,261*** -0,168*** -0,124**
moradoresXrenda2a5sm -0,258*** -0,247*** -0,211*** -0,161***
moradoresXrenda5a10sm -0,274*** -0,176** -0,194** -0,121
moradoresXrenda10sm -0,517*** -0,122 -0,215** -0,209**
esc_munic 0,605** 0,628*** 0,672
esc_fed 8,475*** 8,458*** 9,354***
esc_priv 2,167*** 3,541*** 3,408***
reg_sa 0,784*** 0,973*** 0,388
reg_re -12,954*** -3,673*** -9,571***
reg_rj -0,499*** -0,998*** -0,893***
reg_sp -0,929*** -0,967*** -0,784***
reg_pa 1,300*** 1,308*** 1,718***
Razo Inversa de Mills 0,403***
constante 57,251*** 56,826*** 58,913*** 55,476*** 55,842***
Mills (rho) 0,034
ICC 13,13% 10,05% 6,91%
N Observaes 159159 149145 173628 159159 159159
Nota: *: significante a 10%; **: significante a 5%; ***: significante a 1%.
Fonte dos dados bsicos: INEP - ENEM 2008.
MQO HECKMAN HLM0r HLM1r HLM2r

96
6 A RELAO ENTRE PROFICINCIA COGNITIVA E
SITUAO OCUPACIONAL DOS JOVENS
Os objetivos deste captulo so, em primeiro lugar, apresentar os resultados da
imputao da proficincia cognitiva, medida pela nota do ENEM, para os
indivduos que esto terminando o ensino mdio na base de dados da PME. Com
isso, avaliamos a consistncia do resultado mediante os dados utilizados.
Em segundo lugar, investigamos a situao ocupacional desses jovens doze
meses aps a primeira entrada na pesquisa da PME, explorando a proficincia
estimada como fator associado. Com isso, analisamos se esta varivel influencia
a insero dos jovens no mercado de trabalho, como proposto por Hanushek
(2009) e analisado por Soares (2010).
6.1 Imputao da Proficincia Cognitiva do ENEM para a PME
A imputao da nota do Enem para os indivduos na PME foi feita conforme a
metodologia de Elbers et al. (2003) e utitizou as variveis descritas anteriormente
e que so comuns a ambas as bases de dados. Apesar da nota do ENEM estar
no intervalo de 0 a 100 na escala do exame, nada garante que esses limites
sejam respeitados quando estimamos a varivel com outra amostra.
Por essa razo, os valores da nota imputada foram truncados para esses limites,
mesmo porque tais casos foram minoria em nossa estimao, com apenas uma
observao abaixo do limite inferior e nove acima do limite superior, de um total
de 1838 observaes. Os coeficientes estimados na base de dados do ENEM e
que foram utilizados na imputao da nota na PME podem ser conferidos na
tabela 9, onde foi estimado uma regresso para cada idade:
97
TABELA 9 - Resultado da estimao do modelo (3.17) para a imputao da
nota do ENEM para os indivduos da PME por idade

A tabela 10 mostra o resultado da imputao da nota do ENEM 2008 na PME
2008 e 2009 e que foi descrita pela varivel profic. A mdia amostral do ENEM
ficou entre as mdias amostrais da nota imputada para os anos de 2008 e 2009
da PME, com um desvio-padro um pouco maior.
98

TABELA 10 Estatsticas descritivas da nota do ENEM e da proficincia
imputada na bases de dados da PME

O grfico 9 aponta para a existncia de uma diferena na distribuio de
proficincia entre as amostras. Pelo grfico, podemos observar que o valor modal
da nota imputada maior que a calculada na base do ENEM. Alm disso,
notamos que existe uma concentrao de indivduos que obtiveram a sua
proficincia estimada ao mximo, o que no observado na base original.
GRFICO 9 - Distribuio da nota do ENEM 2008 e da nota imputada na PME
2008-2009

99
Essa distoro pode ser resultado da distribuio desproporcional das variveis
dependentes em ambas as bases de dados, conforme foi discutido ao final da
seo anterior. Aparentemente, os indivduos menos proficientes esto em maior
nmero na amostra do ENEM, mas, por exemplo, existem muito mais indivduos
com renda familiar elevada na PME do que na base de dados do ENEM e, como
essa varivel possui impacto positivo sobre a proficincia, a nota estimada para
os indivduos na PME tende a ser maior, considerando este efeito parcial. O
mesmo acontece pela participao diferenciada de indivduos nas regies
metropolitanas, que pode ser fruto do vis de auto-seleo da amostra do ENEM.
6.2 Anlise dos Determinantes da Mobilidade Ocupacional dos Jovens
O principal objetivo deste captulo investigar se a proficincia cognitiva funciona
como um determinante da mobilidade ocupacional dos jovens, no perodo de 12
meses, sendo que entre as possveis situaes ocupacionais, o jovem pode
deixar de estudar e estar economicamente inativo (que inclui no trabalhar nem
procurar emprego), pode estar no mercado de trabalho e deixar de estudar, pode
estar ativo no mercado de trabalho e estudando ou, por fim, pode dedicar-se
apenas aos estudos e ficar inativo no mercado de trabalho.
A estimao do modelo logit multinomial foi feita separadamente para homens e
mulheres, considerando cada situao inicial como uma amostra parte, o que
resultou em quatro modelos estimados utilizando quatro subamostras
15
. Conforme
mostrado pela descrio dos dados do quadro n 4, existe uma tendncia dos
indivduos transitarem para a situao de trabalho, deixando a escola, aps o
perodo de 12 meses.
Queremos investigar se a incluso da varivel indicativa da proficincia cognitiva
altera a probabilidade de transio entre as categorias. Para controlar pelo ano

15
Em busca de um melhor ajuste dos dados, tentamos estimar o modelo de transio ocupacional
utilizando outros recortes amostrais, separando os indivduos por sexo e regio metropolitana ou
agregando pelas regies sul, sudeste e nordeste. Apesar disso, os resultados foram insatisfatrios
ou pouco informativos diante nossos de objetivos, com poucas observaes em algumas
categorias, o que resultava na no convergncia de alguns modelos.
100
em que o indivduo entrar na amostra, acrescentamos a varivel binria v2009,
que indica se o mesmo entrou na amostra em 2009 ou, caso contrrio, em 2008.
As tabelas 11 e 12 apresentam as razes de risco relativo estimadas pelos
modelos economtricos, para as duas situaes iniciais possveis (ativo do
mercado de trabalho e estuda; inativo no mercado de trabalho e estuda),
respectivamente. Cada coluna representa o resultado de um modelo estimado
para homens e mulheres.
A princpio, como observado na parte inferior das tabelas de resultados, o ajuste
do modelo cuja subamostra foi composta por indivduos os quais a situao inicial
era estudar e trabalhar, mostrou-se pouco significativo. O p-valor do teste Qui-
Quadrado, que compara o modelo estimado ao modelo nulo, sem variveis, ficou
bastante elevado, nessas amostras, tanto para homens (0,484), quanto para
mulheres (0,715), quando comparados ao nvel de 5% de significncia.
Em outras palavras, por exemplo, ao nvel de 5% de significncia, no possvel
rejeitar a hiptese nula, de que os coeficientes do modelo so todos
simultaneamente iguais a zero, no havendo efeito estatisticamente significativo
pelas variveis independentes. Ou seja, a proficincia cognitiva, nesse caso, no
possui efeito algum sobre o risco relativo de mudar de situao, ela no um
agente de mudana para os indivduos, para nenhuma situao.
Com respeito aos modelos estimados para a subamostra daqueles indivduos que
apenas estudavam no perodo inicial (no trabalha e estuda), o teste Qui-
Quadrado rejeita a hiptese nula, tanto para homens quanto para mulheres.
Assim, podemos afirmar que pelo menos um dos coeficientes de cada modelos
difere estatisticamente de zero, ambos ao nvel de 5% de significncia.
A razo de risco relativo mostra se, para um aumento marginal na proficincia
cognitiva, o indivduo est mais (ou menos) propenso a transitar da categoria de
referncia. Quando o seu valor do coeficiente da varivel maior do que a
unidade, ento existe uma propenso de mobilidade da categoria de referncia
para a outra situao, considerando a variao de um ponto na escala de
proficincia estimada pela nota do ENEM. Se o coeficiente for menor do que a
101
unidade, a propenso de que o indivduo permanea na categoria de referncia
maior, quanto maior a proficincia.

102
TABELA 11 - Razo de risco relativo para as situaes ocupacionais
estimadas pelo modelo logit multinomial para a situao inicial "Trabalha e
Estuda"



103
TABELA 12 - Razo de risco relativo para as situaes ocupacionais
estimadas pelo modelo logit multinomial para a situao inicial "No
Trabalha e Estuda"



104
Ao considerar apenas os modelos estimados para os indivduos que apenas
estudavam, aqueles que se apresentaram estatisticamente significativos no teste
qui-quadrado, nas tabelas 11 e 12, podemos observar que, quanto maior a
proficincia, menor o risco relativo do indivduo passar para uma situao em que
ele no estuda. A afirmao anterior fica comprovada pelos valores dos
coeficientes da proficincia menores que a unidade para a primeira e segunda
categoria da varivel dependente, para ambos os sexos.
A razo de risco relativo devida ao aumento de um ponto na escala de
proficincia cognitiva estimada para a situao (no trabalha e no estuda)
relativa situao (no trabalha e estuda), dado que as outras variveis foram
mantidas constantes, foi de 0,987 para os homens e de 0,986 para as mulheres.
Em outras palavras, com aumento da proficincia cognitiva, aumenta-se a
expectativa de que o indivduo permanea na situao de referncia, o que
parece bastate razovel, uma vez que ele estar ocupando todo o seu tempo
continuao de sua formao escolar.
A interpretao do coeficiente da proficincia cognitiva para a situao trabalha e
no estuda, tando como referncia a situao no trabalha e estuda
semelhante. Como o valor inferior a um, para ambos os sexos, significa que
quanto maior a proficincia cognitiva, menores so as chances de que o jovem
deixe de estudar para apenas trabalhar.
O coeficiente da varivel proficincia para a situao do jovem trabalhar e estudar
no apresentou um valor estatisticamente diferente de um. Isto , um aumento na
proficincia cognitiva no aumenta ou diminui o risco relativo de um indivduo que
estava cursando o ltimo ano do ensino mdio e no trabalhava, passar a
trabalhar e continuar a sua educao formal.
Assim, o valor dos coeficientes da proficincia cognitiva no modelo logit
multinomial estimado para explicar a mobilidade ocupacional dos jovens, pelo
menos no prazo de doze meses, pode indicar como verdadeira a hiptese de que
o aumento da proficincia cognitiva pode induzir a situao ocupacional dos
jovens.
105
A matriz de transio apresentada no quadro N4 mostrou que grande parte dos
jovens cessa os estudos aps a concluso do ensino mdio. No entanto, o
modelo estimado prope que, quanto maior a proficincia cognitiva, maior a
probabilidade de o jovem continuar estudando e, consequentemente, acumulando
capital humano.
As bases de dados utilizadas so consistentes, no sentido de que servem
finalidade a que se destinam, apesar do ENEM apresentar um vis de auto-
seleo, no representando fielmente a populao composta por todos os
concluientes do ensino mdio, o que pode afetar os nossos resultados e distorcer,
pelo menos em parte, a nossa anlise. A metodologia de compatibilizao das
bases buscou apresentar uma alternativa eficaz para estudar como a proficincia
cognitiva induz a situao ocupacional dos jovens.
Os resultados diferem daqueles obtidos por Soares (2010, p.106-110), que
tambm utilizou o modelo logit multinomial para explicar a situao ocupacional
dos jovens, utilizando a PME (2003-2008) e o ENEM (2003-2007), mas valeu-se
de outra metodologia de compatibilizao para imputao da nota do ENEM para
os indivduos da PME. O autor concluiu que um aumento na nota do ENEM
aumenta as chances de estar empregado, aps o trmino do ensino mdio, mas
no possui influncia sobre a probabilidade do jovem entrar no ensino superior ou
estar em um curso preparatrio para vestibulares.
Os resultados poderiam ter uma significncia estatstica maior, ou at mesmo um
efeito diferente, se houvesse a possibilidade de acompanhar os indivduos por um
perodo superior a doze meses em uma base longitudinal, considerando, assim, a
situao ocupacional no longo prazo. Utilizamos a base de dados do ENEM 2008,
pois ela foi a base mais atualizada com disponibilidade de dados relativos a
pessoas que esto terminando o ensino mdio. Contudo, uma possibilidade de
extenso deste trabalho seria investigar o problema aqui levantado por um
perodo maior, utilizando vrias edies do ENEM e da PME.
106
7 CONCLUSO
A proficincia cognitiva um fator importante na vida dos indivduos e o seu nvel
determinado por fatores pessoais, familiares e escolares, entre outros. Os
trabalhos resenhados no segundo captulo mostraram a relevncia do tema para
entender a desigualdade de renda entre as pessoas sob a luz da teoria do Capital
Humano e a crtica da teoria da Sinalizao sobre o papel da escola.
Por meio do mtodo de mnimos quadrados ordinrios, foi possvel trabalhar em
torno do nosso primeiro objetivo, o de estimar e analisar a funo de produo
educacional, utilizando a base de dados do ENEM 2008. Com o mtodo de
Heckman em dois estgios, testamos e no rejeitamos a hiptese do vis de
seleo da amostra. Ademais, buscamos corrig-lo. Por fim, os modelos
hierrquicos estimados foram teis para observar que as escolas possuem um
efeito sobre todos os seus alunos, mas que a diferena da proficincia entre as
instituies se deve, em grande parte, a caractersticas pessoais e familiares dos
alunos.
A anlise dos modelos estimados possibilitou verificar que a renda familiar foi o
determinante mais importante da nota do ENEM, juntamente com a escolaridade
da me. Dentre os fatores pessoais, destacamos que os negros/pardos possuem
um desempenho inferior aos brancos/amarelos. As mulheres possuem uma
desvantagem na prova objetiva, mas possuem vantagem na prova de redao,
em relao ao sexo masculino.
A nota do ENEM, tomada como medida de proficincia cognitiva, foi imputada
para os indivduos na base de dados da PME, seguindo a metodologia de criao
de mapas de pobreza. O resultado foi satisfatrio, tendo em vista a carncia de
trabalhos com o mesmo objetivo, principalmente pela inexistncia de uma base de
dados que alie tanto informaes sobre proficincia cognitiva quanto variveis de
status ocupacional.
107
Com respeito ao objetivo principal desta dissertao, a investigao do efeito da
proficincia cognitiva do jovem sobre a sua situao ocupacional, o resultado
obtido confirmou aquilo que j foi discutido pela teoria.
Os resultados mostram que quanto maior a proficincia cognitiva, maiores so as
chances dos indivduos continuarem os estudos no ensino superior, e isso
verdade para os jovens que no trabalhavam durante o trmino do ensino mdio,
isto , maiores as chances de manter o status de estudante. Assim, os indivduos
com maior proficincia cognitiva tenham, talvez, um custo de oportunidade menor
que os demais, em relao a uma atividade que envolva aprendizado.
Em face aos determinantes da proficincia cognitiva, vimos que a renda familiar
possui grande influencia, de forma que alguns jovens com baixa renda familiar
tm suas escolhas limitadas muito antes da poca em que devem prestar o
vestibular. Por esta razo, o Estado poderia intensificar o investimento na
qualidade do ensino bsico, como forma de competir com o ensino privado e
garantir aos alunos da rede pblica de ensino, que concentra a maioria dos jovens
de baixa renda, chances de competir pelo seu futuro educacional.
Por outro lado, a escolha de interromper os estudos e entrar no mercado de
trabalho pode ser aquela que os jovens realmente desejem. Neste contexto, para
o jovem que faz esta opo, o Estado deveria reorientar o contedo programtico
do ensino bsico, que, atualmente, excessivamente cientfico-acadmico,
(exceto no caso de escolas tcnicas), desenvolvendo habilidades voltadas
diretamente para mercado de trabalho. Por exemplo, alguns pases oferecem um
contedo mais tcnico, como o caso da Alemanha, que permite melhor
adaptao dinmica do mercado de trabalho. Sendo assim, o Estado poderia
intensificar o investimento tambm em educao tcnica, no s nos institutos
federais e estaduais, mas promover disciplinas vocacionais, como atividades
extracurriculares, para as redes pblicas de ensino.
Por fim, cabe ressaltar que existem poucos trabalhos fundamentados na
compatibilizao de bases de dados para estudar a situao ocupacional dos
jovens no Brasil com base na proficincia cognitiva. Os resultados sugerem que a
108
sua acumulao possui diversos determinantes, que podem refletir na sua
situao ocupacional e nas oportunidades de geraes futuras.
A inexistncia de uma base de dados que alie informaes de proficincia
cognitiva e mercado de trabalho foi uma das causas para as vrias hipteses que
foram assumidas como verdadeiras neste trabalho. Como proposta de uma
agenda futura de pesquisa, propomos avanar em estudos empricos que
aprimorem a compatibilizao de bases de dados educacionais e de mercado de
trabalho, bem como testes que possibilitem discutir a robustez de tais medidas.

109
REFERNCIAS BIBLIOGRFICAS
ALBERNAZ, A.; FERREIRA, F.H.G.; FRANCO, C. Qualidade e equidade no
ensino fundamental brasileiro. 2002. Disponvel em:
http://www.ppe.ipea.gov.br/index.php/ppe/article/view/139/74. Acesso em:
09/05/2011.
ANDRADE, R.J. Qualidade e equidade na educao bsica brasileira: as
evidncias do Saeb 1995-2003. 2008. 230f. Dissertao (Mestrado em Educao)
Faculdade de Edcuao, Universidade Federal de Minas Gerais, Belo
Horizonte, 2008.
ANDRADE, J.M.; LAROS, J.A. Fatores associados ao desempenho escolar:
Estudo Multinvel com os dados do SAEB/2001. 2007. Disponvel em: <
http://www.scielo.br/pdf/ptp/v23n1/a05v23n1.pdf>. Acesso em: 24 fev 2012.
ASSUNO, J.J.; ALVES, L.S. Restries de crdito e decises intra-familiares.
RBE, v.61, n.2, p. 201-229, abr./jun. 2007.
ASTONE, N.M.; MCLANAHAN, S.S. Family structure, residential mobility, and
school dropout: a research note. 1994. Disponvel em:<
http://www.jstor.org/stable/2061791>. Acesso em 17/05/2011.
BARBOSA, M.E.F.; FERNANDES, C. A escola brasileira faz diferena? Uma
investigao dos efeitos da escola na proficincia em matemtica em alunos da 4
srie. 2001. Disponvel em: <http://www.educacion.gob.es/
cide/espanol/investigacion/rieme/documentos/files/barbosa/Barbosa.pdf>. Acesso
em: 10/05/2011.
BARROS, R.P.; MACHADO, A.F.; MENDONA, R.S.P. A desigualdade da
pobreza: estratgias ocupacionais e diferenciais por genro. 1997. Disponvel em:
< http://desafios2.ipea.gov.br/pub/td/1997/td_0453.pdf >. Acesso em 11 jan. 2012.
BECKER, G.S. Investment in Human Capital: A Theoretical Analysis. The
Journal of Political Economy, Vol. 70, No. 5, Part 2: Investment in Human
Beings(Oct., 1962), pp. 9-49. Disponvel em: <
http://www.jstor.org/stable/1829103>. Acesso em: 16 fev 2011.
BEN-PORATH, Y. The Production of Human Capital and the Life Cycle of
Earnings. The Journal of Political Economy, Vol. 75, No. 4, Part 1 (Aug., 1967),
pp. 352-365. Disponvel em: < http://www.jstor.org/stable/1828596>. Acesso em:
16 fev. 2011.
BLAUG, M. The economic value of education: studies in the economics of
education. Editora Aldershot: 1992.
110
BOWLES, S., GINTIS, H., OSBORNE, M. The Determinants of Earnings: A
Behavioral Approach. Journal of Economic Literature, Vol. 39, No. 4 (Dec., 2001),
pp. 1137-1176. Disponvel em: < http://www.jstor.org/stable/2698522>. Acesso
em: 12 mar. 2011.
BRASIL, 1996. Lei n 9394, de 20 de dezembro de 1996.
BRASIL, 2005. Exame Nacional do Ensino Mdio (ENEM): Fundamentao
Terico-Metodolgica. Disponvel em: < http://historico.enem.inep.gov.br >.
Acesso em: 17 jan. 2012.
BRASIL, 2007. Pesquisa mensal de emprego: Srie relatrios metodolgicos.
Disponvel em: < www.ibge.gov.br/home/estatistica/indicadores/.../srmv23pme.pdf
>. Acesso em: 09 nov. 2011.
CAMERON, A.C.; TRIVEDI, P.K. Microeconometrics: Methods and Applications.
Cambridge: Cambridge University Press, 2005. Cap.15. Multinomial models.
p.490-528.
CARVALHO, R.L. Casa, comida e roupa lavada: fatores associados sada
do jovem brasileiro do domiclio de origem. 2009. 95f. Dissertao.
CEDEPLAR, UFMG, Belo Horizonte.
CSAR, C.C.; SOARES, J.F. Desigualdades acadmicas induzidas pelo contexto
escolar. 2001. Disponvel em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol18_n1e2_2001/vol18_n1e2_200
1_6artigo_97_110.pdf>. Acesso em: 10/05/2011.
CIOL, M.A.; HOFFMAN, J.M.; DUDGEON, B.J.; SHUMWAY-COOK,
A.YORKSTON, K.M.; CHAN, L. Understanding the use of weights in the analysis
of data from multistage surveys. 2006. Disponvel em: <
http://www.sciencedirect.com/science/article/pii/S0003999305012840>. Acesso
em: 28 fev 2012
COLEMAN, J.S.; CAMPBEL, E.Q.; HOBSON, C.J.; MCPARTLAN, J.;MOOD,
A.M.; WEINFELD, F.D.; YORK, R.L. Equality of educational opportunity. 1966.
Disponvel em: < http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/06389>.
Acesso em: 18 out. 2011.
COLLIER, W.; VALBUENA, J.; ZHU, Y.What determines post-compulsory
educational choices? Evidence from the longitudinal survey of young people in
England. 2011. Disponvel em: < ideas.repec.org/p/ukc/ukcedp/1112.html>.
Acesso em: 13 jan. 2012.
CLARK, K.B.; SUMMERSL.H. The dynamics of youth unemployment. 1982.
Disponvel em: < www.nber.org/chapters/c7875.pdf >. Acesso em: 03 jan. 2012.
CRESPO, A; REIS, M.C. O efeito diploma no Brasil. 2006. Disponvel em: <
http://www.ipea.gov.br/agencia/images/stories/PDFs/mercadodetrabalho/08Nota2
_Anna_Mauricio.pdf>. Acesso em: 12/05/2011.
111
CRESPO, A; REIS, M.C.Sheepskin effects and the relationship between earnings
and education: analyzing their evolution over time in Brazil. 2009. Disponvel em:
<http://www.scielo.br/scielo.php?pid=S0034-1402009000300002&script
=sci_arttext>. Acesso em: 11/05/2011.
CURI, A.Z.; MENEZES-FILHO, N.A. A relao entre o desempenho escolar e
os salrios no Brasil. 2006. Disponvel em: <
www.anpec.org.br/encontro2005/artigos/A05A158.pdf >. Acesso em: 17 jan. 2012.
CURI, A.Z.; MENEZES-FILHO, N.A. Os determinantes das transies
ocupacionais no mercado de trabalho brasileiro. 2004. Disponvel em:
<ww.anpec.org.br/encontro2004/artigos/A04A141.pdf >. Acesso em: 19 jan 2012.
ECKSTEIN, Z.; WOLPIN, K.I. Why youth drop out of high school: the impact of
preferences, opportunities, and abilities. Econometrica, v. 67, n.6, p. 1295-1339,
nov. 1999.
ELBERS, C.; LANJOUW, J.O.; LANJOUW P. Micro-level estimation of poverty
and inequality. 2003. Disponvel em: < are.berkeley.edu/~ligon/.../elbers-
etal03.pdf >. Acesso em: 21 ago. 2011.
FERRO, M.E.; BELTRO, K.I.; SANTOS, D.P. Polticas de no-repetncia e a
qualidade da educao: evidncias obtidas a partir da modelagem dos dados da
4 srie do Saeb-99. 2002. Disponvel em: <
www.fcc.org.br/pesquisa/publicacoes/eae/arquivos/1179/1179.pdf> . Acesso em:
04 jan. 2012.
FERREIRA, R.A. Desigualdade de desempenho escolar dos alunos do ensino
fundamental do estado de So Paulo: uma anlise de decomposio. 2008. 85f.
Dissertao (mestrado em economia) Universidade de So Paulo, Ribeiro
Preto, 2008.
FERREIRA, S.G.; VELOSO F.A. Mobilidade intergeracional de educao no
Brasil. Pesquisa e Planejamento Econmico. v.33, n.3, dez. 2003.
FLEISCHHAUER, K.J. A Review of Human capital Theory: Microeconomics.
University of St. Garden, 2007. Disponvel em: <
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=957993 >. Acesso em: 12 jan.
2011.
FLORI, P.M.; MENEZES-FILHO, N.A. Mobilidade entre ocupaes e efeitos
salariais. 2008. Disponvel em:
<www.anpec.org.br/encontro2008/artigos/200807171058080-.pdf >. Acesso em:
19 jan. 2012.
FRANCO, C.; ORTIGO, I.; ALBERNAZ, A.; BONAMINO, A.; AGUIAR, G.;
ALVES, F.; STYRO N. Qualidade e equidade em educao: reconsiderando o
significado de fatores intra-escolares. 2007. Disponvel em: <
http://www.scielo.br/scielo.php?pid=S0104-40362007000200007&script=sci_
arttext&tlng=pt>. Acesso em: 03/05/2011.
112
GHEZ, J. Education, the price of time, and lyfe-cycle consumption. In JUSTER,
F.T. (Org.) Education, Income and Human Behavior. Mcgraw-Hill Books
Company: 1975. p.295-312.
GOLDIN, C. The Human Capital Century and American Leadership: virtues of the
past. Disponvel em:
<http://www.economics.harvard.edu/faculty/goldin/files/humancap.pdf>. Acesso
em: 02 abr 2012.
GOLGHER, A. Dilogos com o Ensino Mdio 5: A Escola de Ensino Mdio no
Brasil Analisada a Partir de Dados do INEP. 2010a. Disponvel em: <
www.cedeplar.ufmg.br/pesquisas/td/TD%20395.pdf >. Acesso em: 12 jan. 2012.
GOLGHER, A. Dilogos com o Ensino Mdio 6: A Escola de Ensino Mdio no
Brasil Analisada a Partir de Dados do INEP. 2010b. Disponvel em: <
www.cedeplar.ufmg.br/pesquisas/td/TD%20396.pdf >. Acesso em: 12 jan. 2012.
GONALVES, F.O.; FRANA, M.T.A. Transmisso intergeracional de
desigualdade e qualidade educacional: avaliando o sistema educacional brasileiro
a partir do SAEB 2003. Ensaio: avaliao de polticas pblicas educacionais. v.16,
n. 61, p. 639-662, out./dez. 2008.
GREENE W.H. Econometric analysis. New Jersey: Prentice Hall, 2003. Cap.22.
Limited dependent variable and duration models. p.756-802.
GUIMARES, R.R.M., RIOS-NETO, E.L.G. Desigualdades de oportunidades
educacionais: seletividade e progresso por srie no Brasil, 1986 a 2008. Belo
Horizonte: UFMG/CEDEPLAR, 2010. Disponvel em: <
http://ufmg.academia.edu/RaquelGuimaraes/Talks/27454/Desigualdade_de_oport
unidades_educacionais_Seletividade_e_progressao_por_serie_no_Brasil_1986_a
_2008>. Acesso em: 12 mar. 2011.
HALEY, W.J. Human Capital: The Choice between Investment and Income. The
American Economic Review, Vol. 63, No. 5 (Dec., 1973), pp. 929-944. Disponvel
em: < http://www.jstor.org/stable/1813915>. Acesso em: 16 fev 2011.
HANUSHEK, E.A. Sample selectivity and the validity of international student
achievement tests in economic research. 2010. Disponvel em:
<http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6V84-51C9JYF-
7-1&_cdi=5860&_user=686413&_pii=S0165176510003605&_
origin=gateway&_coverDate=02%2F28%2F2011&_sk=998899997&view=c&wchp
=dGLzVzb-zSkzk&md5=a3363b06c1a0a28700e20cd4a68ec47
f&ie=/sdarticle.pdf>. Acesso em: 13/05/2011.
HANUSHEK, E.A. The trade-off between child quantity and quality. The
Journal of Political Economy, Vol. 100, No. 1 (Feb., 1992), pp. 84-117. Disponvel
em: < http://www.jstor.org/stable/2138807>. Acesso em: 11 mar. 2011.
HANUSHEK, E.A. The economic value of education and cognitive skills. In:
SYKES, D.; SCHNEIDER, B.; PLANK, D.N. (Eds.) Handbook of education policy
research. Washington: AERA. 2009. p.39-56.
113
HARDIE, J.H. Making it? Paths to achieving and not achieving aspirations in the
transition to adulthood. 2009. Disponvel em:
<http://paa2009.princeton.edu/download.aspx?submissionId=91113>. Acesso em:
09 mar 2012.
HECKMAN, J.J. Sample selection bias as a specification error. 1979. Disponvel
em: < http://www.jstor.org/stable/1912352 >. Acesso em: 18 fev. 2011.
HECKMAN, J.J., RUBINSTEIN, Y. The Importance of noncognitive Skills:
Lessons from GED Testing Program. The American Economic Review, Vol. 91,
No. 2, Papers and Proceedings of the Hundred Thirteenth Annual Meeting of the
American Economic Association (May, 2001), pp. 145-149. Disponvel em: <
http://www.jstor.org/stable/2677749>. Acesso em: 11 abr. 2011.
HECKMAN, J.J.; MASTEROV, D.V. The productivity argument for investing in
young children. 2005. Disponvel em: < http://jenni.uchicago.edu/human-
inequality/papers/Heckman_final_all_wp_2007-03-22c_jsb.pdf>. Acesso em: 19
jan. 2012.
HOX, J. Multilevel analysis: Techniques and applications. New Jersey: Laurence
Erlbaum Associates, 2002. Cap. 1. Introduction to multilevel analysis, p. 1-10.
LAM, D. MARTELETO, L. A Dinmica da Escolaridade das Crianas Brasileiras
durante a Transio Demogrfica: Aumento no Tamanho da Coorte versus
Diminuio no Tamanho da Famlia. 2002. Disponvel em:
<http://www.abep.nepo.unicamp.br/docs/anais/pdf/2002/Com_EDU_ST16_Lam_te
xto.pdf>. Acesso em: 16/11/2010.
LAYARD, R., PSACHAROLOUPOS, G. The Screening Hypothesis and the
Returns to Education. The Journal of Political Economy, Vol. 82, No. 5 (Sep. -
Oct., 1974), pp. 985-998. Disponvel em: < http://www.jstor.org/stable/1829179>.
Acesso em: 13 abr. 2011.
MACHADO , A.F.; MORO, S.; MARTINS, L.; RIOS, J. Qualidade do Ensino em
Matemtica: Determinantes do Desempenho de Alunos em Escolas Pblicas
Estaduais Mineiras. 2008. Disponvel em: <
http://www.anpec.org.br/revista/vol9/vol9n1p23_45.pdf >. Acesso em: 04 mai.
2011.
MARTELETO, L. O papel do tamanho da famlia na escolaridade dos jovens.
2002. Revista Brasileira de Estudos de Populao, v.19, n.2, jul./dez. Disponvel
em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol19_n2_2002/vol19_n2_2002_10
artigo_p159a178.pdf> Acesso em: 11 abr. 2011.
MEDEIROS, M., OSRIO, R. Mudanas nas Famlias Brasileiras: A
Composio dos Arranjos Familiares entre 1978 e 1998. Disponvel em: <
http://www.abep.nepo.unicamp.br/docs/rev_inf/vol17_n1e2_2000/vol17_n1e2_200
0_4artigo_67_85.pdf>. Acesso em: 01 mai. 2011.
114
MENEZES-FILHO, N. Os Determinantes do Desempenho Escolar do Brasil.
2007. Disponvel em:<
http://www.cepe.ecn.br/seminarioiv/download/menezes_filho.pdf>. Acesso em:
07/05/2011.
MINCER, J. Investment in human Capital and Personal Income Distribution.
The Journal of Political Economy, Vol. 66, No. 4 (Aug., 1958), pp. 281-302.
Disponvel em: < http://www.jstor.org/stable/1827422 > . Acesso em: 18 fev. 2011.
ORDINE, P.; ROSE, G. Inefficient self-selection into education and wage
inequality. 2011. Disponvel em:<
http://www.aiel.it/bacheca/SASSARI/papers/ordine_rose.pdf >. Acesso em: 04 mar
2012.
PATRINOS, H.A., PSACHARAPOULOS, G. Family Size, Schooling and Child
Labor in Peru An Empirical Analysis. Disponvel em: <
http://link.springer.de/link/service/journals/00148/papers/7010004/70100387.pdf >.
Acesso em: 11 abr. 2011.
PISA. The Programme for International Student Assessment. 2006. Disponvel
em: < http://www.pisa.oecd.org >. Acesso em 11 jan. 2012.
RIANI, J.L.R.; RIOS-NETO, E.L.G. Background familiar versus perfil escolar do
municpio: qual possui maior impacto na resultado educacional dos alunos
brasileiros?. 2008. Disponvel em: < http://www.scielo.br/scielo.php?pid=S0102-
30982008000200004&script=sci_arttext&tlng=es>. Acesso em: 17/05/2011.
RIBAS, R.P.; MACHADO, A.F. A imputao da renda do no trabalho na
pesquisa mensal de emprego. 2009. Disponvel em:
http://www.ppe.ipea.gov.br/index.php/ppe/article/viewFile/1157/1062. Acesso em:
10 fev. 2011.
RIBAS, R.P.; SOARES, S.S.D. Sobre o painel da pesquisa mensal de emprego
(PME) do IBGE. 2008. Disponvel em:<
www.ipea.gov.br/sites/000/2/publicacoes/tds/td_1348.pdf >. Acesso em: 08 ago.
2011.
SAMPAIO, C.E.M. Situao ocupacional dos jovens brasileiros na faixa etria de
15 a 17 anos. 2009. Disponvel em: <http://www.publicacoes.inep.gov.br>. Acesso
em: 12 mar 2012.
SCHOON I.; POLEK, E. Tennage career aspirations and adult career attainment:
the role of gender, social background and general cognitive ability. 2011.
Disponvel em:< http://jbd.sagepub.com/content/35/3/210>. Acesso em: 09 dez.
2011.
SCHULTZ, T.W. Investment in Human Capital. The American Economic Review,
Vol. 51, No. 1 (Mar., 1961), pp. 1-17. Disponvel em:
<http://www.jstor.org/stable/1818907>. Acesso em: 16 fev 2011.
115
SILVA, N.V., HASENBALG, C. Recursos Familiares e transies
Educacionais. Disponvel em: < http://www.scielo.br/pdf/csp/v18s0/13794.pdf>.
Acesso em: 01 mai. 2011.
SOARES, J.F. Avaliao da qualidade da educao escolar brasileira. 2008.
Manuscrito. apud ANDRADE, R.J. Qualidade e equidade na educao bsica
brasileira: as evidncias do Saeb 1995-2003. 2008. 230f. Dissertao (Mestrado
em Educao) Faculdade de Edcuao, Universidade Federal de Minas Gerais,
Belo Horizonte, 2008.
SOARES, J.F. O efeito da escola sobre o desempenho cognitivo dos alunos.
2004. Disponvel em:
<http://www.ppe.ipea.gov.br/index.php/ppe/article/view/139/74>. Acesso em:
02/04/2011.
SOARES, S.S.D. O bnus demogrfico relativo e absoluto no acesso
escola. 2008. Disponvel em: <www.ipea.gov.br/sites/000/2/publicacoes/tds/
td_1340.pdf>. Acesso em: 11 fev. 2011.
SOARES, S.S.D. O Contedo Econmico da Educao. 2010. 146f. Tese
(Doutorado em Economia) Programa de Ps-Graduao em Economia,
Universidade de Braslia, Distrito Federal, 2010.
SOARES, T.M. Modelo de trs nveis hierrquicos para aproficincia dos
alunos de 4a srie avaliadosno teste de lngua portuguesa do
SIMAVE/PROEB-2002. 2005. Disponvel em:
<http://www.fcc.org.br/pesquisa/publicacoes/eae/arquivos/1112/1112.pdf>.
Acesso em: 08/04/2011.
SPENCE, M. Job market Signalling. The Quarterly Journal of Economics, Vol.
87, No. 3 (Aug., 1973), pp. 355-374. Disponvel em:
<http://www.jstor.org/stable/1882010>. Acesso em: 11 mar. 2011.
WOOLDRIDGE, J.M. Econometric Analysis of cross section and panel data.
Cambridge: The MIT Press, 2001. Cap.4. The single-equation linear model and
OLS estimation. p.49-76.

116
ANEXOS
Quadro A.1: Variveis utilizadas no processo de imputao da nota do
ENEM na PME

117
GRFICO A.1 - Distribuio do log da renda per capita na base de dados da
PNAD e PME

118
GRFICO A.2 - Distribuio percentual dos indivduos segundo a regio
metropolitana em que reside, pela base de dados do ENEM e da PME com
expanso da amostra

119
TABELA A.1 - Primeiro estgio de Heckman - modelo Probit para a
probabilidade do indivduo comparecer prova objetiva do ENEM

120
TABELA A.2 - Primeiro estgio de Heckman - modelo Probit para a
probabilidade do indivduo comparecer prova de redao do ENEM

121
TABELA A.3 - Resultado do modelo (3.19) que estima o erro do modelo de
imputao da nota do ENEM na base da PME por idade

You might also like