You are on page 1of 102

ESTADISTICA APLICADA A LA EDUCACION

Universidad
Santander
Rodolfo Gallardo-Rosales
gallardo33@gmail.com

ESTADISTICA APLICADA A LA EDUCACION

EVALUACION
Item
Peso
Asistencia
10
Participacin
10
Trabajo mensual
10
Examen terico
25
Examen prctico
35
Autoevaluacin
5
Evaluacin del compaero
5
=====
TOTAL
100

01 02 03 04 05 06

Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones

Conceptos fundamentales

01 02 03 04 05 06

1. QU ES LA ESTADSTICA?
Muy a menudo, tenemos ideas generales sobre
alguna cosa, como inversiones, votos por algn
candidato poltico, apuestas, tomar medicinas
para la gripe, juego de dados, tratar de conocer
a nuestros maestros, una cita a ciegas, etc.
Desafortunadamente pocas de nuestras
decisiones, que pudieran ser equivocadas
algunas de ellas, no se basan en la experiencia.
La investigacin social tiene ideas acerca de la
realidad social, que llama hiptesis, y las
comprueba por la investigacin sistemtica.
Para esto se usa la estadstica.

Conceptos fundamentales

01 02 03 04 05 06
La estadstica se divide en tres ramas principales: la
descriptiva, que comprende la organizacin, anlisis y resumen
de datos, la teora de la probabilidad, que proporciona una base
racional para tratar de resolver situaciones influidas por
factores aleatorios, y la teora de la inferencia, que incluye el
anlisis e interpretacin de muestras. Su conocimiento se
convierte en una poderosa herramienta de toma de decisiones.
Una de las caractersticas es el uso de modelos matemticos,
los cuales se constituyen en versiones resumidas de algn
problema o caso de inters de las ciencias sociales (en nuestro
caso). El Taller inicia con una lectura acerca del mtodo de
aplicacin de la estadstica en las ciencias sociales,
posteriormente con una breve resea histrica de la estadstica
y posteriormente con alguna terminologa bsica.

Conceptos fundamentales

01 02 03 04 05 06

La investigacin es una
actividad humana orientada a la
descripcin, comprensin,
explicacin y transformacin de
la realidad social a travs de un
plan de indagacin sistemtica.
La investigacin social suele
iniciarse con la identificacin de
un problema y la delimitacin de
unos objetivos que reflejan las
intenciones del investigador.

Conceptos fundamentales

01 02 03 04 05 06

Los problemas de investigacin no suelen


encontrarse aislados y definidos en la realidad
social, por lo que el investigador tienen que a partir
de la observacin de la realidad identificar los
problemas, reformularlos hasta que puedan ser
investigados. El investigador selecciona tras
consulta del marco terico existente la metodologa
ms adecuada y lleva a cabo la aplicacin del
protocolo de investigacin a travs de las tcnicas
de obtencin de informacin y recoge los datos
necesarios para analizarlos con el fin de: Explorar,
comprender, interpretar o explicar el fenmeno
objeto de estudio.

Conceptos fundamentales

01 02 03 04 05 06
Los cientficos sociales han visto el mundo social desde
diferentes perspectivas han utilizado diversos modelos de
investigacin y han recogido la informacin a travs de
mltiples tcnicas. Esta diversidad de tcnicas obedece a
cuestiones planteadas desde la filosofa de la ciencia. Las
metodologas aplicadas pueden clasificarse como: Empricoanaltica, constructivista y sociocrtica. De entre ellas, la
Emprico-analtica suele orientarse al contraste de hiptesis,
siendo su centro de inters la construccin de conocimiento
terico para describir, explicar, predecir y en lo posible
controlar los fenmenos sociales. En general, su mbito de
aplicacin queda reducido a fenmenos observables
susceptibles de medicin, control experimental u anlisis
estadstico.

Conceptos fundamentales

01 02 03 04 05 06

La observacin sistemtica, la medida,


el experimento y la construccin de
teoras son aspectos clave de esta
metodologa, junto con el papel que
tiene la estadstica en la contrastacin
de hiptesis. En esta metodologa la
cuantificacin es una consecuencia
directa de la medida, que por
definicin genera datos cuantitativos y
exige una anlisis de los mismos,
utilizando modelos estadsticos, en su
pretensin se llegar a generalizaciones
de carcter probabilstico.

Conceptos fundamentales

01 02 03 04 05 06
Breve historia de la Estadstica
La estadstica entendida como una
actividad de recuento o recoleccin de
datos para proporcionar informacin tiene
su origen posiblemente en Cerdea, donde
existen monumentos prehistricos en
cuyas piedras se encontraban muescas
que previsiblemente permitan contar el
ganado cazado. En el mundo antiguo, los
gobiernos por motivos militares, fiscales,
administrativos, ordenan el
empadronamiento de la poblacin o
censos de personas.

Conceptos fundamentales

01 02 03 04 05 06
En China, Confucio cita la confeccin de un censo
para las producciones agrcola, industrial y
comercial, en el ao 2238 A.C. En Egipto, los
censos y catastros llegaron a poseer carcter
institucional y las estadsticas tuvieron gran
importancia. En Israel, en el libro de Nmeros, se
habla de un censo de personas realizado por
Moiss. En Roma, estas recolecciones fueron tan
destacables que hasta se implantaron censores.
Servio Tulio (335 AC) instituy la obligacin de
acudir a las fiestas de aldeas o ciudades y
depositar cada ciudadano una moneda distinta
para hombres mujeres o nios. El recuento de
monedas proporcionaba el nmero de habitantes
de cada clase.

Conceptos fundamentales

01 02 03 04 05 06

En la edad media, merece


destacada importancia la
aparicin de los que
posteriormente ser las
Estadsticas industriales.
Con el nacimiento del
Estado Moderno en el
Renacimiento resurge la
elaboracin de censo y
recoleccin de datos
socioeconmicos.

Conceptos fundamentales

01 02 03 04 05 06

A principios del siglo XVII, la familia


Elzevir, en los Pases Bajos, publica en
60 volmenes, una especie de
enciclopedia de los estados. En el siglo
XVIII con el cambio de mentalidad, nacen
algunos incipientes conceptos de
estadstica bsicos basados en tres
corrientes. Por un lado, la escuela
estadstica descriptiva y la escuela
aritmtico poltica y por otro lado, el
clculo de probabilidad, constituyendo
as los antecedentes de los mtodos
estadsticos modernos.

Conceptos fundamentales

01 02 03 04 05 06

La escuela estadstica descriptiva


(Alemana, 1648), impone la
necesidad de una disciplina
prctica y jurdica. La escuela
aritmtico poltica, adems de los
mismo objetivos de la escuela
almena, se plante por primera vez
la bsqueda de las leyes
cuantitativas que rigen los
fenmenos objeto de estudio. La
escuela del clculo de
probabilidades, se desarroll en
principio, de manera independiente
a las otras dos vertientes.

Conceptos fundamentales

01 02 03 04 05 06

Metodologa de la Estadstica
El punto de partida de una
investigacin estadstica es, en
sentido amplio, la consideracin de
una situacin real en ambientes de
incertidumbre. En la primera fase
se recoge toda la informacin
disponible a travs de la
observacin de los datos. El
conjunto de estas observaciones es
lo que denominamos muestra y
sobre la que posteriormente se
realiza el anlisis.

Conceptos fundamentales

01 02 03 04 05 06
La eleccin de las observaciones que constituirn la
muestra va a ser muy importante. El diseo muestral
resultante, debe garantizar que la muestra sea
representativa de la poblacin, as como evitar errores o
anomalas en los datos seleccionados. Una vez recogida la
informacin en la etapa anterior, se intenta especificar un
modelo que explique la realidad de forma adecuada.
Generalmente cuando se propone un modelo, se pretende
que cumpla con dos concisiones: Describir la realidad y
evitar excesiva complejidad en su composicin
estructural. Una vez obtenido el modelo que explique la
realidad del objeto de estudio, el investigador ha de
comprobar si dicho modelo proporciona resultados
coherentes, es decir, si es tericamente aceptable y
estadsticamente significativo.

Conceptos fundamentales

01 02 03 04 05 06
La investigacin estadstica se desarrolla utilizando el ciclo
deductivo-inductivo que consta de las siguientes etapas:
1. Planteamiento del problema: El primer paso de la investigacin
es definir los objetivos de estudio y relacionar este objetivo con
los valores numricos de variables observables.
2. Construccin del modelo estadstico: El tipo de modelo
estadstico ms frecuente consiste en una descomposicin de
los valores de la variable de inters en una parte sistemtica
ms una parte aleatoria. Un modelo estadstico es una
aproximacin operativa de la realidad, que tiene en cuenta
explcitamente las variables observables presumiblemente ms
importantes, y engloba en la parte aleatoria los efectos del resto.

Conceptos fundamentales

01 02 03 04 05 06

3. Recogida de la informacin muestral:


Una vez construido un modelo del
problema tendr que medir los valores de
las variables de inters. Esta recogida de
la informacin puede hacerse mediante
muestreo o con un diseo de
experimentos.
4. Depuracin de la muestra: Antes de
utilizar los datos muestrales conviene
aplicar tcnicas estadsticas simples para
identificar errores.

Conceptos fundamentales

01 02 03 04 05 06

5. Estimacin de los parmetros: Los


modelos estadsticos dependen de
ciertas constantes desconocidas que
llamaremos parmetros. La fase de
estimacin consiste en utilizar la
informacin disponible para decidir
respecto a un valor concreto de estos
parmetros as como cuantificar el
posible error de estimacin.
6. Contrastes de simplificacin: El objetivo
de esta fase es conseguir un modelo tan
simple como sea posible.

Conceptos fundamentales

01 02 03 04 05 06

7. Crtica y Diagnosis del modelo: Los


resultados de las dos etapas anteriores
se obtiene suponiendo que el modelo
es correcto. Esta fase investigativa la
compatibilidad entre la informacin
emprica y el modelo. Si despus de
esta fase aceptamos el modelo como
correcto, lo utilizaremos para tomar
decisiones o realizar previsiones de la
variable. En caso contrario volveremos
a reformular el modelo estadstico,
repitiendo el proceso hasta conseguir
un modelo correcto.

Conceptos fundamentales

01 02 03 04 05 06

CONSTRUCCIN
DEL MODELO
ESTADSTICO

PLANTEAMIENT
O DEL
PROBLEMA

RECOGIDA DE
LA
INFORMACIN
MUESTRAL

CRTICA Y
DIAGNOSIS DEL
MODELO

CONTRASTES
DE
SIMPLIFICACIN

DEPURACIN DE
LA MUESTRA

ESTIMACIN DE
PARMETROS

Conceptos fundamentales

01 02 03 04 05 06

ACTIVIDAD 01:
1. Realice una breve resea de la
anterior exposicin
2. Cmo ha sido el desarrollo de la
estadstica como herramienta
metodolgica en las ciencias
sociales?

Conceptos fundamentales

01 02 03 04 05 06

2. TERMINOLOGA BSICA
ESTADSTICA
Los procedimientos y anlisis que
aparecen en estadstica se
clasifican en dos categoras
generales, ESTADISTICA
DESCRIPTIVA (o deductiva), y
ESTADISTICA INFERENCIAL (o
inductiva), dependiendo del
propsito de estudio.

Conceptos fundamentales

01 02 03 04 05 06

Estadstica Descriptiva. Procedimientos estadsticos que


sirven para organizar y resumir conjuntos de datos
numricos. Ejemplo: Una entidad quiere calcular la
proporcin de mexicanos encuestados que estn a favor
de determinado candidato poltico.
Estadstica Inferencial. Procedimientos estadsticos que
sirven para deducir o inferir algo acerca de una
poblacin, seleccionando un grupo menor de esta
(muestra). Ejemplo: Con base en una muestra de
estudiantes, la Universidad de Colima desea determinar el
porcentaje de estudiantes que fuman.

Conceptos fundamentales

01 02 03 04 05 06

Poblacin y muestra.
Cuando se realiza un estudio de
investigacin, se pretende generalmente
inferir o generalizar resultados de una
muestra a una poblacin. Se estudia en
particular a un reducido nmero de
individuos a los que tenemos acceso con
la idea de poder generalizar los hallazgos
a la poblacin de la cual esa muestra
procede. Este proceso de inferencia se
efecta por medio de mtodos
estadsticos basados en la probabilidad.

Conceptos fundamentales

01 02 03 04 05 06

La poblacin representa el conjunto grande de individuos que


deseamos estudiar y generalmente suele ser inaccesible. Es, en
definitiva, un colectivo homogneo que rene unas
caractersticas determinadas.
La muestra es el conjunto menor de individuos (subconjunto de
la poblacin accesible y limitado sobre el que realizamos las
mediciones o el experimento con la idea de obtener
conclusiones generalizables a la poblacin). El individuo es
cada uno de los componentes de la poblacin y la muestra. La
muestra debe ser representativa de la poblacin y con ello
queremos decir que cualquier individuo de la poblacin en
estudio debe haber tenido la misma probabilidad de ser
elegido.

Conceptos fundamentales

01 02 03 04 05 06

Las razones para estudiar muestras en lugar de


poblaciones son diversas y entre ellas podemos
sealar
a. Ahorrar tiempo. Estudiar a menos individuos es
evidente que lleva menos tiempo.
b. Como consecuencia del punto anterior
ahorraremos costes.
c. Estudiar la totalidad de los pacientes o
personas con una caracterstica determinada en
muchas ocasiones puede ser una tarea
inaccesible o imposible de realizar.

Conceptos fundamentales

01 02 03 04 05 06

d. Aumentar la calidad del estudio. Al


disponer de ms tiempo y recursos, las
observaciones y mediciones realizadas a
un reducido nmero de individuos pueden
ser ms exactas y plurales que si las
tuvisemos que realizar a una poblacin.
e. La seleccin de muestras especficas nos
permitir reducir la heterogeneidad de una
poblacin al indicar los criterios de
inclusin y/o exclusin.

Conceptos fundamentales

01 02 03 04 05 06

Tipos de datos
Lo que estudiamos en cada individuo de
la muestra son las variables (edad, sexo,
peso, talla, tensin arterial sistlica,
etctera). Los datos son los valores que
toma la variable en cada caso. Lo que
vamos a realizar es medir, es decir,
asignar valores a las variables incluidas
en el estudio. Deberemos adems
concretar la escala de medida que
aplicaremos a cada variable.

Conceptos fundamentales

01 02 03 04 05 06

La naturaleza de las
observaciones ser de gran
importancia a la hora de elegir el
mtodo estadstico ms
apropiado para abordar su
anlisis. Con este fin,
clasificaremos las variables, a
grandes rasgos, en dos tipos:
variables cuantitativas o
variables cualitativas.

Conceptos fundamentales

01 02 03 04 05 06

a. Variables cuantitativas. Son las variables


que pueden medirse, cuantificarse o
expresarse numricamente. Las variables
cuantitativas pueden ser de dos tipos:
Variables cuantitativas continuas, si
admiten tomar cualquier valor dentro de un
rango numrico determinado (edad, peso,
talla).
Variables cuantitativas discretas, si no
admiten todos los valores intermedios en un
rango. Suelen tomar solamente valores
enteros (nmero de hijos, nmero de partos,
nmero de hermanos, etc).

Conceptos fundamentales

01 02 03 04 05 06

b. Variables cualitativas. Este tipo de


variables representan una cualidad o
atributo que clasifica a cada caso en
una de varias categoras. La situacin
ms sencilla es aquella en la que se
clasifica cada caso en uno de dos
grupos (hombre/mujer, enfermo/sano,
fumador/no fumador). Son datos
dicotmicos o binarios. Como resulta
obvio, en muchas ocasiones este tipo
de clasificacin no es suficiente y se
requiere de un mayor nmero de
categoras (color de los ojos, grupo
sanguneo, profesin, etctera).

Conceptos fundamentales

01 02 03 04 05 06

En el proceso de medicin de estas


variables, se pueden utilizar dos escalas:
Escalas nominales: sta es una forma de
observar o medir en la que los datos se
ajustan por categoras que no mantienen una
relacin de orden entre s (color de los ojos,
sexo, profesin, presencia o ausencia de un
factor de riesgo o enfermedad, etctera).
Escalas ordinales: en las escalas utilizadas,
existe un cierto orden o jerarqua entre las
categoras (grados de disnea, estadiaje de un
tumor, etctera).

Conceptos fundamentales

01 02 03 04 05 06
Parmetro. Un parmetro es cualquier
caracterstica cuantificable de una poblacin.
Ejemplo: El ingreso promedio de todos los
trabajadores de una empresa, si todos los
trabajadores se consideran como una poblacin.
Estadstico. Un estadstico es cualquier
caracterstica medible de una muestra. Ejemplo:
En el ejemplo anterior el ingreso promedio de
todos los asalariados de una determinada seccin
de la empresa.
Un censo es la enumeracin completa de la
poblacin. Ejemplo: Segn el censo llevado a
cabo por el INEGI en 1995 Mxico tena 91,2
millones de habitantes, de los cuales 44,9 millones
eran hombres y 46,3 millones mujeres.

Conceptos fundamentales

01 02 03 04 05 06

ACTIVIDAD No. 02
1. Clasificar si es muestra o
poblacin:
a. Las elecciones en Mxico
b. El salario de 20 empleados de
una compaa.
c. Hacer una encuesta a 100
personas que entraron a una
tienda de los 896 que entraron
a dicha tienda, en un da.
d. Hacer un estudio con todos los
pacientes geritricos de un
hospital

Conceptos fundamentales

01 02 03 04 05 06

2. Describa una posible muestra de tamao 5 de


cada una de las siguientes poblaciones:
Todos los peridicos publicados en Mxico.
Todas las empresas importantes de Mxico.
Todos los estudiantes de su curso.
3. Una revista publica datos sobre la clasificacin
de las 300 corporaciones industriales ms
grandes de un pas, en trminos de ventas y
utilidades.
Cuntos elementos hay en este conjunto de
datos?
Cul es la poblacin?

Conceptos fundamentales

01 02 03 04 05 06

4. Clasificar las siguientes variables:


a. Preferencias polticas (izquierda, derecha o centro).
b. Tipos de test psicolgicos
c. Velocidad del torrente sanguneo
d. El peso en Kg.
e. Signo del zodiaco.
f. Nivel educativo (primaria, secundaria, bachillerato).
g. Aos de estudios completados.
h. Tipo de enseanza (privada o pblica).
i. Nmero de empleados de una empresa.
j. La temperatura de un enfermo en grados Celsius (C)
k. La clase social (baja, media o alta).
l. La presin arterial

Conceptos fundamentales

01 02 03 04 05 06
5. Dado el siguiente cuestionario, clasifique sus variables:
A. Cul es su edad?
B. Estado civil:
a) Soltero
b) Casado
c) Separado
d) Divorciado
e) Viudo
C. Cuanto tiempo emplea para desplazarse a su trabajo?
D. Tamao de su municipio de residencia:
a) Municipio pequeo (menos de 2.000 habitantes)
b) Municipio mediano (de 2.000 a 10.000 hab.)
c) Municipio grande (de 10.000 a 50.000 hab.)
d) Ciudad pequea (de 50.000 a 100.000 hab.)
e) Ciudad grande (ms de 100.000 hab.)
E. Est afiliado al Seguro Social?

Conceptos fundamentales

01 02 03 04 05 06

MEDIBILIDAD Y VARIABILIDAD
En un conjunto de datos siempre se
espera variacin. Si se encuentra
poca variacin, o no se encuentra
variacin, podra suponerse que el
instrumento de evaluacin no est
calibrado con una unidad que sea lo
suficientemente pequea.

Conceptos fundamentales

01 02 03 04 05 06

Por ejemplo, se toma un paquete de


24 barras de algn dulce favorito y
cada barra se pesa en forma
individual. Se observa que cada una
de las 24 barras pesa 24.8 gramos,
aproximado a la dcima de gramo
ms prxima. Significa esto que
todas las barras se pesan
exactamente lo mismo? No
necesariamente. Suponga que las
barras se pesan en una balanza
analtica que registra la centsima
de gramo ms prxima. En este caso
los pesos de las 24 barras
mostraran VARIABILIDAD

Conceptos fundamentales

01 02 03 04 05 06

No importa cul sea la variable de


respuesta: si la herramienta de
medicin es suficientemente exacta,
habr variabilidad en los datos. Uno
de los objetivos primordiales del
anlisis estadstico es la medicin de
la variabilidad. Por ejemplo, en el
estudio de control de calidad, la
medicin de variabilidad es
absolutamente indispensable.
Controlar (o reducir) la variabilidad en
un proceso de manufactura es todo
un campo por s mismo: el control,
estadstico de los procesos.

Conceptos fundamentales

01 02 03 04 05 06

RECOPILACION DE DATOS
Por lo general es imposible estudiar toda
una poblacin (cada uno de los individuos
de un pas, todos los estudiantes
universitarios, cada paciente de un mdico,
etc.), los investigadores suelen apoyarse
en muestras para adquirir la informacin, o
los datos necesarios. Es importante
obtener buenos datos porque en ltima
instancia las inferencias efectuadas se
basan en los estadsticos obtenidos a
partir de los datos. Estas inferencias slo
pueden ser tan buenas como lo sean los
datos.

Conceptos fundamentales

01 02 03 04 05 06

Aunque es relativamente fcil definir


buenos datos como datos que
representen con exactitud a la poblacin
de la cual se tomaron, no es fcil garantizar
que un mtodo particular de muestreo
produzca buenos datos. Se desea usar
mtodos de muestreo (recoleccin de
datos) que producirn datos que sean
representativos de la poblacin y que no
sean sesgados.

Mtodo de muestreo sesgado: produce valores que difieren


sistemticamente de la poblacin que est siendo muestreada. Un
mtodo de muestreo no-sesgado es aqul que no est sesgado.
Conceptos fundamentales

01 02 03 04 05 06

Dos mtodos de muestreo de uso comn


que a menudo producen muestras
sesgadas son las muestras por
conveniencia y de voluntarios.
Una muestra de conveniencia, a veces
conocida tambin como al azar, ocurre
cuando los elementos son seleccionados
arbitrariamente y en forma no estructurada
de una poblacin, mientras que una
muestra de voluntarios est formada por
resultados recolectados a partir de los
elementos de la poblacin que por su
propia iniciativa eligen contribuir con la
informacin necesaria.

Conceptos fundamentales

01 02 03 04 05 06

Alguna vez ha comprado una cesta de frutas


en el mercado, basando la decisin de compra
en la apariencia apetitosa de la fruta de arriba,
para descubrir despus que la fruta de abajo no
era tan fresca? No consider conveniente
inspeccionar la fruta de abajo, de modo que
usted confi en una muestra por conveniencia.
Alguna vez el maestro ha utilizado a los
alumnos de un saln como muestra de dnde
recabar datos? Los alumnos forman un grupo
conveniente, pero el grupo es realmente
representativo de la poblacin de la escuela?
(Considere las diferencias entre estudiantes del
turno matutino, vespertino, etc.)

Conceptos fundamentales

01 02 03 04 05 06

Alguna vez ha enviado el


cuestionario de la encuesta de una
revista? Bajo qu condiciones se
tom el tiempo para llenar un
cuestionario? La actitud inmediata
de casi todas las personas es no
hacer caso de la encuesta. Quienes
tengan ideas firmes harn el
esfuerzo para responder el
cuestionario; por tanto, no deben
esperarse muestras representativas
cuando se recolectan muestras de
voluntarios.

Conceptos fundamentales

01 02 03 04 05 06
PROCESO DE RECOLECCION DE DATOS
La obtencin de datos para el anlisis estadstico
es un proceso complicado que incluye los
siguientes pasos:
1. Definir los objetivos de la investigacin o del
experimento.
Ejemplos: comparar la eficacia de un nuevo
medicamento con la eficacia del medicamento
estndar; estimar el ingreso familiar promedio
en Mxico.
2. Definir la variable y la poblacin de inters.
Ejemplos: duracin del tiempo de recuperacin
de los pacientes que sufren alguna enfermedad
particular; estimar el ingreso total en las familias
de Mxico.

Conceptos fundamentales

01 02 03 04 05 06
3. Definir los esquemas para recolectar y medir los
datos.
Esto incluye el marco muestral, el procedimiento de
muestreo, el tamao de la muestra y el instrumento
de medicin (cuestionario, por telfono, etc.) de los
datos.
4. Recolectar la muestra. Seleccionar los sujetos a ser
muestreados y recolectar los datos.
5. Revisar el proceso de muestreo al terminar la
recoleccin.
A menudo ocurre que un analista se encuentra con
datos ya recolectados, tal vez, incluso,
recolectados para otros fines, lo cual imposibilita
determinar si los datos son buenos o no. Es
mucho mejor que usted recolecte los datos
utilizando tcnicas aprobadas.

Conceptos fundamentales

01 02 03 04 05 06
Los dos mtodos que por lo general se utilizan
para recabar datos son experimentos y estudios
observacionales. En un experimento, el
investigador controla o modifica el entorno y
observa el efecto sobre la variable bajo estudio.
A menudo leemos sobre resultados de
laboratorio obtenidos usando ratas blancas para
probar dosis diferentes de un nuevo
medicamento y analizar su efecto en la presin
arterial. Los tratamientos experimentales fueron
diseados especficamente para obtener los
datos necesarios para estudiar el efecto sobre la
variable. En un entorno observacional, el
investigador no modifica el entorno y no
controla el proceso en observacin.

Conceptos fundamentales

01 02 03 04 05 06

COMPARACION ENTRE
PROBABILIDAD Y ESTADISTICA
La probabilidad y la estadstica son
dos campos ajenos pero
relacionados de las matemticas. Se
ha dicho que la probabilidad es el
vehculo de la estadstica. Es decir,
que si no fuera por las leyes de la
probabilidad, la teora de la
estadstica no sera posible.

Conceptos fundamentales

01 02 03 04 05 06
Observemos estas dos cajas:

Probabilidad
5A, 5R, 5B

Esta caja contiene fichas de


pquer: 5 azules, 5 rojas y 5
blancas.
La probabilidad intenta
responder preguntas como si
se extrae una ficha de la caja,
cul es la probabilidad de que
sea azul?

Conceptos fundamentales

Estadstica?
? ? ?

En esta caja se ignora cul es la


combinacin de fichas.
Se extrae una muestra y, con
base en los resultados
obtenidos en sta, se hacen
conjeturas sobre lo que se cree
que hay en la caja

01 02 03 04 05 06

Observemos la diferencia:

PROBABILIDAD

ESTADISTICA

Pregunta sobre la
posibilidad de que ocurra
algo especfico, por ejemplo,
sacar una ficha azul, cuando
se conocen las posibilidades
(es decir, se conoce la
poblacin)

Pide extraer una muestra,


describirla (estadstica
descriptiva) y luego hacer
inferencias sobre la
poblacin con base en la
informacin que se obtuvo
en la muestra (estadstica
inferencial)

Conceptos fundamentales

01 02 03 04 05 06

Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones

Estadstica descriptiva

01 02 03 04 05 06

REPRESENTACION GRAFICA DE DATOS


Grficas de crculos y grficas de barras:
son grficas que se usan para resumir
datos cualitativos, o por atributos, o
datos categricos. Las grficas de
crculos (diagramas de pastel) muestran
la cantidad de datos que pertenecen a
cada una de las categoras como parte
proporcional de un crculo. Las grficas
de barras muestran la cantidad de datos
que pertenecen a cada una de las
categoras como un rea rectangular de
tamao proporcional.

Estadstica descriptiva

01 02 03 04 05 06
TABLA DE DATOS

14 a 15

16 a 17

18 a 19

20 o ms

99

142

Estadstica descriptiva

01 02 03 04 05 06
GRAFICO DE CIRCULO

EDAD DE LOS
ENCUESTADOS
2
6
14 a 15
99

16 a 17
18 a 19
20 o ms

142

Estadstica descriptiva

01 02 03 04 05 06
HISTOGRAMA
(GRAFICO DE BARRAS)

EDAD DE LOS
ENCUESTADOS

160

142
140
120
100

99

80
60
40
20

18 a 19

20 o ms

0
14 a 15

16 a 17

Estadstica descriptiva

01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)

frecuencia
Numerode Fronterasde
frecuencia acumulativ
grupo
grupo
a

frecuencia
acumulativa
relativa

35X<45

(2)

2/50

0,04

45X<55

(2+2)

4/50

0,08

55X<65

11

(7+4)

11/50

0,22

65X<75

13

24

(13+11)

24/50

0,48

75X<85

11

35

(11+24)

35/50

0,70

85X<95

11

46

(11+35)

46/50

0,92

95X<105

50

(4+46)

50/50

1,00

50

Estadstica descriptiva

01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)

Calificaciones de examen final en


estadstica elemental
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0

20

40

Estadstica descriptiva

60

80

100

120

01 02 03 04 05 06

MEDIDAS DE TENDENCIA
CENTRAL
Son valores numricos que
localizan, en algn sentido, el
centro de un conjunto de datos.
Es frecuente que el trmino
promedio se asocie con todas
las medidas de tendencia
central.

Estadstica descriptiva

01 02 03 04 05 06
Media (Media aritmtica):
Es el promedio con el que probablemente estemos ms
familiarizados. La media muestral se representa por x
(lase x barra o media muestral). La media se
encuentra al sumar todos los valores de la variable x (esta
suma de valores se simboliza como x ) y dividir la suma
entre el nmero de estos valores , n (el tamao muestral).
Expresamos esto mediante frmula como
suma de todas las x
Media muestral: x barra = ---------------------------nmero de las x

x=
n

Estadstica descriptiva

01 02 03 04 05 06

EJEMPLO
Un conjunto de datos consta de cinco valores:
6, 3, 8, 6, y 4. Encuentre la media.
SOLUCION:
Con la frmula anterior, encontramos:

x =

6+ 3+8+ 6+ 4
27
=
=
= 5 .4
5
5

Por lo tanto, la media de esta muestra es 5.4

Estadstica descriptiva

01 02 03 04 05 06

Mediana:
Es el valor de los datos que ocupa la
posicin media cuando los datos estn
clasificados en orden de acuerdo con
su tamao. La mediana muestral se
representa por ~
x (lase x tilde o
mediana muestral).

Estadstica descriptiva

01 02 03 04 05 06
Procedimiento para determinar la mediana:
PASO 1: Clasifique los datos
PASO 2: Determine la profundidad de la mediana. La profundidad,
o posicin (nmero de posiciones desde cualquiera de los
extremos), se determina con la frmula

nmero + 1
Profundidad de mediana:
2

n +1
~
d (x ) =
2

PASO 3: Determine el valor de la mediana. Cuente los datos


~
clasificados, localizando los datos en la posicin d (x )
La mediana ser la misma cualquiera que sea el extremo de los
datos clasificados (alto o bajo) desde el que se cuente. De hecho,
contar desde ambos extremos servir como excelente prueba.

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n IMPAR
Encuentre la mediana para el conjunto de datos
{6, 3, 8, 5, 3}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
3, 3, 5, 6 y 8
n +1 5 +1
PASO 2: Profundidad de la mediana: d ( ~
x) =
=
=3

(La 3. Posicin)
PASO 3: La mediana es el tercer nmero desde cualquier extremo
~
de los datos clasificados, es decir: x = 5

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n PAR
Encuentre la mediana para el conjunto de datos
{9, 6, 7, 9, 10, 8}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
6, 7, 8, 9, 9 Y 10
~ n +1 = 6 +1
PASO 2: Profundidad de la mediana: d ( x ) =

= 3.5

(La 3.5ava Posicin)


PASO 3: La mediana es est a mitad entre los datos tercero y
cuarto, se suman los dos valores y se dividen entre dos, la mediana
es:

8+9
~
x=
= 8.5
2

Estadstica descriptiva

01 02 03 04 05 06

MEDIDAS DE DISPERSION
Una vez que se ha localizado el medio mediante
la aplicacin de las medidas de tendencia central,
nuestra bsqueda de informacin a partir de
conjuntos de datos se dirige ahora a las medidas
de dispersin. Las medidas de dispersin incluyen
el rango, varianza y desviacin estndar.
Estos valores numricos describen la cantidad de
dispersin o variabilidad que se encuentra entre los
datos: los datos agrupados de manera estrecha
tienen valores relativamente pequeos y aquellos
datos que estn ms dispersos tienen valores ms
grandes.

Estadstica descriptiva

01 02 03 04 05 06
Rango:
Es la diferencia de valor entre los datos de valor ms
alto, H, y los de valor ms bajo, L.
rango = valor alto valor bajo
rango = H L
Por ejemplo:
La muestra 3, 4, 5, 6, 8 tiene un rango de
H L = 8 3 = 5.
El rango de 5 nos dice que estos datos caen todos
ellos dentro de un intervalo de 5 unidades.

Estadstica descriptiva

01 02 03 04 05 06

Las otras medidas de dispersin que


se van a estudiar, son medidas de
dispersin alrededor de la media.
Para desarrollar una medida de
dispersin alrededor de la media,
contestemos primero a la pregunta:
qu tan lejos de la media est cada x?

Estadstica descriptiva

01 02 03 04 05 06

Desviacin desde la media:


Una desviacin desde la media , (x - x ) es la diferencia
entre el valor de x y la media x .
Cada valor individual de x se desva de la media en una
cantidad igual a (x - x ).
Esta desviacin (x - x ) es cero cuando x es igual a la
media x .
La desviacin (x - x ) es positiva cuando x es mayor que x
y es negativa cuando x es menor que x .

Estadstica descriptiva

01 02 03 04 05 06

Ejemplo:
Considere la muestra {6, 3, 8, 5, 3}, de la cual encontramos
su media:

x=
n

Encontramos que la media es 5.

Cada desviacin (x - ) se encuentra entonces al restar 5 de


cada valor:
Datos, x
6
3
8
5
3
-------------------------------------------------------------------------Desviacin, x 1
-2
3
0
-2

Estadstica descriptiva

01 02 03 04 05 06

Desviacin media absoluta:


Es la media de los valores absolutos de las desviaciones desde la
media:
(suma de valores absolutos de desviaciones)
Desviacin media absoluta = ---------------------------------------------------------------nmero

Desviacin media absoluta =

Estadstica descriptiva

| x x |
x

01 02 03 04 05 06

Para nuestro ejemplo:


La suma de las desviaciones absolutas es 8 :
(1 + 2 + 3 + 0 + 2) y

| xx| 8

= = 1.6
Desviacin media absoluta =
n

Estadstica descriptiva

01 02 03 04 05 06

Varianza muestral:
La varianza muestral, s2, es la media del cuadrado de las
desviaciones, calculada usando n-1 como divisor:
suma de (cuadrado de desviaciones)
Varianza muestral: s2 = -----------------------------------------------------nmero 1
s = 4.5
2

s2 =

(
x
x
)

n 1

Donde n es el tamao muestral, es decir, el nmero de datos de la


muestra.

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO:
Para encontrar la varianza de la muestra 6, 3, 8, 5, 3 se calcula:
---------------------------------------------------------------------------------------------------------------------Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
2
Hallar x
Hallar
Hallar toda x Hallar ( x x )
Hallar s2
---------------------------------------------------------------------------------------------------------------------6
65= 1
(1)2 = 1
x
( x x )2
2
s =
x=
3
3 5 = -2
(-2)2 = 4
n 1
n
8
85= 3
(3)2 = 9
18
5
55= 0
(0)2 = 0
25
2
s
=
2
x
=
3
3 5 = -2
(-2) = 4
4
5
----------------------------------------2

x = 25

x =5

(x x) = 0 (x x)

= 18

s = 4.5

----------------------------------------------------------------------------------------------------------------------

Estadstica descriptiva

01 02 03 04 05 06

Desviacin muestral estndar


Para obtener la desviacin estndar de una muestra, s, es la raz
cuadrada positiva de la varianza:

Desviacin muestral estndar: s = raz cuadrada de varianza muestral

s = s2

Estadstica descriptiva

01 02 03 04 05 06

MEDIDAS DE POSICION
Las medidas de posicin se utilizan
para describir la posicin que un
dato especfico posee en relacin
con el resto de los datos cuando
estn en orden por categoras.
Cuartiles y percentiles son dos de
las medidas de posicin ms
populares.

Estadstica descriptiva

01 02 03 04 05 06

Cuartiles
Son valores de la variable que dividen los datos ordenados en
cuartos; cada conjunto de datos tiene tres cuartiles. El primer
cuqrtil, Q1, es un nmero tal que a lo sumo 25% de datos son
menores en valor que Q1, y a lo sumo 75% son mayores. El segundo
cuartil es la mediana. El tercer cuartil, Q3, es un nmero tal que a lo
sumo 75% de los datos son menores en valor que Q3 y a lo sumo
25% son mayores.
Datos clasificados, orden creciente
25%

25%

25%

Q1

Estadstica descriptiva

Q2

25%

Q3

01 02 03 04 05 06

El procedimiento para determinar


los valores de los cuartiles es el
mismo que para percentiles y se
muestra en la descripcin de
percentiles. Recordemos que los
datos debe estar clasificados de
bajo (L) a alto (H)

Estadstica descriptiva

01 02 03 04 05 06
Percentiles
Son los valores de la variable que dividen un conjunto de datos clasificados
en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El
k-simo percentil Pk es un valor tal que a lo sumo k% de los datos son
menores en valor que Pk y a lo sumo (100 k)% de los datos son mayores.
Percentiles
Datos clasificados, orden creciente
1% 1% 1% 1% 1%

L P1 P2 P3 P4

1% 1% 1% 1%

P97 P98 P99 H

K-simo percentil
Datos clasificados, orden creciente
a lo sumo (100 k) %

a lo sumo k%

Pk

Estadstica descriptiva

01 02 03 04 05 06

Notas:
1. El primer cuartil y el 25avo percentil, son lo
mismo, es decir, Q1 = P25 Tambin Q3 = P75.
2. La mediana, el segundo cuartil y el 50avo
percentil son todos lo mismo: Med = Q2 =
P50. Por tanto, cuando se nos pida hallar P50
o Q2, usamos el procedimiento para hallar la
mediana

Estadstica descriptiva

01 02 03 04 05 06
INTERPRETACION Y COMPRENSION DE LA
DESVIACION ESTANDAR
Las desviacin estndar es una medida de
variacin (dispersin) en los datos. Se ha definido
como un valor calculado con el uso de frmulas.
An as, podemos preguntarnos qu es realmente
y cmo se relaciona con los datos. Es una clase de
medidor por el que podemos comparar la
variabilidad de un conjunto de datos con la de otro.
Esta medida particular puede comprenderse
mejor al examinar dos enunciados que nos dicen
cmo se relaciona la desviacin estndar con los
datos: la regla emprica y el teorema de
Chebyshev.

Estadstica descriptiva

01 02 03 04 05 06
Regla emprica
Si una variable est normalmente distribuida, entonces :
1. Dentro de una desviacin estndar de la media habr
aproximadamente 68% de los datos
2. Dentro de dos desviaciones estndar de la media, habr
aproximadamente 95% de los datos; y
3. Dentro de tres desviaciones estndar de la media, habr
aproximadamente 99.7% de los datos
Esta regla aplica de manera especfica a una distribucin
normal [en forma de campana], pero con frecuencia se
aplica como gua interpretativa a cualquier distribucin
agrupada.

Estadstica descriptiva

01 02 03 04 05 06
99.7%
95%
68%

x 3s

x 2s

Estadstica descriptiva

xs

x+s

x + 2 s x + 3s

01 02 03 04 05 06

En la figura anterior, se muestran los intervalos de


1, 2 y 3 desviaciones estndar alrededor de la
media de una distribucin aproximadamente
normal.
Por lo general estas proporciones no se presentan
de manera exacta en una muestra, pero los valores
observados estarn cercanos cuando una muestra
grande se tome de una poblacin normalmente
distribuida.
Si una distribucin es aproximadamente normal,
ser casi simtrica y la media dividir la
distribucin en dos (la media y la mediana son
iguales en una distribucin simtrica

Estadstica descriptiva

01 02 03 04 05 06

34% 34%

13.5%

13.5%

2.5%

Calificaciones z

2.5%

x 3s

x 2s

xs

x+s

x + 2s

x + 3s

-3

-2

-1

Estadstica descriptiva

01 02 03 04 05 06

Teorema de Chebyshev
La proporcin de cualquier distribucin que se
encuentre dentro de k desviaciones estndar de la
media es al menos

1
1 2
k
Donde k es cualquier nmero positivo mayor a 1.
Este teorema aplica a todas las distribuciones de
datos.

Estadstica descriptiva

01 02 03 04 05 06

Este teorema indica que dentro de 2 desviaciones


estndar de la media (k=2), siempre se encontrar al
menos 75% (es decir, 75% o ms) de los datos.

1 3
1
1
=
1

=
1

= = 0.75
2
2
k
2
4 4

La siguiente figura muestra una distribucin agrupada


que ilustra al menos 75%.

Estadstica descriptiva

01 02 03 04 05 06
Teorema de Chebyshev k=2
s

Al menos 3/4

x 2s
Estadstica descriptiva

x + 2s

01 02 03 04 05 06

Si consideramos el intervalo encerrado por 3


desviaciones estndar en cualquier lado de la
media (k=3), el teorema dice que siempre
encontraremos al menos 89% (es decir, 89% o
ms) de los datos, como se ilustra en la siguiente
figura:

1
1
1 8
1 2 = 1 2 = 1 = = 0.89
k
3
9 9

Estadstica descriptiva

01 02 03 04 05 06
Teorema de Chebyshev k=3
s

Al menos 8/9

x 3s
Estadstica descriptiva

x + 3s

01 02 03 04 05 06

Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones

Probabilidad

01 02 03 04 05 06

CONCEPTOS PRELIMINARES Y DEFINICIONES DE


PROBABILIDAD
Definamos lo que significa probabilidad En forma
especfica, hablamos de la probabilidad de que
ocurra cierto evento
Probabilidad de que ocurra un evento:
Es la frecuencia relativa con la que puede
esperarse que el evento ocurra.
La probabilidad de un evento puede tenerse en tres
formas diferentes: empricamente, tericamente y
subjetivamente.

Probabilidad

01 02 03 04 05 06

El mtodo emprico podra llamarse probabilidad experimental o emprica.


Esta probabilidad es la frecuencia relativa observada con lo que ocurre en
un evento. El valor asignado a la probabilidad del evento A como resultado
de experimentacin se puede hallar por medio de la frmula:
Probabilidad emprica (observada): P(A)
nmero de veces que A ocurri
En palabras: probabilidad emprica A = -------------------------------------------nmero de intentos

En lgebra:

Probabilidad

n(A)
P(A) = -------n

01 02 03 04 05 06

Notacin para probabilidad


emprica:
Cuando el valor asignado a la
probabilidad de un evento resulta de
datos experimentales o empricos,
identificaremos la probabilidad del
evento con el smbolo P( ).

Probabilidad

01 02 03 04 05 06

El mtodo terico para obtener la probabilidad de un evento usa


un espacio muestral. Un espacio muestral es una lista de todos los
posibles resultados del experimento bajo consideracin.
Cuando se utiliza este mtodo, el espacio muestral debe c ontener
puntos muestrales igualmente probables.
Por ejemplo, el espacio muestral para el hecho de tirar un dado es
{1, 2 3, 4, 5, 6}. Cada resultado (es decir, nmero) es igualmente
probable.
Un evento es un subconjunto del espacio muestral. Por tanto la
probabilidad de un evento A, P(A), es la razn entre el nmero de
puntos que satisfacen la definicin del evento A, n(A), y el nmero
de puntos muestrales de todo el espacio muestral, n(S), esto es:

Probabilidad

01 02 03 04 05 06

Probabilidad terica esperada: P(A)


Nmero de veces que A ocurre en espacio muestral
En palabras: probabilidad terica de A = ----------------------------------------------------------------------------Nmero de elementos en espacio muestral

n(A)
En lgebra: P(A) = ------n(S)

Probabilidad

01 02 03 04 05 06

LEYES DE PROBABILIDAD
Con frecuencia, uno desea saber la
probabilidad de un evento compuesto
y los nicos datos de que se dispone
son las probabilidades de los eventos
simples relacionados. (Los eventos
compuestos son combinaciones de
ms de un evento simple). A
continuacin se resume la relacin
entre esas probabilidades.

Probabilidad

01 02 03 04 05 06
Para hallar la probabilidad de no A
El concepto de eventos complementarios es fundamental para hallar la
probabilidad de no A. Eventos complementarios: el complemento de A,
es el conjunto de todos los puntos muestrales del espacio muestral que
no pertenecen al evento A.
Nota. El complemento del evento A se denota por A (lase A
complemento.
Unos pocos ejemplos de eventos complementarios son:
-El complemento del evento xito es fracaso
-El complemento de votante seleccionado es priista es votante
seleccionado no es priista
-El complemento de no caras de 10 tiros de una moneda es al menos
una cara.

Probabilidad

01 02 03 04 05 06

Regla de complemento:
En palabras: probabilidad de A complemento = uno probabilidad de A

En lgebra:

A = 1 P( A)

Nota:
Todo evento tiene un evento complementario Las probabilidades
complementarias son muy tiles cuando la pregunta pide la probabilidad
de al menos uno. Generalmente, esto representa una combinacin de
varios eventos, pero el evento complementario ninguno es un solo
resultado. Es ms fcil despejar el evento complementario y obtener la
respuesta con el uso de la frmula.

Probabilidad

01 02 03 04 05 06

Para hallar la probabilidad de A o B


Un trabajador que se emplea por hora desea
calcular las probabilidades de recibir una
promocin u obtener un aumento de sueldo.
El trabajador estara feliz con cualquiera de
esos resultados. Existe informacin histrica
que permitir que el trabajador estime la
probabilidad de recibir una promocin y
obtener un aumento de sueldo
separadamente.
Aprenderemos cmo aplicar la ley de la
adicin para hallar la probabilidad compuesta
de inters.

Probabilidad

01 02 03 04 05 06

Regla general de adicin


Sean A y B dos eventos definidos en un espacio
muestral, S.
En palabras:
probabilidad de A o B = probabilidad de A + probabilidad de B
probabilidad de A y B

En lgebra:

Probabilidad

P(A o B) = P(A) + P(B) P(A y B)