Professional Documents
Culture Documents
Universidad
Santander
Rodolfo Gallardo-Rosales
gallardo33@gmail.com
EVALUACION
Item
Peso
Asistencia
10
Participacin
10
Trabajo mensual
10
Examen terico
25
Examen prctico
35
Autoevaluacin
5
Evaluacin del compaero
5
=====
TOTAL
100
01 02 03 04 05 06
Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones
Conceptos fundamentales
01 02 03 04 05 06
1. QU ES LA ESTADSTICA?
Muy a menudo, tenemos ideas generales sobre
alguna cosa, como inversiones, votos por algn
candidato poltico, apuestas, tomar medicinas
para la gripe, juego de dados, tratar de conocer
a nuestros maestros, una cita a ciegas, etc.
Desafortunadamente pocas de nuestras
decisiones, que pudieran ser equivocadas
algunas de ellas, no se basan en la experiencia.
La investigacin social tiene ideas acerca de la
realidad social, que llama hiptesis, y las
comprueba por la investigacin sistemtica.
Para esto se usa la estadstica.
Conceptos fundamentales
01 02 03 04 05 06
La estadstica se divide en tres ramas principales: la
descriptiva, que comprende la organizacin, anlisis y resumen
de datos, la teora de la probabilidad, que proporciona una base
racional para tratar de resolver situaciones influidas por
factores aleatorios, y la teora de la inferencia, que incluye el
anlisis e interpretacin de muestras. Su conocimiento se
convierte en una poderosa herramienta de toma de decisiones.
Una de las caractersticas es el uso de modelos matemticos,
los cuales se constituyen en versiones resumidas de algn
problema o caso de inters de las ciencias sociales (en nuestro
caso). El Taller inicia con una lectura acerca del mtodo de
aplicacin de la estadstica en las ciencias sociales,
posteriormente con una breve resea histrica de la estadstica
y posteriormente con alguna terminologa bsica.
Conceptos fundamentales
01 02 03 04 05 06
La investigacin es una
actividad humana orientada a la
descripcin, comprensin,
explicacin y transformacin de
la realidad social a travs de un
plan de indagacin sistemtica.
La investigacin social suele
iniciarse con la identificacin de
un problema y la delimitacin de
unos objetivos que reflejan las
intenciones del investigador.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Los cientficos sociales han visto el mundo social desde
diferentes perspectivas han utilizado diversos modelos de
investigacin y han recogido la informacin a travs de
mltiples tcnicas. Esta diversidad de tcnicas obedece a
cuestiones planteadas desde la filosofa de la ciencia. Las
metodologas aplicadas pueden clasificarse como: Empricoanaltica, constructivista y sociocrtica. De entre ellas, la
Emprico-analtica suele orientarse al contraste de hiptesis,
siendo su centro de inters la construccin de conocimiento
terico para describir, explicar, predecir y en lo posible
controlar los fenmenos sociales. En general, su mbito de
aplicacin queda reducido a fenmenos observables
susceptibles de medicin, control experimental u anlisis
estadstico.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Breve historia de la Estadstica
La estadstica entendida como una
actividad de recuento o recoleccin de
datos para proporcionar informacin tiene
su origen posiblemente en Cerdea, donde
existen monumentos prehistricos en
cuyas piedras se encontraban muescas
que previsiblemente permitan contar el
ganado cazado. En el mundo antiguo, los
gobiernos por motivos militares, fiscales,
administrativos, ordenan el
empadronamiento de la poblacin o
censos de personas.
Conceptos fundamentales
01 02 03 04 05 06
En China, Confucio cita la confeccin de un censo
para las producciones agrcola, industrial y
comercial, en el ao 2238 A.C. En Egipto, los
censos y catastros llegaron a poseer carcter
institucional y las estadsticas tuvieron gran
importancia. En Israel, en el libro de Nmeros, se
habla de un censo de personas realizado por
Moiss. En Roma, estas recolecciones fueron tan
destacables que hasta se implantaron censores.
Servio Tulio (335 AC) instituy la obligacin de
acudir a las fiestas de aldeas o ciudades y
depositar cada ciudadano una moneda distinta
para hombres mujeres o nios. El recuento de
monedas proporcionaba el nmero de habitantes
de cada clase.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Metodologa de la Estadstica
El punto de partida de una
investigacin estadstica es, en
sentido amplio, la consideracin de
una situacin real en ambientes de
incertidumbre. En la primera fase
se recoge toda la informacin
disponible a travs de la
observacin de los datos. El
conjunto de estas observaciones es
lo que denominamos muestra y
sobre la que posteriormente se
realiza el anlisis.
Conceptos fundamentales
01 02 03 04 05 06
La eleccin de las observaciones que constituirn la
muestra va a ser muy importante. El diseo muestral
resultante, debe garantizar que la muestra sea
representativa de la poblacin, as como evitar errores o
anomalas en los datos seleccionados. Una vez recogida la
informacin en la etapa anterior, se intenta especificar un
modelo que explique la realidad de forma adecuada.
Generalmente cuando se propone un modelo, se pretende
que cumpla con dos concisiones: Describir la realidad y
evitar excesiva complejidad en su composicin
estructural. Una vez obtenido el modelo que explique la
realidad del objeto de estudio, el investigador ha de
comprobar si dicho modelo proporciona resultados
coherentes, es decir, si es tericamente aceptable y
estadsticamente significativo.
Conceptos fundamentales
01 02 03 04 05 06
La investigacin estadstica se desarrolla utilizando el ciclo
deductivo-inductivo que consta de las siguientes etapas:
1. Planteamiento del problema: El primer paso de la investigacin
es definir los objetivos de estudio y relacionar este objetivo con
los valores numricos de variables observables.
2. Construccin del modelo estadstico: El tipo de modelo
estadstico ms frecuente consiste en una descomposicin de
los valores de la variable de inters en una parte sistemtica
ms una parte aleatoria. Un modelo estadstico es una
aproximacin operativa de la realidad, que tiene en cuenta
explcitamente las variables observables presumiblemente ms
importantes, y engloba en la parte aleatoria los efectos del resto.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
CONSTRUCCIN
DEL MODELO
ESTADSTICO
PLANTEAMIENT
O DEL
PROBLEMA
RECOGIDA DE
LA
INFORMACIN
MUESTRAL
CRTICA Y
DIAGNOSIS DEL
MODELO
CONTRASTES
DE
SIMPLIFICACIN
DEPURACIN DE
LA MUESTRA
ESTIMACIN DE
PARMETROS
Conceptos fundamentales
01 02 03 04 05 06
ACTIVIDAD 01:
1. Realice una breve resea de la
anterior exposicin
2. Cmo ha sido el desarrollo de la
estadstica como herramienta
metodolgica en las ciencias
sociales?
Conceptos fundamentales
01 02 03 04 05 06
2. TERMINOLOGA BSICA
ESTADSTICA
Los procedimientos y anlisis que
aparecen en estadstica se
clasifican en dos categoras
generales, ESTADISTICA
DESCRIPTIVA (o deductiva), y
ESTADISTICA INFERENCIAL (o
inductiva), dependiendo del
propsito de estudio.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Poblacin y muestra.
Cuando se realiza un estudio de
investigacin, se pretende generalmente
inferir o generalizar resultados de una
muestra a una poblacin. Se estudia en
particular a un reducido nmero de
individuos a los que tenemos acceso con
la idea de poder generalizar los hallazgos
a la poblacin de la cual esa muestra
procede. Este proceso de inferencia se
efecta por medio de mtodos
estadsticos basados en la probabilidad.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Tipos de datos
Lo que estudiamos en cada individuo de
la muestra son las variables (edad, sexo,
peso, talla, tensin arterial sistlica,
etctera). Los datos son los valores que
toma la variable en cada caso. Lo que
vamos a realizar es medir, es decir,
asignar valores a las variables incluidas
en el estudio. Deberemos adems
concretar la escala de medida que
aplicaremos a cada variable.
Conceptos fundamentales
01 02 03 04 05 06
La naturaleza de las
observaciones ser de gran
importancia a la hora de elegir el
mtodo estadstico ms
apropiado para abordar su
anlisis. Con este fin,
clasificaremos las variables, a
grandes rasgos, en dos tipos:
variables cuantitativas o
variables cualitativas.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Parmetro. Un parmetro es cualquier
caracterstica cuantificable de una poblacin.
Ejemplo: El ingreso promedio de todos los
trabajadores de una empresa, si todos los
trabajadores se consideran como una poblacin.
Estadstico. Un estadstico es cualquier
caracterstica medible de una muestra. Ejemplo:
En el ejemplo anterior el ingreso promedio de
todos los asalariados de una determinada seccin
de la empresa.
Un censo es la enumeracin completa de la
poblacin. Ejemplo: Segn el censo llevado a
cabo por el INEGI en 1995 Mxico tena 91,2
millones de habitantes, de los cuales 44,9 millones
eran hombres y 46,3 millones mujeres.
Conceptos fundamentales
01 02 03 04 05 06
ACTIVIDAD No. 02
1. Clasificar si es muestra o
poblacin:
a. Las elecciones en Mxico
b. El salario de 20 empleados de
una compaa.
c. Hacer una encuesta a 100
personas que entraron a una
tienda de los 896 que entraron
a dicha tienda, en un da.
d. Hacer un estudio con todos los
pacientes geritricos de un
hospital
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
5. Dado el siguiente cuestionario, clasifique sus variables:
A. Cul es su edad?
B. Estado civil:
a) Soltero
b) Casado
c) Separado
d) Divorciado
e) Viudo
C. Cuanto tiempo emplea para desplazarse a su trabajo?
D. Tamao de su municipio de residencia:
a) Municipio pequeo (menos de 2.000 habitantes)
b) Municipio mediano (de 2.000 a 10.000 hab.)
c) Municipio grande (de 10.000 a 50.000 hab.)
d) Ciudad pequea (de 50.000 a 100.000 hab.)
e) Ciudad grande (ms de 100.000 hab.)
E. Est afiliado al Seguro Social?
Conceptos fundamentales
01 02 03 04 05 06
MEDIBILIDAD Y VARIABILIDAD
En un conjunto de datos siempre se
espera variacin. Si se encuentra
poca variacin, o no se encuentra
variacin, podra suponerse que el
instrumento de evaluacin no est
calibrado con una unidad que sea lo
suficientemente pequea.
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
RECOPILACION DE DATOS
Por lo general es imposible estudiar toda
una poblacin (cada uno de los individuos
de un pas, todos los estudiantes
universitarios, cada paciente de un mdico,
etc.), los investigadores suelen apoyarse
en muestras para adquirir la informacin, o
los datos necesarios. Es importante
obtener buenos datos porque en ltima
instancia las inferencias efectuadas se
basan en los estadsticos obtenidos a
partir de los datos. Estas inferencias slo
pueden ser tan buenas como lo sean los
datos.
Conceptos fundamentales
01 02 03 04 05 06
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
01 02 03 04 05 06
PROCESO DE RECOLECCION DE DATOS
La obtencin de datos para el anlisis estadstico
es un proceso complicado que incluye los
siguientes pasos:
1. Definir los objetivos de la investigacin o del
experimento.
Ejemplos: comparar la eficacia de un nuevo
medicamento con la eficacia del medicamento
estndar; estimar el ingreso familiar promedio
en Mxico.
2. Definir la variable y la poblacin de inters.
Ejemplos: duracin del tiempo de recuperacin
de los pacientes que sufren alguna enfermedad
particular; estimar el ingreso total en las familias
de Mxico.
Conceptos fundamentales
01 02 03 04 05 06
3. Definir los esquemas para recolectar y medir los
datos.
Esto incluye el marco muestral, el procedimiento de
muestreo, el tamao de la muestra y el instrumento
de medicin (cuestionario, por telfono, etc.) de los
datos.
4. Recolectar la muestra. Seleccionar los sujetos a ser
muestreados y recolectar los datos.
5. Revisar el proceso de muestreo al terminar la
recoleccin.
A menudo ocurre que un analista se encuentra con
datos ya recolectados, tal vez, incluso,
recolectados para otros fines, lo cual imposibilita
determinar si los datos son buenos o no. Es
mucho mejor que usted recolecte los datos
utilizando tcnicas aprobadas.
Conceptos fundamentales
01 02 03 04 05 06
Los dos mtodos que por lo general se utilizan
para recabar datos son experimentos y estudios
observacionales. En un experimento, el
investigador controla o modifica el entorno y
observa el efecto sobre la variable bajo estudio.
A menudo leemos sobre resultados de
laboratorio obtenidos usando ratas blancas para
probar dosis diferentes de un nuevo
medicamento y analizar su efecto en la presin
arterial. Los tratamientos experimentales fueron
diseados especficamente para obtener los
datos necesarios para estudiar el efecto sobre la
variable. En un entorno observacional, el
investigador no modifica el entorno y no
controla el proceso en observacin.
Conceptos fundamentales
01 02 03 04 05 06
COMPARACION ENTRE
PROBABILIDAD Y ESTADISTICA
La probabilidad y la estadstica son
dos campos ajenos pero
relacionados de las matemticas. Se
ha dicho que la probabilidad es el
vehculo de la estadstica. Es decir,
que si no fuera por las leyes de la
probabilidad, la teora de la
estadstica no sera posible.
Conceptos fundamentales
01 02 03 04 05 06
Observemos estas dos cajas:
Probabilidad
5A, 5R, 5B
Conceptos fundamentales
Estadstica?
? ? ?
01 02 03 04 05 06
Observemos la diferencia:
PROBABILIDAD
ESTADISTICA
Pregunta sobre la
posibilidad de que ocurra
algo especfico, por ejemplo,
sacar una ficha azul, cuando
se conocen las posibilidades
(es decir, se conoce la
poblacin)
Conceptos fundamentales
01 02 03 04 05 06
Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
TABLA DE DATOS
14 a 15
16 a 17
18 a 19
20 o ms
99
142
Estadstica descriptiva
01 02 03 04 05 06
GRAFICO DE CIRCULO
EDAD DE LOS
ENCUESTADOS
2
6
14 a 15
99
16 a 17
18 a 19
20 o ms
142
Estadstica descriptiva
01 02 03 04 05 06
HISTOGRAMA
(GRAFICO DE BARRAS)
EDAD DE LOS
ENCUESTADOS
160
142
140
120
100
99
80
60
40
20
18 a 19
20 o ms
0
14 a 15
16 a 17
Estadstica descriptiva
01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)
frecuencia
Numerode Fronterasde
frecuencia acumulativ
grupo
grupo
a
frecuencia
acumulativa
relativa
35X<45
(2)
2/50
0,04
45X<55
(2+2)
4/50
0,08
55X<65
11
(7+4)
11/50
0,22
65X<75
13
24
(13+11)
24/50
0,48
75X<85
11
35
(11+24)
35/50
0,70
85X<95
11
46
(11+35)
46/50
0,92
95X<105
50
(4+46)
50/50
1,00
50
Estadstica descriptiva
01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)
20
40
Estadstica descriptiva
60
80
100
120
01 02 03 04 05 06
MEDIDAS DE TENDENCIA
CENTRAL
Son valores numricos que
localizan, en algn sentido, el
centro de un conjunto de datos.
Es frecuente que el trmino
promedio se asocie con todas
las medidas de tendencia
central.
Estadstica descriptiva
01 02 03 04 05 06
Media (Media aritmtica):
Es el promedio con el que probablemente estemos ms
familiarizados. La media muestral se representa por x
(lase x barra o media muestral). La media se
encuentra al sumar todos los valores de la variable x (esta
suma de valores se simboliza como x ) y dividir la suma
entre el nmero de estos valores , n (el tamao muestral).
Expresamos esto mediante frmula como
suma de todas las x
Media muestral: x barra = ---------------------------nmero de las x
x=
n
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO
Un conjunto de datos consta de cinco valores:
6, 3, 8, 6, y 4. Encuentre la media.
SOLUCION:
Con la frmula anterior, encontramos:
x =
6+ 3+8+ 6+ 4
27
=
=
= 5 .4
5
5
Estadstica descriptiva
01 02 03 04 05 06
Mediana:
Es el valor de los datos que ocupa la
posicin media cuando los datos estn
clasificados en orden de acuerdo con
su tamao. La mediana muestral se
representa por ~
x (lase x tilde o
mediana muestral).
Estadstica descriptiva
01 02 03 04 05 06
Procedimiento para determinar la mediana:
PASO 1: Clasifique los datos
PASO 2: Determine la profundidad de la mediana. La profundidad,
o posicin (nmero de posiciones desde cualquiera de los
extremos), se determina con la frmula
nmero + 1
Profundidad de mediana:
2
n +1
~
d (x ) =
2
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n IMPAR
Encuentre la mediana para el conjunto de datos
{6, 3, 8, 5, 3}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
3, 3, 5, 6 y 8
n +1 5 +1
PASO 2: Profundidad de la mediana: d ( ~
x) =
=
=3
(La 3. Posicin)
PASO 3: La mediana es el tercer nmero desde cualquier extremo
~
de los datos clasificados, es decir: x = 5
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n PAR
Encuentre la mediana para el conjunto de datos
{9, 6, 7, 9, 10, 8}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
6, 7, 8, 9, 9 Y 10
~ n +1 = 6 +1
PASO 2: Profundidad de la mediana: d ( x ) =
= 3.5
8+9
~
x=
= 8.5
2
Estadstica descriptiva
01 02 03 04 05 06
MEDIDAS DE DISPERSION
Una vez que se ha localizado el medio mediante
la aplicacin de las medidas de tendencia central,
nuestra bsqueda de informacin a partir de
conjuntos de datos se dirige ahora a las medidas
de dispersin. Las medidas de dispersin incluyen
el rango, varianza y desviacin estndar.
Estos valores numricos describen la cantidad de
dispersin o variabilidad que se encuentra entre los
datos: los datos agrupados de manera estrecha
tienen valores relativamente pequeos y aquellos
datos que estn ms dispersos tienen valores ms
grandes.
Estadstica descriptiva
01 02 03 04 05 06
Rango:
Es la diferencia de valor entre los datos de valor ms
alto, H, y los de valor ms bajo, L.
rango = valor alto valor bajo
rango = H L
Por ejemplo:
La muestra 3, 4, 5, 6, 8 tiene un rango de
H L = 8 3 = 5.
El rango de 5 nos dice que estos datos caen todos
ellos dentro de un intervalo de 5 unidades.
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Ejemplo:
Considere la muestra {6, 3, 8, 5, 3}, de la cual encontramos
su media:
x=
n
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
| x x |
x
01 02 03 04 05 06
| xx| 8
= = 1.6
Desviacin media absoluta =
n
Estadstica descriptiva
01 02 03 04 05 06
Varianza muestral:
La varianza muestral, s2, es la media del cuadrado de las
desviaciones, calculada usando n-1 como divisor:
suma de (cuadrado de desviaciones)
Varianza muestral: s2 = -----------------------------------------------------nmero 1
s = 4.5
2
s2 =
(
x
x
)
n 1
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO:
Para encontrar la varianza de la muestra 6, 3, 8, 5, 3 se calcula:
---------------------------------------------------------------------------------------------------------------------Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
2
Hallar x
Hallar
Hallar toda x Hallar ( x x )
Hallar s2
---------------------------------------------------------------------------------------------------------------------6
65= 1
(1)2 = 1
x
( x x )2
2
s =
x=
3
3 5 = -2
(-2)2 = 4
n 1
n
8
85= 3
(3)2 = 9
18
5
55= 0
(0)2 = 0
25
2
s
=
2
x
=
3
3 5 = -2
(-2) = 4
4
5
----------------------------------------2
x = 25
x =5
(x x) = 0 (x x)
= 18
s = 4.5
----------------------------------------------------------------------------------------------------------------------
Estadstica descriptiva
01 02 03 04 05 06
s = s2
Estadstica descriptiva
01 02 03 04 05 06
MEDIDAS DE POSICION
Las medidas de posicin se utilizan
para describir la posicin que un
dato especfico posee en relacin
con el resto de los datos cuando
estn en orden por categoras.
Cuartiles y percentiles son dos de
las medidas de posicin ms
populares.
Estadstica descriptiva
01 02 03 04 05 06
Cuartiles
Son valores de la variable que dividen los datos ordenados en
cuartos; cada conjunto de datos tiene tres cuartiles. El primer
cuqrtil, Q1, es un nmero tal que a lo sumo 25% de datos son
menores en valor que Q1, y a lo sumo 75% son mayores. El segundo
cuartil es la mediana. El tercer cuartil, Q3, es un nmero tal que a lo
sumo 75% de los datos son menores en valor que Q3 y a lo sumo
25% son mayores.
Datos clasificados, orden creciente
25%
25%
25%
Q1
Estadstica descriptiva
Q2
25%
Q3
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Percentiles
Son los valores de la variable que dividen un conjunto de datos clasificados
en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El
k-simo percentil Pk es un valor tal que a lo sumo k% de los datos son
menores en valor que Pk y a lo sumo (100 k)% de los datos son mayores.
Percentiles
Datos clasificados, orden creciente
1% 1% 1% 1% 1%
L P1 P2 P3 P4
1% 1% 1% 1%
K-simo percentil
Datos clasificados, orden creciente
a lo sumo (100 k) %
a lo sumo k%
Pk
Estadstica descriptiva
01 02 03 04 05 06
Notas:
1. El primer cuartil y el 25avo percentil, son lo
mismo, es decir, Q1 = P25 Tambin Q3 = P75.
2. La mediana, el segundo cuartil y el 50avo
percentil son todos lo mismo: Med = Q2 =
P50. Por tanto, cuando se nos pida hallar P50
o Q2, usamos el procedimiento para hallar la
mediana
Estadstica descriptiva
01 02 03 04 05 06
INTERPRETACION Y COMPRENSION DE LA
DESVIACION ESTANDAR
Las desviacin estndar es una medida de
variacin (dispersin) en los datos. Se ha definido
como un valor calculado con el uso de frmulas.
An as, podemos preguntarnos qu es realmente
y cmo se relaciona con los datos. Es una clase de
medidor por el que podemos comparar la
variabilidad de un conjunto de datos con la de otro.
Esta medida particular puede comprenderse
mejor al examinar dos enunciados que nos dicen
cmo se relaciona la desviacin estndar con los
datos: la regla emprica y el teorema de
Chebyshev.
Estadstica descriptiva
01 02 03 04 05 06
Regla emprica
Si una variable est normalmente distribuida, entonces :
1. Dentro de una desviacin estndar de la media habr
aproximadamente 68% de los datos
2. Dentro de dos desviaciones estndar de la media, habr
aproximadamente 95% de los datos; y
3. Dentro de tres desviaciones estndar de la media, habr
aproximadamente 99.7% de los datos
Esta regla aplica de manera especfica a una distribucin
normal [en forma de campana], pero con frecuencia se
aplica como gua interpretativa a cualquier distribucin
agrupada.
Estadstica descriptiva
01 02 03 04 05 06
99.7%
95%
68%
x 3s
x 2s
Estadstica descriptiva
xs
x+s
x + 2 s x + 3s
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
34% 34%
13.5%
13.5%
2.5%
Calificaciones z
2.5%
x 3s
x 2s
xs
x+s
x + 2s
x + 3s
-3
-2
-1
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev
La proporcin de cualquier distribucin que se
encuentre dentro de k desviaciones estndar de la
media es al menos
1
1 2
k
Donde k es cualquier nmero positivo mayor a 1.
Este teorema aplica a todas las distribuciones de
datos.
Estadstica descriptiva
01 02 03 04 05 06
1 3
1
1
=
1
=
1
= = 0.75
2
2
k
2
4 4
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev k=2
s
Al menos 3/4
x 2s
Estadstica descriptiva
x + 2s
01 02 03 04 05 06
1
1
1 8
1 2 = 1 2 = 1 = = 0.89
k
3
9 9
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev k=3
s
Al menos 8/9
x 3s
Estadstica descriptiva
x + 3s
01 02 03 04 05 06
Conceptos fundamentales
Estadstica descriptiva
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis sobre proporciones
Probabilidad
01 02 03 04 05 06
Probabilidad
01 02 03 04 05 06
En lgebra:
Probabilidad
n(A)
P(A) = -------n
01 02 03 04 05 06
Probabilidad
01 02 03 04 05 06
Probabilidad
01 02 03 04 05 06
n(A)
En lgebra: P(A) = ------n(S)
Probabilidad
01 02 03 04 05 06
LEYES DE PROBABILIDAD
Con frecuencia, uno desea saber la
probabilidad de un evento compuesto
y los nicos datos de que se dispone
son las probabilidades de los eventos
simples relacionados. (Los eventos
compuestos son combinaciones de
ms de un evento simple). A
continuacin se resume la relacin
entre esas probabilidades.
Probabilidad
01 02 03 04 05 06
Para hallar la probabilidad de no A
El concepto de eventos complementarios es fundamental para hallar la
probabilidad de no A. Eventos complementarios: el complemento de A,
es el conjunto de todos los puntos muestrales del espacio muestral que
no pertenecen al evento A.
Nota. El complemento del evento A se denota por A (lase A
complemento.
Unos pocos ejemplos de eventos complementarios son:
-El complemento del evento xito es fracaso
-El complemento de votante seleccionado es priista es votante
seleccionado no es priista
-El complemento de no caras de 10 tiros de una moneda es al menos
una cara.
Probabilidad
01 02 03 04 05 06
Regla de complemento:
En palabras: probabilidad de A complemento = uno probabilidad de A
En lgebra:
A = 1 P( A)
Nota:
Todo evento tiene un evento complementario Las probabilidades
complementarias son muy tiles cuando la pregunta pide la probabilidad
de al menos uno. Generalmente, esto representa una combinacin de
varios eventos, pero el evento complementario ninguno es un solo
resultado. Es ms fcil despejar el evento complementario y obtener la
respuesta con el uso de la frmula.
Probabilidad
01 02 03 04 05 06
Probabilidad
01 02 03 04 05 06
En lgebra:
Probabilidad