Professional Documents
Culture Documents
Lasvariablespuedenserdedostipos:
Variablescualitativasoatributos:nosepuedenmedirnumricamente
(porejemplo:nacionalidad,colordelapiel,sexo).
Variablescuantitativas:tienenvalornumrico(edad,preciodeun
producto,ingresosanuales).
LAS VARIABLES TAMBIN SE PUEDEN CLASIFICAR EN
Variables unidimensionales: slo recogen informacin sobre una caracterstica (por
ejemplo: edad de los alumnos de una clase).
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por
ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, nunca
podr ser 3,45).
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos el
precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha
ciudad.
Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm):
AL ALUMNO
Sipresentamosestainformacinestructuradaobtendramosla
siguientetabladefrecuencia:
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy
pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera
obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos
de sntesis, veamos un ejemplo
Supongamos que medimos la estatura de los habitantes de una vivienda y obtenemos los siguientes resultados (cm):
Las medidas de tendencia nos facilitan informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos.
Lasmedidasdetendenciasondedostipos:
a) Medidas de tendencia central: informan sobre los valores medios de la serie de datos.
Media aritmtica
Mediana:Eselvalordelaseriededatosquesesitajustamenteenelcentrodelamuestra(un
50%devaloressoninferioresyotro50%sonsuperiores).
Moda:Eselvalorquemsserepiteenlamuestra.
Ejemplo: Vamos a utilizar la tabla de distribucin de frecuencias con los datos de la estatura de los alumnos que vimos antes
Media aritmtica =?
Mediana = ?
Moda: = ?
HISTOGRAMAS DE FRECUENCIA
Cuartiles:
Son3valoresquedistribuyenlaseriededatos,ordenadadeformacrecienteodecreciente,encuatro
tramosiguales,enlosquecadaunodeellosconcentrael25%delosresultados.
Deciles:
Son9valoresquedistribuyenlaseriededatos,ordenadadeformacrecienteodecreciente,endieztramos
iguales,enlosquecadaunodeellosconcentrael10%delosresultados.
Percentiles:
Son99valoresquedistribuyenlaseriededatos,ordenadadeformacrecienteodecreciente,encientramos
iguales,enlosquecadaunodeellosconcentrael1%delosresultados
Ejemplo:
Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos vista
antes.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes
Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor
ms bajo
DESVIACIN MEDIA
Se define como la media aritmtica en valor absoluto de todas las diferencias entre cada valor de la variable y su
media aritmtica.
Cuando los datos no estn agrupados, la frmula matemtica que expresa dicha definicin es:
En caso de tener los datos agrupados en una tabla de frecuencias, la frmula ser:
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las
diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada
valor. El sumatorio obtenido se divide por el tamao de la muestra
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores
de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.
Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la media.
Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin 2) y vamos a
calcular sus medidas de dispersin.
2.-Varianza:recordemosquelamediadeestamuestraes1,253.Luego,aplicamosla
frmula:
4.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la
media de la muestra.
El inters del coeficiente de variacin es que al ser un porcentaje permite comparar el nivel de
dispersin de dos muestras. Esto no ocurre con la desviacin tpica, ya que viene expresada en las
mismasunidasquelosdatosdelaserie.
Porejemplo,paracompararelniveldedispersindeunaseriededatosdelaalturadelosalumnosde
unaclaseyotraserieconelpesodedichosalumnos,nosepuedeutilizarlasdesviacionestpicas(una
viene vienes expresada en cm y la otra en kg). En cambio,sus coeficientes de variacin son ambos
porcentajes,porloquessepuedencomparar.
SESGO
Curtosis
El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores
alrededor de la zona central de la distribucin.
Ejemplos:lanzamosunamonedaalaire:elresultado
puedesercaraosello,peronosabemosdeantemano
cualdeellosvaasalir.
Sucesoelemental:hacereferenciaacadaunadelasposibles
solucionesquesepuedenpresentar.
Ejemplo:allanzarunamonedaalaire,lossucesoselementalessonlacara
yelsello.Allanzarundado,lossucesoselementalessonel1,el2,..,hasta
el6.
Sucesocompuesto:esunsubconjuntodesucesoselementales.
Ejemplo: lanzamos un dado y queremos que salga un nmero par. El
suceso "numero par" es un suceso compuesto, integrado por 3 sucesos
elementales:el2,el4yel6
Espacio Muestral: es el conjunto de todos los posibles
sucesos elementales. Cada experimento aleatorio tiene definido su
espacio muestral (es decir, un conjunto con todas las soluciones
posibles).
a) Un suceso puede estar contenido en otro: las posibles soluciones del primer suceso
tambin lo son del segundo, pero este segundo suceso tiene adems otras soluciones
suyas propias.
El valor cero corresponde al suceso imposible: lanzamos un dado al aire y la probabilidad de que salga el
nmero 7 es cero (al menos, si es un dado certificado por la OMD, "Organizacin Mundial de Dados").
El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de que salga
cualquier nmero del 1 al 6 es igual a uno (100%).
El resto de sucesos tendr probabilidades entre cero y uno: que ser tanto mayor cuanto ms probable
sea que dicho suceso tenga lugar.
Cmo se mide la probabilidad?
Eventos independientes/dependientes
Dos eventos son independientes si el resultado del segundo evento no es
afectado por el resultado del primer evento. Si A y B son eventos
independientes, la probabilidad de que ambos eventos ocurran es el
producto de las probabilidades de los eventos individuales.
Ejemplo
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero
no los dos a la vez, esto quiere decir que estos eventos son
excluyentes.
Dos o ms eventos son no excluyentes, cuando es posible que
ocurran ambos. Esto no indica que necesariamente deban ocurrir estos
eventos en forma simultnea.
Ejemplo
Si consideramos en un juego de domino sacar al menos un blanco y un
seis, estos eventos son no excluyentes porque puede ocurrir que salga el
seis o el blanco
Reglas de la Adicin
La Regla de la Adicin expresa que: la probabilidad
deocurrenciade al menos dos sucesos A y B es igual a:
Siendo:
P(A) = probabilidad deocurrenciadel evento A
P(B) = probabilidad deocurrenciadel evento B
P(A y B) = probabilidad deocurrenciasimultanea de los
eventos A y B
Probabilidad Condicional
Por otro lado
Ejemplo
Ejemplo
Teorema de Probabilidad total o regla de eliminacin
La esperanza matemtica o valor esperado de una variable
aleatoria discreta es la suma del producto de la probabilidad de
cada suceso por el valor de dicho suceso.
E = {(c,c);(c,x);(x,c);(x,x)}
P(1c) = 2/4
P(2c) = 1/4
P(2s) = 1/4
E(x)= 1 2/4 + 2 1/4 - 5 1/4 = 1/4. Es desfavorable
Para aplicar la Regla de Laplace, el clculo de los sucesos
favorables y de los sucesos posibles a veces no plantea ningn
problema, ya que son un nmero reducido y se pueden calcular
con facilidad:
Por ejemplo: Probabilidad de que al lanzar un dado salga el
nmero 2. Tan slo hay un caso favorable, mientras que los
casos posibles son seis.
(1,2), (1,3) y (2,3) (1,2), (1,3), (2,1), (2,3), (3,1) y (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3,
(3,2) 1), (3, 1, 2) y (3, 2, 1)
(1,2) y (2,1) (1,2) y (2,1)
se consideran idnticas se consideran distintos.
No importa el orden Importa el orden Se toman todos los elementos
Cmo se calculan?
Combinaciones Variaciones Permutaciones
"Cm,n" representa las "Vm,n" representa las variaciones "Pm" representa las
combinaciones de "m" elementos, de "m" elementos, formando permutaciones de "m" elementos,
formando subgrupos de "n" subgrupos de "n" elementos. tomando todos los elementos.
elementos.
Ejemplos
C10,4 son las combinaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:
V10,4 son las variaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:
P10 son las permutaciones de 10 elementos:
Veamos este caso: tenemos bolas de 6 colores diferentes y queremos formar subgrupos
en los que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo tuvieran el
mismo color. En este caso no podramos utilizar las frmulas que vimos en la leccin
anterior.
Combinaciones Variaciones Permutaciones
conrepeticin conrepeticin conrepeticin
V'10,4sonlasvariacionesde10elementosconrepeticin,agrupndolosensubgruposde4elementos:
Calcularlaspermutacionesde10elementos,enlosqueunodeellosserepiteen2ocasionesyotrose
repiteen3ocasiones:
Distribucin de probabilidad
Es una distribucin terica de frecuencias que describe cmo se espera que varen
los resultados de un experimento. Existen diferentes tipos de modelos que
permiten describir el comportamiento de fenmenos estadsticos que permiten
hacer inferencias y tomar decisiones en condiciones de incertidumbre