You are on page 1of 48

UNIVERSIDAD MULTITCNICA PROFESIONAL

LICENCIATURA EN PEDAGOGIA

ESTADSTICA EDUCATIVA
CP y MA HUGO LEONEL CASTRO ROCA

COLIMA, COL. FEBRERO DEL 2013


Estadstica Educativa

INDICE

I.- Conceptos Bsicos


Poblacin 1
Muestra 2
Muestreo 2
Tipos de Muestreo 3
Variables y Atributos 3
Observacin Directa 4
Observacin Indirecta 4
Observacin Continua 4
Observacin Perodica 5
Observacin Circunstancial 5
Observacin Exhaustiva 5
Observacin Parcial 5
Observacin Mixta 5
Censo 5
Encuesta 6
Estadstica Descriptiva 6
Estadstica Inductiva 6
Medicin 7
II.- Niveles O Escalas De Medicin
Escala Nominal 8
Escala Ordinal 8
Escalas de Intervalos 9
Escala de Coeficientes 9
Las Variables y su Medicin 9
Datos Estadsticos 10
III.- Estadstica Descriptiva e Inferencia Estadstica
Estadstica Descriptiva 12
Inferencia Estadstica 12
Distribucin de frecuencias 12
Tipos de Variables 12
Escalas de Medicin 13
Frecuencias 15
Representaciones Grficas de la Distribucin de
16
Frecuencias
Histograma de Frecuencias 17
Polgono de Frecuencias 18
Ojivas 19
Casos Prcticos 20
IV.- Medidas de Tendencia Central
Desviacin Estndar 22
La Moda 24
La Mediana 25
La Media 26
Comparaciones 28
Formas de Distribucin (distribucin normal) 29
Intervalos de Confianza 32
Casos Prcticos 35
V.- Muestras y Poblaciones
Muestreo 38
Mtodos de Muestreo 39
El Tamao de la Muestra 41
Distribucin Muestral de Medias 42
Intervalos de Confianza 42
Casos Prcticos 43
I.-CONCEPTOS BSICOS

La estadstica es comnmente considerada como una coleccin de hechos numricos


expresados en trminos de una relacin sumisa, y que han sido recopilados a partir de
otros datos numricos.

Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980, en Nuez,
Rafael, 2000) definen la estadstica como un valor resumido, calculado, como base en
una muestra de observaciones que generalmente, aunque no por necesidad, se considera
como una estimacin de parmetro de determinada poblacin; es decir, una funcin de
valores de muestra.

"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos
de masa o colectivo, cuya mediacin requiere una sin nmero de observaciones de otros
fenmenos ms simples llamados individuales o particulares". (Gini, 1953.)

Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para
recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y
tomar decisiones razonables basadas en tal anlisis.

"La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de


los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y
comparacin de los fenmenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la


estadstica, debido al gran campo de aplicacin que posee.

Poblacin
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce
como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u
objetos que presentan caractersticas comunes.

"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una poblacin es un conjunto de elementos que presentan una caracterstica comn".


Cadenas (1974).

Ejemplo:

Los miembros del Colegio de Ingenieros del Estado Cojedes.

El tamao que tiene una poblacin es un factor de suma importancia en el proceso de


investigacin estadstica, y este tamao vienen dado por el nmero de elementos que
constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o
infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se
puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos
los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado

1
nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la
Universidad Nacional Experimental Simn Rodrguez.

Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos
se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para
solucionar este inconveniente se utiliza una muestra estadstica.

Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre


todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o
universo, se examina una pequea parte del grupo llamada muestra.

Muestra
"Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla".
Murria R. Spiegel (1991).

"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos".


Levin & Rubin (1996).

"Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones
que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia",
Cadenas (1974).

Ejemplo;

El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes.

El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta


menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin
entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos
casos, el muestreo puede elevar el nivel de calidad.

Una muestra representativa contiene las caractersticas relevantes de la poblacin en las


mismas proporciones que estn incluidas en tal poblacin.

Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin
para hacer referencias sobre la poblacin que est representada por la muestra. En
consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y
una muestra es una fraccin o segmento de ese todo.

Muestreo
Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una
poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de
poblacin.

Este se realiza una vez que se ha establecido un marco muestral representativo de la


poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos
diseos de la muestra.

2
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de una
muestra a otra.

Ejemplo;

Consideremos como una poblacin a los estudiantes de educacin del Ncleo San
Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha
poblacin; Religin de los estudiantes, Sexo.

Tipos de muestreo
Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio
o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos
de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra
seleccionada por muestreo de juicio se basa en la experiencia de alguien con la
poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa
para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio
evitan los anlisis estadsticos necesarios para hacer muestras de probabilidad.

Variables y Atributos
Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que
pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin.
Como por ejemplo, la estatura, el peso, el salario, la edad, etc.

Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Hx, que
puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio
de la variable. Si la variable puede tomar solamente un valor, se llama constante."

Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como
estos en general no suelen representarse con la misma intensidad, es obvio que las
variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que
toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una
variable.

Los atributos tambin llamados caracteres cualitativos, son aquellos que no son
susceptibles de medicin, es decir que no se pueden expresar mediante un nmero.

IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas


caractersticas que pueden presentarse en individuos que constituyen un conjunto.

La forma de expresar los atributos es mediante palabras, por ejemplo; profesin, estado
civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma
forma en todos los elementos. Estas distintas formas en que se presentan los atributos
reciben el nombre de "modalidades".

3
Ejemplo;

El estado civil de cada uno de los estudiantes del curso de estadsticas I, no se presenta
en la misma modalidad en todos.

Formas de Observar la Poblacin:

Atendiendo a la fuente se clasifican en directa o indirecta

Observacin directa
Es aquella donde se tienen un contacto directo con los elementos o caracteres en los
cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se
consideran datos estadsticos originales. Para Ernesto Rivas Gonzlez (1997)
"Investigacin directa, es aquella en que el investigador observa directamente los casos
o individuos en los cuales se produce el fenmeno, entrando en contacto con ellos; sus
resultados se consideran datos estadsticos originales, por esto se llama tambin a esta
investigacin primaria".

Ejemplo; el seguimiento de la poblacin agrcola por ao, llevado en una determinada


granja.

Observacin Indirecta
Es aquella donde la persona que investiga hace uso de datos estadsticos ya conocidos
en una investigacin anterior, o de datos observados por un tercero (persona o entidad).
Con el fin de deducir otros hechos o fenmenos.

Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja


avcola, en sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a
tal fin recurrira a las observaciones que posee la oficina administrativa de la granja
durante estos cinco aos, o dirigirse a la oficina de estadstica, llevada en el ministerio
de produccin y comercio (M.P.C) de la localidad donde est registrada dicha granja. Es
de notar que el investigador se vale de observaciones realizadas por terceros.

Atendiendo a la periodicidad, puede ser continua, peridica o


circunstancial

Observacin continua
Como su nombre lo indica es aquella que se lleva acabo de un modo permanente.

Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras


operaciones que se van registrando a medida que van producindose.

4
Observacin peridica

Es aqulla que se lleva a cabo a travs de perodos de tiempo constantes. Estos perodos
de tiempos pueden ser semanas, trimestres, semestres, aos, etc. Lo que debemos
destacar es que los perodos de tiempo tomados como unidad deben tomarse constantes
en lo posible.

Ejemplo; el registro llevado por las Oficinas de Control de Estudios de la UNESR, en


cuanto a la inscripcin de los estudiantes por semestre.

Observacin circunstancial
Es aquella que se efecta en forma ocasional o espordica, esta observacin hecha ms
por una necesidad momentnea, que de carcter regular o permanente.

Ejemplo; la obtencin de nmeros de aulas utilizadas y no utilizadas en los colegios


pertenecientes al municipio San Carlos del Estado Cojedes.

Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta

Observacin Exhaustiva
Cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin
se habla de una observacin exhaustiva.

Observacin Parcial
Dados que las poblaciones en general son grandes, la observacin de todos sus
elementos se ve imposibilitada. La solucin para superar este inconveniente es observar
una parte de esta poblacin.

Observacin Mixta
En este tipo de observacin se combinan adecuadamente la observacin exhaustiva con
la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal
manera que los caracteres que se consideran bsicos se observan exhaustivamente y los
otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se
observa parcialmente.

Censo
Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los
caracteres componentes de una poblacin.

Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada
persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una
numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o
medir todos los elementos de la poblacin.

5
Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se
utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho
tiempo por lo que resulta demasiado costoso.

Encuesta
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales.

El diseo de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que


si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms
directo y simple es preguntrselo directamente a ellas. (Cadenas, 1974).

Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere


averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un
gran nmero de personas".

Estadstica Descriptiva
Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de
datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho
conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas.
No obstante puede no solo referirse a la observacin de todos los elementos de una
poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de
una muestra (observacin parcial).

En relacin a la estadstica descriptiva, Ernesto Rivas Gonzlez dice; "Para el estudio de


estas muestras, la estadstica descriptiva nos provee de todos sus medidas; medidas que
cuando quieran ser aplicadas al universo total, no tendrn la misma exactitud que tienen
para la muestra, es decir al estimarse para el universo vendr dada con cierto margen de
error; esto significa que el valor de la medida calculada para la muestra, en el oscilar
dentro de cierto lmite de confianza, que casi siempre es de un 95 a 99% de los casos.

Estadstica Inductiva:
Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin,
con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de
donde procede, por lo que recibe tambin el nombre de Inferencia estadstica.

Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que


sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin),
seleccionando un grupo menor de ellos (muestra).

El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer


clases numerosas de objetos, personas o eventos a partir de otras relativamente
pequeas compuestas por los mismos elementos.

6
En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996) citan los
siguientes ejemplos para ayudar a entender la diferencia entre las dos.

Supngase que un profesor calcula la calificacin promedio de un grupo de historia.


Como la estadstica describe el desempeo del grupo pero no hace ninguna
generalizacin acerca de los diferentes grupos, podemos decir que el profesor est
utilizando estadstica descriptiva. Graficas, tablas y diagramas que muestran los datos
de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva.

Supngase ahora que el profesor de historia decide utilizar el promedio de calificaciones


obtenidas por uno de sus grupos para estimar la calificacin promedio de las diez
unidades del mismo curso de historia. El proceso de estimacin de tal promedio sera un
problema concerniente a la estadstica inferencial.

Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica
generalizaciones y afirmaciones con respecto a la probabilidad de su validez.

Medicin
Existen diversas definiciones del trmino "medicin", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificacin y el proceso mismo de la construccin de una escala o instrumento de
medicin.

En general, se entiende por medicin la asignacin de nmeros a elementos u objetos


para representar o cuantificar una propiedad. El problema bsico est dado por la
asignacin un numeral que represente la magnitud de la caracterstica que queremos
medir y que dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas
reglas. Por medio de la medicin, los atributos de nuestras percepciones se transforman
en entidades conocidas y manejables llamadas "nmeros". Es evidente que el mundo
resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que
le servira la fsico saber que el hierro tiene una alta temperatura de fusin.

7
II Niveles o Escalas de mediciones

Escala Nominal
La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste
en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las
diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que
puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento
pueda pertenecer a una y solo una de estas categoras.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se
asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones,
se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como
"medidas nominales".

Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR


Ncleo San Carlos de acuerdos a la carrera que cursan.

Carrera Nmero asignada a la categora


Educacin 1
Administracin 2

Se ha de tener presente que los nmeros asignados a cada categora sirven nica y
exclusivamente para identificar la categora y no poseen propiedades cuantitativas.

Escala Ordinal
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un
objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la
propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que,
si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un
mayor grado de atributo que B.
La asignacin de nmeros a las distintas categoras no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre stas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de
poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin,
como por ejemplo la mediana.

Ejemplo:
Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada,
estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir
que al primeo en llegar le asignamos el n 1, al siguiente el n 2 y as sucesivamente, de
esta forma, cada nmero representar una categora en general, con un solo elemento y
se puede establecer relaciones entre ellas, ya que los nmeros asignados guardan la
misma relacin que el orden de llegada a la consulta.

8
Escalas de intervalos iguales
La escala de intervalos iguales, est caracterizada por una unidad de medida comn y
constante que asigna un nmero igual al nmero de unidades equivalentes a la de la
magnitud que posea el elemento observado. Es importante destacar que el punto cero en
las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia
de la magnitud que estamos midiendo.

Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que
la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la
magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a
dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele
todas las medidas estadsticas a excepcin del coeficiente de variacin.

Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001.

Escala de coeficientes o Razones


El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las
escalas de intervalos iguales nicamente por poseer un punto cero propio como origen;
es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos
midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de
medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems,
siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene
dos, tres o cuatro veces la magnitud de la propiedad presente en B.

Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay familias que
no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas
que tienen 3 hijos.

Las variables y su medicin


Una variable es un smbolo, tal como X, Y, H, x B, que pueden tomar un conjunto
prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991)
"una variable que puede tomar cualquier valor entre dos valores dados se dice que es
una variable continua en caso contrario diremos que la variable es discreta".

Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones
son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar
numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia
sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas.

Las variables continuas se caracterizan por el hecho de que para todo para de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo
empleado para realizar un trabajo, etc.)

9
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de
dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.

Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de
valores separados y no continuos; son aquellas que solo toman un determinado nmeros
de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por
ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo
tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1,5 estudiantes.

Datos Estadsticos
Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas
en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar.
Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al
conocimiento de un hecho o para reducir las consecuencias de este.

Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy
difcil en general, obtener conclusiones de los datos presentados de esta manera. Para
poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis,
estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos
sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la
recopilacin de los datos.

Ejemplo:
Si se quiere conocer las caractersticas de los estudiantes del Ncleo San Carlos de la
UNESR, que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de
la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia,
edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la
clase de datos que debe ser obtenido.

Clasificacin de los datos


Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos,
cronolgicos y geogrficos.

Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de
clase y no de cantidad.

Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su
estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.

Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus
notas, observamos que los valores (nota) representan diferentes magnitudes.

10
Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o
perodos de tiempo, los datos son reconocidos como cronolgicos.

Ejemplo:
Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la
UNESR en los diferentes semestres.

Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen
que son datos geogrficos.

Ejemplo
El nmero de estudiantes de educacin superior en las distintas regiones del pas.

Fuentes de datos Estadsticos:


Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a
travs de fuentes primarias y fuentes secundarias.

Fuentes de datos primarias: es la persona o institucin que ha recolectado


directamente los datos.

Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades
que no han recolectado directamente la informacin.

Las fuentes primarias ms confiables, son las efectuadas por oficinas gubernamentales
encargadas de tal fin.

En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima instancia


cuando estas no existan, usar estadsticas de fuentes secundarias. Con este ltimo tipo
no debemos pasar por alto que la calidad de las conclusiones estadsticas depende en
grado sumo de la exactitud de los datos que se recaben. De anda servira usar tcnicas
estadsticas precisas y refinadas para llegar a conclusiones valederas, si estas tcnicas no
son aplicadas a datos adecuados o confiables.

Cuando un investigador quiere obtener datos estadsticos relativo a un estudio que desea
efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O
recopilar los datos por s mismo. La posibilidad mencionada en ltimo trmino podr
deberse bien a la inexistencia de los datos o bien a que esto no se encuentran
discriminados en la forma requerida.

Ejemplo:
Si un investigador quiere conocer el nmero de alumnos repitientes en educacin media,
clasificados por ciclos, para los ltimos diez aos, el investigador puede usar una fuente
primaria, tal como la memoria y cuenta el Ministerio de Educacin cada ao.

11
III Estadstica descriptiva e inferencia estadstica.

Estadstica descriptiva

Es un mtodo utilizado para describir las caractersticas de un conjunto de datos.


Algunos ejemplos podran ser los diversos tipos de tablas, grficas, promedios y
medidas de dispersin (variacin).

Como su nombre lo indica es el estudio, resumen y presentacin no analtica de la


informacin numrica. (Por lo anterior no incluye el anlisis de datos)

Inferencia Estadstica
El entrenador del equipo de bisbol al que nos referamos, necesita an ms
informacin, puesto que quisiera conocer la probabilidad de que un determinado
jugador bateara de hit o se robara una base .Desde luego, no slo necesita conocer
lo anterior en promedio sino que quisiera obtener esta informacin segn los equipos
contrarios y los jugadores que stos alinean. Estos ejemplos de las necesidades del
entrenador muestran ejemplos de la Estadstica Analtica .un concepto que determina
la observacin minuciosa y la recoleccin de datos as como en anlisis, la planeacin y
la toma de decisiones subsecuentes.

Aunque una coleccin o un conjunto de datos numricos y las estadsticas descriptivas


utilizadas para describirlos se revelan como las caracterizaciones ms conocidas de la
Estadstica, cuatro unidades del libro, se refieren a la llamada Estadstica Analtica
usando inferencia estadstica, (estoa es a partir de una parte de la poblacin se generan
caractersticas que representan a toda esta) y su fundamento, la probabilidad.

Distribucin De Frecuencias
Distribucin de frecuencias es como se denomina en estadstica a la agrupacin de
datos en categoras mutuamente excluyentes que indican el nmero de observaciones en
cada categora. Esto significa una de las cosas ms importantes de la matemtica, su
estadstica con la agrupacin de datos. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase.

Es decir, Luego que producto de la observacin estadstica se captaron los datos y


atributos del fenmeno-objeto de estudio, se hace necesario proceder a tabular esta
informacin con el objetivo de conocer estadsticamente el fenmeno. A este proceso de
tabulacin de la informacin se la llama distribucin de frecuencias, y lo definiremos
como un mtodo para organizar y resumir datos en una tabla estadstica.

Tipos de variables
Los tipos de variables fundamentales, por lo menos para este tema, sern los siguientes:

Variables Cuantitativas o Cardinales: susceptibles de medicin cuantitativa; o sea


son las que se describen por medio de nmeros y las que a su vez comprenden:

12
Variable Cuantitativa Discretas: son aquellas cuyo conjunto de valores es a lo sumo
numerable. Sus valores pueden representarse siempre por X1, X2, , Xn.; y slo se
pueden asociar a un nmero entero, es decir, aquellas que por su naturaleza no admiten
un fraccionamiento de la unidad
Ejemplos:
Nmero de hijos en el hogar, Pginas de un libro

Variable Cuantitativa Continua: son aquellas que pueden tomar todos los valores de
un intervalo de nmeros reales, o sea que no se pueden expresar mediante un nmero
entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualquier
la variable puede tomar cualquier valor intermedio.

Ejemplos: variable temperatura en grados Celsius (escala de intervalos), variable


longitud en cm. (escala de razn), variable peso, variable tiempo

Variables Cualitativas (Atributos) u Ordinales: susceptibles de ordenacin, pero no


de medicin cuantitativa, reflejan generalmente los atributos del fenmeno. Los
atributos son aquellos caracteres que para su definicin precisan de palabras, es decir,
no le podemos asignar un nmero, y a su vez las podemos clasificar en:

Ordenables: aquellas que sugieren una ordenacin, por ejemplo la graduacin militar,
el nivel de estudios, etc.

No Ordenables: aquellas que slo admiten un ordenamiento alfabtico, pero no


establece orden por su naturaleza,, por ejemplo el color del cabello, sexo, estado civil,
etc.

Escalas de medicin
Es una escala en que se establece un nmero determinado de clases o categoras de tal
modo que cada elemento de la poblacin pertenece a una y slo una clase.
Matemticamente se dice que se ha establecido una relacin de equivalencia entre los
elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La
nica operacin matemtica que se puede realizar con las clases de cualquier escala
nominal es determinar las cantidades de elementos que les corresponden determinar sus
frecuencias.

Por ejemplo:
Sexo: las clases son masculinas o femeninas.
Especialidad: las diferentes especialidades (carreras) del CRUSAM.
Nmero de cedula de identidad personal.

Temperatura de una persona: sanguneo, flemtico, melanclico, colrico.


Nmero de placa de automviles del pas.

Escala Nominal

Es decir, es una escala en que se establece un nmero determinado de clases o


categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una
clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre

13
los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica.
La nica operacin matemtica que se puede realizar con las clases de cualquier escala
nominal es determinar las cantidades de elementos que les corresponden determinar sus
frecuencias.

Por ejemplo:
Sexo: las clases son masculinas o femeninas.
Especialidad: las diferentes especialidades (carreras) del CRUSAM.
Nmero de cedula de identidad personal.
Temperatura de una persona: sanguneo, flemtico, melanclico, colrico.
Nmero de placa de automviles del pas.

Escala Ordinal

Corresponde a la Situacin 2. Es una escala nominal entre cuyas clases est definido un
orden, de modo que cualquiera que sean dos de ellas, una ser mayor o superior, en
algn sentido, que la otra.

Por ejemplo:
Evaluaciones en un examen: 5, 4, 3 y 2.

Grado de satisfaccin de una necesidad: alto, medio, bajo

Conocimiento de un idioma: excelente, bien, regular, mal

Escala de Intervalos

Corresponde a la situacin 3 y no es ms que una escala ordinal con una distancia, una
unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se
pueden saber cuan distante est uno del otro. La unidad de medida es arbitraria, pero
comn y el punto de inicio (cero) es tambin arbitrario.

Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adicin y
sustraccin, pero no necesariamente la multiplicacin y divisin dentro de la escala.

Por ejemplo:
La temperatura del aire. (Caluroso, fresco, agradable, etc.)

Escala de Razones

Corresponde a la situacin 4 y es una escala de intervalos donde existe un cero absoluto


que marca la ausencia total del atributo en estudio. La proporcin entre los atributos de
dos individuos cualesquiera es independiente de la escala de medida utilizada. En ella la
razn entre dos clases (puntajes) cualesquiera permanece invariable ante toda la
transformacin de la escala de razn, o sea ante toda transformacin del tipo y=(x).
De aqu que siempre el cero de la escala transformada coincide con el cero de la escala
original.

En las escalas de razones es posible realizar todas las operaciones aritmticas con los
puntajes.

14
Por ejemplo:
Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas.

Peso de los alumnos: (en libras o kilogramos)

El tiempo invertido en una prueba de velocidad en educacin fsica (en minutos o


segundos).

Frecuencias
Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y
categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que
pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente
con las frecuencias de clases se denomina distribucin de frecuencias

El caso que se describe a continuacin, variables discretas se denomina distribucin por


conteo de valores individuales. Supongamos que un determinado colectivo,
representado por la variable estadstica Xi, que para mayor sencillez consideraremos
como unidimensional; sean los datos de esta variable (representativo cada uno de ellos
de un suceso) X1, X2, , Xn (supuesto que sean n los valores de la variable
considerada.)

Definiremos como frecuencia de un dato el nmero de veces que este aparece en el


colectivo; consecuentemente, si una variable estadstica toma r valores, cada uno de los
cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de
datos representado por la variable seran N, siendo N la suma de las respectivas
frecuencias de cada dato (N=Xi).

Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada
dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La
frecuencia absoluta nos habla del nmero de veces que un dato aparece en un colectivo,
ms ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la
importancia de este dato. Para obtener una idea de la importancia que un dato posee en
el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el
concepto frecuencia relativa, que se definir como: el coeficiente entre la frecuencia
absoluta del dato considerado y la frecuencia total (fr=fi/Xi).

Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:

Frecuencias absolutas: es el nmero de veces que aparece en la muestra dicho valor de


la variable y se representa por fi.

Frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la


muestra. La denotaremos por fri.

Frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que
tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa
Ordenables. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo

15
representaremos por fa, se puede acumular, en la tabla estadstica) en orden ascendente
(fa) o descendente (fa).

Frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el


cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra
(N) y la denotaremos por

Elementos fundamentales para elaborar una distribucin de frecuencia:

1) RANGO.

Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y
el nmero menor de los datos.
R = N_max - N_min
Ejemplo.
Dados los nmeros: 5, 10, 12, 8, 13, 9, 15
R= 15- 5

2) AMPLITUD TOTAL.

Simplemente se obtiene sumndole 1 al rango.


AT = (R+1)

3) LAS CLASES.

Estn formadas por dos extremos. El menor se llama lmite inferior el mayor se llama
lmite superior. Hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)

4) EL NMERO DE CLASES.

Se determina a travs de la formula de stuger, la cual es valida cuando el No de


observaciones sea menor o igual a 500. Formula.
Nc= 1 + 3.33log ( N )
Donde:
Nc es el nmero de clases. N es la cantidad de muestras tomadas.

5) VALOR DEL INTERVALO O AMPLITUD

Se Obtiene por medio de la ecuacin de dicta:


Vi = AT / Nc
Donde:
Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de

Representaciones Grficas de la Distribucin de Frecuencias

La estadstica es una disciplina que nos ensea a organizar los datos recogidos para
poder analizar sus caractersticas y posteriormente inferir, a partir de las muestras
tomadas, las caractersticas de la poblacin investigada.

16
Los cuadros o tablas corresponden a arreglos sistemticos de los datos por filas y
columnas y son un buen complemento del texto en los informes.

El primer procedimiento estadstico consiste en tabular los datos segn el tipo de escala
de medicin utilizada. La tabulacin de los datos conlleva a representar la informacin a
travs de tablas que de forma general contiene las siguientes partes fundamentales:

Numeracin (siempre que se presenten dos o ms cuadros)

Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma
breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del
mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo.

Encabezamiento: se refiere al nmero de atributos o variables que se quieren representar


en el cuadro y se anotan como denominaciones de las columnas y subcolumnas; puede
ser unidimensional, bidimensional o multidimensional. Los ttulos de las columnas van
en maysculas y los subttulos en minsculas

Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro en orden vertical y


horizontal, donde se colocan los datos sobre los hechos observados

Pie: se refiere a la informacin adicional necesaria a saber: notas, llamadas, fuentes de


informacin y otras. Se anotan en el espacio debajo de la lnea inferior que limita el
cuerpo del cuadro.

Los Grficos Estadsticos:


El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos estadsticos,
este elemento no le aade novedad a las tablas o cuadros estadsticos, es de fcil
comprensin y accesible a un nmero mayor de usuarios. El grfico adems de expresar
visualmente los hechos ms importantes de la informacin numrica, permite una mejor
y ms fcil comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos
al facilitar su apreciacin visual en forma conjunta:

Histogramas de frecuencias
Un histograma es un grfico que sirve para representar una distribucin de frecuencias.
Este grfico est formado por un conjunto de rectngulos (caso de variables continuas)
que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X),
y como centro los puntos medios de las clases. Los anchos de las clases y las reas de
los rectngulos son proporcionales a las frecuencias de las clases. En el caso de las
variables discretas el grfico consiste de un conjunto de barras verticales en lugar de
rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura
proporcional a la frecuencia de la observacin

17
Polgono de frecuencias
El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los
centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias
de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada
centro de clase se seala mediante un punto y luego los puntos consecutivos se unen por
lneas rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia
uniendo los puntos medios de las bases superiores de cada rectngulo mediante lneas
rectas.

18
Ojivas
Las ojivas se refieren a los grficos que se construyen utilizando una distribucin
acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin
de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que
se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del
orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de
los datos en el cuadro, la ojiva resulta ser ascendente.

19
III.5 Casos Prcticos:
(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)
Problema #1: Variable Continua.
En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de
Panam, con una aproximacin de una libra.

138 164 150 132 144 125 149 157


146 164 140 147 136 148 152 144
168 126 138 176 163 118 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 126

a. Construya una tabla de distribucin de


frecuencias, indicando las frecuencias
absolutas, relativas, absolutas acumuladas y
relativas acumuladas.
b. Construya un histograma, un polgono de
frecuencias y una ojiva de la distribucin.

Problema #2: Variable Discreta:

Una encuesta entre un grupo de madres-solteras, para analizar los problemas


econmicos que enfrentan, en determinada comunidad; arroj los siguientes
resultados acerca del nmero de nios en el hogar.

14 2 3 5 3 53 3 5
11 2 1 4 1 21 4 1
21 1 2 1 2 32 3 3
31 3 4 1 1 35 4 2
25 1 4 2 3 12 5 1

a. Construya una tabla de distribucin de frecuencias y sus respectivas


representaciones grficas.

Problema #3:

Una compaa de transmisiones electrnicas registro como sigue el nmero de


recibos de servicios prestados por cada una de sus 20 sucursales en el ltimo mes:

808 641 628 731 641 446 342 545 910 568
335 459 727 848 229 347 309 649 575 757

20
La compaa piensa que una tienda realmente no puede esperar alcanzar
financieramente el punto de equilibrio con menos de 456 servicios prestados
mensualmente. Adems su poltica es dar un bono financiero al gerente que genere
ms de 683 servicios al mes. Disponga los datos en un arreglo e indique cuntas
sucursales no estn consiguiendo el punto de equilibrio y cuntas ganan el bono.

Problema #4:

Una agencia de viajes ofrece precios especiales en ciertas travesas por el Caribe.
Planea ofrecer varios de estos paseos durante la prxima temporada invernal en el
hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el
mayor provecho por cada unidad monetaria gastada en publicidad, necesita la
distribucin de las edades de los pasajeros de travesas anteriores. Se consider
que si participaban pocas personas de un grupo de edad en los paseos no sera
econmico enviar un gran nmero de folletos a personas de ese grupo de edad. La
agencia seleccion una muestra de 40 clientes anteriores de sus archivos y se
registr sus edades, como sigue:

77 18 63 84 38 54 50 59
54 56 36 50 50 34 44 41
58 58 53 62 62 43 52 53
63 62 62 61 61 52 60 60
45 66 83 63 63 58 61 71

a. Organice los datos en una tabla de distribucin de


frecuencias de las edades de los clientes en la muestra
b. Cul grupo de edad presenta la mayor frecuencia
relativa? Cul la menor frecuencia relativa?.
c. Saque conclusiones que puedan ayudar a la agencia a
planear una campaa de publicidad para los paseos
invernales.

21
IV.- Medidas De Tendencia Central

Antes de pasar a este captulo debemos de tener claro que es la desviacin estndar;

Desviacin Estndar
La desviacin estndar o desviacin tpica es una medida de centralizacin o dispersin
para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica
descriptiva. Junto a la varianza -con la que est estrechamente relacionada-, es una
medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto
de su media aritmtica, expresada en las mismas unidades que la variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que representan
los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.

La desviacin slo significa qu tan lejos de lo normal

La desviacin estndar () mide cunto se separan los datos.

La frmula es fcil: es la raz cuadrada de la varianza. As que, "qu es la varianza?"


Varianza.

La varianza (que es el cuadrado de la desviacin estndar: 2) se define as:

Es la media de las diferencias con la media elevadas al cuadrado.


En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los nmeros).

2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia
elevada al cuadrado).

3. Ahora calcula la media de esas diferencias al cuadrado. (Por qu al cuadrado?)

Ejemplo

Se miden las alturas de vuestros perros (en milmetros):

22
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviacin estndar.

Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5

As que la altura media es 394 mm. Vamos a dibujar esto en el grfico: Ahora
calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:
2
2062 + 762 + (-224)2 + 362 + (-94)2 108,520
Varianza: = = = 21,704
5 5
As que la varianza es 21,704.

Y la desviacin estndar es la raz de la varianza, as que:


Desviacin estndar: = 21,704 = 147

23
As lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a
distancia menos de la desviacin estndar (147mm) de la media:

As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es


normal, o extra grande o extra pequeo, Los Rottweilers son perros grandes, y los
Dachsunds son un poco menudos.

*Nota: por qu al cuadrado?


Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza), y tambin hacen que las
diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho ms grande que
502=2,500, pero elevarlas al cuadrado hace que la respuesta sea muy grande, as que lo
deshacemos (con la raz cuadrada) y as la desviacin estndar es mucho ms til.

La Moda
Para obtener la moda, simplemente buscamos el puntaje o categora que ocurre ms
frecuentemente en una distribucin, La moda puede encontrarse fcilmente por
inspeccin ms que por clculo.

Ejemplo: en el conjunto de datos 1,2,3,1,1,6,5,4,1,4,4,3 , la moda es 1, ya que es el que


ocurre ms que cualquier otro en el conjunto(ocurre 4 veces).

TABLA 4.1. Valor de los puntajes f

2 2
6 3
5 4
Mo 4 5
3 4
2 3
1 2
Total 23

En el caso de u a distribucin de frecuencia simple en la que los valores de los puntajes


y las frecuencias se presentan en columnas separadas, la moda es el valor que aparece
ms a menudo en la columna de frecuencia de la tabla .Por lo tanto ,en distribucin de
frecuencia simple localizada en la tabla 4.1, Mo = 4.

24
La Mediana
Cuando los puntajes ordinales o por intervalos, se organizan por orden de tamao,
resulta posible localizar la mediana (mdn), el punto ms cercano al medio en una
distribucin. Por lo tanto, se considera la mediana como la medida de tendencia central
que corta la distribucin en dos partes iguales.

Si tenemos un nmero impar de casos, entonces la mediana ser el caso que cae
exactamente en la mitad de la distribucin. La posicin del valor de la mediana puede
localizarse por inspeccin o por formula.

Posicin de la mediana= N+ 1 /2

As 16 es el valor de la mediana para los puntajes 11,12,13,16,17,20,25, este es el caso


en que divide los nmeros de manera que le quedan 3 nmeros a cada lado. De
acuerdo con la frmula (7 + 1) / 2, vemos que la mediana 16 es el cuarto puntaje en la
distribucin, contando desde cualquiera de los 2 extremos.

La solucin es simple : la mediana es el valor numrico .Por lo tanto , en los puntajes


11,12,13,16,16,16,25,26,27, el caso mediano es 16, a pesar de que ocurre ms de una
vez.

Para encontrar la mediana de una distribucin de frecuencia simple: comencemos con


el procedimiento que acabamos de ver .En el caso de la 4.1.

Posicin de la mediana = 23+1/2 = 24+2/2= 12

La mediana resulta de ser el duodcimo puntaje en esta distribucin de frecuencia. Para


ayudar a localizar este duodcimo puntaje, podramos construir una distribucin de
frecuencia acumulada como se muestra en la tercera columna de la tabla 4.2. (Este
puede hacerse mentalmente para un nmero de pequeo de puntaje) comenzando con el
valor ms bajo, sumamos frecuencias hasta llegar al duodcimo puntaje en la
distribucin .En el presente ejemplo, la mediana de los valores de los puntos es 4.

Tabla 4.2. Valores del puntaje f fa


Como encontrar
La mediana 7 2 23
Para una 6 3 21
Distribucin
Simple 5 4 18
mdn 4 5 14

3 4 9
2 3 5
1 2 2
Total 23

25
La Media

La medida de tendencia central ms comnmente utilizada, la media aritmtica X,


puede obtenerse sumando un conjunto de porcentajes y dividiendo entre el nmero de
stos. Por lo tanto, definimos la media ms formalmente como la suma de un conjunto
de puntajes dividido entre el nmero total de puntajes del conjunto. Por frmula,

X = ZX / N

Donde

X = la media (lase X barra)


Z = la suma (expresada como la letra mayscula griega sigma)
X= un conjunto no procesado en un conjunto de datos
N = el nmero total de puntajes en un conjunto.

Aplicando la frmula de arriba expuesta, encontramos que la media del coeficiente


intelectual de los 8 entrevistados listados en la tabla 4.3. es 108.

TABLA 4.3 entrevistado X( C.I)


Como calcular
La media Leticia 125
Francisco 92
Sara 72 X = ZX/ N
Miguel 126
Rebeca 120 = 864/ 8
Rocio 99
Benjamn 130
Pablo 100 = 108
XZ = 864

A diferencia de la moda la media no es el puntaje que ocurre ms a menudo. A


diferencia de la mediana, no es necesariamente el punto ms cercano al medio en una
distribucin. Entonces. Qu significa media? Cmo puede interpretarse? Como
veremos, la media puede considerarse como el centro de gravedad, el punto alrededor
del cual las desviaciones positivas y negativas de cualquier distribucin se equilibran.
Para comprender esta caracterstica de la media, debemos comprender primero el
concepto de desviacin, que indica la distancia entre cualquier puntaje no procesado y
la media .Para encontrar la desviacin, simplemente la restamos de la media a cualquier
puntaje no procesado. De acuerdo con la frmula,

x= X X

Donde

x= el puntaje de desviacin (simbolizado siempre por x minscula)


X= cualquier puntaje no procesado en la distribucin
X= la media

26
TABLA 4.4. X x
Desviaciones de un
Conjunto de puntajes no 9 +3 +5
Procesados 8 +2
6 0 X= 6
4 - 2 -5
3 -3

Como X = 6 para el conjunto de puntajes no procesados 9,8,6,4, y 3, el puntaje no


procesado 9 se encuentra exactamente 3 unidades de puntaje no procesados por sobre
la media de 6 ( o X X = 4 -6 = -2) Conclusin : mientras ms grande es la
desviacin x , ms grande es la distancia entre ese puntaje no procesado y la media de la
distribucin.

Considerando la media como un punto de equilibrio en la distribucin, podemos decir


ahora que la suma de las desviaciones que caen por encima de la media es igual en
valor absoluto (haciendo caso omiso de los signos menos) a la suma de las desviaciones
que cae por debajo de la media. Volvamos a un ejemplo anterior, al conjunto de puntaje
9,8,6,4,3, en que X= 6 . Si la media para esta distribucin es el centro de gravedad
pasando por alto los signos menos, la suma de las desviaciones positivas(desviaciones
de los puntajes no procesados 8 y 9 ) debieran ser igualar la suma de las desviaciones
negativas (desviaciones de los puntajes no procesados 4 y 3) .

Como se indica en la Tabla 4.4. este resulta ser el caso ,ya que la suma de las
desviaciones por debajo de X(-5) es igual a la suma de las desviaciones por encima de
X(+5)

Como obtener la media de una distribucin de frecuencia simple:

La formula X= ZX/N sirve para obtener la media de un pequeo nmero de puntajes


.Sin embargo, cuando tenemos un mayor nmero de casos podra ser ms prctico, y se
gastara menos tiempo, calcular la media de una distribucin de frecuencia por la
frmula.

X= Zfx/N

En que

X= la media
X = el valor de un puntaje no procesado en la distribucin
FX= un puntaje multiplicado por su frecuencia de ocurrencia
ZfX= la suma de los FXs
N= el nmero total de puntajes

27
TABLA 4.5. X f fX

Tabla de frecuencia
Simple 8 2 16
7 3 21
6 5 30
5 6 30 X= ZfX/N
4 4 16 = 132/28
3 4 12 = 4.71
2 3 6
1 1 1
N= 28 ZfX = 132

Comparacin De La Moda, Mediana Y La Media De Una Distribucin


De Frecuencias Agrupada.
Llega un momento en que el investigador social escoge una medida de tendencia central
para una situacin en una investigacin particular EMPLEAR LA MODA, LA
MEDIANA O LA MEDIA? Su decisin involucra varios factores que incluyen:

1. El nivel de medicin.
2. La forma de distribucin de sus puntajes, y
3. el objetivo de la investigacin

Nivel de medicin
Como la moda requiere slo de un conteo de frecuencia, puede aplicarse a cualquier
conjunto de datos en el nivel de medicin nominal, ordinal o por intervalos .por
ejemplo, podramos determinar que la categora modal en una medicin de nivel
nominal de afiliaciones religiosas (protestante, catlica y juda) es protestante, ya
que el mayor numero de nuestros entrevistados se identifican como tales. Del mismo
modo, podramos saber que el mayor numero de estudiantes que asisten a una
universidad privada tiene un promedio de 2.5 (Mo = 2.5).

La mediana requiere un ordenamiento de categoras de la ms alta a la ms baja. Es


por esto que solo puede obtenerse a partir de datos ordinales o por intervalos y no de
datos nominales. Para ilustrar, podramos encontrar que la mediana de los ingresos
anuales entre los dentistas de un pequeo pueblo es $ 17,000.Este resultado nos da una
forma significativa de examinar la tendencia central de nuestros datos. Por contraste,
tendra poco sentido que furamos a calcular la mediana para escalas de afiliacin
religiosa (protestante, catlica o juda), sexo (masculino o femenino) o pas u origen
(Inglaterra, Polonia, Francia o Alemania), cuando no se ha realizado una categorizacin
o ajuste a una escala.

El uso de la media se restringe exclusivamente a los datos por intervalos. Su aplicacin


a datos ordinales o nominales da un resultado sin significado que generalmente no
indica en absoluto la tendencia central. Qu sentido tendra calcular la media para una
distribucin de afiliacin religiosa o de sexo? Aunque es menos obvio, es igualmente

28
Inapropiado calcular una media para datos que pueden categorizarse pero no
puntuarse.

Forma de distribucin
La forma de un a distribucin es otro factor que puede influir en la eleccin de la
medida de tendencia central que haga el investigador .En una distribucin unimodal
perfectamente simtrica, la moda, la mediana y la media sern idnticas, ya que el
punto de mxima frecuencia (Mo) es tambin el puntaje ms cercano a la mediana
(Mdn), as como el centro de gravedad (X). Como se muestra en la figura
4.2, las medidas de tendencia central coincidirn en el punto ms central, en el pico
de la distribucin simtrica.

FIGURA 4.2. Una distribucin Simtrica, unimodal, que demuestra que la moda, la
mediana y la Media asumen valores idnticos

Cuando el investigador social trabaja con una simtrica, su eleccin de la medida de


tendencia central se basar principalmente en sus objetivos particulares de
investigacin y en el nivel a que estn medidos sus datos. Sin embargo, cuando trabaje
con una distribucin sesgada su decisin estar muy influida por la forma de sus datos.

Mientras que la media est muy influida por los puntajes extremos en ambas
direcciones, los cambios en los valores extremos modifican poco o nada la mediana.

Esto se debe a que la media considera todos los puntajes en una distribucin. Mientras
que, por definicin, la mediana se entiende solo con el valor numrico de puntaje que
cae en la posicin mas cercana al medio de la distribucin .Como se ilustra mas
adelante, el cambio del valor de un puntaje extremo de 10, en la distribucin A, a 95 en
la distribucin B no modifica en absoluto el valor de la mediana (Mdn = 7.5), en tanto
que la media varia de 7.63 a 18.25:

Distribucin A: 5,6,6,7,8,9,10,10 Mdn = 7.5 X = 7.63


Distribucin B: 5,6,6,7,8,9,10,95 Mdn = 7.5 X = 18,25

29
En una distribucin sesgada, la mediana cae siempre en algn punto entre la media y
la moda. Es esta caracterstica la que convierte a la mediana en la medida de tendencia
central ms deseable para describir una distribucin de puntajes sesgada. Para ilustrar
esta ventaja de la mediana volvamos a la tabla 4.6. Y examinemos el salario anual
promedio entre los empleados de una pequea corporacin.

Si fusemos publirrelacionistas contratados por una corporacin para darle una


imagen pblica favorable, probablemente querramos calcular la media para demostrar
que el empleado promedio gana $ 18,000 y esta relativamente bien pagado. Por otra
parte, si furamos representantes sindicales que buscan elevar los niveles salariales,
querramos, probablemente, emplear la moda para demostrar que el salario promedio
es de solo $ 1, 000, una suma atrozmente baja.

Finalmente, si furamos investigadores sociales buscando informar con exactitud sobre


el salario promedio entre los empleados de la corporacin, sabiamente emplearamos
la mediana ($3,000), ya que cae entre las otras medidas de tendencia central y da, por lo
tanto, una visin mas equilibrada de la estructura salarial. El mtodo mas aceptable
seria el de dar a conocer las tres medidas de tendencia central y dejar que el publico
interpretase los resultados.

Desafortunadamente, es cierto que pocos investigadores sociales- publirrelacionistas y


los representantes sindicales- informan sobre ms de una medida de tendencia central.
Es mas desafortunado aun el hecho de que algunos informes de investigacin no
especifican exactamente cual medida de tendencia central- la moda, la mediana o la
media se utilizo para calcular la cantidad promedio o la posicin dentro de un
grupo de puntajes. Como lo demuestra la ilustracin, seria imposible una interpretacin
razonable de los descubrimientos si no se contara con tal informacin.

TABLA 4.6. Medidas de SALARIO


Tendencia central de una
Distribucin sesgada de $ 100,000
Salarios anuales 25,000
10,000 x = $18,000
5,000
1,000 Mdn = 3,000
1,000
1,000 Mo = 1,000
1,000

Ya se anoto, anteriormente, que algunas distribuciones de frecuencia pueden


caracterizarse como bimodales, ya que contienen dos puntos de frecuencia mxima.

Para describir apropiadamente las distribuciones bimodales, generalmente es til


identificar ambas modas, el uso de la mediana o la media podra oscurecer aspectos
importantes de tales distribuciones.

Consideraremos la situacin del investigador social que dirigi entrevistas con 26


personas de bajos ingresos para determinar cual era su concepcin ideal sobre el
tamao de su familia.

30
A cada entrevistado se le pregunt: suponga que usted puede decidir exactamente que
tan grande debe ser su familia Cuantas personas le gustara ver en su familia ideal,
incluyendo a todos los nios y adultos? Como se muestra en la Tabla 4.7.
Los resultados de este estudio indicaron una amplia gama de preferencias en cuanto al
tamao de la familia, desde vivir solo( 1) hasta vivir con muchas personas (10) Usando
la media o la mediana, podramos concluir que la familia ideal de los entrevistados
constaba de seis miembros (X = 5.58, Mdn = 6=).Sin embargo, sabiendo que la
distribucin es bimodal, vemos que estaban representadas, en realidad, dos
concepciones ideales sobre el tamao de la familia dentro del grupo de entrevistados:
una con nmero bastante grande de personas (Mo = 8) , y la otra con solo una cuan tas
personas (Mo.= 3).

El objetivo de la Investigacin
Hasta este punto, hemos estudiado la eleccin de una medida de tendencia central en
trminos del nivel de medicin y de la forma de una distribucin de los puntajes.
Preguntamos ahora: Qu espera hacer el investigador social con su medida de
tendencia central? Si busca una medicin rpida, sencilla, pero crudamente descriptiva
o si esta trabajando con una distribucin bimodal, empleara generalmente la moda.
Sin embargo, en la mayora de las situaciones que enfrenta el investigador, la moda
solo tiene utilidad como un indicador preliminar de la tendencia central que puede
obtenerse rpidamente mediante una breve exploracin de los puntajes. Si busca una
medicin precisa de la tendencia central, La decisin esta generalmente entre la
mediana y la media.

Para describir una distribucin sesgada, el investigador generalmente escoge la


mediana ya que (como se anoto anteriormente) tiende a dar un cuadro equilibrado de
los puntajes extremos. La mediana se utiliza adems como un punto de la distribucin
donde los puntajes pueden dividirse en dos categoras de acuerdo con preferencias
sobre el tamao familiar-aquellos que prefieren una familia pequea contra los que
prefieren una familia grande.

Para una medida precisa de las distribuciones simtricas se tiende a preferir la media
sobre la mediana, ya que la media puede usarse fcilmente en el anlisis estadstico
ms avanzado, como el que se introduce en los captulos subsiguientes del texto. Es
ms, la media es ms estable que la mediana, ya que vara menos a travs de las
distintas muestras tomadas de cualquier poblacin dada. Esta ventaja de la media-
aunque quizs no haya sido entendido o apreciada por el estudiante se har mas
manifiesta en el subsiguiente estudio de la funcin de toma de decisiones de la
estadstica.

31
TABLA 4.7. Concepciones Tamao ideal de la familia f
Ideales sobre el tamao de
La familia entre 26 entre 10 1
Visitados de bajos ingresos: 9 2
Una distribucin bimodal. 8 6
7 3
6 2
5 1
4 2
3 6
2 2
1 1
N= 26

Intervalos De Confianza
Se llama intervalo de confianza en estadstica a un par de nmeros entre los cuales se
estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un parmetro poblacional. La
probabilidad de xito en la estimacin se representa por 1 - y se denomina nivel de
confianza. En estas circunstancias, es el llamado error aleatorio o nivel de
significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.[1]

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un


intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumentan sus posibilidades de error.

Para la construccin de un determinado intervalo de confianza es necesario conocer la


distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro se
distribuya normalmente. Tambin pueden construirse intervalos de confianza con la
desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - % para la estimacin de un parmetro


poblacional que sigue una determinada distribucin de probabilidad, es una expresin
del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de
probabilidad de .

Intervalo de confianza para la media de una poblacin


Un intervalo de confianza aporta ms informacin que un estimador puntual cuando se
quiere hacer inferencias sobre parmetros poblacionales, existen intervalos de
confianza bilateral y unilateral.

La amplitud de un intervalo de confianza est determinado por: el nivel de confianza


establecido; la variabilidad de los datos; el tamao de la muestra.

32
En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable)
construir intervalos de confianza para Odds Ratios y Riesgos Relativos.

Un intervalo de confianza permite verificar hiptesis planteadas acerca de parmetros


poblacionales.

De una poblacin de media y desviacin tpica se pueden tomar muestras de n


elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede
demostrar que la media de todas las medias mustrales coincide con la media
poblacional:2

Pero adems, si el tamao de las muestras es lo suficientemente grande,3 la distribucin


de medias mustrales es, prcticamente, una distribucin normal (o gaussiana) con

media y una desviacin tpica dada por la siguiente expresin: . Esto se

representa como sigue: . Si estandarizamos, se sigue que:

En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual
"caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y
z2 tales que P[z1 z z1] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el
uso de las tablas en una distribucin normal).

Se desea obtener una expresin tal que

En esta distribucin normal de medias se puede calcular el intervalo de confianza


donde se encontrar la media poblacional si slo se conoce una media muestral ( ),
con una confianza determinada. Habitualmente se manejan valores de confianza del
95% y 99%. A este valor se le llamar 1 (debido a que es el error que se
cometer, un trmino opuesto).

Para ello se necesita calcular el punto X / 2 o mejor dicho su versin estandarizada Z


/ 2 junto con su "opuesto en la distribucin" X / 2. Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:

33
Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:


z / 2 = z / 2
As:

Haciendo operaciones es posible despejar para obtener el intervalo:

Resultando el intervalo de confianza:

Si no es conocida y n es grande (habitualmente se toma n 30):4

, donde s es la desviacin tpica de una muestra.


Aproximaciones para el valor z / 2 para los niveles de confianza estndar son 1,96 para
1 = 95% y 2,576 para 1 = 99%.5

34
Intervalo de confianza para una proporcin
El intervalo de confianza para estimar una proporcin p, conocida una proporcin
muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:

En la demostracin de estas frmulas estn involucrados el Teorema Central del Lmite


y la aproximacin de una binomial por una normal.6

Casos Prcticos.

MEDIA MUETRAL = Suma de todos los valores de la muestra

Numero de valores de la muestra

X = X
N

1. a) Calcule la media de los siguientes valores maestrales 5,9,4,10.


b) Demuestre que (x-x ) = 0

2. Determine el salario medio por hora pagado a carpinteros que obtuvieron los
siguiente pagos de salario por hora (en dlares)
15.40,20.10,18.75,22.76,30.67,18.00, respectivamente.

MEDIA PONDERADA

Xw = (W *

X)
w

W = Numero de unidades con x precio


X = Precio

35
3. Un establecimiento vende refrescos de cola de tres tamaos: pequeo, mediano
y grande. El pequeo cuesta $0.50 (dlares); el mediano, $0.75; y el grande $1.00.

Ayer se vendieron 20 pequeos, 50 medianos y 30 grandes. Cul fue el precio


medio ponderado por refresco?.

4. Un hospital emplea 200 personas en su cuerpo de enfermera. De ese personal,


50 son ayudantes de enfermera, 50 son enfermeras practicas y 100 son
enfermeras registradas, las primeras reciben un sueldo de $ 8 (dlares) por hora;
las segundas, uno de $10, y las ultimas, de $14. Cul es el valor medio
ponderado del sueldo?

5. Los ingresos netos diarios de una muestra de industriales de acero en Qubec


son (en millones de dlares): $96.70, $67.10, $89.70, $96.70, $91.40, $96.70 y
$82.60;

a. Cul es el ingreso modal?


b. Es la moda un promedio representativo?
c. Cul es la mediana de los ingresos?
d. Cul es la media de los ingresos?
MEDIA, MEDIANA, MODA

X = Fx
N

X Designa la media aritmtica


X Es el valor central o punto medio de cada clase
F Es la frecuencia de clase
Fx Es la frecuencia de clase multiplicada por el punto medio de la clase.
fx Es la suma de estos productos
N Es el nmero total de frecuencias.

6. Determine la media estimada de la siguiente distribucin de frecuencia.

Clase Frecuencia Punto medio fx

20-29 7 24.5 171.5


30-39 12 34.5 414
40-49 21 44.5 934.5
50-59 18 54.5 981
60-69 12 64.5 774

70 fx 3275

36
MEDIANA CON DATOS AGRUPADOS

N - AF
2
MEDIANA = L + (i)
f

DONDE:

L Es el lmite inferior verdadero de la clase que contiene a la mediana.


N Es el nmero total de frecuencias.
F Es la frecuencia de la clase que contiene a la mediana.
AF Es el nmero acumulativo de frecuencias en todas las clases que preceden
inmediatamente
A la clase que contiene la mediana.
I Es el ancho de la clase en que se encuentra la mediana.

7. Calcular la mediana con los datos del ejercicio anterior y cul es el valor
modal?

Clase Frecuencia Acumulado de frecuencias

20-29 7 7
30-39 12 19
40-49 21 40
50-59 18 58
60-69 12 70

37
V.- MUESTRAS Y POBLACIONES
Concepto de muestreo.

El muestreo es una herramienta de la investigacin cientfica. Su funcin bsica es


determinar que parte de una realidad en estudio (poblacin o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error que se
comete debido al hecho de que se obtienen conclusiones sobre cierta realidad a partir
de la observacin de slo una parte de ella, se denomina error de muestreo. Obtener una
muestra adecuada significa lograr una versin simplificada de la poblacin, que
reproduzca de algn modo sus rasgos bsicos.

Terminologa:

Poblacin objeto: conjunto de individuos de los que se quiere obtener una


informacin.
Unidades de muestreo: nmero de elementos de la poblacin, no solapados,
que se van a estudiar. Todo miembro de la poblacin pertenecer a una y
slo una unidad de muestreo.
Unidades de anlisis: objeto o individuo del que hay que obtener la
informacin.
Marco muestral: lista de unidades o elementos de muestreo.
Muestra: conjunto de unidades o elementos de anlisis sacados del marco.

El investigador social generalmente busca sacar conclusiones acerca de grandes


nmeros de individuos. Por ejemplo, podra desear estudiar a los 350, 000,000 de
ciudadanos de Latinoamrica, a los 1,000, miembros de un determinado sindicato de
trabajadores, a los 10,000 indgenas que viven en los pueblos del sur de Mxico o a los
45,000 estudiantes inscritos en determinada universidad.

Hasta este punto, hemos estado suponiendo que el investigador social investiga la
totalidad del grupo que intenta comprender. Este grupo conocido como poblacin o
universo, consiste en un conjunto de individuos que comparten por lo menos una
caracterstica, sea una ciudadana comn, la calidad de ser miembros de una
asociacin voluntaria o de una raza, la matricula de una misma universidad o similares.

Como el investigador social trabaja con limitaciones de tiempo, energa y recursos


econmicos, rara vez estudia a todos y cada uno de los miembros de la poblacin en
que se est interesado. En cambio el investigador analiza slo una muestra: un nmero
pequeo de individuos tomado de alguna poblacin. A travs del proceso de
muestreo el investigador social busca generalizar de su muestra (grupo pequeo) a la
totalidad de la poblacin de donde la obtuvo (grupo mayor).

El proceso de muestreo es una parte integral de la vida diaria. De qu otra forma


obtendramos informacin acerca de los dems si no haciendo muestreos a nuestro
alrededor? Por ejemplo, podramos discutir informalmente sobre temas polticos con
otros estudiantes para averiguar cules son, en general, sus opiniones polticas;
podramos intentar determinar de qu manera nuestros compaeros de curso estudian
para cierto examen ponindonos en contacto, anticipadamente ,con slo algunos
miembros de la clase; incluso podramos invertir en el mercado de valores despus de

38
descubrir que una pequea muestra de nuestros compaeros ha ganado dinero de una
manera similar.

Mtodos De Muestreo
Los mtodos de muestreo del investigador social son generalmente ms cuidadosos y
sistemticos que los de la vida diaria .Su preocupacin central es asegurarse de que los
miembros de su muestra sean lo suficientemente representativos de la poblacin entera
como para permitir hacer generalizaciones precisas acerca de ella. Para hacer tales
inferencias, el investigador escoge un mtodo de muestreo apropiado para ver si todos
y cada uno de los miembros de la muestra tiene igual oportunidad de ser integrados en
ella. Si a cada miembro de la poblacin se le da igual oportunidad de ser escogido para
la muestra, se est utilizando un mtodo aleatorio; de no ser as el mtodo empleado
viene a ser no aleatorio.

Muestras no aleatorias
El mtodo de muestreo no aleatorio ms usual es le muestreo por accidente y es el que
menos difiere con nuestros procedimientos diarios de muestreo, ya que se basa
exclusivamente en lo que es conveniente para el investigador. Es decir, el investigador
simplemente incluye los casos ms convenientes en su muestra y excluye de ella los
casos inconvenientes.

Muestras aleatorias
Como se anot anteriormente, el muestreo aleatorio le da a todos y cada uno de los
miembros de la poblacin igual oportunidad de ser seleccionados para la muestra. Esta
caracterstica del muestreo aleatorio indica que cada miembro de la poblacin debe ser
identificado antes de obtener dicha muestra aleatoria, requisito que generalmente se
llena obteniendo una lista que incluye a todos y cada uno de los miembros de la
poblacin.

Una tabla de nmeros aleatorios se construye en forma tal que genere series de
nmeros sin ningn patrn u orden determinado. Como resultado, el proceso de usar
una tabla de nmeros aleatorios produce una muestra imparcial semejante a aqulla que
se logra poniendo pedazos de papel en un sombrero y sacando nombres con los ojos
vendados.

Muestreo probabilstico
El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de
la poblacin, y dicha probabilidad no es nula para ningn elemento.

Los mtodos de muestreo no probabilsticas no garantizan la representatividad de la


muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la
poblacin.

39
(En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilstica, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin.)

Entre los mtodos de muestreo probabilstico ms utilizados en investigacin


encontramos:

Muestreo aleatorio simple


Muestreo estratificado
Muestreo sistemtico
Muestreo polietpico o por conglomerados

Ventajas e inconvenientes de los distintos tipos de muestreo probabilstico

CARACTERISTICAS VENTAJAS INCONVENIENTES

Aleatorio Se selecciona una muestra de tamao n de una


simple poblacin de N unidades, cada elem ento tiene una Sencillo y de fcil comprensin. Requiere que se posea de antemano
probabilidad de inclusin igual y conocida de n/N. un listado completo de toda la
Clculo rpido de medias y varianzas. poblacin.

Se basa en la teora estadstica, y por tanto Cuando se trabaja con muestras


existen paquetes informticos para analizar pequeas es posible que no
los datos represente a la poblacin
adecuadam ente.

Sistemtico
Conseguir un listado de los N elem entos de la Fcil de aplicar. Si la constante de muestreo est
poblacin asociada con el fenmeno de inters,
No siempre es necesario tener un listado de las estimaciones obtenidas a partir de
Determinar tam ao muestral n. toda la poblacin. la muestra pueden contener sesgo de
seleccin
Definir un intervalo k=N/n. Cuando la poblacin est ordenada
siguiendo una tendencia conocida, asegura
Elegir un nmero aleatorio, r, entre 1 y k una cobertura de unidades de todos los
(r=arranque aleatorio). tipos.

Seleccionar los elem entos de la lista.

Estratificado En ciertas ocasiones resultar conveniente Se ha de conocer la distribucin en la


estratificar la muestra segn ciertas variables de Tiende a asegurar que la muestra poblacin de las variables utilizadas
inters. Para ello debem os conocer la composicin represente adecuadam ente a la poblacin para la estratificacin.
estratificada de la poblacin objetivo a muestrear. en funcin de unas variables seleccionadas.
Una vez calculado el tamao muestral apropiado,
este se reparte de manera proporcional entre los Se obtienen estimaciones ms precisa
distintos estratos definidos en la poblacin usando
una simple regla de tres. Su objetivo es conseguir una muestra lo
mas sem ejante posible a la poblacin en lo
que a la o las variables estratificadoras se
refiere.

Conglomerad
os Se realizan varias fases de muestreo sucesivas Es muy eficiente cuando la poblacin es El error estndar es mayor que en el
(polietpico) muy grande y dispersa. muestreo aleatorio simple o
estratificado.
La necesidad de listados de las unidades de una No es preciso tener un listado de toda la
etapa se limita a aquellas unidades de muestreo poblacin, slo de las unidades prim arias de El clculo del error estndar es
seleccionadas en la etapa anterior. muestreo. complejo.

40
Clculo del tamao muestral
Cada estudio tiene un tamao muestral idneo, que permite comprobar lo que se
pretende con la seguridad y precisin fijadas por el investigador.

De que depende el tamao muestral?

Variabilidad del parmetro a estimar: Datos previos, estudios piloto o usar 50%
como peor estimacin
Precisin: Amplitud del intervalo de confianza. Si se estima prevalencia su formato
ser %
Nivel de confianza (1-a): habitualmente 95% o 99%. Probabilidad complementaria
al error admitido a

Si aumentamos el tamao muestral n, podremos mejorar la calidad de la estimacin bien


aumentando la precisin (disminuye amplitud del intervalo) o bien aumentando la
seguridad (disminuye el error admitido).

Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la poblacin en
grupos, llamados estratos, que son ms homogneos que la poblacin como un todo.
Los elementos de la muestra son entonces seleccionados al azar o por un mtodo
sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en la muestra
estratificada, usualmente tienen mayor precisin (o menor error muestral) que si la
poblacin entera muestreada mediante muestreo aleatorio simple. El nmero de
elementos seleccionado de cada estrato puede ser proporcional o desproporcional al
tamao del estrato en relacin con la poblacin.

Error De Muestreo
A travs del resto del texto seremos cuidadosos en distinguir entre las caractersticas de
las muestras que estudiamos realmente y las poblaciones a las cuales esperamos
generalizar. Para hacer esta distincin, en nuestros procedimientos estadsticos, no
podemos, por tanto, seguir usando los mismos smbolos para representar la media y la
desviacin estndar tanto de la muestra como de la poblacin.

En su lugar debemos emplear diferentes smbolos, dependiendo de si nos estamos


refiriendo a caractersticas de la muestra o de la poblacin. En relacin con la media,
simbolizaremos siempre a la media de una muestra como X y la media de una
poblacin como U. En relacin con la desviacin estndar, simbolizaremos a la
desviacin estndar de una muestra como s y a la desviacin estndar de su poblacin
como o.

Normalmente, el investigador social trata de obtener una muestra que sea


representativa de la poblacin en la que est interesado. Como las muestras aleatorias le
dan a todos y a cada uno de los miembros de la poblacin la misma oportunidad de ser
seleccionados para la muestra, son, ala larga, ms representativas de las caractersticas
poblacionales que sus contrapartes no aleatorias. Sin embargo, como se explic

41
brevemente en el Captulo 1, siempre podemos esperar, por mera casualidad, que haya
alguna diferencia entre una muestra, aleatoria o de otro tipo, y la poblacin de la que se
ha extrado. X casi nunca ser exactamente igual a o. Esta diferencia, conocida como
error de muestreo, resulta sin importar qu tan bien se haya diseado y realizado el plan
de muestreo con las mejores intenciones del investigador y donde no ocurre ningn
fraude ni se han cometido errores.

Distribucin Muestral De Medidas


Dada la presencia del error de muestreo, el estudiante se preguntar cmo es posible
generalizar siempre a partir de una muestra a una poblacin. Para llegar a una respuesta
razonable, consideremos el trabajo de un hipottico investigador social que estudia la
audicin de radio entre un milln de residentes de una ciudad. Para ahorrar tiempo y
dinero entrevista a slo una muestra tomada aleatoriamente del total de la poblacin
de residentes. Extrae 500 residentes por medio de una tabla de nmeros aleatorios y le
pregunta a cada miembro de la muestra: cuntos minutos escucha usted la radio
diariamente? Y encuentra que el tiempo empleado en escucharla va desde 0 a 240
minutos. El tiempo medio empleado en escuchar la radio en una muestra de 500
residentes es de 101,55 minutos.

Significa que nuestro investigador social es levemente excntrico y tiene una notable
inclinacin a extraer muestras de poblaciones. Es tan intenso su entusiasmo por el
muestreo que contina extrayendo muchas muestras adicionales de 500 residentes
cada una y calculando el tiempo de audicin de radio de los miembros de cada muestra.
Este procedimiento contina hasta que nuestro excntrico investigador ha extrado 98
muestras de 500 residentes cada una. En el proceso de extraer 98 muestras aleatorias
estudia, de hecho a 49000 entrevistados (500 x 98= 49000).

Supongamos que las muestras tomadas por nuestro excntrico investigador social
producen medias que van desde 89 hasta 111 minutos. De acuerdo con nuestro estudio
previo, esto podra suceder fcilmente, simplemente con base en el error de muestreo.

Intervalos De Confianza
Para explorar el procedimiento que se sigue para encontrar un intervalo de confianza,
ampliemos un ejemplo anterior. Supongamos que la muestra aleatoria (de un
investigador) de 100 exalumnos de cierta universidad marca un ingreso anual medio de
$14,000.Como sus datos provienen solamente de una muestra aleatoria, y no de la
poblacin total de exalumnos, no podemos estar seguros de que el ingreso medio
reportado sea realmente un reflejo de esta poblacin de exalumnos universitarios. Como
ya hemos visto, el error de muestreo es, despus de todo, el producto inevitable de sacar
muestras de poblaciones.

42
Casos Prcticos
I.- Una cadena de tiendas de artculos para deportes, que busca especializarse en
servicios para esquiadores principiantes, planea efectuar un estudio acerca de cunto
gasta una persona esquiadora principiante en la compra inicial de equipo y suministros.
Con base a estas cifras, desea explorar las posibilidades de ofrecer combinaciones
como un par de botas o un par de esqus- a fin de inducir a los clientes a comprar ms.
Una muestra de sus ingresos registrados de compras al contado indic las siguientes
compras iniciales.

$140 $82 $265 $168 $90 $114 $172 $230 $142


86 125 235 212 171 149 156 162 118
139 149 132 105 162 126 216 195 127
161 135 172 220 229 129 87 128 126
175 127 149 126 121 118 172 126

a) Desarrollar un intervalo de clase a seguir. Utilice cinco clases. Sea $80 (dlares)
l lmite inferior de la primera clase.

b) Cul sera un mejor intervalo de clase?


c) Organice los datos en una distribucin de frecuencias.
d) Interprete los resultados.

Las puntuaciones en una prueba de aptitud de mecnica se organizaron en la siguiente


distribucin.

Puntaciones en la prueba Numero de puntuaciones


100-119 6
120-139 17
140-159 38
160-179 15
180-199 4

a) Represente la distribucin mediante un histograma.


b) Represente la distribucin por medio de un polgono de frecuencias.
c) Utilizando los diagramas, interprete la distribucin de las puntuaciones de la
prueba.

II.- El peso de 75 mazorcas de Growfast, un maz comestible, se registr y condensaron


en la distribucin siguiente.

Peso en Nmero de
onzas mazorcas
16 - 17 12
18 - 19 36
20 - 21 14
22 - 23 8
24 - 25 4
26 - 27 1

43
a) Presente los pesos en un histograma.
b) Presente los pesos en un polgono de frecuencia.
c) Con base en los diagramas, interprete la distribucin de los pesos.

III.- Una encuesta reciente mostr que el propietario tpico de auto en Estados Unidos
destina $ 2 950 (dlares) al ao en gastos de operacin. A continuacin se muestra una
clasificacin de los diversos conceptos de gastos. Trace un diagrama apropiado para
presentar datos.

Gastos por concepto Importe


Combustible $603
Inters sobre prstamo 279
Reparaciones 930
Seguro y licencia 646
Depreciacin 492
Total $ 2 950

IV.- Una institucin bancaria seleccion una muestra de 40 cuentas de cheques de


estudiantes. Enseguida se presentan los saldos de fin de mes.

$ 404 $ 74 $ 234 $ 149 $ 279 $ 215 $ 123 $ 55 $ 43 $ 321


87 234 68 489 57 185 141 758 72 863
703 125 350 440 37 252 27 521 302 127
968 712 503 498 327 608 358 425 303 204

a) Coloque los datos en una distribucin de frecuencias usando 100 (dlares) como
intervalo de clase, y 0 como el punto partida.
b) Trace un polgono de frecuencias acumuladas menos de.
c) El banco considera como cliente preferido a un estudiante con un saldo final
de $400 dlares o ms en su cuenta. Estime el porcentaje de clientes preferidos.
d) Ese banco tambin est considerando un cargo por servicio al 10% ms bajo de
los saldos finales. Qu recomendara usted como un punto de corte entre los
que tienen que pagar un cargo por servicio y los que no estn en tal caso?

44
BIBLIOGRAFA.

FERNANDEZ, Araceli. Arte de Aplicar la Estadstica Bsica en la Investigacin


Social. Psicologa Tcnica Aplicada. 2001.

HUNTER, William. Estadstica para Investigadores. Introduccin al Diseo de


Experimentos Anlisis de Datos. Reverte. 2001.

NUEZ, Rafael. Estadstica para la Ciencia Social. Trillas. 2000.

LEVIN, JACK. Fundamentos de Estadstica en la Investigacin Social Ed.


HARLA.2001

45

You might also like