Professional Documents
Culture Documents
ASPECTOS GENERALES:
HISTORIA DE LA ESTADISTICA
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y
militares (clculo de recursos y hombres disponibles). La investigacin histrica revela
que se realizaron 69 censos para calcular los impuestos, determinar los derechos de
voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron
emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la
poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda
uno de estos empadronamientos de la poblacin bajo la autoridad del imperio.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante
durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos
de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas
cientficos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la
palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el
trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor
intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las
ms variadas situaciones.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.
CONCEPTOS DE LA ESTADISTICA
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos
valores: cara y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara,
cara, cruz, cara, cruz.
METODOS ESTADISTICOS
ETAPAS DEL MTODO ESTADSTICO
El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre
mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que acten
libremente, pero se registran las diferentes observaciones y se analizan sus variaciones.
Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:
1. Planteamiento del problema.
2. Fijacin de los objetivos.
3. Formulacin de la hiptesis.
4. Definicin de la unidad de observacin y de la unidad de medida.
5. Determinacin de la poblacin y de la muestra.
6. La recoleccin.
7. Crtica, clasificacin y ordenacin.
8. Tabulacin.
9. Presentacin.
10. Anlisis.
11. Publicacin.
1. PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se
pretende estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible
sobre el o los fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre
otras cosas, la revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados
obtenidos por investigaciones similares, someter nuestras proposiciones bsicas a un anlisis
lgico; es decir, se debe hacer una ubicacin histrica y terica del problema.
2. FIJACIN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.
3. FORMULACIN DE LAS HIPTESIS
Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada.
Una hiptesis estadstica debe ser susceptible de docimar, esto es, debe poderse probar para su
aceptacin o rechazo.
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis
contraria se le llama Hiptesis Alternativa (H1).
4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA
FUNCIONES DE LA ESTADISTICA
As pues, la Estadstica puede aportar una primera aproximacin al campo de estudio a partir de
los datos que facilita al investigador, con posterioridad se pueden aplicar los principios derivados de
la Estadstica, entendida como ciencia, para la resolucin de problemas o para la toma de
decisiones. Por ejemplo, puede realizarse una recopilacin de datos sociodemogrficos de una
determinada zona residencial, para prever la construccin de escuelas infantiles a corto plazo. Esta
informacin puede ser til para las autoridades administrativas.
Downie y Heath (1983) sealan que los profesionales de la pedagoga, sociologa, psicologa, en
sus trabajos de estudio e investigacin, suelen disponer de muchos y variados datos que necesitan
ser analizados e interpretados, algo que no sera posible sin un conocimiento de la Estadstica, as
podemos sealar que nos ofrece las siguientes posibilidades:
Permite calcular las medias aritmticas de los grupos, para comparar niveles de dominio de las
variables.
ABUSOS DE LA ESTADSTICA
Se puede definir de dos diferentes maneras:
Como ciencia:
Estudia el comportamiento de masas buscando las caractersticas generales de un colectivo y
preside de las particulares de cada elemento. Por ejemplo: al investigar el sexo de los nacimientos
despus obtener la proporcin del sexo masculino o del sexo femenino.
1. USOS Y ABUSOS
Uso:
Conocer el porcentaje de la poblacin que necesita agua.
Conocer el porcentaje de poblacin que tiene diabetes.
Conocer el porcentaje de personas que utilizan tomate para preparar sus comidas
Conocer el porcentaje de personas guatemaltecas que consumen tortilla.
Abuso:
Aprovechar dicho resultado para el aumento de precio.
Aprovechar el resultado para el aumento del precio de las medicinas.
Conocer el resultado de dicho estudio y aumentarles el precio.
Conocer el resultado de dicho y aumentar el precio.
2. ASPECTOS FUNDAMENTALES:
TECNICAS DE MUESTREO
Como se ha puesto de manifiesto, gran parte del trabajo de un estadstico profesional se hace con
muestras. Estas son necesarias porque las poblaciones son casi siempre demasiado grandes para
estudiarlas en su totalidad. Exigira demasiado tiempo y dinero estudiar la poblacin entera, y
tenemos que seleccionar una muestra de la misma, calcular el estadstico de esa muestra y
utilizarlo para estimar el parmetro correspondiente de la poblacin.
La obtencin de la informacin se puede realizar por diversos medios.
Una forma es a travs de una encuesta a un grupo de individuos, donde a cada uno se le hacen las
mismas preguntas.
Otra forma es a travs de experimentos donde la respuesta a la variable es el resultado del
experimento. Puede tambin recolectarse los datos en forma directa, es decir, la informacin se
extrae de alguna base de datos seleccionando una muestra de ellos.
En cualquiera de estos casos contamos con una seleccin de informacin llamada muestra y que
se procede a analizar.
Existen diferentes tcnicas para realizar el muestreo y que depender cada caso, cual usar.
Algunas de ellas son:
1. Muestreo aleatorio simple: todos los elementos de la poblacin tiene igual posibilidad de ser
escogido y se eligen al azar.
2.
Si hubiese una escala para medir la amistad, nos daramos cuenta que amigos hay
muy pocos Le Thierre
Como sabemos las caractersticas personales como estatura , edad, gnero,
habilidades, tamaos de un determinado grupo se los conoce como variables,
sabemos que existe una gama muy diferenciada de variables de las cuales se pude
extrapolar diferentes escalas para ser medibles, la aplicacin de la bioestadstica para
medir caracterstica y valores tanto cualitativos como cuantitativos a travs de la
utilizacin de escalas que permitan medir de mejor manera un resultado obtenido.
MEDICION DE VARIABLES
Antes que una variable sea tratada estadsticamente debe ser observada/medida
para un conjunto de unidades observacionales, las unidades observacionales
son aquellos entidades que se observan, cuando las observaciones se
cuantifican (es decir se expresan numricamente) se dice que los nmeros son
medibles, una medicin es una observacin que se expresa fsicamente en
forma numrica, es decir cuando se le otorga un valor determinado segn su
magnitud.
De lo anteriormente mencionado podemos deducir que existen diferentes formas de
medir variables, algunas se las puede medir directamente por ejemplo la temperatura,
la tensin arterial, la inteligencia, y otros en forma indirecta, como el grado de
aprovechamiento de una determinada asignatura, la eficiencia, eficacia, el amor , ser
romntico, ser buen mal estudiante, etc.
Algunos de esos mtodos de evaluacin de medicin de variables (escalas) podran
arrojar datos numricos u otros podran ser expresados en palabras, de esto depende
la credibilidad de la investigacin basada en la exactitud, conveniencia, y significado
de las mediciones que podran ser el origen de las conclusiones, recomendaciones y
acciones, fruto de la resolucin del fenmeno problema. Una vez que agrupamos
estas caractersticas de los individuos de los elementos observados ( variables) en
categoras en grupos clases, esta agrupacin de caracterstica comunes
similares nos permite clasificarlas en :
CLASIFICACION DE LAS ESCALAS
Las Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al
mismo tiempo se sub dividen en:
Cualitativas :
Escala ordinal
Cuantitativas:
Escala cronolgica
Escala intervalar
Escala de razn
ESCALA NOMINAL CLASIFICATORIA
Este tipo de variables no presentan un ordenamiento previo, ms al contrario es
arbitraria, de ah que se haya ideado tres parmetros para entender mejor este tipo de
escala; variable, escala y diferencia, por ejemplo
Variable : PROFESION
Escala : INGENIERO
MEDICO
ABOGADO
ENFERMERO
ODONTOLOGO
Otros ejemplos:
Variable: DEPARTAMENTOS DE BOLIVIA
Escala: La paz
Cochabamba
Oruro
Potos
Tarija
Beni
Diferencia: Ninguna .
Variable: Sexo
Escala: Masculino
Femenino
Diferencia: Ninguna
Variable: Estado civil
Escala: Soltero
Casado
Divorciado
Viudo
Unin estable
Diferencia: Ninguna.
ESCALA ORDINAL
Escala : PRIMARIAS
SECUNDARIA
SUPERIOR
POST SUPERIOR
Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes de
grado primario con los de nivel superior existe no solo aos de experiencia, sino
conocimiento. ,
Otros ejemplos:
1. Variable: GRADO DE MILITAR y/o POLICIAL
Escala: SOLDADO
SARGENTO
SUBOFICIAL
OFICIAL
GENERAL
Diferencia: Existe diferencia entre los grados jerrquicos no solo en aos de
experiencia sino en aos de estudio.
Variable: JERARQUIA FAMILIAR
Escala: HIJO MENOR
HIJO MEDIO
HIJO MAYOR
MADRE PADRE
PADRE MADRE
Diferencia: Existe diferencia entre los grados jerrquicos de la familia no solo en aos
de experiencia sino en edad.
ESCALA DISCRETA DISCONTINUA
Se dice que si la variable medida es susceptible a ser contada, se puede construir una
escala discreta, formada por nmeros ENTEROS con incrementos fijos, donde las
fracciones no son consideradas, para esto, se debe considerar la magnitud de los
nmeros expuestos. Por ejemplo:
9,5 Kg
Amplitud: Entre 6,5 y 9,5 kg, existe una amplitud de 4,0 kg.
Variable: TIEMPO EN HORAS
Escala: 1,10 hrs.
2,10 hrs.
3,10 hrs.
4,10 hrs.
Amplitud: Entre 1,10 y 4,10 horas, existe una amplitud de 4 horas.
ESCALA DICOTOMICA
Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo
esta variable de tipo cualitativo cuantitativo dependiendo de la informacin
resultado que se busque, por ejemplo:
ESCALA CRONOLGICA
Escala de medicin : al 1 ao
5 aos
25 aos
50 aos
75 aos
100 aos
ESCALA DE RAZN
En esta escala SI EXISTE EL CERO ABSOLUTO y la magnitud de diferencia entre los
valores numricos entre s por ejemplo :
Variable: RELACIN ENTRE LAS EDADES
Escala: Juan recin nacido (0 aos)
Jos 9 aos ( 9aos ms )
Joaqun 18 aos (9 aos que Jos y 18 aos ms que Juan)
3. ORGANIZACIN DE DATOS:
RECOPILACION DE DATOS
En un estudio estadstico los mtodos que se aplican son:
A) Recopilacin: De acuerdo con la localizacin de la informacin los datos
estadsticos pueden ser internos y externos.
Los internos son los registros obtenidos dentro de la organizacin que hace un estudio
estadstico,
Los externos se obtienen de datos publicados y encuestas.
B) Organizacin: En la organizacin de los datos recopilados, el primer paso es
corregir cada uno de los elementos recopilados.
C) Representacin: Hay 3 maneras de presentar un conjunto de datos mediante
enunciados, tablas estadsticas y grficas estadsticas.
D) Anlisis: Despus de los datos anteriores los datos estadsticos estn listos para
hacer analizados, para lo cual frecuentemente se emplean operaciones matemticas
durante el proceso de anlisis.
METODO PARA LA RECOLECCION DE DATOS
En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que
se desea investigar. Discutiremos aqu los mtodos ms importantes, incluyendo las ventajas y
limitaciones de estos.
La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen
frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente,
directamente a la persona investigada. El investigador efectuar a esta persona una serie de
preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas
correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite
obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a
que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier
duda que se presente sobre el cuestionario o investigacin.
Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las
preguntas al nivel intelectual de las personas entrevistadas.
Una de las desventajas de este mtodo se debe a que si el entrevistador no obra de buena f o no
tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.
Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes
o entrenadores y los supervisores de estos, sobre todo si se trata de una investigacin extensa.
Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el
instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las
preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar
interpretaciones errneas.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no
hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal.
Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante
bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido
recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como
consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el
investigador.
Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la
persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y
econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las
preguntas es siempre fcil.
Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que
pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este
mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente
podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser
entrevistados.
a.
b.
c.
Datos propios de la investigacin, son los datos que interesa conocer para construir el
propsito de la investigacin.
Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la
encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada
por no tener ningn tipo de inters para el estudio.
Consideraciones que debemos tomar en cuenta:
El cuestionario debe ser conciso; tratar en los posible de que con el menor nmero de
preguntas, se obtenga la mejor informacin.
Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas
procurando que se relacionen unas con otras.
Series o distribuciones estadsticas:
Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado,
sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se
obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o
secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos
obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se
denominan "series estadsticas", tambin conocidas como "distribucin estadstica".
Clasificacin de las series estadsticas:
1.
Ejemplo:
Produccin nacional de madera en Rola en m
Rollizos (periodo 1993 1998)
Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos
producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos
instantes o periodos de tiempo.
3.
3
4
Tabulando los datos tenemos
Nios distribuidos por edades:
Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da
lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a
su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se
refieran a atributos o variables respectivamente.
2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de
atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de
modalidades.
Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un
carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el
atributo, "frecuencia cualitativa".
Ejemplo:
Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I,
respecto a su estado civil.
Estudiantes de la materia Estadsticas I, clasificados por su estado civil.
2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se
repiten (frecuencia) al ser observada una variable.
Ejemplo:
2.2) series especiales o geogrficas: es aquella que est formada por los valores que toman una
variable en funcin del espacio geogrfico.
TABULACION DE DATOS
La tabulacin consiste en presentar los datos estadsticos en forma de tablas o cuadros.
Forma de tabular
VARIABLES CUALITATIVAS
Pueden representarse:
_ La frecuencia absoluta (smbolo: f n), que es el n de veces que aparece cada modalidad
(resultado del recuento). La frecuencia total, de todas las modalidades juntas, se representa por N.
_ La frecuencia relativa (fr) o proporcin se obtiene dividiendo la frecuencia de cada modalidad
entre el total de datos. fr = f / N . Los valores posibles oscilan entre 0 y 1.
Suele expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 un nmero muy
cercano al 1, si ha habido redondeos.
_ El porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100 % =
(f*100)/N. Suele expresarse con 3 dgitos. La suma de todos los porcentajes debe dar 100 o un
nmero muy prximo, si ha habido redondeos.
f
25
fr
0.125
%
12.5
f
25
fr
0.125
%
12.5
a
Lactantes
Preescolares
Total
95
80
200
0.475
0.400
1
47.5
40
100
120
200
0.6
1
60
100
En la tabla definitiva no se presentan todos estos parmetros, sino los ms adecuados en cada
caso concreto. Casi siempre f y/o %. Slo el porcentaje, sin que conste N, no es correcto. En este
ejemplo bastara con f y %.
VARIABLES CUANTITATIVAS
Los datos se agrupan segn la frecuencia de los valores. Es lo que se denomina Distribucin de
frecuencias. La forma de tabular depende del n de datos.
----Si son pocos (la mayora de autores pone el tope en 30), se hace una tabla simple de forma
similar a lo visto para las variables CL. Cada dato equivale a una modalidad. Al final nos
quedaremos con la f de cada nmero y si se prefiere tambin con el %. Los nmeros se ordenan
de menor a mayor o de mayor a menor. La tabla puede hacerse en sentido vertical u horizontal.
Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1 , 4)
x
f
1
2
2
4
4
2
7
3
9
2
O bien,
x
1
2
4
7
9
---Si son muchos se agrupan en clases, que son intervalos sucesivos de valores. Los datos se
asignan a la clase que les corresponde y se cuentan los datos de cada clase, que est
representada por el punto medio o centro de clase (pm c).
f
2
4
2
3
2
Esta agrupacin es arbitraria con dos condiciones esenciales: que las clases sean mutuamente
excluyentes y que todos los datos puedan se asignados a una clase. Ahora bien, la experiencia ha
ido introduciendo una serie de normas, que permiten hacer esta agrupacin de la forma ms
racional posible.
Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible entre
ambos extremos de la distribucin fijando as los lmites definitivos de la tabla.
5)
6)
7)
Escribir la TABLA DEFINITIVA. Son obligadas las clases y la frecuencia absoluta, pudiendo aadir
otros parmetros, si se considera que mejoran la informacin. Una tabla excesivamente prolija
resulta ms difcil de leer. Por tanto la norma es: poner todo lo necesario, pero no ms de lo
necesario.
Es recomendable probar con al menos 2 tablas y elegir la que quede mejor
EJEMPLO 1:
Tabular los 70 valores siguientes:
DATOS ORIGINALES (N = 70)
40 55 19 51 62 15 20 44 60 60 45 15 21 31 13 44 41 43 51 35 50 33 25 16 61
14 14 59 59 59 20 23 25 29 29 59 58 54 50 49 39 27 37 23 24 58 27 28 57 32
32 34 57 56 35 35 54 36 43 46 52 50 49 42 43 46 40 39 31 48
PASOS DE LA TABULACION
-dato mayor: 62, cuyo LRS es 62,5
-dato menor: 13, cuyo LRI es 12,5
-recorrido (R): 62,5-12,5 = 50 (62-13)+1 = 50
-n de clases (NC): 7 u 8
-amplitud (i):
-si NC = 7 , i = 50/7 = 7,1 8 (par)
-si NC = 8 , i = 50/8 = 6,2 7 (impar)
-nos quedamos pues con NC = 8 de amplitud 7, que es impar
-sobras: (8*7) 50 = 6 , que repartimos as: 3 abajo y 3 arriba
la 1 clase empezar en 10 (13-3)
la ltima terminar con el 65 (62+3)
--ya se puede construir el esquema de la tabla (clases, LR y punto medio) y proceder al recuento
de los datos que corresponden a cada clase, para completar las otras columnas
Clases
Lmites reales
punto medio c
fr
fr
9,5 16,5
16,5 23,5
23,5 30,5
30,5 37,5
37,5 44,5
44,5 51,5
51,5 58,5
58,5 65,5
13
20
27
34
41
48
55
62
6
6
8
11
11
11
9
8
70
0,09
0,09
0,11
0,16
0,16
0,16
0,13
0,11
1,01
8,57
8,57
11,4
15,7
15,7
15,7
12,9
11,4
99,94
6
12
20
31
42
53
62
70
0,09
0,17
0,29
0,44
0,60
0,76
0,89
1,00
8,57
17,1
28,6
44,3
60,0
75,7
88,6
100
(Lmites tabulados)
10 16
17 23
24 30
31 37
38 44
45 51
52 58
59 - 65
Suma
Frecuencia
xi
3
4
5
6
7
8
5
4
6
2
2
1
Los valores de las variables estadsticas continuas se agrupan por intervalos o clases. Adems, si
la variable es discreta y toma muchos valores, tambin se suele agrupar por intervalos o clases.
El valor medio de cada clase o intervalo se llama marca de clase y se calcula como la semisuma
de los extremos del intervalo.
El recorrido de la variable es la diferencia entre el valor ms grande y el ms pequeo. La
amplitud de cada intervalo se calcula dividiendo el recorrido de la variable entre el nmero total de
intervalos.
Ejemplo 3.- A los 100 empleados de una empresa de piezas de precisin, se les ha realizado una
prueba de habilidad manual. En una escala de 0 a 100 se han obtenido las siguientes
puntuaciones:
27, 66, 32, 55, 46, 37, 75, 81, 18, 33, 47, 74, 37, 52, 47, 66, 80, 87, 37, 29,
46, 15, 29, 90, 76, 67, 23, 35, 94, 23, 25, 56, 73, 78, 17, 28, 76, 58, 45, 36,
55, 60, 17, 56, 23, 82, 64, 50, 51, 45, 37, 65, 62, 26, 69, 36, 54, 42, 40, 54,
27, 62, 28, 65, 46, 92, 36, 33, 23, 66, 18, 82, 47, 49, 59, 45, 73, 43, 47, 83,
78, 65, 39, 36, 53, 91, 38, 35, 68, 78, 91, 23, 34, 43, 55, 56, 74, 56, 62, 38.
Observamos que los valores extremos son 15 y 94. La amplitud total entre los datos es de 80
puntos, ya que ambas puntuaciones estn incluidas.
Agruparemos los datos en 8 intervalos de amplitud 10:
14,24 , 24,34 , , 84,94 . Realizando el recuento con atencin, se obtiene la tabla que sigue:
Habilidad manual
Marca de clase
14,24
24,34
34,44
44,54
54,64
64,74
74,84
84,94
Frecuencias
xi
fi
19
10
29
12
39
17
49
18
59
13
69
13
79
11
89
Frecuencia absoluta (
dato
xi
fi
) de cada valor
xi
.
Frecuencia absoluta acumulada (
Fi
) de cada valor
xi
xi
xi
f
correspondiente i entre el nmero total de datos N.
fr
fi
N
xi
Frecuencia
Frecuencia
Frecuencia
Frecuencia
absoluta
absoluta
relativa
relativa
fi
acumulada
hi
acumulada
Fi
3
4
5
6
7
8
5
4
6
2
2
1
5
9
15
17
19
20
Hi
0,25
0,2
0,3
0,1
0,1
0,05
0,25
0,45
0,75
0,85
0,95
1
5.
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos
resumen la informacin contenida en ella
MEDIDAS POSICION
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos,
que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los
percentiles.
PERCENTILES:
son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el
85%
CUARTILES:
son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles:
DECILES:
son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales,
son tambin un caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.
ni
x
Ni
14
14
10
24
15
39
26
65
20
85
15
100
n=1
00
Solucin:
1. Primer cuartil:
2. Segundo cuartil:
3. Tercer cuartil:
Si los datos estn agrupados utilizamos las marcas de clase, es decir c i en vez de xi.
MEDIANA
(Me):es el valor que separa por la mitad las observaciones ordenadas de menor a
mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el
nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la
media aritmtica de los dos valores centrales.
MODA
(M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica.
Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:
DESVIACIN
TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al
cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que
se define como la raz cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la
frmula (cuasi desviacin tpica):
RECORRIDO
CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto
cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.
MEDIDAS DE FORMA
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras
de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y
negativo cuando existe asimetra a la izquierda.
EJEMPLO 1
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra
mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos
dos valores nos dar a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmtica de la distribucin.
Sx2=
S = 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 das
El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media
aritmtica
CV = 20,67/52,3 = 0,39
COVARIANZA
12
16
76
CORRELACION
La correlacin trata de establecer la relacin o dependencia que existe entre
las dos variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las variables estn
correlacionadas o que hay correlacin entre ellas.
Tipos de correlacin
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.
2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.
3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos
tiene una forma redondeada.
Grado de correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la
nube de puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3. Correlacin nula
COEFICIENTE DE CORRELACION LINEAL
El coeficiente de correlacin lineal es el cociente entre la covarianza y el
producto de las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.
2 Calculamos la covarianza.
coeficiente de Pearson
(1) sobre la pregunta uno, nos indica si dos variables parecen estar
correlacionadas o no; (2) con respecto a la pregunta dos, el coeficiente de
Pearson indica la fuerza de la aparente relacin; y (3) el coeficiente, por ltimo,
nos indica si la aparente relacin es positiva o negativa. Como ya sabemos, el
anlisis de correlacin no puede responder a la ltima pregunta.
El coeficiente de correlacin de Pearson (r) se mide en una escala de 0 a 1, tanto
en direccin positiva como negativa. Un valor de 0 indica que no hay relacin
lineal entre las variables. Un valor de 1 o 1 indica, respectivamente, una
correlacin positiva perfecta o negativa perfecta entre dos variables. Normalmente,
el valor de se ubicar en alguna parte entre 0 y 1 o entre 0 y 1.
En las ciencias sociales en general y en educacin en particular, donde la mayora
de las variables son simultneamente afectadas por una gran multitud factores,
una correlacin positiva de 0,7 o una correlacin negativa de 0,7 se considera
muy fuerte. (Por ltimo, tenga en mente el coeficiente de Pearson mide slo
relaciones lineales entre variables, y no es til para medir relaciones que no son
lineales.)
Cuadro 15. El coeficiente de Pearson de correlacin.
Valor del
Coeficiente de Pearson
Grado de Correlacin
entre las Variables
r=0
Ninguna correlacin
r=1
0<r<1
Correlacin positiva
r = -1
-1 < r < 0
Correlacin negativa
Ntese que una correlacin negativa no es menos fuerte que una correlacin
positiva. As, por ejemplo, un de 0,5 es tan grande o fuerte como un de 0,5. Los
signos positivos y negativos slo indican si el valor de una variable aumenta o
disminuye, respectivamente, con el aumento en el valor de la otra variable. Como
usted sabe, cuando los aumentos (disminuciones) de una variable producen
aumentos (disminuciones) en la otra, la relacin es positiva. Es negativa cuando
los aumentos (disminuciones) de una variable producen disminuciones (aumentos)
en la otra.
Segn su opinin, las calificaciones profesionales de los maestros estn
correlacionadas en forma positiva o negativa con el rendimiento de los
estudiantes? Qu sucede con el tamao de la clase? Y el gasto en educacin?