You are on page 1of 22

1.

METODOS ESTADISTICOS

El mtodo estadstico consiste en una serie de procedimientos para el manejo


de los datos cualitativos y cuantitativos de la investigacin.
Dicho manejo de datos tiene por propsito la comprobacin, en una parte de la
realidad de una o varias consecuencias verticales deducidas de la hiptesis
general de la investigacin.

Las caractersticas que adoptan los procedimientos propios del mtodo


estadstico dependen del diseo de investigacin seleccionado para la
comprobacin de la consecuencia verificable en cuestin.

1.1 ANALISIS DE DATOS

El anlisis de datos consiste en la realizacin de las operaciones a las que el


investigador someter los datos con la finalidad de alcanzar los objetivos del
estudio. Todas estas operaciones no pueden definirse de antemano de manera
rgida. La recoleccin de datos y ciertos anlisis preliminares pueden revelar
problemas y dificultades que desactualizarn la planificacin inicial del anlisis
de los datos. Sin embargo, es importante planificar los principales aspectos del
plan de anlisis en funcin de la verificacin de cada una de las hiptesis
formuladas ya que estas definiciones condicionarn a su vez la fase de
recoleccin de datos.

Existen dos grandes familias de tcnicas de anlisis de datos:

Tcnicas cualitativas: en las que los datos son presentados de manera


verbal (o grfica) - como los textos de entrevistas, las notas, los
documentos-

Tcnicas cuantitativas: en las que los datos se presentan en forma


numrica.

Estas dos modalidades son especies radicalmente diferentes, utilizan


conocimientos y tcnicas completamente diferenciadas.
1.1.1 DEFINICIN DE ESTADSTICA

La mayor parte de las palabras tienen varios significados. La palabra


Estadstica no es una excepcin. En el lenguaje comn, la palabra se emplea
para denotar un conjunto de calificaciones o de nmeros, por ejemplo: una
persona puede preguntar has visto las ltimas estadsticas acerca del
desempleo?. El comentarista de deportes puede decir estas son las
estadsticas para la primera mitad del partido, o has ledo las estadsticas de
accidentes en carreteras durante las vacaciones?. El trmino estadstica
empleado as significa ms que datos numricos y no debe confundirse con la
misma palabra empleada en este fascculo.

El trmino estadstica tambin se emplea para designar un rea de estudio:


una disciplina. Como rea de estudio, la Estadstica proporciona los mtodos
que ayudan a resolver los problemas correspondientes, para ello es necesario
conocer los conceptos bsicos que conforman los contenidos de esta materia
tales como:
a) Poblacin.
b) Muestra.
c) Variable de Estudio.
d) Datos u observaciones.
e) Parmetros.
f) Estadgrafos o Estadsticos.

Definicin

Poblacin estadstica es un conjunto de personas, entidades u objetos del cual


se quiere saber algo que nos interesa para tomar una determinacin acertada.

Para facilitar el estudio de las poblaciones stas se clasifican en:


a) Poblacin finita.
b) Poblacin infinita.

Muestra

Una muestra es un conjunto de medidas u observaciones tomadas a partir de


una poblacin dada; es un subconjunto de la poblacin. Desde luego, el nmero
de observaciones en una muestra es menor que el nmero de posibles
observaciones en la poblacin, de otra forma, la muestra ser la poblacin
misma. Las muestras se toman debido a que no es factible desde el punto de
vista econmico usar a toda la poblacin.

En algunos casos es imposible recolectar todas las posibles observaciones en la


poblacin.

Definicin

Muestra representativa es un subconjunto de la poblacin que se estudia para


determinar el parmetro que describe la caracterstica deseada de la misma.

POBLACIN

MUESTRA

das las muestras son subconjuntos de la poblacin, pero no todas son


representativas.
Las muestras representativas se seleccionan aleatoriamente.

Definicin

Muestra aleatoria es aquella que se obtiene de tal manera que cada posible
observacin disponible en la poblacin tiene la misma probabilidad de ser
seleccionada.

Para poder obtener estas muestras es necesario que no intervenga la


preferencia del investigador por algn elemento de la poblacin; es decir, cada
elemento de la poblacin deber tener igual oportunidad de ser seleccionado.
Los promedios y proporciones muestrales son caractersticas medibles de las
muestras respectivas y se les llama estadsticas o estadgrafos.
1.1.2 ESTADSTICA DESCRIPTIVA E INFERENCIAL

En base a lo que se ha dicho se concluye, que la Estadstica como disciplina o


rea de estudio comprende tcnicas descriptivas como inferenciales. Incluye la
observacin y tratamiento de datos numricos y el empleo de los datos
estadsticos con fines inferenciales.
Para su estudio se clasifica de la siguiente forma:

Descriptiva

Estadstica

Inferencial

El origen de la Estadstica descriptiva puede relacionarse con el inters por


mantener registros gubernamentales hacia fines de la Edad Media. Cuando los
estados nacionalistas empezaron a surgir durante ese perodo, se volvi
necesario obtener informacin acerca de los territorios bajo la jurisdiccin de
cada nacin. Esta necesidad de informacin numrica acerca de los ciudadanos
y recursos lleva al desarrollo de tcnicos para obtener y organizar datos
numricos.

Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros


censos modernos. Al mismo tiempo, las compaas de seguros empezaban a
recopilar tablas de mortalidad para determinar las primas de seguros de vida.

En las primeras etapas de desarrollo, la estadstica inclua poco ms que la


obtencin, clasificacin y presentacin de datos numricos. An hoy en da,
estas actividades siguen siendo una parte importante de la Estadstica.
A continuacin, se da una definicin de Estadstica Descriptiva.

La Estadstica Descriptiva es el estudio que incluye la obtencin, organizacin,


presentacin y descripcin de informacin numrica.

Ejemplo:
Un director de escuela desea conocer las aptitudes de cinco secretarias que
trabajan en dicha institucin.
Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son
82, 85, 95, 92 y 91. La medida estadstica que emplea el director es la aptitud
promedio o media aritmtica, la cual es la suma de los valores obtenidos dividida
por el nmero de observaciones.
Entonces, la calificacin promedio es:
82+85+95+92+91 = 445 = 89
5 5 5

El clculo de la media aritmtica, simple como es, es una parte importante de la


estadstica descriptiva. El resultado se limita a los datos obtenidos en este caso
particular y no implica ninguna inferencia o generalizacin acerca de las
aptitudes de otras secretarias. Este mtodo es de naturaleza descriptiva, debido
a que el promedio condensa y describe la informacin obtenida, por ejemplo, en
el caso de las secretarias significa que el promedio de las aptitudes de las cinco
secretarias es 89%.

Estadstica Inferencial

Si el inters del director de la escuela va ms all de la informacin obtenida,


necesitar otras tcnicas distintas a loa mtodos descriptivos.

Por ejemplo; podra desear conocer la aptitud promedio de las dems


secretarias, pero carece del tiempo o de los recursos para aplicar una prueba a
todas ellas. Podra utilizar la calificacin promedio de las cinco secretarias como
base para realizar una inferencia o estimacin acerca de la aptitud promedio de
todas las secretarias.

Con ese fin, necesitar conocer otra rama de la Estadstica conocida como
Estadstica Inferencial o Inferencia Estadstica.

La inferencia estadstica es una tcnica mediante la cual se obtienen


generalizaciones o se toman decisiones en base a una informacin parcial
o completa obtenida mediante tcnicas descriptivas.

1.2 ENFOQUES DE ESTADISTICA


Clasificacin de la Estadstica en las Ciencias sociales
Clsica: descriptiva e inferencial
Bayesiana.

Clsica

Todo manejo de datos con la tendencia a definir el comportamiento de los


experimentos, procedimientos, controles, etc. que emplee informacin para
obtener conocimiento, es estadstica clsica y marca la diferencia entre decidir y
evaluar fenmenos. La estadstica es una ciencia que analiza series de datos y
trata de extraer conclusiones sobre el comportamiento de estas variables, las
cuales se pueden clasificar como:

Algunas autoridades la han definido como una tcnica especial apta para el
estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin
requiere una masa de observaciones de otros fenmenos ms simples llamados
individuales y que estudia los mtodos cientficos para recoger, organizar,
resumir y analizar datos, as como para sacar conclusiones vlidas y tomar
decisiones razonables basadas en tal anlisis.

b. Descriptiva: Se fundamenta en la descripcin y anlisis de las


caractersticas de un conjunto de datos, de donde se extrae informacin y
conclusiones sobre el comportamiento de los datos y relaciones existentes con
entre ellos o de ellos con otras poblaciones con las cuales se comparan. Se trata
de estimar, pronosticar y definir comportamientos que se puedan reproducir
bajos similares condiciones de experimentacin.

c. Inferencial: Est fundamentada en los resultados obtenidos del anlisis


de una muestra de poblacin, con el fin de inferir el comportamiento o
caracterstica de la poblacin, de donde procede, por lo que recibe tambin el
nombre de Inferencia estadstica. El objetivo de la inferencia en investigacin
cientfica y tecnolgica radica en conocer clases numerosas de objetos,
personas o eventos a partir de otras relativamente pequeas compuestas por los
mismos elementos.
1.2.3 NIVELES DE MEDICIN
Las Escalas y los Niveles de Medicin

Basndose en esta diferencia entre las formas de clasificar variables por


referencia a este criterio de calidad-cantidad, la Estadstica distingue, ya en un
grado mayor de complejidad, la medicin de acuerdo al tipo de escala o nivel de
medicin, en que se encuentran expresados los atributos que queremos medir.
Se trata de operaciones clasificatorias, o sea, ubicacin de las unidades de
anlisis en clases, clases que tienen ciertas propiedades formales. De estas
propiedades se deducen definiciones exactas de las caractersticas de la escala
mucho ms precisas de lo que pueden darse en trminos verbales. Estas
propiedades pueden formularse en forma ms abstracta de lo hasta aqu
expresado, mediante un conjunto de axiomas que delinean las operaciones para
elaborar las escalas y las relaciones entre los objetos a que se aplican.
Se distinguen cuatro tipos de escala:
A) Nominal.
B) Ordinal.
C) Intervalar.
D) De razones.

A. LA ESCALA NOMINAL

Consiste en clasificar objetos o fenmenos, segn ciertas caractersticas,


tipologas o nombres, dndoles una denominacin o smbolo, sin que implique
ninguna relacin de orden, distancia o proporcin entre los objetos o fenmenos.
En la escala nominal los nmeros slo sirven para distinguir categoras, estos no
poseen propiedades cuantitativas y sirven solamente para identificar las clases.
Por lo tanto, los numerales utilizados en la clasificacin no son cuantitativos. Ni
siquiera se puede realizar un orden de las observaciones con sentido.

La medicin se da a nivel elemental en estos casos (se dice que es el nivel ms


bajo de medicin).
En una escala nominal, la operacin de escalamiento consiste en partir de una
caracterstica dada y formar un subconjunto de clases que se excluyen
mutuamente. La nica relacin implicada es la de equivalencia. Esto es, los
miembros de cualquier clase deben ser equivalentes en la propiedad medida. La
relacin de equivalencia es reflexiva (x = x para todo x), simtrica (x = y luego y
= x) y transitiva (x = y et y = z luego x = z).

Los smbolos que designan a los diferentes grupos en una escala nominal
pueden intercambiarse sin alterar la informacin esencial de la escala; debido a
esto, las estadsticas de tipo descriptivo admisibles son aquellas que no se
alteran por este proceso: el modo, la frecuencia, el conteo, la proporcin, etc. Se
pueden desarrollar procesos analticos acerca de la distribucin de las
categoras, as como la posible relacin entre dos o ms caractersticas
clasificadas mediante este tipo de escala que llamaremos variables cualitativas.

Ejemplo de escala nominal: variable estado civil:


Viudo

Otros ejemplos de escala nominal:

- Sexo (1. masculino; 2. femenino)


- Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa)
- Departamento de origen (1. Artigas; 2. Canelones; 3. Colonia, etc.).
- Conformidad (1. Si; 0. No)

B. LA ESCALA ORDINAL

Para las mismas personas tambin se pueden medir propiedades donde la


clasificacin debe seguir un orden jerrquico. Se trata de la escala ordinal. Con
ella se establecen posiciones relativas de los objetos o fenmenos en estudio
respecto a alguna caracterstica de inters, sin que se reflejen distancias entre
ellos.

Suponga que a los clientes en un negocio se les hace unas preguntas para
valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo con las
siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy
insatisfecho). Estos datos son ordinales. Note que una valoracin de 1 no indica
que el servicio es dos veces mejor que cuando se da una valoracin de 2. Sin
embargo, podemos decir que la valoracin de 1 es preferiblemente mejor que 2,
y as en los dems casos.

Puede suceder que los objetos de una categora de las escala no sean
precisamente diferentes a los objetos de otra categora de la escala, sino que
estn relacionados entre s, guardan una relacin de jerarqua. Los numerales
empleados en las escalas ordinales no son cuantitativos, sino que indican
exclusivamente la posicin en la serie ordenada y no "cuantifican" la diferencia
entre posiciones sucesivas de la escala.

Las relaciones entre los elementos en clasificacin pueden formularse con el


signo >, mayor que, o sea que axiomticamente la diferencia fundamental entre
una escala nominal y una ordinal es que esta ltima incorpora no solamente la
relacin de equivalencia (=) sino tambin la relacin ''ms grande que'' (>). Esta
relacin es irreflexiva (no es verdad para ninguna x tal que x > x), asimtrica (x
> y luego x < y) y transitiva (x > y et y > z luego x > z).

Puesto que cualquier transformacin tendiente a conservar el orden no altera la


informacin contenida en una escala ordinal, se dice que la escala es "nica
hasta una transformacin monotnica". Esto es, no importa que nmeros se den
a una pareja de clases o a los miembros de esas clases, siempre que el nmero
mayor sea dado a los miembros de la clase mayor o ms preferida. Por supuesto,
pueden usarse nmeros menores para grados ms preferidos (3. de primera
clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es
indiferente el uso del nmero mayor o menor para denotar "mayor" o "ms
preferido".

Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base


en las llamadas "estadsticas de orden" o "estadsticas de rango": mximos,
mnimos, mediana, percentiles, etc.

Ejemplo de escala ordinal: satisfaccin con el resultado

1 Muy satisfecho
2 Satisfecho
3 Insatisfecho
4 Muy Insatisfecho
C. LA ESCALA DE INTERVALO

Representa un nivel de medicin ms preciso, matemticamente hablando, que


las anteriores. No slo se establece un orden en las posiciones relativas de los
objetos o individuos, sino que se mide tambin la distancia entre los intervalos o
las diferentes categoras o clases.

En este caso, la medicin se ejecuta en el sentido de una escala de intervalo;


esto es, si la asignacin de nmeros a varias clases de objetos es tan precisa
que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de
la escala, se ha obtenido una medida de intervalo. Una escala de intervalo est
caracterizada por una unidad de medida comn y constante que asigna un
nmero real a todos los pares de objetos en un conjunto ordenado. En esta clase
de medida, la proporcin de dos intervalos cualesquiera es independiente de la
unidad de medida y del punto cero. En una escala de intervalo, el punto cero y
la unidad de medida son arbitrarios.

Axiomticamente se puede ver que las operaciones y las relaciones en que se


origina la estructura de una escala de intervalo son tales que las diferencias en
la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden
asociarse con las posiciones de los objetos de tal manera que las operaciones
de la aritmtica puedan realizarse significativamente con las diferencias entre los
nmeros.

La consecuencia de cualquier cambio de los nmeros asociados con los objetos


medidos en una escala de intervalo debe preservar no solamente el orden de los
objetos sino tambin las diferencias relativas entre ellos. Esto es, la escala de
intervalo es "nica hasta una transformacin lineal". La escala de intervalo es la
primera escala verdaderamente cuantitativa. Las estadsticas paramtricas, son
las aplicables a estudios en estas escalas.

Ejemplo de variable Interval: etapas cronolgicas

2050
2000
1950
1900
Suponga que se est interesado en algn perodo histrico especfico y se estn
haciendo proyecciones demogrficas. Se quiere conocer el crecimiento
poblacional cada 50 aos. Obviamente los datos pueden ser ordenados
(semejante a los datos ordinales) en orden ascendente indicando pasado/s y
futuro/s sucesivamente. Adems, las diferencias entre los valores ordenados
pueden ser comparadas. Aqu el intervalo entre los valores de los datos 1900 y
1950 representan un incremento en la historia de 50 aos, y lo mismo en los
dems intervalos. Hay que tener encuentra que en esta escala no hay un cero
absoluto o real, el cero es arbitrario; depende del tipo de calendario que estemos
usando.

D: LA ESCALA DE RAZN

Cuando una escala tiene todas las caractersticas de una escala de intervalo y
adems un punto cero real en su origen, se llama escala de razn. Adems de
distincin, orden y distancia, sta es una escala que permite establecer en que
proporcin es mayor una categora de una escala que otra.

El cero absoluto o natural representa la nulidad de lo que se estudia. Las


operaciones y relaciones hechas con los valores numricos en una escala de
razn son correspondientes a una escala isomrfica de la estructura de la
aritmtica. Por consiguiente, las operaciones de la aritmtica son permisibles en
los valores numricos asignados a los objetos mismos, as como tambin en los
intervalos entre los nmeros como sucede en las escalas de intervalo. Implican
que las relaciones de equivalencia, relacin de mayor a menor, proporcin
conocida de dos intervalos y proporcin conocida de dos valores de la escala,
sean posibles de obtener operacionalmente. Los nmeros asociados con los
valores de la escala de razn son "verdaderos" nmeros con un verdadero cero;
solo la unidad de medida es arbitraria. As la escala de razn es "nica hasta la
multiplicacin por una constante positiva". Adems de los procesos paramtricos
bsicos de las escalas de intervalo, en las de razn pueden utilizarse estadsticas
como la media geomtrica, el coeficiente de variacin, las que requieren el
conocimiento del verdadero valor cero.
Ejemplo de variable de razn: nmero de miembros del hogar ocupados

Suponga que se quiere medir los ingresos percibidos por las distintas personas
empleadas en una empresa de servicios. Los valores relevados han sido, 2, 1
2, 2 2,3 en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en
el ingreso percibido puede ser comparado, pero tambin el incremento de lo
percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo
que el que existe entre 2.2 y 2.3 miles de pesos. Tambin, cuando comparamos
los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razn significativa, quien
gana 2,2 gana 10 % ms que quien gana 2, 0 miles de pesos.

3
2
1
0

1.3 MEDIDAS DE TENDENCIA CENTRAL


1.3.1 DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias es un conjunto de puntuaciones ordenadas en sus
respectivas categoras y generalmente se presenta como una tabla.
La frecuencia puede ser absoluta (fi): Es el nmero de veces que se repite un
determinado valor de la variable (xi). Se designa por fi.
Propiedad: la suma de todas las frecuencias absolutas es igual al total de
observaciones (n).

Ejemplo:
En un estudio entre 200 personas latinas que viven en el estado de california,
estados unidos, se les pregunto: Cmo prefiere que se refiera a usted en cuanto
a su origen tnico? Las respuestas fueron:
Tabla 1.1 Ejemplo de una distribucin de frecuencias
Variable: preferencias al referir el origen tnico
Categoras Cdigos (Valores) Frecuencias
- Hispano
- Latino
- Latinoamericano
- Americano
- Otros
- No respondieron
Total 1 2 3 4 5 6 52 88 6 22 20 12 200

Si una muestra (o una poblacin) es grande, es difcil observar sus diversas


caractersticas o calcular estadsticos como la media o la desviacin estndar.
Por esta razn es til organizar o agrupar los datos en bruto. Para ilustrar esto
suponga que se tiene una muestra que consta de las estaturas de 100
estudiantes varones de la universidad XYZ. Estos datos se organizan en clases
o categoras y se determina la cantidad de individuos que pertenece a cada
clase, lo que se llama la frecuencia de clase. El resultado, que se muestra en la
tabla 1.2, se conoce como distribucin de frecuencias o tabla de frecuencias.
La primera clase o categora, por ejemplo, consta de las estaturas que van de 60
a 62 pulgadas, lo que se anota como 60-62 y se le conoce como intervalo de
clase. Como hay 5 estudiantes cuya estatura pertenece a esta clase, la
frecuencia de clase correspondiente es 5. Puesto que una estatura registrada de
60 pulgadas de encuentra en realidad entre 59.5 y 60.5 pulgadas, mientras que
una estatura de 62 pulgadas est en realidad entre 61.5 y 62.5 pulgadas, este
intervalo de clase podra haber sido tambin 59.5-62.5, a los nmeros 59.5 y
62.5 se les llama lmites de clase. La amplitud del intervalo de clase j-simo, que
se denota con cj, que por lo general es el mismo para todas las clase (en cuyo
caso se denota c), es la diferencia entre el lmite de clase superior y el lmite
inferior. En este caso, c=62.5 59.5=3.
El punto medio del intervalo de clase, que se toma como representativo de la
clase, se llama marca de clase. En la tabla 1.2, la marca de clase
correspondiente al intervalo de clase 60-62 es 61.
Distribucin de frecuencias relativas
En la tabla 1.2 se dividi el nmero de estudiantes entre el total (100) y se
anotaron las frecuencias relativas o porcentuales y no la cantidad de estudiantes
en cada clase, el resultado es una distribucin de frecuencias relativas o
porcentuales. Por ejemplo, la frecuencia relativa o porcentual de la clase 63-65
es 18/100, es decir 18%.
Una distribucin de frecuencias relativas puede considerarse como una
distribucin de probabilidades empricas, las distribuciones de frecuencias
relativas se conocen como distribuciones de probabilidad emprica.

Qu otros elementos contiene una distribucin de frecuencias?


Estatura (Pulgadas) Nmero de estudiantes
- 60-62
- 63-65
- 66-68
- 69-71
- 72-74 5 18 42 27 8
TOTAL 100

Las distribuciones de frecuencias pueden completarse agregando los


porcentajes de casos en cada categora, los porcentajes vlidos (excluyendo los
valores perdidos), y los porcentajes acumulados (porcentaje de lo que se va
acumulando en cada categora, desde la ms baja hasta la ms alta).
La tabla 1.3 muestra un ejemplo con las frecuencias y porcentajes en s, los
porcentajes vlidos y los acumulados. El porcentaje acumulado constituye lo que
aumenta en cada categora de manera porcentual y progresiva (en orden
descendente de aparicin de las categoras), tomando en cuenta los porcentajes
vlidos. En la categora no se ha obtenido la cooperacin, se ha acumulado
74.6%. En la categora no se ha obtenido la cooperacin, se acumula 78.7%
(74.6% de la categora anterior y 4.1% de la categora en cuestin). En la ltima
categora siempre se acumula el total (100%)
Variable: cooperacin del personal con el proyecto de calidad de la empresa
Categoras Cdigos Frecuencias Porcentaje valido Porcentaje acumulado
- Si se ha obtenido la cooperacin.
- No se ha obtenido la cooperacin.
- No respondieron
Total 1 2 3 91 5 26 122 74.6 4.1 21.3 100.0 74.6 78.7 100.0

Las columnas porcentaje y porcentaje vlido son iguales (mismas cifras o


valores) cuando no hay valores perdidos; pero si tenemos valores perdidos, la
columna porcentaje vlido presenta los clculos sobre el total menos tales
valores. En la tabla 1.4 se muestra un ejemplo con valores perdidos en el caso
de un estudio exploratorio, sobre los motivos de los nios celayenses para elegir
su personaje televisivo favorito. Al elaborar el reporte de resultados, una
distribucin se presenta con los elementos ms informativos para el lector y la
descripcin de los resultados o un comentario, tal como se muestra en la tabla
1.5
Motivos de la preferencia de su personaje favorito
frecuencia Porcentaje vlido Porcentaje acumulado
Validos
Perdidos
TOTAL, Divertidos Buenos Tienen poderes Son fuertes Total No contestaron 142
10 23 19 194 3 197 72.1 5.1 11.7 9.6 98.5 1.5 100.0 73.2 5.2 11.9 9.8 100.0 73.2
78.4 90.2 100.0

De qu otra manera pueden presentarse las distribuciones de frecuencias?


Las distribuciones de frecuencias, especialmente cuando utilizamos los
porcentajes, pueden presentarse en forma de histogramas o grficas de otro tipo
(por ejemplo: de pastel)
Las distribuciones de frecuencias tambin se pueden graficar como polgonos de
frecuencias
Los polgonos de frecuencias relacionan las puntuaciones con sus respectivas
frecuencias. Es ms bien propio de un nivel de medicin por intervalos o razn.
Los polgonos se construyen sobre los puntos medios de los intervalos.
Los polgonos de frecuencias representan curvas tiles para describir los datos.
Nos indican hacia donde se concentran los casos (personas, organizaciones,
segmentos de contenido, mediciones de polucin, etc.

1.3.2 MEDIA ARITMTICA, MEDIANA Y MODA


Son puntos en una distribucin obtenida, los valores medios o centrales de sta,
y nos ayudan a ubicarla dentro de la escala de medicin. Las principales medidas
de tendencia central son tres: moda, mediana y media. El nivel de medicin de
la variable determina cul es la medida de tendencia central apropiada para
interpretar.
La moda es la categora o puntuacin que ocurre con mayor frecuencia.
La mediana es el valor que divide la distribucin por la mitad. Esto es, la mitad
de los casos caen por debajo de la mediana y la otra mitad se ubica por encima
de
Se ha obtenido la cooperacin del personal para el proyecto de calidad?
Obtencin Nm. de organizaciones Porcentajes
Si
No
No respondieron
Total 91 5 26 122 74.6 4,1 21.3 100.0
sta. La mediana refleja la posicin intermedia de la distribucin. Por ejemplo si
los datos obtenidos fueran:
24 31 35 35 38 43 45 50 57
La mediana es 38, porque deja cuatro casos por encima (43,45,50 y 57) y cuatro
casos por debajo (35,35,31 y 24). Parte a la distribucin en dos mitades. En
general, para descubrir el caso o la puntuacin que constituye la mediana de una
distribucin, simplemente se aplica la frmula: N+1
2
Si tenemos 9 casos, 9+1 entonces buscamos el quinto valor y ste es la mediana
2
Note que la mediana es el valor observado que se localiza a la mitad de la
distribucin, no el valor de cinco. La frmula no nos proporciona directamente el
valor de la mediana, sino el nmero de caso en donde est la mediana.
La mediana es una medida de tendencia central propia de los niveles de
medicin ordinal, por intervalos y de razn. No tiene sentido con variables
nominales, porque en este nivel no hay jerarquas ni nocin de encima o debajo.
Asimismo, la mediana es particularmente til cuando hay valores extremos en la
distribucin. No es sensible a estos. Si tuviramos los siguientes datos:
24 31 35 35 38 43 45 50 248
La mediana seguira siendo 38
La media es la medida de tendencia central ms utilizada y puede definirse como
el promedio aritmtico de una distribucin. Se simboliza como, y es la suma de
todos los valores dividida entre el nmero de casos. Es una medida solamente
aplicable a mediciones por intervalos o de razn. Carece de sentido para
variables medidas en un nivel nominal u ordinal. Es una medida sensible a
valores extremos. Si tuviramos las siguientes puntuaciones:
876432698
El promedio sera igual a 5.88. Pero bastara una puntuacin extrema para
alterarla de manera notoria:
8 7 6 4 3 2 6 9 20 (promedio igual a 7.22)
1.4 ANLISIS DE VARIANZA

En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn


terminologa inglesa) es una coleccin de modelos estadsticos y sus
procedimientos asociados, en el cual la varianza est particionada en ciertos
componentes debidos a diferentes variables explicativas.

Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el


estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces
conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al
uso de la distribucin F de Fisher como parte del contraste de hiptesis

El anlisis de la varianza parte de los conceptos de regresin lineal.

El primer concepto fundamental es que todo valor observado puede expresarse


mediante la siguiente funcin:

Donde Y sera el valor observado (variable dependiente), y X el valor que toma


la variable independiente.

sera una constante que en la recta de regresin equivale a la ordenada en


el origen, es otra constante que equivale a la pendiente de la recta, y e es
una variable aleatoria que aade a la funcin cierto error que desva la
puntuacin observada de la puntuacin pronosticada.

Por tanto, a la funcin de pronstico la podemos llamar "Y prima":

Y' = + *X

Podemos resumir que las puntuaciones observadas equivalen a las


puntuaciones esperadas, ms el error aleatorio:
Y = Y' + e (1.1)

Sabiendo este concepto, podemos operar con esta ecuacin de la siguiente


forma:

1) Restamos a ambos lados de la ecuacin (para mantener la igualdad) la media


de la variable dependiente:

2) Substituimos el error por la ecuacin resultante de despejar la ecuacin 1.1:


e = Y - Y'

Por tanto...

Y reorganizando la ecuacin:

Ahora hay que tener en cuenta que la media de las puntuaciones observadas es
exactamente igual que la media de las puntuaciones pronosticadas:

Por tanto:
Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora las
elevamos al cuadrado para que posteriormente, al hacer el sumatorio, no se
anulen:

Y desarrollamos el cuadrado:

Podemos ver que tenemos los numeradores de las varianzas, pero al no estar
divididas por el nmero de casos (n), las llamamos Sumas de Cuadrados.,
excepto en el ltimo trmino, que es una Suma Cruzada de Cuadrados (el
numerador de la covarianza), y la covarianza en este caso es cero (por las
propiedades de la regresin lineal, la covarianza entre el error y la variable
independiente es cero).

Por tanto:

O lo mismo que:

de un factor, que es el caso ms sencillo, la idea bsica del anlisis de la varianza


es comparar la variacin total de un conjunto de muestras y descomponerla
como:
Donde:

es un nmero real relacionado con la varianza, que mide la variacin


debida al "factor", "tratamiento" o tipo de situacin estudiado.

es un nmero real relacionado con la varianza, que mide la variacin


dentro de cada "factor", "tratamiento" o tipo de situacin.

En el caso de que la diferencia debida al factor o tratamiento no sean


estadsticamente significativa puede probarse que las varianzas muestrales son
iguales:

Donde:

es el nmero de situaciones diferentes o valores del factor se estn


comparando.
es el nmero de mediciones en cada situacin se hacen o nmero de
valores disponibles para cada valor del factor.

As lo que un simple test a partir de la F de Snedecor puede decidir si el factor o


tratamiento es estadsticamente significativo.

Visin general
Existen tres clases conceptuales de estos modelos:

1) El Modelo de efectos fijos asume que los datos provienen de poblaciones


normales las cuales podran diferir nicamente en sus medias. (Modelo 1)
2) El Modelo de efectos aleatorios asume que los datos describen una
jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas
por la jerarqua. Ejemplo: El experimentador ha aprendido y ha
considerado en el experimento slo tres de muchos ms mtodos
posibles, el mtodo de enseanza es un factor aleatorio en el
experimento. (Modelo 2)
3) El Modelo de efectos mixtos describen situaciones que ste puede tomar.
Ejemplo: Si el mtodo de enseanza es analizado como un factor que
puede influir donde estn presentes ambos tipos de factores: fijos y
aleatorios. (Modelo 3)

Supuestos previos
El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de intervalo.


Independencia de las observaciones.
La distribucin de los residuales debe ser normal.
Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS,


'sum of squares') en componentes relativos a los factores contemplados en el
modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con
un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los
efectos son lineales, puede resultar apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y


corresponde con la forma en que la distribucin chi-cuadrado ( o Ji-cuadrada)
describe la suma de cuadrados asociada.
Tipos de modelo

Modelo I: Efectos fijos

El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en


las que el experimentador ha sometido al grupo o material analizado a varios
factores, cada uno de los cuales le afecta slo a la media, permaneciendo la
"variable respuesta" con una distribucin normal.

Este modelo se supone cuando el investigador se interesa nicamente por los


niveles del factor presentes en el experimento, por lo que cualquier variacin
observada en las puntuaciones se deber al error experimental.

Modelo II: Efectos aleatorios (componentes de varianza)

Los modelos de efectos aleatorios se usan para describir situaciones en que


ocurren diferencias incomparables en el material o grupo experimental. El
ejemplo ms simple es el de estimar la media desconocida de una poblacin
compuesta de individuos diferentes y en el que esas diferencias se mezclan con
los errores del instrumento de medicin.

Este modelo se supone cuando el investigador est interesado en una poblacin


de niveles, tericamente infinitos, del factor de estudio, de los que nicamente
una muestra al azar (t niveles) estn presentes en el experimento.

You might also like