Professional Documents
Culture Documents
com/
Por población estadística se entiende el conjunto de todos los elementos que comparten una o varias
características.
A cada uno de los elementos que componen una población se les denomina de manera genérica
entidades estadísticas, y de acuerdo con el número de entidades que halla en una población, ésta
puede ser finita o infinita
Una muestra es un subconjunto representativo de los elementos de una población. Una muestra no
representativa puede aportar una descripción distorsionada, y por tanto incorrecta, de la población.
Parámetro y estadístico
A cualquiera de los valores numéricos que se refieren a la población se les denomina parámetro.
Los parámetros poblacionales tienen valores únicos, en cambio, los estadísticos pueden tener tantos
valores diferentes como muestras se extraigan de la población.
Los parámetros se simbolizan con letras griegas (m, p, s?), mientras que los estadísticos se simbolizan
con letras mayúsculas.
Característica y Modalidad
Una característica es una propiedad de los individuos de una población.
Una modalidad es cada una de las variantes como se manifiesta una característica. P.E. El estado
civil, o las creencias religiosas, son características que presentan pocas modalidades.
En el ámbito de la Psicología las características son tales como la personalidad, memoria, percepción,
atención, inteligencia, motivación, etc.
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Una escala de medida es, en un sentido general, un procedimiento mediante el cual se relacionan de
manera biunívoca un conjunto de modalidades (distintas) con un conjunto de números (distintos).
Estos es, a cada modalidad le corresponde un sólo número, y a cada número le corresponde una sola
modalidad.
Atendiendo a las relaciones que puedan verificarse empíricamente entre las modalidades de los objetos
o características pueden distinguirse cuatro tipo de escalas de medida: nominal, ordinal, de
intervalos y de razón.
Otro concepto relacionado con las escalas de medidas es el de transformación admisible, el cual hace
referencia al problema de la unicidad de la medida y que puede plantearse de la siguiente forma: ¿son
las representaciones numéricas que hacemos de las modalidades las únicas posibles? NO.
Escala nominal
Se utiliza en todas aquellas modalidades o características en las que la única comprobación empírica
que puede hacerse es la de igualdad o desigualdad.
Supongamos que se dispone de un conjunto de n elementos (o1, o2, ?, on) con una determinada
característica que adopta k modalidades diferentes. A la modalidad de un objeto genérico oI, la
representamos por m(oi), y al número que asignamos a dicha modalidad lo representamos por n(oi). La
regla de asignación de números a los objetos, de modo que se preserven las relaciones empíricas
observadas entre estos debe cumplir las siguientes condiciones:
La transformación admsible es: cualquiera que preserve las relaciones de igualdad-desigualdad de los
objetos respecto a una determinada característica.
Escala ordinal
Los objetos pueden manifestar determinada característica en mayor grado unos que otros. Ej. La
dureza de los minerales.
Supongamos que se dispone de un conjunto de n objetos (o1, o2, ?, on)y cada uno posee una cierta
magnitud de una determinada característica [m(o1), m(o2), ?, m(on)]. La escala para asignar números
a los objetos [n(o1), n(o2), ?, n(on)],de modo que reflejen esos diferentes grados en que los objetos
presenten la característica, ha de cumplir las siguientes condiciones:
Escala de intervalos
Permite establecer la igualdad o desigualdad de las diferencias enre las magnitudes de los objetods
medidos. Ej. Termómetro, calendario.
Supongamos que los valores asignados a los objetos sean una representación numérica correcta de sus
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
relaciones empíricas. Para todo cuarteto de objetos genéricos, o I, oj, ok, ol, los valores asignados n(o i),
n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(o i
), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:
Es decir, una trasformación lineal tal de los valores iniciales de una escala de intervalo deja la escala
invariante respecto a las condiciones estipuladas en el párrafo anterior. Este tipo de transformación
supone un cambio en los dos aspectos que caracterizan la escala de intervalo. Por un lado, el valor a,
como constante aditiva, provoca un cambio en el origen. Por otro lado, el factor b provoca un
cambio en la unidad de medida que se toma para construir la escala (sólo cuando b = 1 la unidad
de medida no se altera).
Escalas de razón
Las escalas de intervalo sirven para medir características en las que el valor cero no significa ausencia
de dicha característica. Los valores en una escala de razón tienen un valor absoluto, no arbitrario, o
valor cero absoluto que sí significa ausencia de característica.
Para todo cuarteto de objetos genéricos, o i, oj, ok, ol, los valores asignados n(o i), n(oj), n(ok), n(ol), a
las magnitudes con que dichos objetos poseen una determinada característica m(o i), m(oj), m(ok), m(ol
), deben cumplir las siguientes condiciones:
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Al tener un origen de escala absoluto, la única transformación admisible para la escala de razón es del
tipo: t[n(oi)] = a . n(oI), siendo a > 0.
Conclusiones
Tipo de escala Transformación admisible Ejemplos
acerca de
Dureza
Relaciones minerales,
Cualquiera que
del tipo prestigio socia
preserve el orden o
ORDINAL 'mayor que', de
grado de magnitud de
'menor que' o profesiones,
los objetos
'igual que' ubicación
ideológica.
Igualdad o Calendario,
INTERVALO desigualdad a + b.x (b>0) temperatura,
de diferencias inteligencia
Igualdad o
Longitud,
RAZON desigualdad b.x (b>0)
masa, tiempo
de razones
Variables.Clasificación y Notación
Una variable, en su acepción estadística, es una representación numérica de una característica.
Cuando una característica presenta una sola modalidad decimos que se trata de una constante.
CLASIFICACIÓN
Clasificación por el tipo de escala de medida:
- Variables nominales
- Variables ordinales
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
- Variables de intervalo
- Variables de razón
Este tipo de clasificación rara vez se utiliza, en su lugar se distinguen tres grandes tipos de variables,
que engloban las cuatro derivadas del tipo de escala:
Cualitativa
En general, cualquier variable medida a un nivel superior de escala nominal es susveptible de ser
categorizada; cuando esto sucede se dice que la variable ha sido dicotomizada, si se han establecido
sólo dos categorías y politomizada si se han establecido más.
Cuantitativa
- Discreta, si los valores que puede asumir la variable son números enteros.(ej. Hijos de
una pareja)
- Continua,si la variable puede tomar cualquier valor de la escala de números reales. Las
variables continuas, por razón del nivel de precisión de los instrumentos de medida, puede
considerarse a efectos prácticos estadísticos como variables discretas.(al pesar un objeto
con una balanza de precisión de 1 gramo, el peso que se lee se conoce como valor
informado o valor aparente, mientras que los valores que acotan el intervalo (30,5 y
31,5) se conocen como límites exactos de la medida.
Cuasicuantitativa
En el ámbito de la metodología científica se emplea otra clasificación:
- V. independiente
- V. dependiente
- V. contaminante o V. intermedia .
NOTACIÓN DE VARIABLES
Para simbolizar las variables estadísticas se utilizan letras mayúsculas del alfabeto latino, afectadas por
un subíndice, para diferenciarlas de los valores constantes.
Reglas de sumatorio
1. Si los valores de una variable se multiplican por una constante, su sumatorio quedará
multiplicado por dicha constante.
2. El sumatorio de una constante c un número n veces es igual a n veces dicha constante.
3. El sumatorio de una suma con cualquier número de términos es igual a la suma de los
sumatorios de dichos términos tomados por separado.
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Consecuencias del sumatorio
Consecuencia 1: El sumatorio de una variable mas una constante es igual a la suma de la variable mas
n veces la constante
Doble sumatorio
Supongamos que un grupo total se descompone en k grupos con n1, n2, ., nk personas respectivamente
donde Xij representa la puntuación de la persona I que pertenece al grupo j.
Dicho en palabras, este doble sumatorio significa el sumatorio de los sumatorios de las puntuaciones
de las personas en cada grupo:
DISTRIBUCIÓN DE FRECUENCIAS
Ej.Variable: Procedencia población de inmigrantes
X ni pi Pi
Suramérica 24 0,16 16
Norteáfrica 60 0,40 40
Centroáfrica 12 0,08 8
Esteeuropa 18 0,12 12
China 21 0,14 14
Surasia 15 0,10 10
En la columna representada como X se representan todas las modalidades o categorias que representa
la variable.
La frecuencia relativa también se expresa en porcentajes, para lo cual hay que multiplicar cada una de
las proporciones por cien (Pi).
Frecuencia absoluta acumulada: es el número de veces que, en la muestra, se repite cada modalidad o
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
cualquiera de las modalidades anteriores.
Se simboliza por na. Se halla acumulando las frecuencias absolutas en orden ascendente.
Frecuencia relativa acumulada: simbolizada por pa, es el cociente entre la frecuencia absoluta
acumulada de cada clase, na, y el total de observaciones, n. Expresado formalmente: pa=na/n.
Pa=pa*100.
X ni pi Pi na pa Pa
El número total de observaciones, n, debe ser la suma del número de observaciones de cada clase, ni, y
debe coincidir con el valor de la frecuencia absoluta acumulada de la última modalidad de la variable.
Se dan casos en los que la variable se expresa en un amplio número de valores, entonces solo cabe la
estrategia de agrupar en intervalos estos valores.
Tambien se puede hallar (según Kaiser), el número de intervalos no debe exceder nunca de la raiz
cuadrada de n
X ni pI na pa
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
X ni pI na pa
100 1,00
Límites exactos de medida, son los valores que acotan el intervalo en el que se encuentra el valor
real.
La distribución de frecuencias de valores que son expresión discreta de una cantidad contínua (5,76)
deben realizarse teniendo en cuenta los límites exactos de medida, no los valores informados.
En general, para obtener los valores exactos, o límites, entre los que se encuentra el valor real de la
medida, se aplica la siguiente fórmula:
Por ejemplo, si se mide el tiempo que se emplea en ejecutar una determinada tarea, y para ello se
utiliza un cronómetro con precisión de centésimas de segundo (0,01), el tiempo real de un tiempo
aparente de 15,63 segundos se encontrará en el intervalo, Intervalo valor real= 15,63 0,01 *0,5 = 15,63
0,005 = 15,625 - 15,635
Conceptos:
Intervalo: sinónimo del concepto de modalidad, es cada uno de los grupos de valores que ocupan una
fila en una distribución de frecuencias.
Límites aparentes: virtuales o informados, son los valores mayor y menor de cada intervalo, teniendo
en cuenta el nivel de precisión del instrumento de medida.
Límites reales o exactos: son los valores máximo y mínimo que tendría cada intervalo si el
instrumento de medida tuviera una precisión perfecta.
Punto medio del intervalo: es la semisuma de los límites exactos o de los límites aparentes.
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Amplitud del intervalo: es la diferencia entre el límite exacto superior y el límite exacto inferior.
El segundo supuesto es el de la concentración de los valores en el punto medio del intervalo, y este
punto medio es la única información que vamos a tener de dicho intervalo.
REPRESENTACIONES GRÁFICAS
La representación gráfica es una forma útil de visualizar un conjunto de datos. El tipo de
representación gráfica depende de la variable objeto de estudio.
Diagrama de rectángulos
En el eje de abcisas se señalan las diferentes modalidades de la variable, y en el eje de ordenadas las
frecuencias absolutas o relativas.
Sobre cada valor de la variable se levanta un rectángulo, con base arbitraria pero igual para todos, cuya
altura será igual a la frecuencia que aparece en la tabla de distribución.
La suma de las alturas de todos los rectángulos debe ser igual al número total de datos, n, si se
representan frecuencias absoultas, o a 1 si se representan frecuencias relativas.
En muchos casos, los diagramas se presentan en sentido horizontal, es decir, situando las modalidades
en el eje de ordenadas y las frecuencias en el eje de abcisas.
Diagrama de barras
Sirve para representar distribuciones de frecuencia de variables discretas . En el eje de abcisas se
colocan, en orden ascendente de magnitud, los distintos valores observados en la variable, y en el eje
de coordenadas se colocan las frecuencias, absolutas o relativas, según se quiera representar una u otra.
Sobre cada valor del eje de abcisas se levanta una línea o barra hasta su frecuencia observada. La suma
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
de las longitudes de las líneas es igual al número total de casos observados, ó 1 si el diagrama es de
frecuencias relativas
Las frecuencias acumuladas, tanto absolutas como relativas, también se representan en diagrama de
barras.
Histograma
Se emplea para representar distribuciones de frecuencia de variables continuas cuando los datos
están agrupados en intervalos.
En el eje de abcisas se colocan los límites exactos de cada uno de los intervalos en que se han
agrupado los datos (todos con la misma amplitud) y sobre ellos se levantan rectángulos cuyas alturas
se igualan a la frecuencia correspondiente, absoluta o relativa.
Polígono de frecuencias
En el caso de que la variable sea discreta, el polígono de frecuencias es el gráfico que resulta de unir
los extremos superiores de las barras o líneas.
En el caso de que la variable sea continua, el polígono de frecuencias es el grafico que resulta de unir,
mediante una línea, los puntos medios de la base superior de los rectángulos del histograma.
Para que el área en el interior del polígono coincida con el del histograma correspondiente se unen los
puntos medios de los intervalos extremos (inferior y superior) con el punto medio del rectángulo
adyacente a cada uno, rectángulo que tiene una frecuencia cero.
Para el polígono de frecuencias acumuladas se toma como base el diagrama de barras acumulativas, si
la variable es discreta, o el histograma de frecuencias acumuladas, si la variable es continua.
En este último caso, se unen mediante una línea los extremos superiores de las bases superiores de los
rectángulos; en el rectángulo del intervalo inferior se traza una diagonal entre el extremo superior
derecho y el extremo inferior izquierdo.
Dentro de un mismo rango de valores (diferencia entre el valor máximo y el valor mínimo),
a medida que el número de observaciones aumenta también aumenta el número de intervalos, con
la consiguiente disminución en la amplitud de los intervalos.
Los polígonos de frecuencias resultantes de distribuciones con cada vez más intervalos van
suavizando el aspecto quebrado, hasta que, en el límite, cuando el número de intervalos tiende al
infinito y, por ende, la amplitud de los intervalos tiende a cero, presenta el aspecto (ideal) de una
curva completamente suavizada (curva normal o curva de Gauss).
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Cuantos más se conoce sobre los datos, más eficientemente pueden usarse para desarrollar, contrastar
y refinar las teorías.
Busca maximizar lo que se aprende de los datos y ello requiere asumir 2 principios básicos:
Por lo cual es previo a cualquier resumen estadístico la exploración gráfica de los datos.
Modo confirmatorio: La mayor parte de las veces el análisis estadístico se diseña para que los datos
confirmen (o refuten) las hipótesis que se plantean, en vez de plantearse la cuestión de manera
exploratoria de forma que sean los propios datos los que nos digan las relaciones que hay entre las
diferentes características objeto de estudio.
Entre las herramientas destacan las gráficas que permiten una rápida inspección de las propiedades de
la distribución de los datos: posición central, variabilidad y forma. Usan dos diagramas; el de Tallo y
Hojas y el de Caja.
Quedaría así:
1 7 7
9 8 033357788
22 9 0000223455677778899999
24 10 02222223344446777777788888
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Frecuencia Tallo Hojas
12 11 111124556789
2 12 06
Cuando el número de casos por tallo es muy grande, hay que dividirlo en varios subtallos.
Quedaría así:
6.00 7 23Z
8.00 7 789Z
25.00 8 000011233344
43.00 8 55566667788888888888999
74.00 9 000000000000001111111122222222223333333334444
88.00 9 5555555555666666666777777778888888888999999999999999
85.00 10 0000000000000011111111111112222222223333333344444
62.00 10 5555555555556666666667777777888889999999
56.00 11 0000000000001111111122222222333334444
29.00 11 55555555666666666778888999
19.00 12 00112333
5.00 12 5Z
Ancho
de 10
tallo
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
Frecuencia Tallo Hojas
Cada
3 casos
Hoja:
Diagrama de Caja
Facilita la inspección visual de las características más notables de una distribución de frecuencias.
Permite comprobar la distancia entre los cuartiles de la distribución así como su simetría
Este diagrama establece dos valores límites de la distribución, inferior y superior, de acuerdo a los
cuales se pueden identificar los casos que están fuera de estos límites, considerándolos como casos
atípicos de la distribución.
La caja es un rectángulo cuyos lados menores son los cuartiles 1 y 3 (percentiles 25 y 75), y los
Bigotes son las líneas que unen estos lados del rectángulo con el valor inferior y superior de la
distribución, respectivamente.
1.- Se determina el valor mínimo, el máximo y se calculan los Cuartiles Uno (percentil
25) y Tres (Percentil 75); tomando los valores de los cuartiles como lados menores, se
construye el rectángulo.
2.- Se calcula el Cuartil Dos (Mediana o Percentil 50), y se señala en el interior del
rectángulo.
3.- Se obtiene el rango intercuartílico (Cuartil 3ª menos cuartil 1º) y este valor se
multiplica por 1.5. Este valor servirá para determinar los casos atípicos.
4.- Para determinar el Límite Inferior para los casos atípicos, se resta el valor obtenido en
el paso 3del cuartil 1.
5.- Para determinar el Límite Superior para los casos atípicos, se suma el valor obtenido
en el paso 3 del cuartil 1º.
6.- Se dibuja una línea desde la caja hasta el valor mínimo de la distribución y otra desde
la caja hasta el valor máximo de la distribución son considerar los valores atípicos
encontrados en los 2 pasos anteriores.
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/
PROPIEDADES DE LA DISTRIBUCIÓN DE FRECUENCIAS
La forma de una distribución de frecuencias se caracteriza por cuatro propiedades básicas:
la tendencia central, la variabilidad, el sesgo o la asimetría y la curtosis o apuntamiento.
Tendencia central
Es un valor de la variable que se encuentra hacia el centro de la distribución de frecuencias. A este
valor se le denomina promedio y es un valor que sintetiza a todos los valores de la distribución .
Variabilidad
Es un índice o medida que resume el grado de concentración de los valores de una distribución en
torno a un promedio.
Si los valores están muy cercanos al promedio se habla de una distribución homogénea; si, por el
contrario, los valores se alejan del promedio se habla de distribución heterogénea.
Sesgo o asimetría
Se refiere al grado de simetría o asimetría de una distribución de frecuencias .
Si hay un número de observaciones similar por debajo y por encima del promedio se dice que la
distribución es simétrica.
Si hay una mayor frecuencia de valores bajos que de valores altos se dice que la distribución es
asimétrica positiva.
Si hay una mayor frecuencia de valores altos que bajos, se dice que la distribución es asimétrica
negativa.
Las distribuciones asimétricas positivas son propias de tareas o tests difíciles, al contrario que las
distribuciones asimétricas negativas, que suelen ser de tareas fáciles.
Curtosis o apuntamiento
Se refiere al grado de apuntamiento de la distribución de frecuencias .
Cuando es muy apuntada, se dice que es leptocúrtica, y si es muy aplastada, se dice que es
platicúrtica.
Descargado de http://www.psicologia-online.com/apuntes-de-psicologia/