You are on page 1of 8

GLOSARIO CONCEPTOS ANÁLISIS DE DATOS I

GLOSARIO

(Índice de conceptos)

ASIMETRÍA

Propiedad de la forma de la distribución de frecuencias que indica en qué medida los


datos se alejan de la simetría. Es positiva si hay tendencia a puntuaciones bajas y
negativa si la hay a puntuaciones altas.

CARACTERÍSTICA y MODALIDAD

La característica es la propiedad o cualidad de un individuo. Por ejemplo, el género. La


modalidad, cada una de las maneras en que se presenta una característica. En el
ejemplo anterior, varón y mujer.

CENTIL

Medida de posición que consiste en 99 valores de una variable que dividen la


distribución en 100 partes iguales. Si a una puntuación le corresponde el centil 25
significa que dicha puntuación es superada por el 75% de los sujetos de la muestra.

CORRELACIÓN DE PEARSON

Índice que cuantifica si existe una relación lineal o no entre dos variables cuantitativas
(es la covarianza en puntuaciones típicas). Oscila entre -1 y +1, por lo que su
interpretación es más sencilla que la de la covarianza. Si es 0, indica que no hay
relación lineal entre las dos variables. A medida que se acerca a +1 la relación lineal
es mayor y es de tipo directa y a -1 la relación lineal es mayor pero inversa.

COVARIANZA

Índice que cuantifica si existe una relación lineal o no entre dos variables cuantitativas.
Se trata del promedio de los productos cruzados de las puntuaciones diferenciales. Si
su valor es nulo, indica que no hay relación lineal. Si es positivo, la relación es lineal
directa y si es negativo lineal inversa. Se utiliza poco a nivel descriptivo porque es
difícil de interpretar.

1
CURTOSIS

Grado de apuntamiento de la distribución de frecuencias. Si es alto, se denomina


distribución leptocúrtica y si es bajo platicúrtica.

DESVIACIÓN TÍPICA

Medida de variabilidad más utilizada que consiste en la raíz cuadrada de la varianza.


Se utiliza más que la varianza porque al calcular la raíz cuadrada se retoman las
unidades de medida originales para resumir las distancias entre las puntuaciones y la
media.

DISTRIBUCIÓN DE FRECUENCIAS

Forma de organizar los datos recogidos que permite resumir la información y facilita el
cálculo de los estadísticos descriptivos y la elaboración de gráficos.

DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO

Función que permite poner en relación a las características poblacionales (los


parámetros) y los estadísticos muestrales correspondientes a dichas características.

ESCALAS DE MEDIDA

Reglas para la asignación de números a las características.

ESCALA DE MEDIDA CUALITATIVA O NOMINAL

Los números asignados sólo informan sobre la igualdad o desigualdad de los


individuos en una característica. Por ejemplo, en el género podría asignare 0 si es
mujer y 1 si es varón, aunque cualquier otra asignación sería aceptable.

ESCALA DE MEDIDA ORDINAL

Los números asignados informan además del grado (mayor o menor) en que se
presenta la característica. Por ejemplo nivel de depresión (bajo, medio y alto).

2
ESCALA DE MEDIDA CUANTITATIVA

Los números asignados constituyen una unidad de medida. Por ejemplo,


la estatura (metros) o el peso (Kg.).

ESCALAS DERIVADAS

Se calculan a partir de las puntuaciones típicas para facilitar su interpretación. Si una


puntuación típica se simboliza mediante z, la escala derivada (a la que llamaremos T)
se expresa mediante: T = a z + b, donde a (en valor absoluto) es la desviación típica
y b la media de la escala T.

ESPACIO MUESTRAL, E

Conjunto (población) de resultados posibles o sucesos elementales de un experimento


aleatorio.

ESTADÍSTICA

Ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras y


de la realización de inferencias sobre las poblaciones de las que éstas proceden

ESTADÍSTICA DESCRIPTIVA

Tiene como objetivo caracterizar, describir y extraer conclusiones sobre una muestra
de datos. Es la 1ª fase de toda investigación.

ESTADÍSTICA INFERENCIAL

Implica realizar inferencias acerca de la población a partir de los datos muestrales y


requiere cálculo de probabilidades.

ESTADÍSTICO

Propiedad descriptiva de una muestra. Por ejemplo, la media y la varianza.

EXPERIMENTO ALEATORIO

Toda acción cuyo resultado no puede predecirse con certeza.


3
FUNCIÓN DE DENSIDAD DE PROBABILIDAD, f(x)

Asocia valores de una variable aleatoria continua con ordenadas o alturas de la curva
en cada punto.

FUNCIÓN DE DISTRIBUCIÓN, F(x)

Probabilidad de que una variable aleatoria (discreta o continua) tome un valor concreto
u otro inferior: P(X ≤ xi).

FUNCIÓN DE PROBABILIDAD, f(x)

Probabilidad de que una variable aleatoria discreta tome un valor concreto: P(X = x i).

MEDIA ARITMÉTICA

Es la medida de tendencia central más utilizado. Es la suma de los valores observados


dividida entre el número de ellos. Por tanto, requiere que la variable sea cuantitativa.

MEDIANA

Medida de tendencia central que indica la puntuación que es superada por la mitad de
de las observaciones y por tanto, no por la otra mitad. Puede utilizarse con variables
cuantitativas y ordinales.

MEDICIÓN

Proceso de asignación de números a las características

MATRIZ DE VARIANZAS-COVARIANZAS, S

Forma de organizar los datos en filas y columnas que permite conocer con facilidad el
valor de las covarianzas entre todas las posibles combinaciones de J variables (si J =
3, habría tres covarianzas) y también el de sus varianzas (que aparecen en la diagonal
principal de la matriz S).

4
MATRIZ DE CORRELACIONES, R

Forma de organizar los datos en filas y columnas que permite conocer con facilidad el
valor de las correlaciones de Pearson entre J variables (en este caso en la diagonal
principal de la matriz R hay unos).

MODA

Medida de tendencia central que indica la puntuación que aparece un mayor número
de veces en una distribución de frecuencias. Puede utilizarse con variables
cuantitativas, ordinales y nominales.

MODELO DE DISTRIBUCIÓN DE PROBABILIDAD

Función que da la probabilidad (si la variable aleatoria es discreta) o la densidad de


probabilidad (si la variable aleatoria es continua) de que una variable aleatoria tome
cada uno de sus posibles valores. Para variables aleatorias discretas el más conocido
es el modelo binomial; y para variables aleatorias continuas el modelo de distribución
normal y el modelo chi-cuadrado de Pearson.

MUESTRA

Sub-conjunto de n elementos de una población.

MUESTREO

Procedimiento seguido para seleccionar un subconjunto de los elementos de una


población.

MUESTREO ALEATORIO SIMPLE

Método de extracción de muestras que garantiza que todos los elementos de la


población tienen la misma probabilidad de ser elegidos en cualquier momento de la
extracción.

PARÁMETRO

Propiedad descriptiva de una población. Por ejemplo, la media y la varianza. Se


simbolizan con letras griegas.
5
POBLACIÓN

Conjunto de todos los elementos que cumplen una o varias características.

PROBABILIDAD

La probabilidad de un suceso es un número que cuantifica en términos relativos (de 0


al 1) las opciones de verificación de ese suceso.

PROBABILIDAD CONDICIONAL

Probabilidad de un suceso A, dada la verificación del suceso B.

PUNTUACIONES TÍPICAS, z

Expresan las puntuaciones en relación a la tendencia central y a la variación pues se


calculan restándole a la puntuación directa su media y dividiendo el resultado entre la
desviación típica. Tienen la propiedad de ser universales pues su media es siempre 0
y su desviación típica 1.

REGRESIÓN LINEAL SIMPLE

Si dos variables cuantitativas X e Y están linealmente relacionadas, se pueden utilizar


las puntuaciones obtenidas en una de ellas para pronosticar las puntuaciones en la
otra variable. Para ello se construye el modelo de regresión mediante la ecuación: Y' =
A + BX (si Y es la variable criterio y X la variable predictora). El pronóstico Y' será más
preciso en la medida en que la relación lineal entre las variables sea mayor.

RELACIÓN LINEAL

Dos variables (cuantitativas) están linealmente relacionadas si los valores altos de una
tienden a emparejarse con los valores altos en la otra y los valores bajos con los bajos
(relación lineal directa); y si los valores altos de una se emparejan con los valores
bajos en la otra y los valores bajos con los altos (relación inversa).

6
SIMETRÍA

Cuando la forma de la distribución de frecuencias refleja que la mayoría de las


observaciones obtienen valores medios y hay el mismo número de puntuaciones
extremas (tanto altas como bajas). Es la forma que tiene la distribución normal.

SUCESO:

Cualquier subconjunto de los elementos del espacio muestral, E.

SUCESO COMPLEMENTARIO

Subconjunto de sucesos elementales de E que no está incluido en un suceso.

SUCESO ELEMENTAL

Cada uno de los resultados posibles del experimento aleatorio. Su conjunto constituye
el espacio muestral, E.

SUCESO IMPOSIBLE

Suceso que tal y como está definido E, es imposible que ocurra.

SUCESO SEGURO

Suceso que está incluido en E.

TABLA DE CONTINGENCIA

Forma de representar las frecuencias conjuntas de dos variables cualitativas o


nominales. Consiste en una tabla de doble entrada donde las filas representan las
categorías de una de las variables cualitativas y las columnas las de la otra. Dentro de
las casillas está el recuento de casos que corresponde al cruce de cada uno de los
pares de categorías de ambas variables.

VARIABLE

Es una representación numérica de una característica.

7
VARIABLE ALEATORIA

Función que asocia un número real y sólo uno, a cada suceso elemental del espacio
muestral (E) de un experimento aleatorio.

VARIABLE CUANTITATIVA CONTINUA

Aquella en la que entre dos valores cualesquiera, por próximos que sean, siempre
pueden encontrarse valores intermedios. Por ejemplo tiempo (medido en segundos).

VARIABLE CUANTITATIVA DISCRETA

Aquella que adopta valores aislados. Fijados dos consecutivos, no puede tomar
ninguno intermedio. Por ejemplo número de hijos, número de aciertos en un test, etc.

VARIANZA

Medida de variabilidad que consiste en la distancia media de las distancias de las


puntuaciones en una variable hasta su media aritmética al cuadrado.

You might also like