You are on page 1of 10

Estadística

Por mucho tiempo, la palabra estadística se refería a información numérica sobre los
estados o territorios políticos, la palabra viene del latín “statisticus” que significa “del
estado”. Las estadísticas como las conocemos hoy día tomaron en desarrollarse varios
siglos y muchas mente privilegiadas. John Graunt (1620-1674), un inglés que estudiaba
los expedientes de los nacimientos y muertos descubrió que nacían mas niños que niñas,
pero también encontró que por estar los hombres más expuestos a accidentes
ocupacionales, a enfermedades y la guerra, el número de hombres y de mujeres en la
edad de casarse era más o menos la misma.
Conceptos Estadísticos

Variable: Característica que puede presentar distintas modalidades. Por ejemplo, la


variable "género" solo presenta dos modalidades (mujer y hombre), y la variable
"depresión" presenta un número infinito de modalidades, (las magnitudes de gravedad
con que puede afectar a las personas).
Constante: Característica que presenta una sola modalidad
Datos: Son números que representan las modalidades de las variables. Por ejemplo, el 1
puede representar la modalidad "Mujer", el 6.3 representa una de las magnitudes que
podemos registrar en la variable "grado de conocimiento de las técnicas estadísticas". Los
datos pueden ser clasificados según diferentes criterios, uno de los cuales se basa en las
modalidades que presentan: Se dirá que son datos dicotómicos los que provienen de
variables que solo admiten dos modalidades (por ejemplo la variable "género"), son datos
dicotomizados aquellos que presentan dos categorías pero provienen de variables con más
de dos modalidades (por ejemplo datos con valores 1 y 0 que representan aprobado y
suspenso).
Población: Conjunto completo de individuos, objetos o fenómenos.
Muestra: Subconjunto de la población.
Muestreo: Procedimiento de selección de las muestras.
Representatividad de la muestra: Las muestras son partes de la población, pero no son
la población completa. Por ello, sus características no suelen coincidir con las de la
población. La medida en que la muestra aproxima a la población se denomina
representatividad.
Sesgo: Es la discrepancia entre las características de las muestras y las de la población.
Análisis invariado: Analiza una sola variable. Es más sencillo, más fácil de entender y
de interpretar. En cambio, la sencillez puede comportar una simplificación excesiva de la
realidad. Por ejemplo, un investigador quiere hacer un estudio del rendimiento académico
universitario, para lo cual recoge las calificaciones de los estudiantes en los exámenes
finales. Es claro que una caracterización del rendimiento basada exclusivamente en las
calificaciones académicas es incompleta y que, si queremos conocer los condicionantes
del rendimiento deberíamos incluir otros variables (como actitud, preparación previa,
etc.) y estudiar cómo interactúan para dar cuenta de las variables de interés.
Análisis multivariado: Analiza los datos teniendo en cuenta las relaciones entre las
variables. Es más complejo y de comprensión más dificultosa, pero proporciona
información más completa del objeto estudiado.
Media Aritmética
La media aritmética (también llamada promedio o media) de un conjunto finito de
números es el valor característico de una serie de datos cuantitativos, objeto de estudio
que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir
de la suma de todos sus valores dividida entre el número de sumandos. Cuando el
conjunto es una muestra aleatoria recibe el nombre de media muestra siendo uno de los
principales estadísticos muéstrales.
La media aritmética es el valor promedio de las muestras y es independiente de las
amplitudes de los intervalos. Se simboliza como y se encuentra sólo para variables
cuantitativas. Se encuentra sumando todos los valores y dividiendo por el número total
de datos.
Es la medida de posición central más utilizada, la más conocida y la más sencilla
de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo
algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su
sensibilidad al cambio de uno de sus valores o a los valores extremos demasiados grandes
o pequeños. La media se define como la suma de todos los valores observados, dividido
por el número total de observaciones

Media aritmética se representa con este:


Para calcular la media aritmética haremos uso de su fórmula, y gracias a esta
obtendremos el promedio total.
Ejemplo:
En el primer examen saqué una nota de 8 y en el segundo un 10. ¿Cuál es la media
aritmética de mis dos notas?
 Nota 1 = 8
 Nota 2 = 10
 Número de notas = 2
 Media Aritmética = (8 + 10) / 2 = 18 / 2 = 9 → He sacado una media aritmética de 9 en mis
dos notas.
La varianza se emplea en el ámbito de la estadística, se trata de una palabra impulsada
por matemático y científico inglés Ronald Fisher (1890 - 1962) que sirve para
identificar a la media de las desviaciones cuadráticas de una variable de carácter
aleatorio, considerando el valor medio de esta.
La varianza de las variables aleatorias, por lo tanto, consiste en una medida vinculada a
su dispersión. Se trata de la esperanza del cuadrado de la desviación de esa variable
considerada frente su media y se mide en una unidad diferente. Por ejemplo: en los casos
en que la variable mide una distancia en kilómetros, su varianza se expresa en kilómetros
al cuadrado.
Cabe destacar que las medidas de dispersión (también identificadas con el nombre
de medidas de variabilidad) se encargan de expresar la variabilidad de una distribución
por medio de un número, en los casos en que las diferentes puntuaciones de la variable
están muy alejadas de la media.
Los expertos hablan de análisis de la varianza para nombrar a la colección de modelos
estadísticos y sus procedimientos asociados en la cual la varianza aparece particionada en
distintos componentes.
La desviación estándar

Uno de los análisis más importantes relacionados con la varianza es la desviación


estándar, también conocida como típica, que representa la magnitud de la dispersión de
variables de intervalo y de razón, y resulta muy útil en el campo de la estadística
descriptiva. Para obtenerla, simplemente se parte de la varianza y se calcula su raíz
cuadrada.
En la práctica, si tenemos los valores (expresados en milímetros) 14mm, 11mm, 10mm,
6mm y 4mm, podemos calcular su promedio sumándolos y dividiendo el resultado por 5,
que es la cantidad de elementos. Obtendríamos 9mm. Para conocer la varianza,
deberíamos restar cada uno de los valores a la media recién evidenciada, elevar cada
Resultado al cuadrado (para evitar números negativos que afecten el estudio), sumarlos
entre sí y, finalmente, dividir todo por 5. La varianza es 93,8 milímetros cuadrados. Por
Último, para dar con la desviación estándar, calculamos la raíz cuadrada, lo que nos deja
con 9.68mm (nótese que la unidad vuelve a ser milímetros).
Estos datos resultan muy útiles y necesarios para analizar y describir información, dado
que nos ofrecen distintos puntos de vista, así como diferentes tendencias de los datos que
caracterizan el objeto en cuestión y permiten establecer parámetros de comparación más
complejos y dinámicos que los meros valores aislados o simplemente sometidos a su
promedio aritmético.
La desviación estándar, también llamada desviación típica, es una medida
de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores
concretos del promedio en una distribución de datos. De hecho, específicamente, el
cuadrado de la desviación estándar es "el promedio del cuadrado de la distancia de cada
punto respecto del promedio".
La desviación estándar de un conjunto de datos es una medida de cuánto se desvían los
datos de su media. Esta medida es más estable que el recorrido y toma en consideración
el valor de cada dato.
La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o
población). Mientras mayor es la desviación estándar, mayor es la dispersión de la
población. La desviación estándar es un promedio de las desviaciones individuales de
cada observación con respecto a la media de una distribución. Así, la desviación estándar
mide el grado de dispersión o variabilidad. En primer lugar, midiendo la diferencia entre
cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas
estas diferencias individuales para dar el total de todas las diferencias. Por último,
dividiendo el resultado por el número total de observaciones (normalmente representado
por la letra “n”) para llegar a un promedio de las distancias entre cada observación
individual y la media. Este promedio de las distancias es la desviación estándar y de esta
manera representa dispersión.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación
estándar de una población, mientras que s se utiliza para representar la desviación
estándar de una muestra.
Como interpretar la desviación estándar.
Las variables cualitativas incluyen todas las cualidades o características observables
de un grupo o población que no pueden ser medidas de forma numérica. Generalmente
se asocian con un atributo físico (cualidad) de un grupo de individuos, pueden adquirir
un número de valores superior a dos, recibe el nombre de politómica. En este grupo, a
su vez, se puede distinguir entre las variables cualitativas politómicas nominales y las
variables cualitativas politómicas ordinales.

Una variable cualitativa puede tomar un número finito de valores numéricos o categorías

Clasificación de variables cualitativas


 Escala nominal: No se puede definir un orden natural entre sus categorías.
(Ejemplo: la raza, el color del pelo, o la religión)
 Escala ordinal: Se pueden establecer relaciones de orden entre las categorías.
(Ejemplo: el rango militar, la clase social o el nivel de estudios)
 Por intervalos: Pueden tratarse como ordinales y se pueden calcular distancias
numéricas entre dos niveles. (Ejemplo: El número de años de educación recibidos
(0, 1, 2, ...) es una variable cuantitativa que puede ser agrupada por intervalos)

Variable dicotómica, cada modalidad que se presenta se denomina atributo o categoría,


y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas
puede ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no,
hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores.

Coeficiente de variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media
y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética,
mostrando una mejor interpretación porcentual del grado de variabilidad que la
Desviación estándar. Por otro lado presenta problemas ya que a diferencia de
la desviación típica este coeficiente es variable ante cambios de origen. Por ello es
importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo.
A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la
variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas
distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en mayor
medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el
C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente
implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad aplicada,
como teoría de renovación y teoría de colas. En estos campos la distribución
exponencial es a menudo más importante que la distribución normal. La desviación típica
de una distribución exponencial es igual a su media, por lo que su coeficiente de variación
es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se
consideran de "baja varianza", mientras que aquellas con un C.V. mayor que uno, como
la distribución hiperexponencial se consideran de "alta varianza". Algunas fórmulas en
estos campos se expresan usando el cuadrado del coeficiente de variación, abreviado
como S.C.V. (por sus siglas en inglés)

Media Aritmética Para Datos No Agrupados


La forma más sencilla para calcular la media aritmética es la usada cuando disponemos
de pocos valores, que no ameritan ser organizados en una distribución de frecuencias. A
estos datos, por su forma de presentación se le llama datos no agrupado.
Media Aritmética Para Datos Agrupados
Cuando la media aritmética se calcula para una distribución de frecuencias o datos
agrupados utilizo el punto medio de clase como forma de aproximar a un solo valor los
datos contenidos en cada clase.
El punto medio se representa mediante la simbología xi, donde la letra x es representada
como la variable considerada en cada clase y el subíndice i indica el orden de cada una
de las clases de la distribución de frecuencias
La varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media. O en
pocas palabras, es la media de los residuos al cuadrado.
Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por
ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada
de la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades
que los datos del variable objeto de estudio.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen
colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión
más robustas.

El sesgo es una medida necesaria para conocer cuánto se parece nuestra distribución a la
distribución teórica de una “curva normal”, curva con forma de campana, y constituye un
indicador del lado de la curva donde se agrupan las frecuencias. Esta medida se construye
con el valor medio, la mediana y el desvió estándar. Si el valor del sesgo es cero (asimetría
= 0), la curva de distribución es simétrica, en este caso coinciden los valores de la media,
la mediana y la moda. Cuando es positiva, el promedio es mayor que la mediana, quiere
decir que hay valores agrupados hacia la izquierda de la curva, por debajo del valor de la
media. Cuando es negativa, la media es menor a la mediana, significa que los valores
tienden a agruparse hacia la derecha de la curva, por encima de la media.

Ejemplo.
La curtosis es una medida que indica o mide lo plano o puntiaguda que es una curva de
distribución. Cuando esta es cero, curtosis = 0, significa que se trata de una curva
Normal. Si es positiva, quiere decir que la curva o distribución o polígono es más
puntiaguda o levantada que la curva normal (curva leptocúrtica). Si es negativa quiere
decir que es más plana (curva mesocúrtica).

Pronostico de ventas es la estimación o previsión de las ventas de


un producto (bien o servicio) durante un determinado período futuro.
La intención de medir la precisión de los pronósticos – un valor relativamente objetivo -
tiene una doble finalidad: la precisión de los pronósticos influye en diversos costos
operativos y en la satisfacción del cliente. Del mismo modo, la propia aparición de una
función de control de eficacia descubre el potencial que tienen los vendedores como
agentes generadores de información – que retroalimenta al sistema de pronósticos - y, al
mismo tiempo plantea la necesidad de que la buena administración de pronósticos sea
recompensada (“lo que se mide se recompensa y lo que se recompensa se hace”).

Una de las derivaciones de la importancia de la precisión de los pronósticos está


relacionada con su efecto en los denominados costos operativos, los cuales incluyen la
generación y gestión del propio sistema de administración de pronósticos. Una forma de
atenuar o minimizar esa gestión es examinar sólo los productos con respecto a los cuales
no se ha alcanzado un grado de precisión aceptable, o trabajar sobre los productos que
requieran niveles de servicio más elevados. Dentro del proceso de generación de los
pronósticos, a existencia de un “campeón del pronóstico”, con el consiguiente costo que
aquello genera, y las derivaciones de capacitación que trae aparejadas – para las diversas
líneas funcionales -, son aspectos por considerar. Los que usan los pronósticos necesitan
entrenamiento sobre cómo fueron elaborados, sus limitaciones y cómo deben ser aplicado
a la planeación.
Entre los costos operativos derivados se pueden mencionar los de operación (producción
logística), mercadotécnica (promociones, publicidad, cuotas de venta, desarrollo de
producto, precio). Estos surgen, en el caso de las operaciones, por costos de inventario,
por errores en el producto, cambios en los programas, envíos erróneos que aumentan
costos de inventario, transporte, etc.
Entre los costos derivados para el caso de mercadotécnica estarían costos ineficaces en
publicidad, desarrollo de nuevos productos sin demanda adecuada, precios que no
maximizan la contribución, cuotas de venta inapropiadas. Es importante considerar cómo
se pueden generar patrones extraños de pronósticos, que pueden estar provocados por
incentivos inapropiados (un sistema de sanciones a los que superen la cuota de ventas,
por ejemplo). Siempre es importante valorar los beneficios que puede traer el sistema de
pronósticos. No siempre superan los costos del desarrollo de un sistema más complejo.
Un último aspecto a considerar en cuanto a la precisión de los pronósticos es su
realización con la satisfacción e insatisfacción de los clientes. La medición de esta
insatisfacción alcanza varias facetas:
 Diseñar y elaborar productos que los clientes quieren.
 No diseñar ni fabricar productos que si quieren.
 No tener los productos deseados por los clientes en los lugares y cantidades
deseadas.