Professional Documents
Culture Documents
LOS NEGOCIOS
RESUMEN
LA NECESIDAD DE PRONOSTICAR
En vista de las imprecisiones ligadas al proceso, por qu es necesario pronosticar? Todas las
organizaciones operan en una atmsfera de incertidumbre y, a pesar de esto, los gerentes deben tomar decisiones
que afectan el futuro de las mismas. Para ellos, las suposiciones acadmicas son ms valiosas que las no
acadmicas.
Anteriormente slo se contaba con el juicio del pronosticador. Por naturaleza, el ser humano tiende a ser
optimista y subestimar la incertidumbre del futuro. Se ha demostrado adems que sus pronsticos no son ms
precisos que los cuantitativos, y que su costo es a menudo ms alto.
Quien pronostique de manera ms efectiva ser capaz de formula una buena mezcla de buen juicio y
tcnicas de pronstico cuantitativas, evitando la total dependencia de cualquiera de ellos.
TIPOS DE PRONSTICO
producir un pronstico que sea preciso y a la vez comprensible para quien va dirigido, y por ltimo, debe producir
un beneficio mayor al costo de su uso.
Recoleccin de datos.
Reduccin o condensacin de datos.
Construccin del modelo.
Extrapolacin del modelo (pronstico en s).
La recoleccin de datos es uno de los pasos ms importantes ya que los dems pasos se efectuarn sobre
dichos datos.
La reduccin o condensacin de datos es necesaria ya que en el paso anterior es posible obtener
demasiados o pocos datos. Algunos pueden no ser pertinentes al problema, por lo que reduciran la precisin del
pronstico. Otros pueden ser los adecuados, pero slo en ciertos perodos.
La construccin del modelo implica ajustar los datos reunidos en un modelo de pronstico adecuado a fin
de minimizar el error en el pronstico. Con frecuencia se debe establecer un balance entre la sencillez y
complejidad del modelo, a fin de obtener un modelo complejo ms preciso, o un modelo ms simple y sencillo de
comprender.
RESUMEN
El propsito del pronstico consiste en reducir el margen de incertidumbre dentro del que se deben
efectuar los juicios de la administracin. Hay dos reglas principales a las que debe adherirse el proceso de
pronstico:
ESTADSTICA DESCRIPTIVA
Su objetivo es describir brevemente un gran conjunto de mediciones con unos cuantos valores clave
resumidos. Una forma comn de lograrlo es calculando la media de los valores, esto es, sumando todos los
valores y dividiendo por su cantidad.
La media poblacional es
=
( )2
( )2
1
Tambin se usa la varianza poblacional y muestral: stas son la desviacin estndar poblacional y
muestral al cuadrado, respectivamente. En la varianza muestral se utiliza el trmino 1, denominado grados de
libertad, el cual indica el nmero de elementos de datos que son independientes de los otros y que constituyen
piezas nicas de informacin.
DISTRIBUCIONES DE PROBABILIDAD
Se denomina variable aleatoria a aquella cantidad que puede tomar diferentes valores entre una prueba y
otra de un experimento o evento aleatorio. Si dicha variable puede tomar slo ciertos valores especficos, se
denomina discreta. Por el contrario, si puede tomar cualquier valor dentro de cierto rango, se denomina
continua.
Si consideramos una variable aleatoria, su distribucin de probabilidad enlista todos los valores
posibles que puede tomar, junto con la probabilidad de cada uno.
El valor esperado de una variable aleatoria es el valor promedio de la variable en muchas observaciones,
y se calcula como:
() = [ ()]
Para una distribucin continua, la probabilidad de obtener un valor especfico se aproxima a cero.
La distribucin binomial se usa para variables discretas. Sus requisitos son:
Luego de calcularlo, puede consultarse una tabla de curva normal para encontrar el rea bajo la curva, entre el
centro y el valor de inters X.
=
La distribucin t se utiliza con frecuencia en pruebas estadsticas cuando se emplea una muestra
pequea y cuando se puede suponer que la poblacin que se investiga tiene una distribucin normal.
DISTRIBUCIONES MUESTRALES
La distribucin muestral es la distribucin de todos los valores posibles del estadstico de la muestra,
que se pueden obtener de la poblacin para un determinado tamao de muestra.
El Teorema Central del Lmite establece que, al hacerse ms grande la muestra, la distribucin de
muestreo de las medias tiende a la distribucin normal, y que la media de esta distribucin normal es la media de
la poblacin, y que la desviacin estndar es /.
ESTIMACIN
Un estimador de un parmetro de una poblacin es un valor individual calculado a partir de datos de la
muestra, que estima el valor desconocido de la poblacin.
Un intervalo de confianza es un intervalo dentro del cual es probable que se ubique el parmetro de
inters de la poblacin. Se obtiene formando un intervalo alrededor del punto de estimacin y se calcula ya sea
mediante la distribucin normal o la t.
A menudo el inters se centra en alguna afirmacin sobre la poblacin, en vez de en la estimacin en s de
algunos de sus parmetros. A este procedimiento se le llama test de hiptesis.
La prueba de bondad de ajuste determina si se puede suponer que los elementos de una muestra hayan
sido extrados de una poblacin que sigue una distribucin especfica.
ANLISIS DE CORRELACIN
Un objetivo comn en las aplicaciones de pronstico consiste en examinar la relacin entre dos variables.
Diagramas de dispersin
Un diagrama de dispersin grafica los puntos de datos X-Y en una grfica bidimensional. Hay varios
tipos de relacin entre variables:
Resumiendo, al investigar la relacin entre dos variables, primero se debe saber si la relacin es lineal o
curva. Si es lineal, se desear saber si la relacin es positiva o negativa y cul es la inclinacin de la lnea que se
ajusta a los puntos de datos. Por ltimo, se necesita el grado de la relacin, esto es, cun cerca estn los puntos de
la lnea.
Coeficiente de correlacin
El coeficiente de correlacin mide el grado al cual se relacionan en forma lineal dos variables entre s.
Dos variables con una relacin negativa perfecta tienen un coeficiente de correlacin igual a -1. En
contraposicin, dos variables con una relacin positiva perfecta tienen un coeficiente de correlacin igual a 1. Dos
variables sin relacin lineal tienen un coeficiente de correlacin igual a 0. Por lo tanto, dicho coeficiente variar
entre -1 y 1.
Hay que sealar dos puntos importantes: primero, debe tenerse presente que se est midiendo la
correlacin y no la causalidad. Segundo, la correlacin mide una relacin lineal entre dos variables, por lo que si
el coeficiente es bajo o nulo, no significa que no haya otro tipo de relacin no lineal.
TIPOS DE DATOS
En general, hay dos tipos de datos de inters para el pronosticador. Los primeros son los que se renen en
un solo punto en el tiempo, sea ste una hora, un da, un ao. El objetivo aqu es examinar dichos datos y
despus extrapolarlos hacia una poblacin mayor.
Una serie de tiempo es una secuencia ordenada de observaciones sobre una variable en particular.
Muchos valores de datos para organizaciones son recolectados cada da, mes, trimestre o ao. En tales casos, se
han reunido series de tiempo de datos. Las mismas son analizadas para descubrir patrones pasados que se puedan
emplear para predecir patrones futuros.
Los datos a corto plazo y largo plazo son fundamentales para realizar pronsticos a corto y largo plazo.
FUENTES DE DATOS
Las fuentes de datos pueden clasificarse en:
La diferencia entre las fuentes primarias y secundarias es que es ms probable que una fuente primaria
contenga datos ms completos y precisos que los encontrados en una fuente secundaria. Por otro lado, los datos
de fuentes primarias suelen ser ms caros que los otros.
Fuentes primarias
Datos de encuestas
Los encuestados pueden ser clientes, pblico en general, proveedores o empleados. Pueden realizarse
mediante:
Correo: llega a un amplio nmero de personas dispersas, con un bajo costo; asegura que se le
pregunta lo mismo a los encuestados. Por otro lado, ocupan mucho tiempo y slo un porcentaje
de los encuestados responden las preguntas.
Entrevista personal: los entrevistadores pueden seleccionar con cuidado a los encuestados, por lo
que asegura un buen muestreo; puede arrojar gran cantidad de informacin debido a que los
encuestados tienden a ser ms abiertos personalmente. Por otro lado, pueden desviarse de su
objetivo y tienen mayores costos por contacto.
Entrevista telefnica: tiene bajo costo por contacto y se obtienen resultados con rapidez. Por otro
lado, slo pueden usarse preguntas cortas, suele ser considerado una invasin a la privacidad, y
no llega a aquellas personas que no tienen telfono.
A quin encuestar?
A cuntas personas encuestar?
Cmo seleccionar las personas a encuestar?
A quin encuestar?
El encuestador deber determinar quin tiene la informacin deseada: usuarios, compradores, etc.
A cuntas personas encuestar?
Esto depender del tipo de investigacin y de qu tan confiables deben ser los resultados. Por ejemplo, en
una investigacin exploratoria en donde se buscan ideas, bastar con pocas entrevistas. Por otro lado, al conducir
una investigacin concluyente para encontrar respuestas especficas, se deben utilizar muestras grandes.
En general, muestras ms grandes arrojan resultados ms precisos, pero cuestan ms en trminos de
tiempo y dinero. El pronosticador debe evaluar el valor de ms informacin a costa del mayor costo, que quizs
no siempre derive en una mayor precisin.
Cmo seleccionar las personas a encuestar?
Muestreo aleatorio: asegura que cada unidad en la poblacin tenga igual probabilidad de ser
incluida en la muestra.
o Muestreo aleatorio simple: utilizada cuando el investigador tiene una lista completa de
todos los elementos de la poblacin. Luego, un generador de nmeros aleatorios se utiliza
para seleccionar la muestra. Por desgracia, no siempre se cuenta con una lista completa
de toda la poblacin.
o Muestreo sistemtico: utilizada cuando se tiene una lista completa de una muestra
enlistada de forma aleatoria: se selecciona un punto de inicio al azar, y despus cada
ensima unidad hasta alcanzar el nmero deseado.
o Muestreo estratificado: utilizada cuando el pronosticador sabe qu grupos importantes
se pueden identificar en la poblacin, y se selecciona de forma aleatoria dentro de cada
grupo.
o Muestreo en bloque: comprende el agrupamiento en bloques de la poblacin y la
seleccin aleatoria de bloques, en lugar de elementos unitarios.
10
11
=1 ( ) ( )
=1( )2
12
Si una serie tiene una tendencia, es tpico que los coeficientes de autocorrelacin sean significativamente
diferentes de cero para los primeros perodos de desfasamiento, y caigan despus gradualmente a cero con el
incremento de los perodos.
Si una serie tiene un patrn estacional, se presentar un coeficiente de autocorrelacin significativo en el
perodo de desfasamiento correspondiente: cuatro en los datos trimestrales o doce en los datos mensuales.
Por otro lado, si una serie tiene es aleatoria, en teora las autocorrelaciones para esta serie deberan ser
iguales a cero.
Una serie estacionaria es aquella cuyo valor promedio no cambia a travs del tiempo.
Para quitar la tendencia de una serie no estacionaria, se utiliza un mtodo llamado diferenciacin, en el
cual se resta de 1 , 1 de 2 , y as hasta crear una nueva serie. En esta nueva forma, la media y la
varianza permanecen constantes a travs del tiempo, y la serie es estacionaria.
Las fuerzas que generan una serie se han estabilizado y el medio en el que existe la misma
permanece relativamente sin cambios. Por ejemplo, las ventas de un producto una vez en etapa de
maduracin.
Se requiere un modelo sencillo debido a la falta de datos, o para facilitar su explicacin. Por
ejemplo, cuando un negocio es nuevo y hay poca informacin disponible.
Se puede lograr la estabilidad haciendo pequeas modificaciones.
La serie puede ser transformada en una serie estable mediante algn mtodo matemtico.
La serie es un conjunto de errores de pronstico, de otra tcnica considerada adecuada.
Algunas tcnicas son mtodos no formales, promedio simple, promedio mvil, atenuacin exponencial y
Box-Jenkins.
Algunas tcnicas son promedio mvil lineal, atenuacin exponencial lineal de Brown, atenuacin
exponencial lineal de Holt, atenuacin exponencial cuadrtica de Brown, regresin simple, modelo de Gompertz,
curvas de crecimiento y modelos exponenciales.
Algunas tcnicas son descomposicin clsica, Census II, atenuacin exponencial de Winter, regresin
mltiple de series de tiempo y mtodos Box-Jenkins.
Algunas tcnicas son descomposicin clsica, indicadores econmicos, modelos economtricos, regresin
mltiple y mtodos Box-Jenkins.
Para pronsticos de corto y mediano plazo, se pueden aplicar diversas tcnicas cuantitativas.
Para pronsticos de largo plazo, algunas de las tcnicas cuantitativas se hacen menos aplicables, y
toman importancia las tcnicas cualitativas.
Por otro lado, los promedios mviles, la atenuacin exponencial y los modelos Box-Jenkins no son muy
buenos modelos para pronsticos de cambios econmicos radicales; en cambio, los modelos economtricos son
ms tiles para este fin.
La facilidad de comprensin es interpretacin de los resultados de un modelo son una consideracin
importante al momento de seleccionar un modelo. Aqu entran los modelos de regresin, descomposicin clsica
y atenuacin exponencial.
Por ltimo, deber evaluarse la confiabilidad, aplicabilidad, efectividad y nivel de precisin de la tcnica
al problema bajo estudio.
Desviacin Absoluta de la Media: resulta de utilidad cuando se desea medir el error de pronstico
en las mismas unidades que la serie original.
14
Error Medio Cuadrado: se penalizan los errores mayores ya que estn elevados al cuadrado.
Resulta de utilidad cuando es preferible una tcnica que produzca errores moderados antes que
una tcnica que produzca errores pequeos, pero ocasionalmente errores grandes.
=1 | |
=1( )2
Porcentaje de Error Medio Absoluto: proporciona un indicador de cun grandes son los errores de
pronstico respecto a los valores de la serie. Tambin puede utilizarse para comparar la precisin
de una tcnica consigo misma u otra sobre otra serie completamente diferente.
=1 | |
Porcentaje Medio de Error: si una tcnica de pronstico produce un porcentaje cercano a cero, el
pronstico no estar sesgado; si produce un porcentaje negativo grande, estar sobreestimando de
manera consistente; si produce un porcentaje positivo grande, estar subestimando de manera
consistente.
=1( )
15
MODELOS NO FORMALES
Las tcnicas no formales ms sencillas suponen que los perodos recientes son los mejores
pronosticadores del futuro. El modelo ms sencillo es:
+1 =
El modelo puede mejorarse para el caso de datos con tendencia:
+1 = + ( 1 )
Resulta aparente que el nmero y complejidad de modelos no formales posibles slo est limitado por el
ingenio del analista.
MODELOS DE PROMEDIO
Este tipo de tcnicas utilizan una forma de promedio ponderado de observaciones anteriores para atenuar
fluctuaciones de corto plazo. La suposicin fundamental de estas tcnicas es que las fluctuaciones en los valores
anteriores representan puntos de partida aleatorios de alguna curva atenuada. Una vez que se identifica esta curva,
se puede proyectar hacia el futuro para producir un pronstico.
Promedio simple
Un promedio simple se obtiene encontrando la media de todos los valores pertinentes y usando despus
esta media para pronosticar el siguiente perodo. Su frmula es:
+1 =
=1
16
Este mtodo debera emplearse cuando los datos son estacionarios: sin tendencia, estacionalidad u otros
patrones.
Promedio mvil
Un promedio mvil se obtiene encontrando la media de un conjunto especfico de valores y emplendolo
despus para pronosticar el siguiente perodo. Su frmula es:
+ 1 + 2 + + +1
Este modelo es adecuado para datos estacionarios. No maneja muy bien la tendencia y estacionalidad,
aunque lo hace mejor que el promedio simple.
+1 =
Cuanto mayor sea el orden (n) del promedio mvil, mayor ser el efecto de atenuacin, y se prestar poca
atencin a las fluctuaciones de la serie de datos. Es deseable un orden grande cuando existan fluctuaciones
amplias.
Cuanto menor sea el orden del promedio mvil, se dar ms peso a los perodos recientes. Es deseable un
orden menor cuando hay cambios sbitos en la serie.
+ 1 + 2 + + +1
+ 1 + 2 + + +1
Se calcula un factor de ajuste, similar a la medicin de una pendiente que cambia a travs de la
serie:
=
2
( )
1
serie, haciendo esto de forma decreciente (exponencial). Las observaciones se ponderan, asignando mayor peso a
las ms recientes. Dichas ponderaciones se designan como para la observacin ms reciente, (1- ) para la
siguiente, (1 )2 para la siguiente, y as sucesivamente. variar entre cero y uno. La ecuacin de
atenuacin exponencial es:
+ (Y Y
)
+1 = Y
) en el
La atenuacin exponencial es simplemente el pronstico anterior, Y , ms veces el error (Y Y
pronstico anterior.
El valor de determina el grado hasta el cual la observacin ms reciente puede influir en el valor del
pronstico:
Debe pensarse en este pronstico como un promedio ponderado de todas las observaciones anteriores, con
ponderaciones que disminuyen de manera exponencial al ir tomando los datos hacia atrs.
Si se desea que los pronsticos sean estables y se atenen las variaciones aleatorias, se requiere de un
valor de pequeo. Por el contrario, si se desea una rpida respuesta al cambio en el patrn de datos, deber
utilizarse un mayor. Un mtodo para estimar consiste en calcular los pronsticos para diferentes valores de
(0.1, 0.2, 0.3,,0.9), y calcular para cada uno el error medio cuadrado. Luego, se seleccionar el valor que d
el error ms pequeo.
1 igual a Y1 ; otra forma es calcular la media de los primeros n valores de
Por ltimo, podr inicializarse Y
Rastreo
Una seal de rastreo comprende el clculo de alguna medicin del error a travs del tiempo y establece
lmites, de modo que cuando el error rebase dichos lmites, se alerte al pronosticador. Por ejemplo, puede usarse
una seal de rastreo para determinar cundo debe cambiarse el valor de utilizado en una tcnica de atenuacin
exponencial.
Sea U el nmero de subestimaciones en los ltimos n pronsticos. Si el proceso de pronstico est bajo
control, el valor esperado de U sera n/2; pero se contempla una variabilidad de la muestra, por lo que no seran
raros valores cercanos a n/2. Por otro lado, valores lejanos a n/2 indicaran que la tcnica est produciendo
pronsticos con sesgo. Si la tcnica de pronstico es razonablemente precisa, el error debera estar en una
distribucin normal con media de cero.
18
a = 2A A
Se calcula un factor de ajuste, similar a la medicin de una pendiente que puede cambiar durante
la serie:
=
( )
1
Al igual que en la atenuacin exponencial simple, la eleccin de alfa se hace seleccionando el mnimo
error medio cuadrado entre los valores reales y los pronsticos de estos valores, utilizando esta tcnica.
La estimacin de la tendencia:
= ( 1 ) + (1 )1
+ (1)(1 + 1 )
La estimacin de la tendencia:
= ( 1 ) + (1 )1
19
La estimacin de la estacionalidad:
=
+ (1 )
20
2 ( )2
0 =
No es prudente realizar predicciones para valores de Y para cualquier X que est ms all del nivel de las
X reunidas en los datos de la muestra.
PREDICCIN DE Y
Lo siguiente consiste en estimar el valor de Y para un valor dado de X. Para obtener una prediccin de
punto, se emplea la ecuacin de regresin: se sustituye el valor de X en la ecuacin y se encuentra el valor de
prediccin para Y.
Desde luego, los puntos de datos que generaron la lnea de regresin se encuentran dispersos alrededor de
esa lnea, segn la medicin de x . Para hacer una prediccin de intervalo de Y para un valor especfico de X, se
debe tener en cuenta esta dispersin. Adems, debe tenerse en cuenta la dispersin de otras lneas de
regresin de la muestra (de otras posibles muestras aleatorias de datos) alrededor de la verdadera lnea de
regresin de la poblacin.
21
El error estndar de pronstico mide la variabilidad de los valores de prediccin de Y alrededor del
verdadero valor de Y para un valor dado de X, tomando en cuenta los dos factores mencionados. El error estndar
de pronstico es:
= x 1 +
1
( )2
+
( )2
Los factores despus del 1 debajo del radical miden la variabilidad de las lneas de regresin de la
muestra alrededor de la verdadera lnea de regresin. Este error depende del valor de X para el cual se desea el
pronstico, ya que la X se encuentra en la ecuacin.
Mediante la siguiente ecuacin se calcula un intervalo de prediccin del 95% para Y cuando X tiene un
determinado valor (esta ecuacin se puede emplear siempre que el tamao de la muestra sea suficientemente
grande, digamos n >= 30):
Al calcular un intervalo de prediccin, se hacen algunas suposiciones. De hecho, todo el procedimiento de
anlisis de regresin se apoya en dichas suposiciones:
1. La poblacin de Y presenta una distribucin normal con respecto a la lnea de regresin de la
poblacin.
2. La dispersin de los puntos de datos de la poblacin alrededor de la lnea de regresin de la
poblacin permanece constante a lo largo de la lnea.
3. Los errores son independientes entre s.
4. Existe en la poblacin una relacin lineal entre X e Y.
COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin mide el porcentaje de variabilidad en Y que puede explicarse a travs
del conocimiento de la variable independiente X:
2 = 1
( )2
=1
( )2
22
VARIABLES DE PREDICCIN
Se denomina colinealidad a la intercorrelacin entre las variables independientes en problemas con ms
de una variable independiente.
Una buena variable de pronstico est relacionada con la variable dependiente y no est altamente
relacionada con ninguna otra variable independiente.
MATRIZ DE CORRELACIN
La matriz de correlacin se crea mediante el clculo de coeficientes de correlacin simples para cada
combinacin de pares de variables. El anlisis de dicha matriz es un paso inicial importante en la solucin de
cualquier problema que comprenda varias variables independientes.
COEFICIENTES DE REGRESIN
Para la ecuacin de regresin, 0 representaba el valor cuando X era igual a 0. Sin embargo, ahora se
interpreta como el valor de cuando 2 y 3 son 0. A los valores 2 y 3 se los denomina coeficientes de
regresin neta, y cada uno mide cambios promedio sobre Y por unidad de cambio en una de las X, cuando la otra
(u otras en caso de que haya ms de dos variables independientes) permanece constante.
23
VARIABLES FICTICIAS
En ocasiones es necesario determinar cmo se relaciona una variable dependiente con una independiente
cuando un factor cualitativo ejerce influencia. Esta relacin se logra creando una variable ficticia. Las variables
ficticias se usan para determinar la relacin entre variables cualitativas independientes y una variable dependiente.
Colinealidad
La colinealidad es la situacin en la que las variables independientes de una ecuacin de regresin
mltiple estn altamente intercorrelacionadas.
En un anlisis, la colinealidad causa algunos problemas:
Un coeficiente de regresin que tiene signo positivo en una ecuacin de regresin de dos
variables, podra cambiar a signo negativo en una ecuacin de regresin mltiple que contenga
otras variables con las que est altamente interrelacionado (el cambio puede ser tambin a la
inversa).
La estimacin de los coeficientes de regresin vara considerablemente entre una muestra y otra.
Resulta en extremo difcil separar las influencias individuales de cada una de las variables
independientes.
El analista desea que la ecuacin incluya tantas variables de prediccin como sea posible.
Mientras la muestra sea lo suficientemente grande, cada nueva variable de prediccin tiene el
potencial de mejorar el pronstico.
Como obtener y mantener informacin sobre un gran nmero de variables de prediccin cuesta
recursos, la ecuacin deber contener el menor nmero de pronosticadores.
El segundo paso consiste en eliminar las variables independientes que no parezcan apropiadas: pudiera
ser no fundamental para el problema, pudiera estar sujeta a errores de medicin considerables, o pudiera duplicar
otras variables independientes.
24
El tercer paso consiste en recortar la lista de pronosticadores con el propsito de obtener la mejor
seleccin de variables independientes.
25