You are on page 1of 11

De todos es sabido que una buena estimacin inicial del coste de un proyecto es una de las mayores necesidades en la gestin

del proyecto. Existen diversos mtodos para realizar estimaciones iniciales del esfuerzo de desarrollo, y casi todos ellos utilizan datos de proyectos anteriores para calcular las nuevas predicciones. Nos podemos imaginar que, dependiendo del mtodo utilizado, obtendremos mejores o peores resultados. Se han utilizado diversos mtodos en la estimacin, comenzando por la regresin clsica, razonamiento basado en casos, redes neuronales, programacin gentica y otros. Aunque existen diferencias entre los mismos, y unos mtodos funcionan mejor que otros, todava no se puede decir que exista un procedimiento notablemente superior al resto. La eleccin de uno u otro mtodo de estimacin se realiza segn las caractersticas del entorno de estimacin (experiencia con los mtodos, etc.) y segn los valores que proporcionan determinadas variables estadsticas

Algunas medidas muy comunes, tales como el coeficiente de correlacin y el coeficiente de determinacin R2, pueden dar una idea equivocada sobre las capacidades predictivas del modelo de estimacin en cuestin. Por lo tanto, se debieran examinar tambin medidas, claramente predictivas, como son el Nivel de Prediccin y la Magnitud Media del Error Relativo. Aunque no se estudiar en estas pginas, tambin es una cuestin importante para la definicin de modelos de estimacin la de si se utiliza una parte de la muestra para construccin y otra para evaluacin del modelo, o si se utiliza el mismo conjunto de datos para la construccin del modelo de estimacin y para la evaluacin.

Algunas medidas de la bondad de la estimacin y de la capacidad de prediccin Coeficiente de determinacin mltiple, R2, y R2 ajustado, son algunas medidas habituales en el anlisis de regresin, denotando el porcentaje de varianza justificado por las variables independientes. El R2 ajustado tiene en cuenta el tamao del conjunto de datos, y su valor es ligeramente inferior al de su correspondiente R2 El R2 es un criterio de valoracin de la capacidad de explicacin de los modelos de regresin, y representa el porcentaje de la varianza justificado por la variable independiente. Se puede interpretar como el cuadrado del coeficiente de correlacin de Pearson entre las variables dependiente e independiente, o tambin como el cuadrado del coeficiente de correlacin entre los valores reales de una variable y sus estimaciones. Si todas las observaciones estn en la lnea de regresin, el valor de R2 es 1, y si no hay relacin lineal entre las variables dependiente e independiente, el valor de R2 es 0. El coeficiente R2 es una medida de la relacin lineal entre dos variables. A medida que su valor es mayor, el ajuste de la recta a los datos es mejor, puesto que la variacin explicada es mayor; as, el desajuste provocado por la sustitucin de los valores observados por los predichos es menor.

Los valores que se han obtenido para el coeficiente R2 en los diferentes estudios publicados, por ejemplo, sobre los puntos de funcin varan desde 0,44 hasta 0,87. Apoyndose en estos valores, algunos autores afirman la validez de la tcnica de los puntos de funcin. Sin embargo, es una conclusin que no se desprende directamente de esos datos. Fijmonos que son valores explicativos, no predictivos. Tanto el R2 como el coeficiente de correlacin no son las medidas ms adecuadas para evaluar la prediccin de un modelo; en el mejor de los casos se trata de medidas del ajuste de la ecuacin a los datos, no de la capacidad predictiva del modelo. En algunos casos la idea que nos transmite el R2 puede coincidir con la de las variables que a continuacin se muestran, pero en otros no. Desde este punto de vista, las variables ms convenientes para la evaluacin son PRED(0,25), nivel de prediccin al 25%, y MMRE, magnitud media del error relativo, definidas y descritas a continuacin.

Desde este punto de vista, las variables ms convenientes para la evaluacin son PRED(0,25), nivel de prediccin al 25%, y MMRE, magnitud media del error relativo, definidas en [Conte et al., 1986], y descritas a continuacin.

Magnitud Media del Error Relativo, MMRE, se define como , donde e es el valor real de la variable, es su valor estimado y n es el nmero de proyectos. As si el MMRE es pequeo, entonces tenemos un buen conjunto de predicciones. Un criterio habitual para considerar un modelo como bueno es el de MMRE < 0,25. La Figura 1 muestra las distancias que se utilizan para el clculo de esta medida. . Distancias utilizadas en el MMRE. Las lneas continuas representan la diferencia entre el valor real y el estimado.

Prediccin de Nivel l -PRED(l)-, donde l es un porcentaje, se define como el cociente del nmero de casos en los que las estimaciones estn dentro del lmite absoluto l de los valores reales entre el nmero total de casos. Por ejemplo PRED(0.1) = 0,9 quiere decir que 90% de los casos tienen estimaciones dentro del 10% de sus valores reales; PRED(0,25) = 0,9 quiere decir que el 90% de los casos tiene estimaciones dentro del 25% de sus valores reales. Un criterio habitual para aceptar un modelo suele ser el de PRED(0,25) 0,75, aunque algunos autores rebajan este requisito. La siguiente figura representa grficamente el nivel de prediccin

El nivel de prediccin se calcula sumando el nmero de veces que la lnea continua se corta con los trazos verticales (rango del 25% de los valores reales), y despus dividiendo esa suma entre el nmero total de puntos

lo que queremos es realizar predicciones lo ms acertadas posibles, sin importarnos el; aceptaramos hasta la bola mgica, si sta funcionara. Y para medir esa capacidad de prediccin se deben utilizar variables predictivas principalmente, no slo explicativas.

Correlacin La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas. Tipos de correlacin 1 Correlacin directa La correlacin directa se da cuando al aumentar una de las variables la otra aumenta.

La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

You might also like