El Mtodo Estadstico es un poderoso instrumento o procedimiento de trabajo del
Mtodo Cientfico. Es comn que se tenga el criterio reducido, de que el mismo se ponga de manifiesto cuando se tiene recogida cierta cantidad de datos y se pretenda analizar los mismos para llegar a las deducciones necesarias, algo que se contradice cuando se mencionan sus etapas: Planificacin de la investigacin. Recoleccin de la Informacin. Elaboracin de los datos recogidos. Anlisis e interpretacin. (Ms C. Alfredo Alvarez Gonzlez).
Es en la Planificacin de la investigacin donde se organiza toda ella a partir de un esquema tal que sea capaz de evaluar su factibilidad adems que controle, facilite y evale su ejecucin hasta alcanzar la meta propuesta. Por tanto se corresponde con esta etapa la preparacin de un Protocolo o Proyecto de Investigacin en el cual se definen las herramientas a utilizar.
Como parte de la Elaboracin de los Datos est el sometimiento de los mismos a las herramientas de la Estadstica, como ejemplo: Prueba de Hiptesis, ya prevista a utilizar cuando se crea el Protocolo.
Con frecuencia en la prctica tenemos que tomar decisiones sobre poblaciones a partir de informaciones mustrales. Esas decisiones se conocen como decisiones estadsticas. Por ejemplo queremos decidir partiendo de datos mustrales si un nuevo material es realmente ms resistente en la construccin de una cuerda, si un procedimiento en Cultura Fsica es mejor que otro, etc.
Al intentar tomar decisiones, debemos hacer suposiciones sobre la poblacin cuya caracterstica es analizada en cuestin. Tales suposiciones, que pueden o no ser verdaderas, y en general son proposiciones sobre las distribuciones de probabilidad de las poblaciones, son llamadas hiptesis estadsticas.
PRUEBA DE HIPOTESIS
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
H o ; = 50 cm/s H 1 ; 50 cm/s
La proposicin H o ; = 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin H 1 ; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hiptesis alternativa unilateral, como en
H o ; = 50 cm/s H o ; = 50 cm/s
H 1 ; < 50 cm/s H 1 ; > 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes:
Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro.
Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.
Cuando el valor del parmetro proviene de consideraciones externas, tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.
Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s. Esto es, se desea probar:
Ho; = 50 cm/s H1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se observa cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la media verdadera de la poblacin. Un valor de la media muestral que este prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5 >51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5 51.5 forman la regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede observarse un valor del estadstico de prueba que cae en la regin crtica. En este caso, la hiptesis nula Ho ser rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es verdadero. Este tipo de conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es verdadera. Tambin es conocido como nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s, aunque la media muestral caiga dentro de la regin de aceptacin. En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error se define como la aceptacin de la hiptesis nula cuando sta es falsa. Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que determinan si la decisin final es correcta o errnea.
Decisin Ho es verdadera Ho es falsa Aceptar Ho No hay error Error tipo II Rechazar Ho Error tipo I No hay error
Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro.
El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores crticos.
Un aumento en el tamao muestral n reducir y de forma simultnea.
Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser menor
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.
Anlisis de Correlacin .- Es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos variables.
El principal objetivo del anlisis de correlacin consiste en determinar que tan intensa es la relacin entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersin.
Diagrama de Dispersin.- es aquel grafico que representa la relacin entre dos variables.
Variable Dependiente.- es la variable que se predice o calcula. Cuya representacin es "Y"
Variable Independiente.- es la variable que proporciona las bases para el calculo. Cuya representacin es: X1,X2,X3.......
Coeficiente de Correlacin. Describe la intensidad de la relacin entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relacin lineal entre dos variables.
El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal entre las dos variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar que ms dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe relacin lineal alguna entre ambas variables. Anlisis de regresin. Es la tcnica empleada para desarrollar la ecuacin y dar las estimaciones.
Ecuacin de Regresin. es una ecuacin que define la relacin lineal entre dos variables.
Ecuacin de regresin Lineal: Y = a + Bx Ecuacin de regresin Lineal Mltiple: Y = a + b1X1 + b2X2 + b3X3... Principio de Mnimos Cuadrados.- Es la tcnica empleada para obtener la ecuacin de regresin, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y". Anlisis de regresin y Correlacin Mltiple.- consiste en estimar una variable dependiente, utilizando dos o ms variables independientes.
REGRESIN Y CORRELACIN ENTRE DOS VARIABLES
Se muestra cmo graficar la regresin lineal entre dos variables y cmo apreciar el coeficiente de correlacin, tanto a partir de la grfica como mediante una columna calculada.
Conformar una vista que tenga en las filas las dos variables (medidas) a estudiar y en las columnas la variable que identifica cada observacin (por ejemplo tiempo, nmero de encuesta, individuo, etc.)
Pasar al modo grfico eligiendo la opcin Lneas Dispersin XY
Si se desea ver la recta que ms se ajusta a los datos, dirigirse a Opciones y elegir Mostrar regresin lineal. En las referencias de la grfica se ver la ecuacin de dicha recta.
Para ver el r^2, nuevamente en Opciones, elegir Desplegar correlacin. En las referencias de la grfica se ver, debajo de la ecuacin de la recta, el valor del r^2
Se puede utilizar la grilla de la vista anterior (en las filas las dos variables (medidas) a estudiar y en las columnas la variable que identifica cada observacin)
Agregar una columna calculada con una expresin creada por el usuario
DEFINICIN ESTADSTICA
La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.
Clculo
Como hemos comentado anteriormente, la probabilidad mide la mayor o menor posibilidad de que se d un determinado resultado (suceso) cuando se realiza un experimento aleatorio.
La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%):
El valor cero corresponde al suceso imposible: lanzamos un dado al aire y la probabilidad de que salga el nmero 7 es cero (al menos, si es un dado certificado por la OMD, "Organizacin Mundial de Dados").
El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de que salga cualquier nmero del 1 al 6 es igual a uno (100%).
El resto de sucesos tendr probabilidades entre cero y uno: que ser tanto mayor cuanto ms probable sea que dicho suceso tenga lugar.
Cmo se mide la probabilidad?
Uno de los mtodos ms utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles.
P(A) = Casos favorables / casos posibles
Veamos algunos ejemplos:
a) Probabilidad de que al lanzar un dado salga el nmero 2: el caso favorable es tan slo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier nmero del uno al seis). Por lo tanto:
P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%)
Significacin estadstica
En estadstica, un resultado es estadsticamente significativo cuando no es probable que haya sido debido al azar. Una "diferencia estadsticamente significativa" solamente significa que hay evidencias estadsticas de que hay una diferencia; no significa que la diferencia sea grande, importante, o significativa en el sentido estricto de la palabra.
El nivel de significacin de un test es un concepto estadstico asociado a la verificacin de una hiptesis. En pocas palabras, se define como la probabilidad de tomar la decisin de rechazar la hiptesis nula cuando sta es verdadera (decisin conocida como error de tipo I, o "falso positivo"). La decisin se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de significacin, entonces la hiptesis nula es rechazada. Cuanto menor sea el valor P, ms significativo ser el resultado.
En otros trminos, el nivel de significacin de un contraste de hiptesis es una probabilidad P tal que la probabilidad de tomar la decisin de rechazar la hiptesis nula - cuando sta es verdadera - no es mayor que P.
CONCLUSIONES
Si se condensan los resultados hasta aqu obtenidos, a manera de conclusiones se puede abordar, que todo problema de prueba de hiptesis consiste en lo siguiente:
1. Identificar una variable aleatoria X que tiene una distribucin conocida, es decir, que pertenece a una clase determinada, por ejemplo a las del tipo normal, y con relacin a la cual se quiere tomar una decisin respecto al valor de un parmetro desconocido, pero asociado a ella, digamos (, (, ...,etc.
2. Se plantea una hiptesis nula, donde se asume un valor para el parmetro; y una hiptesis alternativa donde se contradice lo expresado en la hiptesis nula.
3. Se escoge el nivel de significacin a, que es la probabilidad de rechazar la hiptesis nula siendo esta cierta.
4. Se selecciona una muestra de tamao n para estimar el parmetro desconocido y poder posteriormente decidir si se rechaza o no H0.
5. Se define la regin crtica para la prueba de hiptesis de inters.
6. Se toma la decisin de rechazar H0, con un nivel de significacin a si el valor estimado del parmetro est en la regin crtica y de no rechazar H0 si este valor no est en la regin crtica.
BIBLIOGRAFA
TAPIA B Mara Antonieta. APUNTES Metodologa de la Investigacin. INACAP. Ingeniera en Gestin Informtica. Sede Temuco. Santiago, 2000.
CRDOVA MARTNEZ, Carlos A. Consideraciones sobre la Metodologa de la Investigacin. Centro de Estudios sobre la Cultura e Identidad. Universidad de Holgun "Oscar Lucero Moya". Holgun.
ALVAREZ GONZLEZ Alfredo. Informtica e Investigacin I. Guas de Estudios. Instituto Superior de Ciencias Mdicas de La Habana. Facultad de Tecnologa de la Salud. La Habana. 2006.
MURRAY R. SPIEGEL. Teora y Problemas de Estadstica. Direccin General de Formacin y Perfeccionamiento de Personal Pedaggico. La Habana. 1979
GUERRA BUSTILLO Caridad W, MENENDEZ ACUA Ernesto, BARRERO MORERA Rolando. EGAA MORALES Esteban. Estadstica. Editorial Pueblo y Educacin. La Habana. 1991
TORRICELLA MORALES Ral G. Elaboracin de Bibliografas. Descripcin simplificada del formato ISO 690:1997. Dpto. de Alimentos. Instituto de Farmacia y Alimentos. Universidad de la Habana. La Habana.