1.4. Errores y Tratamiento Estadistico de Los Datos Analiticos (Examen Unidad1)

Instituto tecnolgico de Tuxtla Gutirrez.
Qumica analtica I
Examen de la unidad 1
Errores y tratamientos estadsticos de los datos analticos.
Integrantes: Espinoza Arrioja Yesenia Guadalupe Hernndez Ovalle Karina Lpez Lpez lea Ramrez Jimnez Evelin Ramrez Santizo Fredy Ulises Velzquez Crdova Alejandro Jakousi
Tuxtla Gutirrez, Chiapas. 19 de marzo del 2013.
ndice
Resumen...............................1 Introduccin. 2 1.4. Errores y tratamiento estadstico de los datos analticos..3 1.4.1. Concepto y clasificacin de errores..4 1.4.2. Eliminacin y control de errores.7 1.4.3. Clculo del valor ms probable y lmites de confianza.19 1.4.4 Criterios estadsticos para rechazo de valores dudosos...21 1.4.5 T de student y pruebas de significancia...23 Bibliografa..28
RESUMEN
Los errores experimentales son responsables de variacin en la prediccin y en la exactitud de los resultados experimentales por eso debemos analizar la importancia del tratamiento estadstico de los datos analticos. Debemos definir los trminos precisin y exactitud y los mtodos para expresarla de igual forma. La precisin y exactitud con la que se determina una variable se refiere a cualidades distintas de su valor. Se dice que una variable fue determinada con exactitud, y su valor vista muy poco del valor verdadero o esperado. En cambio, se dice que una variable fue determinada con precisin, si su valor es altamente reproducible; es decir en una serie de medidas hay muy poca variacin entre los valores determinados para la variable. La exactitud se mide usando el error absoluto o discrepancia porcentual respecto al valor verdadero. Existen distintas pruebas para el rechazo de informacin dudosa como la prueba Q para poder utilizarla debemos de conocer su criterio al aplicarla en la evaluacin de datos analticos. As como esta debemos de analizar otros mtodos como t de Student y la prueba F como elementos para pruebas de significancia que sirven para la determinacin de las diferencia entre dos medidas mustrales y para la construccin de intervalos de confianza.
INTRODUCCION
Como una ciencia experimental, la qumica analtica es cada da ms cuantitativa, las mediciones (de masa, volumen, potencial elctrico, unidades de absorbencia, etc.) Realizadas en el laboratorio tienen como metas cuantificar los valores para variables que en la naturaleza son continuas lo que implica que dichas mediciones deben estar sujetas a errores; incluso medidas independientes de la misma cantidad, cuando se realizan en condiciones aparentemente idnticas, difieren dentro de ciertos lmites. El anlisis de los datos debe presentarse de manera que sea fcilmente comprensible. Con demasiada frecuencia, el lenguaje puramente estadstico significa poco o nada para los qumicos y bioqumicos; expresiones tales como existe una diferencia significativa puede ser verdadera, pero es d emasiado general para ser til. Toda medida fsica est sujeta a un grado de incertidumbre que, en el mejor de los casos, puede ser reducido a un valor aceptable, pero nunca podr eliminarse totalmente. Determinar la magnitud de esta incertidumbre puede ser difcil y requiere de un esfuerzo adicional al de la medicin y de criterio por parte del observador. Existen distintas pruebas que nos pueden ayudar en la comparacin de la hiptesis, para los clculos de los valores ms probables y lmites de confianza as como pruebas para el rechazo de valores dudosos. Cualquier determinacin cuantitativa en la que se exprese un resultado numrico sin el conocimiento de la incertidumbre asociada con l es un dato intil. Por otra parte, un resultado de menor exactitud podr ser de utilidad si se conoce el lmite de error que lo afecta. Es decir, no existen resultados cuantitativos vlidos si no van acompaados de una estimacin de los errores inherentes a ellos. Es esencial conocer los errores experimentales para interpretar adecuadamente el resultado obtenido. Existen varias causas para producir errores estadsticos, segn las causas son clasificadas es errores de muestro y de no muestreos. El error de muestro puede ocurrir en cualquier encuesta sea un censo o una muestra. Estos errores comprenden errores sistemticos y equivocaciones. Los errores de no muestreo se originan en el conjunto de operaciones que se realizan en el proceso de recogida y almacenamiento de informacin. La magnitud del error ajeno al muestreo depende bsicamente del nmero de observaciones registradas.
2
1.4. ERRORES Y TATAMIENTO ESTADISTICO DE LOS DATOS ANALITICOS
TRATAMIENTO ESTADSTICO DE DATOS En una serie de determinaciones independientes de una cantidad dada, si los errores determinados se han eliminado efectivamente o corregido, el promedio o la media de los valores numricos obtenidos puede tomarse como el valor ms probable de la serie, y una evaluacin del grado de este valor promedio puede considerarse como una medida del grado de limitacin en que el resultado puede diferir del valor verdadero, desconocido. Esto es, por tanto, una medida de la seguridad del resultado. RECHAZO DE UN RESULTADO En una serie de medidas similares puede aparecer un resultado que difiere de manera considerable de los otros por estar aparentemente alejado, es decir, presenta una desviacin considerablemente mayor que los dems; surge la tentacin de descartarlo para calcular la media. La nica base cierta para descartar este valor, es saber si al realizar el anlisis alguno anduvo mal en esa determinacin en particular. Por ejemplo, se pudo haber pensado una cantidad diferente anotada, se perdi algo de material durante la etapa de disolucin, o en la transferencia de un recipiente a otro hubo perdida de lquido (se derramo), o se hirvi cuando el procedimiento lo impeda, etc. especial inters debe de ponerse al realizar los clculos para descartar un error numrico. El valor sospechoso puede ser descartado con 90% o 95% de confianza, dependiendo de las exigencias de las normas del departamento de aseguramiento de la calidad de la institucin o empresa. Todas las medidas experimentales son variables, suponiendo que el instrumento de medida sea lo suficiente sensible para detectar el nivel de variabilidad existente. Esta variabilidad es la determinante fundamental de la magnitud de los efectos que pueden ser detectados. A menos que las medidas presenten variabilidad, el experimentador est incapacitado para estimar la magnitud del efecto ms pequeo que puede observar y no puede estimar cuantitativamente la veracidad de una diferencia observada.
Por consiguiente, es conveniente que en cualquier experimento las medidas repetidas sean variables y, naturalmente, que la magnitud de la variacin sea pequea. Nadie puede jactarse de haber obtenido una serie de medidas idnticas.
1.4.1 CONCEPTO Y CLASIFICACION DE ERRORES

Errores determinados, indeterminados y grandes Todo resultado contendr algo de error, independientemente de lo cuidados que haya sido la medicin. Los errores se pueden clasificar como indeterminados o determinados, segn su origen. Los errores indeterminados son los que causan una distribucin aleatoria de los datos en torno a un punto medio. A veces se les llama errores aleatorios. En el caso normal se relacionan con el efecto neto de varias fluctuaciones pequeas e impredecibles, que podran no identificarse o eliminarse con facilidad. Errores de este tipo son la causa de baja precisin. Los errores determinados (o sistemticos) causan, sin embargo, que todos los resultados se desplacen en una direccin. En consecuencia, se corren hacia los valores que son demasiado bajos o demasiado altos. Los errores de este tipo son la causa de la poca exactitud. Tambin puede haber errores de un tercer tipo, llamados errores grandes o gruesos. En el caso normal son grandes, y se deben a que se ha cometido un error de importancia en el mismo procedimiento analtico, invalidando as el resultado. Los errores grandes causan los puntos sospechosos que, bajo ciertas circunstancias, se podrn rechazar para no distorsionar el resto del conjunto de datos.
Los errores indeterminados slo causan dispersin de los datos en torno a un punto medio, que con frecuencia es cercano al valor verdadero. Si se calcula el valor medio de varias medidas replicadas, muchas veces se minimiza el efecto de los errores de esta clase. La magnitud de los errores indeterminados es, con frecuencia, una funcin de la magnitud del resultado; pero ello no necesariamente es cierto. Por otra parte, los errores determinados, desplazan todos los datos en una direccin, todos en la misma cantidad. Por consiguiente, los errores determinados son ms significativos cuando los valores de los datos son pequeos, ya que el porcentaje de error en ese caso aumenta en consecuencia. Un error grande suele hacer que un punto de datos est muy alejado del resto de los datos, y de esta forma se identifica con facilidad. FUENTES DE ERRORES INDETERMINADOS
Los errores indeterminados o aleatorios surgen debido a variaciones pequeas e impredecibles. La fuente del error puede deberse a muchos factores, como error humano, fluctuaciones de temperatura o pequeas diferencias en las cantidades de reactivos usados. Como hay distintas fuentes de error que a veces hacen disminuir o aumentar el resultado, los datos se dispersan en torno al valor verdadero. En algunos casos, dos o ms errores aleatorios se suman y aumentan el valor del dato. En otros, pueden causar una disminucin neta en el valor del dato medido. FUENTES DE ERRORES DETERMINADOS Los errores determinados o sistemticos hacen que todos los datos se desplacen en una direccin. Esos errores tienen, con frecuencia, una magnitud muy parecida. Este comportamiento se debe a que se presenta el mismo tipo de error de esta clase. Imagine una bscula que no est puesta en cero (tarada) antes de hacer la primer determinacin; sta da una indicacin de 0.5g por ejemplo, cuando nada hay en el platillo. Despus, cada masa que se pese ser 0.5g menor que el valor que indica la bscula. Tambin es claro que el error adquiere ms importancia cuando se miden menores cantidades de reactivo. Hay tres fuentes principales de errores determinados, que son: 1. Errores instrumentales 2. Errores de metodologa 3. Errores personales ERRORES INSTRUMENTALES Debidos a la discrepancia entre el valor nominal y el real se corrigen procediendo peridicamente al contraste y aforo del material (calibracin de instrumentos): Contenido y vertido del material volumtrico (especialmente cuando se ha estado sometido a variaciones trmicas: calentar matraces aforados o guardarlos en la nevera) Deriva de las seales en la instrumentacin (desajuste del cero por calentamiento, aparicin de radiacin parasita, etc.) Reactivos conteniendo impurezas Efecto de memoria por la retencin accidental de restos de muestra en el instrumento (dificultad de eliminar vestigios de compuestos poco voltiles en espectrometra de masas, elucin muy lenta de componentes en cromatografa de gases, etc.)
6
ERRORES DE METODOLOGA Se pueden presentar errores de metodologa cuya causa es que el mtodo que se sigue tiene fallas, o se realiza en forma incorrecta. En este caso, un ejemplo sera el uso de una pipeta de vidrio que tenga la punta rota y que, en consecuencia, no permita retener el pequeo volumen residual de titulacin. La pipeta est calibrada para tener en cuenta ese volumen, y si no se retiene, todos los puntos de equivalencia en la titulacin estarn desplazados por el mismo valor. De forma similar, un alumno puede sacudir con rigor la ltima gota de la pipeta cuando lo indicado es que se retenga; una vez ms, el punto de equivalencia de la titulacin estar desplazado. ERRORES PERSONALES Se relacionan con el juicio personal, en el caso normal. Hay muchos anlisis donde intervienen el hecho de formarse un juicio. Por ejemplo la anotacin de un punto de equivalencia de titulacin a ojo o la estimacin de una indicacin en una escala. Algunas personas podran pasarse en forma consistente de los puntos finales de las titulaciones si son daltnicas, mientras que otras siempre tendern a redondear hacia abajo o hacia arriba la posicin de la aguja respecto a la divisin ms cercana. Son difciles de eliminar los errores de esta clase, ya que todos tenemos prejuicios incorporados, independientemente de los objetivos que tratemos de ser. Tambin es muy fcil tener una idea preconcebida de que resultado se debe obtener antes de hacer realmente un e xperimento. Tiene especial importancia precaverse de este tipo de errores.
1.4.2. ELIMINACION Y CONTROL DE ERRORES

La consideracin de los errores experimentales Todos los datos contienen cierto grado de incertidumbre, inexactitud y errores asociados. Por consiguiente es imperativo estimarlos de modo que se tomen en cuenta o bien, si se cree que son inaceptables, los datos se puedan rechazar para volver a hacer la medicin. Los mtodos principales para cuantificar y manejar errores implican la aplicacin de una estadstica sencilla. MEDICIONES REPLICADAS En cualquier conjunto de datos siempre se presentan errores, no importa el cuidado con que se haga el anlisis. Por consiguiente se aconseja hacer un anlisis varias veces si es posible, para dar certidumbre de que la prueba produzca una indicacin cierta y vlida.
7
Si uno o ms anlisis resultan en una cifra que parezca dudosa al compararla con el resto de los datos, se aconseja hacer ms lecturas antes de rechazar los datos dudosos. En este caso el dato dudoso puede ser til para llamar la atencin sobre un proceso que podra conducir a resultados incorrectos. Si el conjunto de datos tiene una dispersin grande de valores, poco correlacionados entre s, la validez de todo el procedimiento analtico se puede poner en duda. En casa caso, tener en cuenta el conjunto total de datos puede ser muy til. La prctica para obtener varios resultados se conoce como obtener medidas replicadas o duplicadas (pueden ser varios duplicados). Los procesos que tienen por objeto vigilar la calidad y fiabilidad de los datos se llaman tcnicas de aseguramiento de la calidad. DISPERSIN DE LOS DATOS La dispersin o intervalo de los datos es la diferencia aritmtica entre los datos mnimo y mximo, para un conjunto de mediciones. Primero deben ordenarse los datos aritmticamente de menor a mayor, y restar el valor menor del mayor. Ejemplo 1: Una determinacin analtica de Pb en una solucin acuosa se hace con seis replicados, con los resultados siguientes. Determinar la dispersin (o intervalo) de los datos. ppm Pb2+ a) 20.1 b) 19.5 c) 20.3 d) 19.7 e) 20.0 f) 19.4 g) 19.6 Solucin La dispersin de los datos describe la diferencia entre el dato (o el punto de dato, es decir, el valor del dato) mximo y el mnimo.
8
El valor mximo corresponde a 20.3 ppm Pb2+ y el mnimo valor, a 19.4 ppm Pb2+. Por consiguiente, la dispersin es (20.3 19.4) ppm Pb2+. La dispersin es de 0.9 ppm Pb2+. LA MEDIA La media de un conjunto de medidas replicadas tambin se llama a veces media aritmtica o promedio; slo son sinnimos del mismo trmino. La media de un conjunto de datos es igual a la suma de todos los valores de los datos, dividida entre la cantidad de mediciones que contiene el conjunto de datos. Se acostumbra usar la letra N para indicar la cantidad total de valores de datos, o de medidas replicadas. Tambin se usa con frecuencia la letra i como subndice, para identificar cada valor de dato; i puede ir de i=1 a i=N. Por lo tanto, si hay cinco valores de datos, i puede ser 1,2,3,4 o 5. La letra griega mayscula sigma (), se usa para indicar la suma de varios datos. En el caso normal, se acompaa a con ndices y subndices, para describir los valores mnimo y mximo de datos que se suman. Entonces por consiguiente, significa que se deben sumar los datos desde su primero (i=1) hasta su ltimo (i=N) valor. Con frecuencia hay varios valores de datos dentro de un conjunto, y en ese caso lo normal es identificar cada valor para evitar confusiones. Si se va a sumar el conjunto de datos x, este hecho puede expresarse como datos (i=1 hasta N). , lo cual quiere decir que se deben sumar todos los
En consecuencia, la media de un conjunto de datos (x) ser igual a:
Ejemplo 2: Si se toma el mismo conjunto de datos que para el ejemplo 1, ppm Pb2+. a) 20.1 b) 19.5
9
c) 20.3 d) 19.7 e) 20.0 f) 19.4 g) 19.6
= 20.1 + 19.5 + 20.3 + 19.7 + 20.0 + 19.4 + 19.6 = 138.6 ppm Si N=7 entonces
LA MEDIANA Si un conjunto de datos consiste en una cantidad impar de valores, la mediana es el valor del dato que est a la mitad del conjunto, cuando se ordena por valores aritmticos. Sin embargo, si un conjunto de datos contiene una cantidad par de valores, la mediana es el promedio de los dos valores de los datos que estn a la mitad del conjunto cuando se ordena por valores aritmticos. Ejemplo 3: Si se toma el mismo conjunto de datos, ppm Pb2+. Determinar la mediana. a) 20.1 b) 19.5 c) 20.3 d) 19.7 e) 20.0 f) 19.4 g) 19.6
10
Se ordenan numricamente los datos a) 19.4 b) 19.5 c) 19.6 d) 19.7 e) 20.0 f) 20.1 g) 20.3 Aritmticamente, el punto medio es 19.7 ppm Pb2+, y en este caso es lo que se busca: la mediana = 19.7 ppm Pb2+. Si el conjunto de datos tiene una cantidad par de valores, se debe dar un paso adicional: Ejemplo 4: Calcular la mediana de los datos que aparecen a continuacin. Los datos siguientes son iguales a los del ejemplo anterior, pero con un valor adicional. Hay ocho (cantidad par de valores), ppm Pb2+. a) 20.1 b) 19.5 c) 20.3 d) 19.7 e) 20.0 f) 19.4 g) 19.6 h) 19.9 Solucin:
11
Se ordenan los datos numricamente Se calcula el promedio de los dos valores de datos que estn a la mitad del conjunto, para determinar la mediana. a) 19.4 b) 19.5 c) 19.6 d) 19.7 e) 19.9 f) 20.0 g) 20.1 h) 20.3 Se determina la mediana de los dos valores de dato que estn a la mitad del conjunto ya ordenado. Estos dos valores se sumen y dividen entre 2 para calcular su promedio, y en consecuencia, la mediana del conjunto de datos:
CUANTIFICACIN DE LOS ERRORES EXPERIMENTALES Precisin y exactitud son dos trminos que se confunden con frecuencia. La precisin describe la reproducibilidad de los resultados; en otras palabras, lo cerca que estn las mediciones replicadas entre s. La reproducibilidad y, en consecuencia, la precisin del conjunto de datos, se determinan viendo la dispersin de los valores. La precisin del conjunto de datos, se puede evaluar mediante: 1. La desviacin estndar. 2. La desviacin estndar relativa (coeficiente de variacin). 3. La varianza.
12
Cada uno de estos trminos es una funcin de la dispersin de los datos, la exactitud de los datos, en contraste, describe lo cerca que estn los valores respecto al valor verdadero o aceptado para la medicin. Naturalmente, puede ser que nunca sea posible determinar la exactitud, ya que esto implicara suponer que ya se sabe el valor verdadero, con certeza absoluta. La exactitud de los datos puede ser descrita en funcin del error de los valores. EL ERROR ABSOLUTO El error absoluto de un sistema es igual a la diferencia entre el valor obtenido xi y el valor verdadero (o aceptado) xy: EL ERROR RELATIVO El error relativo, Et, describe la diferencia en relacin con la magnitud del valor verdadero y, en consecuencia, puede ser ms til que considerar el error absoluto aislado. En el caso normal, el error relativo se describe en trminos de un porcentaje del valor verdadero, o en milsimos del valor verdadero. Si el error relativo se debe escribir como porcentaje, entonces se puede calcular con la ecuacin siguiente:
En forma parecida, si se va a expresar en partes por mil (o tanto por uno) () del valor verdadero, Er se calcula con la ecuacin siguiente:
Ejemplo 5: Calcular el error relativo, en porcentaje, para un anlisis de hierro que da como resultado 115 ppm de contenido de Fe, si el valor verdadero es 100 ppm. Solucin: Se asigna el valor verdadero xt y xi; a continuacin se calcula el porcentaje de error en el resultado: Xt = 110 ppm de Fe Xi = 115 ppm de Fe
13
Er puede ser un valor negativo, si el valor medido es menor que el valor verdadero. El signo negativo sirve para indicar que le resultado es bajo. Un valor positivo de Er indica que un resultado es mayor que el valor verdadero.
Ejemplo 6: De nuevo se usan los datos que en el ejemplo anterior, para calcular el error relativo en partes por mil, para un anlisis cuyo resultado es 115 ppm de Fe y el valor verdadero es 110 ppm de contenido de Fe. Solucin: Se asignan los valores de xt, el valor verdadero, y de xi, el valor medido; a continuacin se calcula el error, en el resultado, en partes por mil del valor verdadero.
Xt = 110 ppm de Fe Xi = 115 ppm de Fe
Exactitud y Precisin Se pueden comparar la exactitud y la precisin, imaginando un tiro al blanco al que disparan varios deportistas. Si un tirador apunta bien, cabe esperar que pegue en el blanco una y otra vez. Este caso es anlogo al de un procedimiento analtico que tiene altos valores de exactitud y precisin.
14
DESVIACIONES ESTNDAR Los errores indeterminados o aleatorios se pueden manejar con normalidad mediante la estadstica. Se debe calcular una desviacin estndar muestral, o de la muestra, para conjuntos de datos de 10 valores o menos; se deben calcular desviaciones estndar poblacionales, o de poblacin, si los conjuntos tienen ms de 10 datos. Las desviaciones estndar tienen las mismas unidades que las mediciones originales; si los anlisis originales producen resultados en partes por milln ppm de Pb, entonces la desviacin estndar tambin se expresar en ppm Pb.
15
El concepto de desviacin estndar supone una distribucin de datos en torno al valor medio o verdadero; por consiguiente, una desviacin estndar grande corresponde a una gran dispersin de datos. INTERPRETACIN Y APLICACIN La desviacin estndar es una medida del grado de dispersin de los datos del valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto de la media aritmtica. Una desviacin estndar grande indica que los puntos estn lejos de la media, y una desviacin pequea indica que los datos estn agrupados cerca de la media. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7. La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora. Esto es de esperarse, ya que las mediciones caen fuera del rango de valores de los cuales sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar, es uno de tres parmetros de ubicacin central, nos muestra la agrupacin de los datos alrededor de un valor central. DESVIACIN ESTNDAR MUESTRAL La desviacin estndar muestral, s, describe la dispersin de los datos respecto al punto medio de sus valores, para un conjunto de mediciones replicadas. La ecuacin es:
16
Ejemplo: Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de nios. { 4, 1, 11, 13, 2, 7 } 1. Calcular el promedio o media aritmtica .
En este caso, N = 6 porque hay seis datos:
i=nmero de datos para sacar desviacin estndar
2. Calcular la desviacin estndar s
17
DESVIACIN ESTNDAR POBLACIONAL Cuando un conjunto de datos tiene una cantidad mayor de valores (>10, en el caso tpico), se altera un poco la ecuacin que se usa para calcular la desviacin estndar y es:
Ahora se usa para representar la desviacin estndar de un conjunto grande de datos, y se llama desviacin estndar poblacional. LA VARIANZA La varianza es el cuadrado de la desviacin estndar: Varianza = s2 (para conjuntos de datos con <10 valores) O bien Varianza = 2 (para conjuntos de datos con >10 valores)
18
1.4.3 CALCULO DEL VALOR MS PROBABLE Y LMITES DE CONFIANZA

Para una serie de medias constituida por un gran nmero de datos, se han calculado los valores de las probabilidades de que cualquier medida caiga dentro de ciertos lmites en torno a la media; para infinito nmero de medidas se puede plantear que: En la siguiente tabla se dan algunos valores de esta probabilidad. Esto quiere decir que la probabilidad de encontrar un valor dentro del intervalo [la media ] solo comprende al 68.3% de ellos; dentro del intervalo [la media ] correspondiente al 95.5%, etc. Como en qumica analtica no es posible obtener infinito numero de medidas, no es confiable tomar que la media, , sea una estimacin del valor verdadero, . Luego es necesario hacer un estimativo del intervalo de incertidumbre, planteando que el valor verdadero o mas probable obtenido de una serie de medidas se encuentre en el intervalo: Llamado limite de confiabilidad
Lmite de error expresado en 0.5 1.0 1.5 2.0 2.5 3.0 4.0
Probabilidad de que un resultado quede entre los limites 0.383 0.683 0.866 0.955 0.998 0.997 0.9999
En 1908 W.S. Grosset, quien escriba bajo el seudnimo de Student, desarrollo un parmetro t, para calcular valores para el intervalo de incertidumbre , que depende tanto del nmero de medidas como del grado de confiabilidad de experimentador. Este valor se puede expresar como: El reporte final de los resultados vendr dado por la expresin: 19
En donde es el promedio, N es el tamao de la muestra, s es la desviacin estndar, y el valor de t es la distribucin de la tabla siguiente:
No. De mediciones replicadas 2 3 4 5 6 7 8 9 10

*Tabla de distribucin t Ejemplo:
Probabilidad 90% 6.314 2.920 2.235 2.132 2.015 1.943 1.895 1.860 1.833
95% 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262
Calcular los limites de confianza de 95% y 90% para los datos del valor medio de la concentracin de Pb, en: a) b) c) d) e) f) g) 19.4 20.6 18.7 19.2 21.6 18.9 19.9 ( ( Ppm = partes por milln 19.8 = lmite de confianza )( )( ) )
20
1.4.4. CRITERIOS ESTADSTICOS PARA RECHAZO DE VALORES DUDOSOS.

PUNTOS SOSPECHOSOS Si un conjunto de datos contiene un valor que apreciablemente es distinto de todos los dems, hay una gran posibilidad de que est equivocado, y que sea el resultado de un error grande. Debe optarse por conservar o rechazar su valor. Si se conserva un valor espurio, el promedio de los datos, y tambin la desviacin estndar de stos, quedarn distorsionados. Por otra parte, naturalmente existe la posibilidad de que el valor dudoso sea vlido en realidad, y simplemente sea inesperado; en este caso puede ser que la precisin del procedimiento analtico sea menor que la esperada. Debe tenerse mucho cuidado, ya que si se rechaza un dato vlido, se introducir un sesgo (o prejuicio) en los datos.
LA PRUEBA Q Si se sospecha que existe un punto dudoso, la prueba Q permite calcular un cociente, Q , y compararlo con una table, para decidir si se debe rechazar o
exp
conservar el valor. La prueba no produce un resultado definido, pero da alguna idea de la confianza que se puede asociar al rechazar un valor de dato. Se calcula con la ecuacin:
Qexp=
Donde x representa al valor dudoso, x es el valor vecino ms cercano, x es el

q n h
dato con valor mximo y x es el dato con el valor mnimo.

1
Habiendo calculado el valor Q
exp
debemos compararlo con los valores de la tabla

exp
que correspondan a la cantidad de datos replicados que se midieron. Si Q
es
menor que todos los valores de la tabla, no se pueden rechazar los datos con la certeza indicada en esa tabla. Si Q es mayor que un valor de Q que aparezca
exp
en la tabla, se puede rechazar ese valor (al menos), con la certidumbre asociada con el cociente Q que muestre la tabla. Con frecuencia,, un valor de Q queda
exp
entre dos valores, y en este caso los datos se pueden rechazar con una certidumbre entre los dos valores que aparecen.
21
______________________________________________________ Nde medidas rechazo con rechazo con rechazo con Replicadas 90%de confianza 95%de confianza 99% de confianza 3 0.941 0.970 0.994 4 0.765 0.829 0.926 5 0.642 0.710 0.821 6 0.560 0.625 0.740 7 0.507 0.568 0.680 8 0.468 0.526 0.634 9 0.437 0.493 0.598 10 0.412 0.466 0.568
Tabla para la prueba Q Ejemplo Una serie de medidas replicadas de contenido de agua en una muestra de etanol, para el mtodo Kart-Fischer, tuvo los siguientes resultados: a) 0.71% b) 0.65% c) 0.68% d) 0.72% e) 0.91% Con qu confianza se puede rechazar el dato e), si se usa la prueba Q? Solucin: Calcular Q y comparar con la tabla Q
exp
x = 0.91% es el valor dudoso

q n h 1
x = 0.72% es el valor vecino ms cercano x = 0.91% es el valor mximo de los datos x = 0.65% es el valor mnimo de los datos comparar Q con la tabla de la prueba Q, con los valores adecuados que = 0.73
exp
correspondan a cinco puntos de dato: Q
exp
Los valores Q para cinco datos son 0.642 si no se va a rechazar dato alguno, con 90% de confianza, 0.710 para rechazar datos con 95% de confianza y 0.821 para rechazarlos con un 99% de confianza: Q = 0.73 > 0.710, pero <0.821
exp
Por consiguiente se puede llegar a la conclusin que este punto dudoso se puede rechazar con ms de 95% de confianza, pero con menos de 99% de confianza.
22
1.4.5. T DE STUDENT Y PRUEBA DE SIGNIFICANCIA

LA PRUEBA T Otra prueba para evaluar si se debe rechazar un punto dudoso es la prueba T , a
n
la que con frecuencia se le conoce slo como la prueba T. Tn=

q
donde x es el valor dudoso en cuestin y nxes el valor del dato vecino ms cercano. En este caso, el valor de T tambin se compara con una tabla estndar de la
n
prueba T, para la cantidad adecuada de medidas replicadas
N de medidas Replicadas 3 4 5 6 7 8 9 10
rechazo con 95% de confianza 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18
rechazo con
rechazo con
97% de confianza 99% de confianza 1.16 1.48 1.71 1.89 2.02 2.13 2.21 2.29 1.17 1.49 1.75 1.94 2.10 2.22 2.52 2.41
Tabla para la prueba T
Ejemplo: Si se usan los datos del ejemplo anterior, para medidas replicadas del contenido de agua en un solvente orgnico, Con qu confianza se puede rechazar el valor e)?
23
f) 0.71% g) 0.65% h) 0.68% i) 0.72% j) 0.91% Se calcula primero s, la desviacin estndar de los datos. Se calcula la media de los datos. Se calcula el valor T y se compara con la tabla de la prueba T s = 0.10% H O
2 2
x = 0.73% H O T = (0.91 0.73)/0.1 = 1.8 para cinco datos

n
Lo mejor hace la estadstica inferencial es ayudarnos a tomar decisiones acerca de las poblaciones con base en la informacin que poseemos de las muestras. Una de las herramientas ms tiles para hacer esto es una prueba de significancia estadstica que puede aplicar a diferentes tipos de situaciones, dependiendo de la naturaleza de la pregunta que se est planteando y de la forma de la hiptesis nula.
Las pruebas de significancia inician con el punto de partida, la hiptesis nula. Las pruebas de significancia se basan en el hecho de que cada tipo de hiptesis nula (como Ho:M1=M2 que representa la ausencia de diferencia entre las medidas de dos muestras) tiene asociado un tipo de estadstica especifico .
PRUEBA DE SIGNIFICACIN. Un mtodo analtico debe arrojar libres de errores sistemticos, de tal forma que solo involucren errores aleatorios y el valor final este lo ms prximo verdadero. Esta propiedad se puede estudiar al aplicar el mtodo analtico a una muestra patrn que contenga una cantidad conocida de analito.el ensayo de significacin es una prueba de estadstica que permite diferenciar entre la cantidad medida y la conocida, para justificar los errores aleatorios que acompaan al mtodo aplicado. Este ensayo prueba si las diferencias entre los resultados son significativas, o si se pueden justificar solo por variaciones aleatorias .las pruebas de significacin se ha utilizado en la evaluacin de los resultados experimentales. LA PRUEBA F PARA LA COMPARACION DE DESVIACIONES DE ESTNDAR. Las pruebas de significacin descritas antes se utilizan para las medidas mustrales y, por tanto, para detectar errores sistemticos.
24
En muchos casos, tambin es importante comparar desviaciones estndar, es decir errores aleatorios de dos conjuntos de datos. Esta comparacin ,como en el caso de las pruebas de las medias mustrales ,puede tener dos formas : o bien probar si el mtodo A es ms preciso que el mtodo B(es decir, una prueba de cola) o si los dos mtodos A,B difieren en su precisin (o prueba de dos colas).As ,si se quisiera probar si un mtodo analtico nuevo es ms preciso que uno estndar ,se debera utilizar la prueba de una cola; para saber si dos desviaciones estndar difieren significativamente (por ejemplo ,antes de aplicar la prueba t),seria adecuada una prueba de dos colas. En la prueba f se considera la razn que existe entre las dos varianzas les, es decir la razn de los cuadros de las desviaciones estndar individuales. El valor calculado para F est dado por:
EL CONCEPTO DE LA PRUEBA DE HIPTESIS (PRUEBAS DESIGNIFICANCIA) Lo que realmente queremos saber es: Se debe al azar la asociacin observada?, o Qu tan probable es que la asociacin observada se deba al azar?. Nuestra creencia de que la hiptesis es verdadera antes de tener los resultados). La escuela frecuentista de estadstica, de la cual provienen las pruebas de significancia, no puede contestar esta pregunta directamente. En vez, las pruebas de significancia y los valores p intentan dar una respuesta indirecta, reformulando la pregunta como: Con qu frecuencia se vera una asociacin tan fuerte como la observada slo por azar?. El rol del azar es llevado a cabo por un modelo adecuado de probabilidad, seleccionado para representar la estructura de probabilidad de los datos y el diseo de estudio. Pero la mayor parte de los estudios epidemiolgicos se desvan marcadamente de los modelos probabilsticos sobre los cuales se basan las pruebas estadsticas (p.ej., ver Sander Greenland, Aleatorizacin, estadstica, e inferencia causal [Randomization, statistics, and causalinference]), de manera que aunque la teora estadstica es extremadamente precisa, debe ser aplicable interpretada con mucho cuidado. Una versin intermedia de la pregunta que subyace una prueba de significancia es Qu tan consistentes son los datos numricos con lo que se esperara por azar segn un modelo de probabilidad adecuado. El modelo de probabilidad es frecuentemente uno que supone que no hay diferencia sistemtica entre los grupos, en parte porque dichos modelos son ms fciles de derivar y tambin porque es a menudo conveniente para el marco de la prueba de hiptesis.
25
El resultado de una prueba de significancia es una probabilidad (el valor p) que da una respuesta cuantitativa a esta pregunta intermedia. (Nota: La hiptesis nula estadstica es pocas veces de inters desde el punto de vista sustancial. Una hiptesis de estudio debe ser planteada en trminos de ausencia de asociacin slo cuando es lo que el investigador realmente desea demostrar. De hecho, es bastante difcil demostrar la ausencia de asociacin, dado que la evidencia para la ausencia de asociacin est relacionada con la probabilidad de error de tipo II (1 potencia estadstica) para el estudio, que estn general considerablemente mayor que el nivel de significancia ver ms adelante) PRUEBA F La comparacin de la variabilidad de los datos en dos grupos independientes se hace mediante la prueba F que permite comparar dos varianzas (varianza es el cuadrado de la desviacin estndar) obteniendo un coeficiente, mayor que uno resultante de dividir la varianza mayor entre la menor. Prueba de hiptesis para la razn de dos varianzas de poblacin
26
Para interpretar la prueba se compara este valor de F calculado, con el indicado en la tabla de F de Fisher, para los grados de libertad de los dos grupos, correspondientes (g.l = n-1 de cada grupo, siendo el del numerador el que corresponda al del grupo que tenga la varianza mayor, o bien, se busca en un computador el valor de la probabilidad que corresponde al valor de F (distribucin F, en EXCEL) Si la probabilidad es p menor que 0.05 o en general, menor que el valor hipottico previsto, para el valor de F obtenido, se acepta generalmente que la diferencia entre las varianzas es significativa (lo que tambin se expresa diciendo que las varianzas son heterogneas o heterocedsticas); si p mayor que 0.05, se dice que las varianzas son iguales (estadsticamente), homogneas u homocedsticas. En el segundo caso los dos grupos se pueden considerar como pertenecientes a la misma poblacin en consecuencia se pueden juntar, es decir, fusionarlos para tratarlos como un solo grupo. Actualmente, se prefiere reportar la probabilidad correspondiente a la prueba y se deja al lector decidir si el nivel de error es aceptable, teniendo en cuenta las circunstancias y la importancia clnica.
27
BIBLIOGRAFIA
Alfonso Clavijo Daz. Fundamentos de qumica analtica: equilibrio inico y anlisis qumico. Universidad Nacional de Colombia, sede Bogot. Primera edicin, 2002. Carlos Mongay Fernndez. Quimiometria. Universidad de Valencia, 2005. Neil J. Autor Salkind. Mtodos de investigacin. Prentice Hall Mxico, 1999. I.Q. Carlos Josu Herrera Guzmn, http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r44765.PDF
I.Q. Carlos Josu Herrera Guzmn, http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r44766.PDF
28

1.4. Errores y Tratamiento Estadistico de Los Datos Analiticos (Examen Unidad1)

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

1.4. Errores y Tratamiento Estadistico de Los Datos Analiticos (Examen Unidad1)

Uploaded by

Copyright:

Available Formats

Instituto tecnolgico de Tuxtla Gutirrez.

Errores y tratamientos estadsticos de los datos analticos.

Tuxtla Gutirrez, Chiapas. 19 de marzo del 2013.

1.4. ERRORES Y TATAMIENTO ESTADISTICO DE LOS DATOS ANALITICOS

1.4.1 CONCEPTO Y CLASIFICACION DE ERRORES

1.4.2. ELIMINACION Y CONTROL DE ERRORES

En consecuencia, la media de un conjunto de datos (x) ser igual a:

c) 20.3 d) 19.7 e) 20.0 f) 19.4 g) 19.6

Xt = 110 ppm de Fe Xi = 115 ppm de Fe

En este caso, N = 6 porque hay seis datos:

i=nmero de datos para sacar desviacin estndar

2. Calcular la desviacin estndar s

1.4.3 CALCULO DEL VALOR MS PROBABLE Y LMITES DE CONFIANZA

No. De mediciones replicadas 2 3 4 5 6 7 8 9 10

1.4.4. CRITERIOS ESTADSTICOS PARA RECHAZO DE VALORES DUDOSOS.

Donde x representa al valor dudoso, x es el valor vecino ms cercano, x es el

dato con valor mximo y x es el dato con el valor mnimo.

Habiendo calculado el valor Q

debemos compararlo con los valores de la tabla

que correspondan a la cantidad de datos replicados que se midieron. Si Q

x = 0.91% es el valor dudoso

correspondan a cinco puntos de dato: Q

1.4.5. T DE STUDENT Y PRUEBA DE SIGNIFICANCIA

la que con frecuencia se le conoce slo como la prueba T. Tn=

prueba T, para la cantidad adecuada de medidas replicadas

Tabla para la prueba T

x = 0.73% H O T = (0.91 0.73)/0.1 = 1.8 para cinco datos

I.Q. Carlos Josu Herrera Guzmn, http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r44766.PDF

You might also like