You are on page 1of 101

ESTADSTICA

EN QUMICA ANALTICA

calidadbioquimica.com.ar/error.htm
IMPORTANCIA DE LA ESTADSTICA Y
LA QUIMIOMETRA EN LA QUMICA ANALTICA

Durante la realizacin de una anlisis


cuantitativo es muy importante tomar en cuenta
todas las variables que pueden afectar nuestro
resultado, dentro de estos estn los factores
provocados por los instrumentos utilizados y los
errores provocados por quien maneja el
material.

En el reporte de cualquier anlisis qumico,


es importante tomar en cuenta este tipo de
errores , hacer un anlisis de los resultados
y as se podr concluir sobre l.
Qu es estadstica?
La estadstica es una coleccin de
mtodos para planificar y realizar
experimentos, obtener datos y luego
analizar, interpretar, y formular una
conclusin basada en esos datos. Es
la ciencia encargada de recopilar,
organizar, analizar e interpretar
informacin numrica o cualitativa, de
manera que pueda llevar a
conclusiones vlidas.
La Estadstica se utiliza como tecnologa
al servicio de las ciencias donde la
variabilidad y la incertidumbre forman parte
de su naturaleza.
La Estadstica es la Ciencia de la

i v a Sistematizacin, recoleccin, ordenacin y


t
rip presentacin de los datos referentes a un fenmeno que
e sc presenta variabilidad o incertidumbre para su estudio
D metdico, con objeto de

a d
i lid deducir las leyes que rigen esos fenmenos,
b ab
o
Pr c ia y poder de esa forma hacer previsiones sobre los
n
ere mismos, tomar decisiones u obtener conclusiones.
f
In
Unidad 1: Estadstica Descriptiva.
Arturo A. Alvarado
DATOS NO AGRUPADOS
Media aritmtica
Mediana
Medidas de Moda
Percentiles
tendencia central (posicin)

Rango (amplitud)
Rango
Medidas de intercuartlico
Varianza
dispersin Coef. de variacin

Unidad 1: Estadstica Descriptiva. 6


Arturo A. Alvarado
Medidas de tendencia central

Mediana
En una serie de datos ordenados (creciente o
decreciente) es la puntuacin o valor central de
la distribucin estadstica

Datos no agrupados
Si el n de datos es impar: valor central
Si el n de datos es par: media aritmtica de los 2 puntos
centrales
Medidas de tendencia central
Mediana
Caractersticas
Menos sensible que la media a la variacin de las
puntuaciones.
Se puede calcular aunque algn intervalo carezca
de lmite.
Ms representativa que la media cuando
puntuaciones muy extremas.
Medidas de tendencia central

Moda
Valor de la variable que ms veces se
repite en una serie estadstica (mxima
frecuencia)
Distribuciones: Unimodales o multimodales
Marca de clase (en intervalos)
Caractersticas:
Sencilla de calcular
Se puede calcular si algn intervalo no tiene lmites
Poco representativa
Medidas de tendencia central
Media
Suma de todos los valores de una
variable dividida por el nmero
total de valores
Slo en variables cuantitativas
X = xi / N
Medidas de tendencia central

Media. Clculo
Datos no agrupados: aplicar frmula
Datos agrupados
En tabla de frecuencia: Suma de todos los valores
multiplicados por sus frecuencias y dividido por el
n total.
X = xi fi / N
Medidas de tendencia central
Media
Caractersticas
La media es sensible a la variacin de las
puntuaciones.
No se puede calcular si algn intervalo es de lmite
abierto.
No es recomendable si valores muy extremos
Medidas de dispersin

Reflejan la dispersin, oscilacin de


los datos, respecto al fenmeno
estudiado.

Complementan las de tendencia


central para la descripcin de una
distribucin
Medidas de dispersin
Amplitud o rango
Diferencia entre el valor ms alto y ms bajo
de la distribucin.
Ofrece poca informacin sobre la agrupacin de
los datos.
Indica el campo de variabilidad.
Suele acompaar a la moda.
Medidas de dispersin
Varianza
Junto a la desviacin tpica, la que mejor expresa
la variabilidad del fenmeno
Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmtica

S2 = (xi x)2 / N S2 = xi2 / N x2


Para datos agrupados:

S2 = fi(xi x) 2 / N S2 = fixi2 / N x2
Medidas de dispersin
Desviacin tpica
Es la raz cuadrada de la varianza

S2 = xi2 / N x2
Para datos agrupados:

S2 = fixi2 / N x2
Medidas de dispersin
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos.
Si todos los datos de una distribucin son
iguales entre s, toman el valor 0.
Slo son aplicables a variables cuantitativas

La que ms se suele usar es la desviacin tpica.


Si los datos estn muy dispersos, la desviacin tpica ser
muy grande.
Medidas de dispersin
Coeficiente de variacin de Pearson
Para poder comparar la dispersin entre 2
ms variables entre s, o una misma
variable en 2 ms grupos estudiados
Es una medida relativa: Relaciona la
media con la desviacin tpica

CV = S / X * 100
giovanni10.wordpress.com/.../

giovanni10.wordpress.com/.../
giovanni10.wordpress.com/.../
DISTRIBUCIO DE FRECUENCIAS
En una distribucin de datos estos pueden estar o no
agrupados.
DATOS NO AGRUPADOS EN DATOS AGRUPADOS EN INTERVALOS:
INTERVALOS: SUPUESTO DE CONCENTRACION EN
EL PUNTO MEDIO (Xi):
ni Xi
X
n
ni Xi Xi ni
X 18-20 20
Xi
4
ni
1
n 15-17 30
3 3 12-14 60
2 7 9-11 40
1 6 6-8 30
0 3 3-5 20
Xi ni Xi*ni
4 1 4 Xi ni P. M. PM*ni
3 3 9 18 20 20 19 380
2 7 14
1 6 6
15 17 30 16 480
0 3 0 12 14 60 13 780
33 9 11 40 10 400
mitjana= 33/5= 6,6
6 8 30 7 210
3 5 20 4 80
2330
mitjanna= 2330/200= 11,65
CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:

1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA


ORDINAL.

2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA


INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25

LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS

3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS


CARECEN DE PUNTO MEDIO.
LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO
LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO:
DISTRIBUCION NORMAL).

CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.


La distribucin normal
f(X)

Media X
Mediana
Moda

Datos simtricos: coinciden la media, la


mediana y la moda
Propiedades de la distribucin
normal:

El rea bajo la curva aproximado del promedio a


ms o menos una desviacin estndar (1) es de
0.68, a ms o menos 2 es de .0 95 y a ms o menos
3 es de 0.99.

(Las propiedades continuan en la prxima lmina)


Propiedades de la distribucin
normal:

La forma de la campana de Gauss depende de los parmetros


y .
Tiene una nica moda que coincide con su media y su
mediana.
La curva normal es asinttica al eje de X.
Es simtrica con respecto a su media . Segn esto, para este
tipo de variables existe una probabilidad de un 50% de observar
un dato mayor que la media, y un 50% de observar un dato
menor.
En resumen
Podemos concluir que hay una familia de
distribuciones con una forma comn, diferenciadas por
los valores de su media y su varianza.
La desviacin estndar ( ) determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor
de , ms se dispersarn los datos en torno a la media
y la curva ser ms plana.
La media indica la posicin de la campana, de modo
que para diferentes valores de la grfica es
desplazada a lo largo del eje horizontal.
De entre todas ellas, la ms utilizada es la
distribucin normal estndar, que corresponde a
una distribucin de media 0 y varianza 1.
ERRORES EN LOS ANALISIS
QUIMICOS
Es imposible efectuar anlisis qumicos
totalmente libres de errores o
incertidumbres.
La fiabilidad de un resultado se analiza de
diferentes maneras
Se analizan patrones de composicin
conocida
Se aplican pruebas estadsticas a los
datos
En ciencias e ingeniera, el concepto de error
tiene un significado diferente del uso habitual de
este trmino. Coloquialmente, es usual el
empleo del trmino error como anlogo o
equivalente a equivocacin.
En ciencia e ingeniera, el error, est ms bien
asociado al concepto de INCERTEZA,
INCERTIDUMBRE, en la determinacin del
resultado de una medicin.

ERROR: es la medida del sesgo en el resultado de


una medicin.
INCERTIDUMBRE: es el intervalo o rango de los valores
posibles de una medida. Incluye tanto los errores
sistemticos como aleatorios.
La incertidumbre de un resultado es bien diferente de
la precisin, sta da una medida del error aleatorio.
Errores
Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.
Aleatorio
Estos provocan que Sistemticos
los resultados Provocan que todos los
individuales difieran uno resultados
del otro de manera sean errneos en el mismo
que caigan a ambos lados sentido, son demasiado
del valor medio. grandes, y se denomina tambin
Estos errores sesgo de la medida. Este tipo
afectan la precisin de error es
de un experimento. responsabilidad
Este tipo de errores son del material empleado
los que comete el operador y de su origen y presin
del instrumento utilizado. de fabricacin.
Errores experimentales
Error absoluto.- Nos indica si medimos u obtuvimos
mas o menos que el valor experimental, y en qu cantidad
excedimos del valor real o qu cantidad nos falt; esto
segn el signo de la sustraccin.
EA = valor experimental valor terico

Error relativo.- Es una forma de conocer el porcentaje


de error que obtuvimos en nuestros resultados.

ER = (valor experimental valor terico) x 100


(valor terico)
Los errores presentes en un estudio analtico modifican:

Precisin
Es el grado de confianza con que se puede repetir un
experimento y este puede dar los mismo resultados. Es
utilizado como sinnimo de repetitibilidad.

Exactitud
Es el grado de concordancia entre el resultado de un
ensayo y el valor de referencia aceptado.
TERMINOS IMPORTANTES

Media, Media aritmtica y promedio (X) son


trminos sinnimos. Es la medida de tendencia
central mas utilizada .Se obtiene dividiendo la
suma de los valores de una serie y dividiendo por
el numero de medidas del conjunto.

Mediana es el resultado alrededor del cual se


reparten los dems por igual. Si la serie es un
numero impar la mediana es el numero de la
mitad. Si la serie es un numero par se toma el
promedio del par central despus de haber
ordenado la serie de menor a mayor.
TERMINOS IMPORTANTES

Ejemplo: calcular la media y la mediana


de 10.06, 10.20, 10.08, 10.10.

Media = X =10.06+10.20+10.08+10.10 = 10.11


4
Mediana = 10.08 +10.10 = 10.09
2
CIFRAS SIGNIFICATIVAS
Es el numero necesario de dgitos
para expresar los resultados de
una medicin congruente con la
precisin de medida.
237 : 2 centenas, 3 decenas y 7
unidades

El numero de cifras significativas incluye


todos los dgitos que se conocen mas el
primer digito incierto.
El numero de cifras
significativas en una medicin
es independiente de la
colocacin del punto decimal.

Por
Por ejemplo
ejemplo elel numero
numero 92.067:
92.067: Este
Este numero
numero
tiene
tiene cinco
cinco cifras
cifras significativas
significativas independiente
independiente
donde
donde se
se coloque
coloque elel punto
punto decimal.
decimal. EnEn este
este
caso
caso el
el cero
cero si
si es
es una
una cifra
cifra significativa.
significativa.

En
En el
el numero
numero 727.0
727.0 el
el cero
cero no
no se
se usa
usa para
para
localizar
localizar el
el punto
punto decimal
decimal es
es significativo
significativo
Ejemplos:

0.216 Tres Cifras significativas.


90.7 Tres cifras significativas.
800.0 Cuatro cifras significativas.
0.0670 Tres cifras significativas
TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad de los
resultados y se puede definir como la concordancia que
hay entre los valores numricos de dos o ms
mediciones que se han realizado de idntica manera.

La precisin slo depende


de la distribucin
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
PRECISION

Para describir la precisin de un conjunto


de datos repetidos se utilizan tres
trminos muy conocidos:
La desviacin estndar, la varianza y el
coeficiente de variacin.
La desviacin estndar (DS/DE) es una
medida de dispersin usada en
estadstica que nos dice cunto tienden a
alejarse los valores puntuales del
promedio en una distribucin.

Asi la varianza es la media de los cuadrados de las


diferencias entre cada valor de la variable y la media
aritmtica de la distribucin. Aunque esta frmula es
correcta, en la prctica interesa realizar inferencias
poblacionales, por lo que en el denominador en vez
de n, se usa n-1
TERMINOS IMPORTANTES

METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION

Desviacin estndar S= Xi-X


n-1
Desviacin respecto a la media es la diferencia
numrica entre un valor experimental y la media

Varianza: S2
Coeficiente de variacin. C.V = S/Media
*100
TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se
calcula al dividir la desviacin estndar
entre la media del conjunto de datos.
DER se expresa en partes por mil o en %.
DER * 100% = CV.
Dispersin (W): Es la diferencia entre el
valor mas alto y el valor mas bajo del
conjunto
TERMINOS IMPORTANTES

EXACTITUD : El trmino denota el grado


de coincidencia del resultado de una
medicin con el valor verdadero o
aceptado de la misma y se expresa en
funcin del error. La exactitud implica una
comparacin con el valor verdadero o
aceptado como tal.
Cuando no se conoce el valor verdadero
se debe usar un valor aceptado.
TERMINOS IMPORTANTES
METODOS PARA MEDIR LA EXACTITUD
Error absoluto: Es la diferencia entre el valor
experimental y el valor real.
Error relativo: Es el error absoluto dividido por la
cantidad medida.
Ejemplo:
Una muestra tiene 20.34% de Fe y un analista
encuentra que es 20.44%.
Error Absoluto = 20.44-20.34 = 0.10%
Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por
mil
TERMINOS IMPORTANTES

En trminos generales la exactitud


supone una comparacin con un valor
verdadero o aceptado como tal, la
precisin indica la concordancia entre las
medidas que han sido realizadas de una
misma forma.
Esquema grfico para comprender la
relacin entre exactitud y precisin

www.galeon.com/scienceducation/error00.htm

En C existe buena precisin, pero no buena exactitud;


en A buena exactitud y precisin, y en B mala exactitud
y precisin.
www.galeon.com/scienceducation/error00.htm

Diagrama precisin y exactitud


EVALUACION DE LOS DATOS ANALITICOS
ESTUDIANTE RESULTADOS COMENTARIO
DE UNA TITULACION
A 10.08 Preciso pero
10.11 inexacto
10.09
10.10
10.12
B 9.88
10.14
10.02 Exacto pero
9.80 impreciso
10.21
10.19
C 9.79 Inexacto e
9.69 impreciso
10.05
9.78
EVALUACION DE LOS DATOS ANALITICOS

ESTUDIANTE RESULTADOS COMENTARIO


DE UNA TITULACION

10.04
9.98
D 10.02 EXACTO Y
9.97 PRECISO
10.04
TIPOS DE ERRORES EN DATOS
EXPERIMENTALES

ERRORES

Bruto Aleatorios Sistemticos


Ocurre de manera - = indeterminados - = determinados
Ocasional . suele ser -Afectan la presicion - Afectan la exactitud
Grandes. Dan como o la reproducibilidad o sea la proxim al valor
resultado valores verdadero.
atpicos que difieren - Los resultados caen - Todos los resultados
mucho de los dems. a lado y lado de la X son errneos en el
mismo sentido.
ERRORES DETERMINADOS O SISTEMATICOS

FUENTES DE ERRORES
SISTEMTICOS

Errores instrumentales: Calibraciones deficientes

Errores del mtodo: Dificiles de identificar

Errores personales: Descuido, Falta de atencin


EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser constantes o


proporcionales

En los errores constantes el error absoluto es invariable


con el tamao de la muestra ,mientras el error relativo
cambia al modificar dicho tamao.

Los errores proporcionales aumentan o disminuyen


segn el tamao de la muestra. Con los errores
proporcionales el error absoluto varia con el tamao de
la muestra, en cambio el error relativo permanece
constante.
EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser constantes o


proporcionales.

En los errores constantes, el error absoluto es


invariable con el tamao de la muestra, mientras
en el error relativo cambia al modificar el tamao
de la muestra.

Los errores proporcionales aumentan o


disminuyen segn el tamao de la muestra; con
estos errores el error absoluto varia con el
tamao de la muestra en cambio el error relativo
permanece constante.
EVALUACION DE LOS DATOS
ANALITICOS
EVALUACION DE LOS DATOS
ANALITICOS
Los errores ocasionados por el amoniaco
envasado durante mucho tiempo fueron
constantes por que se utilizo el mismo
volumen y el aporte de Si fue el mismo. El
NH3 del envase recin utilizado fueron
muy pequeos y proporcionales al tamao
de muestra.
ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en
una determinacin.
Muchas variables no controladas y de no
fcil identificacin causan errores
aleatorios.
El efecto acumulativo de las
incertidumbres, aunque estas sean muy
pequeas, hace que las mediciones por
duplicado de una serie flucten al azar.
FUENTES DE LOS ERRORES
ALEATORIOS

Los errores aleatorios obedecen una curva


normal de error o curva de gauss.

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
Distribucin normal
Al iniciar el anlisis estadstico de una
serie de datos, y despus de la etapa de
deteccin y correccin de errores, un
primer paso consiste en describir la
distribucin de las variables estudiadas y,
en particular, de los datos numricos.
Un modo es con la curva de distribucin
normal que muestra la frecuencia con que
se repiten los datos.
TRATAMIENTO ESTADISTICO DEL ERROR
ALEATORIO

Los mtodos estadsticos permiten categorizar y


caracterizar los datos, y tomar decisiones
objetivas en cuanto a su calidad e
interpretacin.
Hay que diferenciar entre muestra y poblacin o
universo. ( caso del anlisis de Ca en agua. La
poblacin seria un numero de medidas muy
grande cercano al infinito).
Las leyes de la estadstica se dedujeron para
usarlas en poblaciones. Para aplicarlas a
muestras se debe hacer ajustes.
TRATAMIENTO ESTADISTICO DEL
ERROR ALEATORIO
Las curvas gaussianas se pueden
representar por medio de una ecuacin
que tiene la media de la poblacin , y la
desviacin estndar de la poblacin .

La media de la poblacin es y la media


de la muestra es X.
EVALUACION DE METODOS
ANALITICOS
Ejemplo 2. La N de una solucin se calculo con 4
titulaciones por separado y los resultados fueron 0.2041,
0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El
rango , La S. la desviacin relativa y el C.V.
X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043
Mediana M= (0.2041+0.2043)/2 = 0.2042
Rango R = 0.2049-0.2039 = 0.001
La desviacin relativa= Sumatoria de (Xi-X)/4=0.0003
S= 0.0004
C.V = (0.0004/0.2043)*100 = 0.2%
PRESENTACION DE LOS DATOS CALCULADOS

Siempre es necesario indicar el nivel de


confianza de los datos.
Es un rango de valores en los que con
una probabilidad determinada est un
valor verdadero poblacional.
Generalmente son del 95% o 99%.
La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza
PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de
un anlisis realizado por dos mtodos
diferentes. Se trabaja con las X
Se aplica el T de student. Plantea la
hiptesis de que las dos X son iguales. La
prueba T da una respuesta si o no a la
hiptesis nula con cierta exactitud como
del 95 o 99%
Prueba de significancia
t = X 1 X2 n1n2
S n1+n2

Si t calculado es mayor que t de la tabla


entonces los dos mtodos son iguales
Para poder calcular t hay que calcular
primero la s de cada serie de datos
Cuando se escoge el nivel de
significacin 0,05 ( 5%),
tenemos un 95% de confianza de
que hemos adoptado la decisin
correcta y una probabilidad 0,05
de ser falsa.
Cmo determina si un valor es realmente un
valor atpico y cmo decide si debe continuar
o no con el anlisis de datos?
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un grupo
de datos.
Un valor atpico es una observacin con un valor
que no parece corresponderse con el resto de los
valores en el grupo de datos.

Por lo general surgen dos preguntas:


1)Es este valor realmente un valor atpico?
2)Puedo eliminar este valor y continuar con el
anlisis de datos?
DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse
que las pruebas estadsticas se utilizan
para identificar valores atpicos, no para
retirarlos del grupo de datos.
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar
esta accin
DATOS ATIPICOS
Si en la investigacin no se encuentra una causa
probable, qu debe hacerse?
Un enfoque sera realizar un anlisis de datos con
el valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor
atpico tiene influencia y esto debera indicarse
en el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas
con mayor frecuencia en un grupo de
datos son la prueba de Dixon y la prueba
de Grubbs.
La prueba de Dixon utiliza relaciones de
las diferencias entre datos que parecen
atpicos comparados con los valores del
grupo de datos.
RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un
nico valor atpico en un grupo de datos, y por lo
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
Una tcnica rigurosa y amplia para identificar
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.
DIXON
Por ejemplo, tomemos los datos 5.3, 3.1,
4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8

El tamao de la muestra es 7, y la relacin utilizada es el espacio


entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
RECHAZO DE DATOS
Este valor se compara con un valor crtico de una tabla, y
el valor se declara valor atpico si supera ese valor
crtico.
Si Dcalculado>Dtabulado se rechaza el dato

El valor tabulado depende del tamao de la muestra, n, y


de un nivel de confianza elegido, que es el riesgo de
rechazar una observacin vlida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
DIXON
La prueba de Dixon se usa en un nmero
pequeo de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.

Para aplicar la prueba de Dixon se


requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.
GRUBBS
La prueba de Grubbs utiliza una estadstica
de prueba, T, que es la diferencia absoluta
entre el valor atpico, XO, y el promedio de la
muestra (X) dividida por la desviacin
estndar de la muestra, s.
Para el ejemplo anterior, el promedio de la
muestra es = 4.86 y la desviacin estndar
de la muestra es = 1.48. La estadstica
calculada de la prueba es:
GRUBBS

Para un n = 7 y un riesgo del 5%, el valor


tabulado es 1.938 y el TCalculado = 1.99
excede este valor crtico, indicando que el
valor 7.8 es un valor atpico.
TEST DE GRUBB PARA DATOS
SOSPECHOSOS
Recomendado por las normas ISO

G= Valor Sospechoso X
S
(Con el valor sospechoso incluido)

Si Gcalculada > Gtabulada el valor sospechoso se rechaza


TEST Q DE DATOS SOSPECHOSOS

Aceptar o rechazar un resultado anmalo (outlier)


Normalmente se producen al cometer errores o fallos
en la metodologa aplicada.

Se ordenan los datos en forma creciente y se calcula Q

Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano


recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza


Ejemplo:
Al efectuar una serie de rplicas para determinar la
concentracin del in sulfato en una muestra de agua
para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.

Medida Valor 1. Se ordenan los datos en orden de valor


1 5.0 decreciente
2 5.2 6.0, 5.6, 5.5, 5.2, 5.0
3 5.5 2. Se calcula Q
4 5.6 Q= (6.0-5.6)/ (6.0-5.0) =0.40
5 6.0 3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
DESCARTE DE DATOS
1. Definir que tan grande es la Diferencia entre el valor
sospechoso y los otros datos.
2. Aplicar Prueba Q.
a) Ordenar los datos
b) Calcular el rango
c) Encontrar la diferencia entre el resultado sospechosos
y su vecino mas cercano
3. Dividir la diferencia obtenida en el paso 2 entre el
Rango. As se obtiene el coeficiente de descartacion
Q.
4. Consultar la tabla de valores Q. Si el valor calculado es
mayor que el de latabla el resultado se puede
descartar con un 90% de confianza de que si se podia.
DESCARTE DE DATOS
EJEMPLO
4 Resultados de N de una solucin fueron
0.1014, 0.1012, 0.1019, 0.1016. Se podr
descartar 0.1019?
X sin el 0.1019 = 0.1014
0.1019-0.01014 =0.0005
Q = 0.1019 - 0.1016 =0.43
0.1019 0.1012
0.43 es menor que 0.76. NO SE DESCARTA
PRESENTACION DE LOS DATOS
CALCULADOS
Un indicador de la calidad de los datos es
la utilizacin de las cifras significativas.
Cifras significativas: Son todos los dgitos
que se conocen con certeza y el primer
digito incierto. Por ejemplo 30.24 tiene 4
cifras significativas (4, el ultimo digito, es
incierto)
PRESENTACION DE LOS DATOS
CALCULADOS
El cero puede ser significativo o no segn
su ubicacin en el numero. Un cero
rodeado por otros dgitos siempre es
significativo.
Los ceros al final pueden o no ser
significativos. 2.0 tiene dos cifras
significativas. 2000 tiene una cifra
significativa. 2x103 tiene una.
PRESENTACION DE LOS DATOS
CALCULADOS
Para las sumas y las restas el resultado debe
tener el mismo numero de decimales que el
numero que tiene menos decimales.
Cuando se suman o restan nmeros con
notacin cientfica se debe expresar el
resultado en la misma potencia de 10.
En la multiplicacin y la divisin se debe
expresar el resultado con las cifras
significativas del numero que tenga menor
cifras significativas.
PRESENTACION DE LOS DATOS
CALCULADOS
Redondeo de datos:
Se debe aproximar al numero mayor si el ultimo
es mayor de 5 y al menor si el ultimo es menor
de 5.
61.555 se aproxima al numero par mas
cercano . Queda 61.56
De todas maneras el resultado debe expresarse
con la desviacin estndar calculada.
OBJETIVOS DEL MUESTREO
Estadsticamente los objetivos del
proceso de muestreo son:
1. Obtener el valor medio
2. Obtener una varianza que sea una
estimacin de la varianza poblacional con
limites de confianza validos para la media.
VALIDACION DE METODOS ANALITICOS

Calidad de resultados

Selectividad Analito en medio de interferencias


Limite de deteccin Promedio de bcos +3(desviacin)
Limite de cuantificacin 5 10 L.D.
Intervalo de trabajo Rango en que el mtodo es exacto y preciso.
Rango lineal
Exactitud. Valor de referencia
Precisin Desviacin y CV
Sensibilidad Pendiente
% Recuperacin. Adicin de cantidades conocidas
GRFICOS DE CONTROL.
VALIDACION DE METODOS ANALITICOS

Curvas de calibracin
Linealidad
Pendiente
Sensibilidad
Residuales
Coeficiente de correlacin
VALIDACION DE METODOS
ANALITICOS
Curvas de calibracin: Mnimos
Cuadrados
Modelo de regresin: Y=mx+b

Cuanto mas cercanos estn los datos a la


lnea que se obtiene del anlisis por
mnimos cuadrados, menores son los
residuales
VALIDACION DE METODOS
ANALITICOS
Variables transformadas.
Transformaciones para linearizar las
funciones.

You might also like