Professional Documents
Culture Documents
Cesar.miranda@unacem.com.pe
MANEJO
DE
DATOS
INVESTIGACIN CIENTFICA
Observacin, por la cual se obtiene el conocimiento de
ciertos hechos
Razonamiento mediante el cual se determina el
significado de esos hechos y su interrelacin con otros
fenmenos.
CONDICIONES DE UTILIZACIN DE MTODOS
ESTADSTICOS
Conocer el objeto de la investigacin
Organizar el conjunto de datos para tabularlos
eficientemente y establecer rutinas econmicas para
el manejo de computacin de los datos.
Manejar medios efectivos de representacin de datos
en forma grfica y tabular.
Poblacin y Muestra
Poblacin o universo, es el conjunto de individuos u
objetos, de caractersticas similares, que sirve como
base para un anlisis estadstico.
Ejemplo 1: Nmero de cerrojos defectuosos y no
defectuosos producidos por una fbrica en un determinado
da.
Ejemplo 2: Alturas y pesos de los estudiantes de SENCICO.
Pero en lugar de examinar el grupo entero llamado
poblacin o universo, se examina una pequea parte
llamada muestra.
Tipos de datos
tipos de anlisis
TIPOS DE VARIABLES
Segn el tipo de valores que toman las variables,
distinguimos diferentes tipos de variables
El tipo de variable es importante: afecta a lo
que podemos hacer con ella, al tipo de anlisis
que podemos hacer
Los mtodos estadsticos que usamos
dependen del tipo de variable
TIPOS DE VARIABLES
Variables cualitativas
La escala de valores es nominal
Los valores son categoras
Las categoras son valores diferentes por una
cualidad, no por una cantidad
Ningn valor se puede decir que sea mayor o
menor que otro
Ejemplos: partido poltico al que vot; regin en
que vive; sexo; estado civil; marca de coche
que conduce...
TIPOS DE VARIABLES
Variables cuantitativas:
Los valores de la variable son nmeros = cada
valor posible es menor o mayor que otro valor
Ejemplos: edad, ingresos, nota en un examen,
nmero de aos de educacin, kilmetros de
distancia entre trabajo y residencia...
OJO: hay nmeros que son etiquetas; por
ejemplo: el cdigo postal; el nmero de
telfono; el cdigo de una asignatura
TIPOS DE VARIABLES
Variables cuantitativas:
El conjunto de valores forman una escala de
intervalo
Intervalo: distancia entre valores
En las variables cuantitativas podemos calcular
la distancia o intervalo entre cualquier par de
valores de la variable
Ejemplo: ingresos. 1.000, 3.000, 4.000 nuevos soles
TIPOS DE VARIABLES
Variables con escala ordinal
Sus valores son categoras como variables cualitativas
Pero cada valor es mayor que o menor que los
dems valores, como variables cuantitativas
Ejemplos:
clase social (baja, media, alta)
ideologa poltica (extrema izquierda, izquierda,
centroizquierda, centro, centro-derecha, derecha, extrema
derecha)
Opinin sobre una propuesta poltica: muy en contra, ms
bien en contra, indiferente, ms bien a favor, muy a favor
TIPOS DE VARIABLES
Variables con escala ordinal
Un grupo intermedio
Categoras, no nmeros, que tienen un orden, pero no
existe una distancia o intervalo definido entre los valores
Tratamiento estadstico:
A veces, como variables cualitativas
A veces, como variables cuantitativas: cambiando las
etiquetas por nmeros y transformando la variable en
cuantitativa
Con cuidado: los resultados del anlisis pueden variar
segn qu nmeros asignemos a los valores
Algunos mtodos especficos para escalas ordinales
VARIABLES DISCRETAS Y
CONTINUAS
CIFRAS SIGNIFICATIVAS
El eslabn ms dbil en la cadena de cualquier anlisis
est determinado por la medicin que se efecte con
la menor exactitud.
No vale la pena esforzarse en efectuar otras
mediciones del anlisis con mayor exactitud que esta
medicin limitante.
El nmero de cifras significativas puede definirse como
el nmero de dgitos necesarios para explicar los
resultados de una medicin conforme a la precisin
medida.
Ejemplo:
35.63 x 0.5481 x 0.05300x100%=88.5470578%
1.1689
El nmero clave es 35.63. La respuesta ser por consiguiente 88.55%
y carece de significado obtener ms de cinco cifras en la operacin (la
quinta cifra se emplea para redondear la cuarta)
Resolver la operacin siguiente con el nmero mximo de cifras
significativas e indicar el nmero clave.
42.68 x 891= 546.57
132.6 x 0.5247
El nmero clave es 891. Como la magnitud absoluta de la respuesta
es menor que el nmero clave, se expresa como 546.6 El ltimo 6 se
escribe como subndice para indicar que es ms dudoso.
Suma y resta
Para las sumas y las restas las reglas son un poco distintas. En este caso
no se tiene nmero clave, y es importante determinar el punto decimal
para determinar cuntas cifras sern significativas. Supngase que se
desea calcular el peso frmula de Ag2MoO4 mediante los pesos atmicos
individuales
Ag
Ag
Mo
O
O
O
O
107.87 0
107.87 0
95.94
15.99 94
15.99 94
15.99 94
15.99 94
375.67 76
2.
Escribir las cifras significativas de los siguientes nmeros y despus localizar el punto decimal para una expresin de 10
elevado a la potencia correspondiente.
3.
Determinar el nmwero de cifras significativas de las siguientes operaciones. Subrayarar con lapicero rojo el nmero clave
o limitante.
REDONDEO DE DATOS
Es una tcnica que permite, ver o manejar una cifra con una
determinada cantidad de nmeros diferentes de cero.
Funciones
Si cada valor que la variable x pueda tomar le corresponde un
nico valor de la otra variable y, decimos que y es funcin de x
y escribimos y=f(x), y se lee: y es igual a f de x.
X es la variable independiente
Y es la variable dependiente
VERACIDAD Y PRECISIN
Veracidad es el grado de concordancia entre el valor medido y
el valor real.
Casi nunca se conoce el valor absoluto verdadero.
Una definicin ms realista de la exactitud, entonces, asumir
que es la concordancia entre el valor medido y el valor real
aceptado.
Es posible lograr, empleando tcnicas analticas correctas
Como la de efectuar comparaciones con una muestra estndar conocida
de composicin semejante
ERRORES
DETERMINADOS O
ALEATORIOS O
SISTEMTICOS O
CASUSTICOS O
DETERMINSTICOS
INDETERMINADOS
53
ERRORES
ERRORES DETERMINADOS O SISTEMATICOS
La exactitud o precisin de una cantidad que se
mide puede ser afectada por dos tipos principales
de errores:
Errores determinados son aquellos que, como implica
el
nombre,
pueden
determinarse
y
probablemente evitarse o corregirse.
Pueden ser constantes, como en el caso de una
pesa sin calibrar que se emplea en todas las
pesadas.
Tambin pueden ser variables, pero de
naturaleza tal que puedan tenerse en cuenta y
corregirse, por ejemplo una bureta cuyas
lecturas de volmenes sean errneas debido a
que contienen distintas cantidades en los
volmenes.
54
Errores de operacin.
Estos incluyen los errores personales y pueden
reducirse por la experiencia y cuidado del analista en
las manipulaciones fsicas que efecta.
Errores de mtodo.
Estos son los errores ms graves de un anlisis.
La mayora de los errores anteriores pueden
reducirse al mnimo o corregirse, pero los errores
inherentes al mtodo no pueden cambiarse a menos
que se modifiquen las condiciones de la
determinacin.
Errores sistemticos:
Los errores sistemticos son los que en principio se
pueden evitar, corregir o compensar.
Estos alteran la medida porque no toman en cuenta
alguna circunstancia que afecta al resultado siempre
igual, dando lugar a un alejamiento hacia un sentido
del valor verdadero.
Se les llama sistemticos porque son consistentes pues
cuando estn presentes se obtienen valores que son
ms altos o ms bajos que el valor verdadero.
Se debe observar que los errores sistemticos y
accidentales se diferencian en que los primeros
producen efectos sistemticos y los segundos efectos
aleatorios.
se
pueden
ERROR ABSOLUTO
La diferencia entre el valor verdadero y el valor
medido, con respecto al signo, es el error absoluto y se
expresa en las mismas unidades que la medicin.
Si se analiza una muestra de 2,62 g. considerando un
peso de 2,52 g., el error absoluto es 0,10g. cuando el
valor medido es el promedio de varias mediciones, el
error se llama error medio.
El error medio tambin puede calcularse tomando el
promedio de la diferencia, con respecto al signo, de los
resultados individuales de las pruebas, con respecto al
valor verdadero.
ERROR RELATIVO
El error absoluto o medio expresado como porcentaje
del valor verdadero es el error relativo.
El anlisis anterior tiene un error relativo de (-0,10 /
2,62) x 100% = -3.8%, es necesario insistir en que
ninguno de los nmeros es realmente verdadero y el
error relativo o exactitud se basa en la media de dos
conjuntos de mediciones.
El error relativo puede expresarse en unidades
distintas al porcentaje.
En investigaciones muy exactas, generalmente los
errores relativos son menores de 1% y es conveniente
emplear unidades ms pequeas.
Un error de 1% es equivalente a una parte de 100.
Tambin equivale a 10 partes de 1000.
DISTRIBUCIN DE FRECUENCIA
Organizacin y presentacin de datos
Una vez recopilada la muestra se debe describir la
naturaleza de los datos organizndolos, presentndolos
en tablas de frecuencias o grficos y evaluando
medidas de resumen que permitan describir
apropiadamente sus caractersticas en cuanto a
posicin y dispersin.
Para organizar los datos en tablas de frecuencia se
debe tener en cuenta si los datos son cualitativos o
cuantitativos.
Si los datos son cualitativos se debe codificar las
categoras, asignndole un nmero que servir de
identificacin, por ejemplo:
PRCTICA 4: Personal
(1) Elaborar la tabla respectiva de valores, el grfico en barras de las
frecuencias absolutas y de las frecuencias absolutas acumuladas:
Resultados de un ensayo de resistencias a la compresin en probetas de
concreto:
385 385 -387 389 387 385 388 387 387 389 387 388 387 389
(2) Elaborar la tabla respectiva de valores, el grfico en barras de las
frecuencias relativas y de las frecuencias relativas acumuladas, as como
el recorrido o rango, la amplitud de los intervalos, el nmero de intervalos
segn Sturges:
Resultados de un ensayo de densidad del cemento Portland tipo I:
3.14 3.14 3.13 -3.13 3.12 -3.12 3.12 3.13 3.13 3.12 3.14
3.12 3.13 3.12 3.14 3.14 3.14 - 3.12 3.15 3.15
PREPARACIN DE MATERIALES
- Todos los grupos debern traer aprox. 100 Kg. de arena seca de playa.
- Se tamizar en las mallas:
Ejemplo:
Podra separarse solamente el pasante de la M30 y retenido en la M40, de la cual usaremos
un 74% de 1500 g de arena en total a usar, o sea 1110 g de esta
Asimismo se podra separar tambin pasante de la M40 y retenido de la malla 50 y emplear
24% de 1500 g, o sea 390 g; donde sumada a la anterior nos da los 1500 g de Arena Ottawa
gradada.
Ejemplo:
Podra separarse solamente el pasante de la M16 y retenido en la M20, de la cual usaremos un 100% de
1375 g de arena en total a usar, o sea 1375 g de esta en el ensayo de contenido de aire