You are on page 1of 31

4.

PROCESAMIENTO DE DATOS

4. PROCESAMIENTO DE DATOS

CONCEPTO
En el procesamiento de datos
consiste en convertir los datos en
bruto
del
instrumento
de
recoleccin y datos en una forma
legible por el computador.
Luego podemos hacer uso de
procedimiento computarizado de
anlisis de datos para extraer la
informacin de los datos.

4.1 DISTINGIR ENTRE LOS CONCEPTOS BASICOS


DEL PROCESAMIENTO DE DATOS

4.1.1 distinguir el caso

CASO:
Un caso es una unidad especifica
de anlisis para el estudio. Con
bastante frecuencia, la unidad de
anlisis es el encuestado de un
cuestionario, por tanto, cada
encuestado se considera un caso
y el numero total de casos es igual
al tamao de la muestra

4.1 DISTINGIR ENTRE LOS CONCEPTOS BASICOS


DEL PROCESAMIENTO DE DATOS

4.1.2 Definir representacin computarizada de los datos

Los datos suministrados por un


instrumento
de
investigacin
deben convertirse a una forma
legible por el computador.
La tarjeta del computador es un
instrumento bsico utilizado para
la investigacin .

4.1 DISTINGIR ENTRE LOS CONCEPTOS BASICOS


DEL PROCESAMIENTO DE DATOS

4.1.3 Definir paquete de datos

El paquete de datos esta compuesta


por todas las tarjetas del computador
necesarias para representar los datos
que aparecen en todos los
cuestionarios.
El paquete de datos es lo que alimenta
al computados

Por ejemplo:
si hubiramos utilizado un
cuestionario que utilizara tres
tarjetas para representar los
datos que aparecen en este y
tuviramos un tamao muestra
de 400, tendramos 3 x 400=
1200
tarjetas
en
nuestro
paquete de datos

4.1 DISTINGIR ENTRE LOS CONCEPTOS BASICOS


DEL PROCESAMIENTO DE DATOS

4.1.4 almacenamiento de datos

Una vez que los datos se han


ingresado al computador, el
investigador pueden utilizar las
capacidades del computador para
almacenar los datos del paquete
en una USB y as de esta manera
evitan los problemas que se
presentaran si se eliminarse o
perdiese el paquete de datos.

4.1 DISTINGIR ENTRE LOS CONCEPTOS BASICOS


DEL PROCESAMIENTO DE DATOS

4.1.5 definir la matriz de datos

Disposicin de almacenamiento de
datos con n filas y m columnas,
donde el numero de filas es igual
numero de casos y el numero de
columnas es igual al numero de
variables

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.1 Decisin sobre si se debe utilizar o no


el instrumento de recoleccin de datos para el anlisis

Al recibir un instrumento de recoleccin


de datos de campo, el investigador
debe examinarlo para determinar si es
aceptable o no para utilizarlo en el
estudio.
Los criterios exactos para juzgar un
instrumento como no aceptable varan
de un estudio a otro, pero lo que se
enumeran
a
continuacin
son
caractersticos:

1. Una parte significativa del instrumento se


deja sin contestar, o los elementos claves se
dejan sin respuestas
2. Es claro, con base en las respuestas
dadas, que el encuestado no comprendi
la tarea requerida al completar el
instrumento .
3. La respuesta muestra poca varianza. Por
ejemplo, la respuesta a unas series de
preguntas de actitud son todas 3 en una
escala de 7 puntos. Esto es evidencia que el
encuestado no esta tomando la tarea con
seriedad

4. Un elemento equivocado de la muestra a


completado el instrumento. Por ejemplo, el
estudio exige
que el encuestado sea
mujeres que trabajan, y un hombre a
completado el instrumento.
5. El
instrumento
esta
fsicamente
incompleto. Por ejemplo, es posible que
no se haya incluido una pagina o que esta
se haya eliminado en el campo.
6. El instrumento se recibe despus de una
fecha de corte establecida. Si se espera que
todos los instrumento se devuelvan del
campo, es probable que el estudio no se
complete a tiempo

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.2 Edicin

Edicin
significa
revisar
los
instrumentos de recoleccin de datos
para asegurar la mxima exactitud y
mnima ambigedad .
Es importan que la edicin se realice en
forma consistente.
Al realizar la funcin de edicin, editor
debera ocuparse de las areas que
describen a continuacin

1. Legibilidad: para que posteriormente


se codifiquen en forma apropiada, los
datos deben ser legibles. El editor
elimina la ambigedad de los datos
registrados, de manera que el
codificador sepa exactamente qu
hacer.

2.- Integridad: las preguntas que no se


contestaron pueden tratarse de tres
formas.
El Primero, el editor puede contactar al
entrevistador para tratar de determinar si
el encuestado no respondi la pregunta o
si el entrevistador simplemente no
registro la pregunta.
El segundo enfoque consiste en clasificar
este dato en particular como faltante
El tercero si el editor considerara que
faltan demasiados elementos de datos,
puede volver a enviar todo el instrumento
al campo o eliminarlo del estudio.

Consistencia: en este punto se


hace una verificacin sobre la
consistencia
de
los
datos.
(posteriormente, el computador
realizara una verificacin mas
detallada)
Por ejemplo, el editor podra
verificar que los encuetados que
afirman que comprar gasolina con
tarjera de crdito, si tengan tarjeta
de crdito.

Exactitud : el editor necesita estar


atento a cualquier evidencia de
inexactitud en los datos. En este
caso, el rea mas importante se
relaciona con el posible sesgo o
trampa del entrevistador.

Clasificacin de respuesta:
Algunas veces las respuestas a
preguntas abiertas son difcil de
interpretar a claridad. Es posibles que
las palabras de las personas que
registra las respuestas hayan abreviado
demasiado las respuestas o que unas
palabras sean ambiguas. El riesgo de
error
es
algo
ambos
casos.
Obviamente, un buen trabajo de campo
inicial puede editar que surjan muchos
problemas

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.3 Codificacin

La codificacin comprende la
asignacin de un smbolo
numrico a un determinada
columna de la hoja de calculo, o
columnas del archivo ASCII para
representar
una
respuesta
especifica de un instrumento de
recoleccin de datos

Preguntas de respuestas cerrada y


abierta
Para preguntas estructuradas o de
respuesta cerrada, usualmente el
esquema de codificacin se especifica
antes de emprender el trabajo de
campo.
Por ejemplo, una clasificacin por sexo
pueden aparecer en el instrumento
como:
31
1
2

Cul es su sexo?
Femenino
masculino

El
detalle
del
esquema
de
codificaciones
necesita
estar
documentado, y esta documentacin
se coloca en lo que se llama libro de
cdigos.
Libros de cdigos:
Un libro de cdigos es el lugar donde
se documenta toda la informacin
necesaria acerca de las variables en
el conjunto de datos.

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.4 ingreso de datos al computador y verificacin

Las hojas de codificacin terminadas se


entregan al personal para su ingreso al
computador; ellos ingresan los nmeros
exactos que aparecen en las hojas en
un archivo ASCII del computador.
Luego el archivo sta listo para ser
convertido en una hoja de calculo o
matriz de datos.

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.5 conversin del paquete de datos a una


forma legible para el computador
El archivo de datos debe de introducirse en el
computador de una manera tal que lo puedan
utilizar los programas computacionales de
anlisis de datos.
La mayora de los programas con mayor
probabilidad de uso por parte de un
investigador estn contenidos dentro de un
paquete de programas. Los datos de hoja de
calculo pueden ser la informacin generada
por los archivos ASCII legibles para la mayora
de los paquetes estadsticos.

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.6 Depuracin del conjunto de datos

Ahora ya tenemos un conjunto de datos


estructurado como un archivo de
computador, pero an debemos tratar
de depurar el conjunto de datos de
posibles errores.
Se realizan tres tipos de verificaciones
en el conjunto de datos y son:
verificacin de cdigos normales
Verificacin de consistencia
Verificacin de caso extremo

Verificacin de cdigos normales:


los primeros elementos que deseamos eliminar de
nuestro conjunto de datos son llamados cdigos
normales, es decir los que no estn definidos en el
libro de cdigos para una determinada variable.
Verificacin de consistencia:
este consiste en verificar la consistencia de las
respuestas dentro de cada caso.
Por ejemplo: podramos verificar si los
encuestados que tiene hipoteca, tambin son
propietarios de una casa. Existen dos tipos de V.C:
de una entre y de dos entradas. Una situacin de
consistencia de una entrada, A es verdadero si B
es verdadero, pero el inverso no tiene que ser
verdadero. Y el de dos entradas seria A es
verdadero si y solo si B es verdadero y viceversa

Verificacin de casa extremo:


este se define como una respuesta de una
variable, que esta muy por fuera de lo comn.
Por ejemplo, un puntaje SAT registrado como
976 en el archivo de datos puede ser
sustancialmente alto que todos los dems
puntajes. Podemos ordenarle al computador
que imprima del total de casos los nmeros de
casos con puntajes SAT por encima de 775.
Luego verificaramos si estos puntajes fueron
los correctos.

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.7generacin de nuevas variables

Una ves depurado el conjunto de datos


originalmente codificado, podemos
agregar nuevas variables a este
conjunto de datos que se utilizar
posteriormente en el anlisis.
Existen varias circunstancias en las
cuales podran generase nuevas
variables:

1. Es posible que queremos agregar


datos no recolectados en la entrevista.
Por ejemplo, es probable que
queramos introducir informacin de un
censo sobre el rea en el cual vive un
encuestado.
2. Es posible que queramos dividir
una variable de intervalo, como
ingreso, en categoras o que
queramos combinar las categoras
de algunas variables para que nos
d una variable con menos
categora.

3. Es posible que queramos formar una variable


que se defina mediante combinaciones de
otras variables. Por ejemplo, la variable la
etapa del ciclo de vida de la familia se forma
utilizando edad, estado, civil, presencia de
hijos, etc.
4. Es posible que queramos crear un ndice
para representar un nmero de variables.
Por ejemplo, podemos simplemente
agregar un conjunto de medias a escala
acerca de un producto para formar un
ndice relacionado con el inters en el
producto.

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.8 Ponderacin de datos

Saber la ponderacin de los


datos de acuerdo con el plan de
muestreo, o debido a resultados
mustrales inesperados.
Le ordenamos al computador
que asigne las ponderaciones
apropiadas a los casos

4.2 IDENTIFICAR EL FLUJO DEL PROCESAMIENTO DE


LOS DATOS Y SUS COMPONENTES PRINCIPALES

4.2.9 Almacenamiento del grupo de datos

Ya que tenemos a un grupo de datos


completamente preparado para el
anlisis. Por lo general se almacena en
un disquete o USB y aparte se tiene un
respaldo de la informacin para as
poderla guardar en un lugar seguro.
Ahora estamos listos para hacer el
anlisis de datos informacin

1
Examinar un instrumento de recoleccin de datos

Eliminar o
regresar al
campo

No

Es
aceptable
para
usar?
Si
Editar los instrumentos aceptables
Codificar los instrumentos
Ingresar al computador y verificar
Convertir el archivo de datos a una forma
legible por el software para el anlisis
Depurar el conjunto de datos
Verificar cdigos anormales
Verificar consistencia
Verificar casa extremo

Plan de muestreo
y resultados

Generar nuevas variables en la medida


que sea necesario
Ponderar datos
Almacenar conjunto de datos para el anlisis

Flujo clsico
del
Procesamiento
de Datos

You might also like