Professional Documents
Culture Documents
INSTRUCTIVO PARA EL
PROCESAMIENTO DE DATOS
EN MICROSOFT EXCEL 2007
CATEDRA DE BIOESTADISTICA
-2009-
Guía para el procesamiento de datos en Excel
Este es un instructivo para aprender a confeccionar una planilla de datos en Excel y utilizar
Tablas Dinámicas (TD). Se usarán TD para confeccionar tablas de frecuencias a partir de la
planilla de datos construida.
Para una mayor claridad se indicará los pasos para el uso de las herramientas a través de
ejemplos concretos como el siguiente:
La construcción de la planilla de datos se debe realizar en Microsoft Excel, ésta es una guía
para aquellos que deseen trabajar en Excel 2007. Debido a que la Cátedra cuenta con la
Versión 2003, las planillas que hayan sido realizadas en versión 2007 deben guardarse de
modo compatible con Excel 2003. Para la construcción de la planilla de datos debe tenerse en
cuenta las siguientes indicaciones:
1. Comenzar el llenado desde la primera fila (1º renglón) y primera columna (columna A),
evitando dejar filas y/o columnas en blanco. Evitar usar detalles de diseño, como “combinar
celdas”, cambiar “orientación del texto”, etc.
2. Cada variable definida en el protocolo debe ir en una columna diferente. En la primera fila
de cada una de las columnas indicar el nombre de la variable. Cada variable debe tener un
nombre diferente.
3. Los datos de cada unidad de observación (individuos, familias, consultas, etc.) se vuelcan
en una fila diferente, comenzando desde la segunda fila, puesto que en la primera fila
estará puesto el nombre de la variable.
4. Se reserva la primera columna para asignar un número identificador de la unidad de
observación, este número debe ser el mismo que el utilizado en la encuesta o ficha de
recolección de datos, con el objetivo de poder identificar los datos recolectados que
corresponden a cada encuesta o ficha.
5. Para aquellas preguntas que admiten más de una respuesta cada una de estas respuestas
deberá ocupar una columna diferente. En el ejemplo planteado, en la pregunta referida a
Fuentes de información, un individuo puede tener más de una respuesta, por lo cual cada
respuesta posible ocupará una columna diferente (columnas G a K de la figura 1).
6. Es conveniente utilizar códigos numéricos para identificar cada categoría de las diferentes
variables cualitativas, a los efectos de emplear dichos códigos para ingresar los datos de
las encuestas o fichas en la planilla.
La planilla de datos del ejemplo se muestra en la figura 1, considerando un total de 10
madres o tutores. Para su construcción se utilizaron los siguientes códigos.
1
Tabla Nº 1: Códigos usados en la planilla de datos del ejemplo
Variable Categorías Códigos
Sexo Masculino 1
Femenino 2
Instrucción Analfabeto 1
Primario incompleto o 2
completo
Secundario incompleto o 3
completo.
Conocimiento Bueno 1
Regular 2
Malo 3
Información Si recibió 1
No recibió 0
Personal de Si recibió 1
salud No recibió 0
Si recibió 1
Familia
No recibió 0
Si recibió 1
Fuentes de Amigos
información No recibió 0
Medios de Si recibió 1
comunicación
No recibió 0
(TV)
Si recibió 1
otros
No recibió 0
2
Se destaca que cuando no se tiene información de una variable para un individuo en
particular la celda correspondiente debe quedar vacía, sin puntos, sin espacios, sin ningún otro
caracter. En el ejemplo, los valores 0 de la variable información previa sobre SBO, indican que
esos individuos “no” recibieron información sobre SBO, por lo cual no respondieron las
siguientes preguntas referidas a las fuentes. Es por ello que quedan vacías las celdas para las
distintas fuentes de información en los individuos que no recibieron información (ver figura 1).
Una vez completada la planilla de datos se debe proceder a hacer el análisis descriptivo de
la información a través de tablas de frecuencia y gráficos.
Figura 2
Se abrirá una ventana denominada Crear tabla dinámica allí en Seleccione una tabla o
rango dentro de Seleccione los datos que desea analizar le pedirán que indique en que
celdas de la hoja de cálculo de Excel se encuentran sus datos, por defecto se marcarán todas
las celdas en donde están, desde la celda que contiene el nombre de la primera columna hasta
la celda que contiene el código de la ultima variable (o columna) para el último individuo
cargado. Si no se marca automáticamente hacer click en el icono y marcar el área
correspondiente a sus datos en la hoja de cálculo y hacer nuevamente click en dicho icono.
Además en esta ventana aparece la opción Elija donde desea colocar el informe de tabla
dinámica en donde le piden que indique donde quiere situar su tabla dinámica, seleccione una
Nueva hoja de cálculo. Luego, hacer click en el botón Aceptar.
3
Figura 3
2. En una nueva hoja en el mismo libro donde están sus datos aparecerá, a la derecha de
la hoja, Lista de campos de tabla dinámica la cuál es una lista de las variables que Ud. tiene
en la planilla de datos y un esquema de una tabla en blanco como se muestra en la Figura 4.1
o 4.2. Si apareciera la tabla dinámica como en la figura 4.1 y usted quisiera trabajar con la
tabla clásica que corresponde a la de la figura 4.2 deberá hacer clic en la opción de menú
Herramientas de la tabla, allí en la opción Tabla dinámica abrir la pestaña Opciones y luego
hacer clic en Opciones, finalmente se abrirá una ventana denominada Opciones de la tabla
dinámica. Dentro de la ventana seleccionar la pestaña Mostrar, allí tildar la opción Diseño de
la tabla dinámica clásica, luego hacer clic en Aceptar (ver figura 4.3). De esta manera se
obtendrá una tabla dinámica como la figura 4.2. la cuál permite arrastras campos en la
cuadrícula.
Figura 4.1
4
Figura 4.2
Figura 4.3
5
Si se desea construir la tabla de frecuencia de una sola variable usando el diseño de tabla
dinámica que se muestra en la figura 4.1, se arrastra con el mouse, desde la lista de variables,
la variable de interés hacia el recuadro inferior Rótulo de columna o fila, luego se selecciona
nuevamente la variable en la lista de variables y se la arrastra una vez más hacia el recuadro
inferior Valores. Si optó por utilizar el diseño de tabla clásica como la de la figura 4.2 la forma
de realizarlo es arrastrando con el mouse, desde la lista de variables, la variable de interés
hacia Coloque aquí campos de columna o fila del esquema de la tabla. Se podrá observar a
la izquierda de la pantalla la tabla dinámica solicitada.
Suponga que la variable de interés sea conocimiento, al arrastrar con el mouse la variable
conocimiento a Rótulo de fila o directamente arrastrándola hacia la tabla a Campos de fila, se
obtiene lo siguiente:
Figura 5
6
Figura 6
Figura 7
7
En la figura 8 se observa la tabla de frecuencias de la variable de interés.
Figura 8
Para realizar el gráfico de la variable conocimiento construir otra tabla reemplazando los
códigos con los nombres de las categorías de la variable y copiar la frecuencias absolutas
directamente de la tabla dinámica. Una vez realizada la tabla como se muestra en la figura 9
“cortar” la misma y “pegarla” en una hoja nueva del mismo archivo.
Se puede realizar el gráfico de esta variable con las frecuencias absolutas o con las
frecuencias porcentuales. Si se desea realizar el gráfico con frecuencias porcentuales se
deberá calcular dichos porcentajes y recién graficar como se muestra en la figura 10.
8
Figura 9
Figura 10
Se destaca que en las barras se agregaron etiquetas de datos con los valores de las
frecuencias. El título y número del gráfico no se incorpora dentro del recuadro del grafico de
Excel sino que se agregan directamente en Word.
Para continuar trabajando con la tabla dinámica, en el caso que se oculte la lista de
variables, hacer clic en cualquier lugar de la tabla dinámica y aparecerá nuevamente el listado
de variables a la derecha. Para construir una nueva tabla de frecuencias tendrá que reemplazar
la/s variable/s utilizada/s (ej: conocimiento) debiendo destildar en la lista de variables la variable
9
que no desea utilizar y realizando todo el proceso explicado anteriormente para la nueva
variable que desea describir.
Figura 11
Las celdas vacías indican que no hubo frecuencia en esa celda, por ejemplo se observa
que no hubo ningún individuo con conocimiento bueno que sea analfabeto.
Para graficar esta tabla se usará el gráfico de barras proporcionales. Es importante
destacar que cada barra llega al 100% en el eje vertical del gráfico y no se tuvieron que
calcular los porcentajes con anterioridad a la confección del gráfico, además es importante que
se muestre la leyenda del gráfico. Se deben agregar etiquetas de datos en el gráfico, estos
aparecen en frecuencias absolutas. Estas etiquetas son necesarias para que los docentes de la
cátedra puedan realizar el cálculo del test de asociación correspondiente. (Figura 12).
10
Figura 12
11
Figura 13
Una vez realizado este procedimiento tendrá que ordenar todos los casos según la variable
continua (edad en el ejemplo) en forma ascendente, para lo cuál deberá ubicar el cursor en la
primera celda, luego en el menú “Inicio” seleccionar “Modificar”, allí dentro de la pestaña
“Ordenar y filtrar” seleccionar la opción “Orden personalizado”, aquí se abrirá una ventana,
en esta en la opción “Ordenar por” elija la variable continua (edad), en la opción “Ordenar
según” elija Valores y por último en la opción “Criterio de ordenación” seleccionar De
menor a mayor. Finalice haciendo clic en Aceptar. (Figura 14)
Figura 14
12
A continuación los individuos aparecerán en el ejemplo ordenados de menor a mayor edad.
Ahora usted deberá formar los grupos de la variable continua (edad) y codificar los mismos. En
el ejemplo se consideraron los siguientes grupos de edad: 20 a 29 (codificado como 1); 30 a 39
(codificado como 2) y 40 a 49 años (codificado como 3). Luego deberá completar la columna de
la nueva variable con los códigos considerados según corresponda. (Figura 15)
Figura 15
Para realizar una tabla de frecuencias con la nueva variable usando tablas dinámicas
existentes, debe actualizar los datos. Esto puede hacerse seleccionando la opción “Datos”
dentro de la barra de herramientas de la tabla dinámica, allí dentro de “Conexiones”
seleccionar en la opción “Actualizar todo” (ver figura 16)
13
Figura 16
Después de este procedimiento aparecerá la variable grupo etáreo junto con las demás
variables a la derecha de la tabla como se muestra en la figura 17, y podrá ser usada para el
análisis que desee.
Figura 17
14