You are on page 1of 15

UNIVERSIDAD NACIONAL DE TUCUMAN FACULTAD DE MEDICINA

INSTRUCTIVO PARA EL
PROCESAMIENTO DE DATOS
EN MICROSOFT EXCEL 2007

CATEDRA DE BIOESTADISTICA

► Lic. Eugenia MATAS (JTP)

► Lic. Adriana PEREZ RENFIGES (JTP)

► Lic. Natalia María SANCHEZ (JTP)

-2009-
Guía para el procesamiento de datos en Excel

Con la elaboración de la presente guía, la Cátedra de Bioestadística, espera transmitir a los


alumnos que realizan la Pasantía Rural las herramientas básicas para la construcción de la
planilla de datos y tablas de frecuencias necesarias para realizar el análisis descriptivo de los
datos del trabajo final.

Este es un instructivo para aprender a confeccionar una planilla de datos en Excel y utilizar
Tablas Dinámicas (TD). Se usarán TD para confeccionar tablas de frecuencias a partir de la
planilla de datos construida.
Para una mayor claridad se indicará los pasos para el uso de las herramientas a través de
ejemplos concretos como el siguiente:

EJEMPLO: Suponga que desea conocer el grado de conocimiento sobre Síndrome


Bronquial Obstructivo (SBO) en madres o tutores de niños menores de 5 años que concurren al
consultorio de pediatría de un cierto hospital y su asociación con el nivel de instrucción. Las
variables estudiadas fueron: edad madre/tutor (medida en años); sexo madre/tutor (femenino o
masculino); instrucción registrada como analfabeto, primario (incompleto o completo),
secundario (incompleto o completo); conocimiento sobre SBO clasificada en bueno, regular o
malo, información sobre SBO (si recibió o no recibió) y fuentes de información
considerándose las categorías: personal de salud, familiares, amigos, medios de comunicación
(tv) y otros.

Pasos para la elaboración de la planilla de datos en Excel 2007.

La construcción de la planilla de datos se debe realizar en Microsoft Excel, ésta es una guía
para aquellos que deseen trabajar en Excel 2007. Debido a que la Cátedra cuenta con la
Versión 2003, las planillas que hayan sido realizadas en versión 2007 deben guardarse de
modo compatible con Excel 2003. Para la construcción de la planilla de datos debe tenerse en
cuenta las siguientes indicaciones:

1. Comenzar el llenado desde la primera fila (1º renglón) y primera columna (columna A),
evitando dejar filas y/o columnas en blanco. Evitar usar detalles de diseño, como “combinar
celdas”, cambiar “orientación del texto”, etc.
2. Cada variable definida en el protocolo debe ir en una columna diferente. En la primera fila
de cada una de las columnas indicar el nombre de la variable. Cada variable debe tener un
nombre diferente.
3. Los datos de cada unidad de observación (individuos, familias, consultas, etc.) se vuelcan
en una fila diferente, comenzando desde la segunda fila, puesto que en la primera fila
estará puesto el nombre de la variable.
4. Se reserva la primera columna para asignar un número identificador de la unidad de
observación, este número debe ser el mismo que el utilizado en la encuesta o ficha de
recolección de datos, con el objetivo de poder identificar los datos recolectados que
corresponden a cada encuesta o ficha.
5. Para aquellas preguntas que admiten más de una respuesta cada una de estas respuestas
deberá ocupar una columna diferente. En el ejemplo planteado, en la pregunta referida a
Fuentes de información, un individuo puede tener más de una respuesta, por lo cual cada
respuesta posible ocupará una columna diferente (columnas G a K de la figura 1).
6. Es conveniente utilizar códigos numéricos para identificar cada categoría de las diferentes
variables cualitativas, a los efectos de emplear dichos códigos para ingresar los datos de
las encuestas o fichas en la planilla.
La planilla de datos del ejemplo se muestra en la figura 1, considerando un total de 10
madres o tutores. Para su construcción se utilizaron los siguientes códigos.

1
Tabla Nº 1: Códigos usados en la planilla de datos del ejemplo
Variable Categorías Códigos
Sexo Masculino 1
Femenino 2
Instrucción Analfabeto 1
Primario incompleto o 2
completo
Secundario incompleto o 3
completo.
Conocimiento Bueno 1
Regular 2
Malo 3
Información Si recibió 1
No recibió 0
Personal de Si recibió 1
salud No recibió 0
Si recibió 1
Familia
No recibió 0
Si recibió 1
Fuentes de Amigos
información No recibió 0
Medios de Si recibió 1
comunicación
No recibió 0
(TV)
Si recibió 1
otros
No recibió 0

Nota: La variable edad, por tratarse de una variable cuantitativa, no se


codifica, sino que se vuelca en la planilla de datos la edad exacta de cada
encuestado; salvo que para algún análisis posterior se requiera su
categorización como se explica al final de la guía.

Figura 1: Planilla de datos del ejemplo

2
Se destaca que cuando no se tiene información de una variable para un individuo en
particular la celda correspondiente debe quedar vacía, sin puntos, sin espacios, sin ningún otro
caracter. En el ejemplo, los valores 0 de la variable información previa sobre SBO, indican que
esos individuos “no” recibieron información sobre SBO, por lo cual no respondieron las
siguientes preguntas referidas a las fuentes. Es por ello que quedan vacías las celdas para las
distintas fuentes de información en los individuos que no recibieron información (ver figura 1).

Una vez completada la planilla de datos se debe proceder a hacer el análisis descriptivo de
la información a través de tablas de frecuencia y gráficos.

Pasos para la confección de tablas de frecuencia a través del uso de la herramienta


“Tablas Dinámicas”:

1. En la hoja de cálculo que contiene la planilla de datos, situarse en la primera fila y


primera columna. Luego, hacer click el menú Insertar, allí abrir la pestaña Tabla dinámica
y seleccionar dentro de ésta la opción Tabla dinámica.

Figura 2

Se abrirá una ventana denominada Crear tabla dinámica allí en Seleccione una tabla o
rango dentro de Seleccione los datos que desea analizar le pedirán que indique en que
celdas de la hoja de cálculo de Excel se encuentran sus datos, por defecto se marcarán todas
las celdas en donde están, desde la celda que contiene el nombre de la primera columna hasta
la celda que contiene el código de la ultima variable (o columna) para el último individuo
cargado. Si no se marca automáticamente hacer click en el icono y marcar el área
correspondiente a sus datos en la hoja de cálculo y hacer nuevamente click en dicho icono.
Además en esta ventana aparece la opción Elija donde desea colocar el informe de tabla
dinámica en donde le piden que indique donde quiere situar su tabla dinámica, seleccione una
Nueva hoja de cálculo. Luego, hacer click en el botón Aceptar.

3
Figura 3

2. En una nueva hoja en el mismo libro donde están sus datos aparecerá, a la derecha de
la hoja, Lista de campos de tabla dinámica la cuál es una lista de las variables que Ud. tiene
en la planilla de datos y un esquema de una tabla en blanco como se muestra en la Figura 4.1
o 4.2. Si apareciera la tabla dinámica como en la figura 4.1 y usted quisiera trabajar con la
tabla clásica que corresponde a la de la figura 4.2 deberá hacer clic en la opción de menú
Herramientas de la tabla, allí en la opción Tabla dinámica abrir la pestaña Opciones y luego
hacer clic en Opciones, finalmente se abrirá una ventana denominada Opciones de la tabla
dinámica. Dentro de la ventana seleccionar la pestaña Mostrar, allí tildar la opción Diseño de
la tabla dinámica clásica, luego hacer clic en Aceptar (ver figura 4.3). De esta manera se
obtendrá una tabla dinámica como la figura 4.2. la cuál permite arrastras campos en la
cuadrícula.

Figura 4.1

4
Figura 4.2

Figura 4.3

5
Si se desea construir la tabla de frecuencia de una sola variable usando el diseño de tabla
dinámica que se muestra en la figura 4.1, se arrastra con el mouse, desde la lista de variables,
la variable de interés hacia el recuadro inferior Rótulo de columna o fila, luego se selecciona
nuevamente la variable en la lista de variables y se la arrastra una vez más hacia el recuadro
inferior Valores. Si optó por utilizar el diseño de tabla clásica como la de la figura 4.2 la forma
de realizarlo es arrastrando con el mouse, desde la lista de variables, la variable de interés
hacia Coloque aquí campos de columna o fila del esquema de la tabla. Se podrá observar a
la izquierda de la pantalla la tabla dinámica solicitada.
Suponga que la variable de interés sea conocimiento, al arrastrar con el mouse la variable
conocimiento a Rótulo de fila o directamente arrastrándola hacia la tabla a Campos de fila, se
obtiene lo siguiente:

Figura 5

3. Luego se arrastra la misma variable al recuadro Valores o directamente hacia la tabla


dinámica a Coloque datos aquí y se obtiene lo siguiente

6
Figura 6

4. Por último, en el encabezado derecho de la tabla no siempre aparece la operación que


uno desea que el programa realice con los datos. En este ejemplo aparece suma de
conocimiento lo que significa que el programa sumará los códigos utilizados en cada categoría,
cuando en realidad lo que se desea es que cuente el número de veces que aparece cada
categoría. Para seleccionar la operación adecuada, hacer doble click en suma de “variable”
(conocimiento), se abrirá una nueva ventana (Figura 7) en la que se seleccionará dentro de
Resumir campo de valor por la opción Cuenta, luego hacer click en Aceptar. Otra manera de
hacer lo mismo es abrir la pestaña del recuadro Valores que aparece a la derecha de la
pantalla, allí debe seleccionar Configuración de campo de valor..., de esta manera abrirá una
ventana en la que se seleccionará dentro de Resumir campo de valor por la opción Cuenta

Figura 7

7
En la figura 8 se observa la tabla de frecuencias de la variable de interés.

Figura 8

Para realizar el gráfico de la variable conocimiento construir otra tabla reemplazando los
códigos con los nombres de las categorías de la variable y copiar la frecuencias absolutas
directamente de la tabla dinámica. Una vez realizada la tabla como se muestra en la figura 9
“cortar” la misma y “pegarla” en una hoja nueva del mismo archivo.
Se puede realizar el gráfico de esta variable con las frecuencias absolutas o con las
frecuencias porcentuales. Si se desea realizar el gráfico con frecuencias porcentuales se
deberá calcular dichos porcentajes y recién graficar como se muestra en la figura 10.

8
Figura 9

Figura 10

Se destaca que en las barras se agregaron etiquetas de datos con los valores de las
frecuencias. El título y número del gráfico no se incorpora dentro del recuadro del grafico de
Excel sino que se agregan directamente en Word.
Para continuar trabajando con la tabla dinámica, en el caso que se oculte la lista de
variables, hacer clic en cualquier lugar de la tabla dinámica y aparecerá nuevamente el listado
de variables a la derecha. Para construir una nueva tabla de frecuencias tendrá que reemplazar
la/s variable/s utilizada/s (ej: conocimiento) debiendo destildar en la lista de variables la variable

9
que no desea utilizar y realizando todo el proceso explicado anteriormente para la nueva
variable que desea describir.

Asociaciones de dos variables cualitativas


Para analizar si existe asociación entre dos variables cualitativas se debe construir una
tabla de frecuencia conjunta de las dos variables a asociar, para ello se arrastra una variable al
recuadro Rótulos de fila o directamente hacia la tabla dinámica a Campos de fila (por ejemplo
conocimiento) y la otra variable al recuadro Rótulos de columna o directamente hacia la tabla
dinámica a Campos de columna (por ejemplo instrucción). Luego se arrastra cualquiera de las
dos variables al recuadro Valores o directamente hacia la tabla dinámica a Coloque datos
aquí. En el encabezado de la tabla debe figurar cuenta y no suma como se indicó en el paso
4.

Figura 11

Las celdas vacías indican que no hubo frecuencia en esa celda, por ejemplo se observa
que no hubo ningún individuo con conocimiento bueno que sea analfabeto.
Para graficar esta tabla se usará el gráfico de barras proporcionales. Es importante
destacar que cada barra llega al 100% en el eje vertical del gráfico y no se tuvieron que
calcular los porcentajes con anterioridad a la confección del gráfico, además es importante que
se muestre la leyenda del gráfico. Se deben agregar etiquetas de datos en el gráfico, estos
aparecen en frecuencias absolutas. Estas etiquetas son necesarias para que los docentes de la
cátedra puedan realizar el cálculo del test de asociación correspondiente. (Figura 12).

10
Figura 12

Nota: El gráfico Nº1 presentado en la Figura 12 se obtuvo solicitando en Insertar un gráfico de


columna 100% apilada a partir de seleccionar la tabla de doble entrada construida, en esta se
observa que los porcentajes están calculados en base a los totales de cada categoría de la
variable nivel de instrucción. Si en la barra de herramientas del gráfico se solicita dentro de
Diseño la opción “Cambiar entre filas y columnas” el programa Excel cambia la forma de
leer los datos de la tabla y toma como base para los porcentajes a los totales de las categorías
de la variable conocimiento obteniéndose de esa manera un gráfico como el Nº 2).
La dirección que se debe elegir depende de las variables en cuestión. Según su
conocimiento debe identificar cuál es la variable explicativa (factor) y cuál es la variable
respuesta. Las categorías de la variable explicativa deben mostrarse en el eje horizontal y las
categorías de la variable respuesta deben aparecer en la leyenda. En el ejemplo se piensa que
el nivel de instrucción podría explicar el conocimiento sobre SBO, por lo que el gráfico correcto
es el gráfico Nº 1 en figura 12.

Categorización de variables continuas


En caso de querer categorizar una variable continua como por ejemplo la variable edad, se
requerirá insertar una nueva columna después de la variable que le interesa categorizar. Esto
se logra ubicando el cursor en la posición en la que se desea la nueva columna (columna C de
la figura 1), luego en el menú “Inicio” seleccionar en “Celdas” la opción “Insertar columnas de
hoja”. A la nueva columna otórguele un nombre que distinga esta variable categorizada de la
original, en el ejemplo “grupo etáreo”. (Figura 13)

11
Figura 13

Una vez realizado este procedimiento tendrá que ordenar todos los casos según la variable
continua (edad en el ejemplo) en forma ascendente, para lo cuál deberá ubicar el cursor en la
primera celda, luego en el menú “Inicio” seleccionar “Modificar”, allí dentro de la pestaña
“Ordenar y filtrar” seleccionar la opción “Orden personalizado”, aquí se abrirá una ventana,
en esta en la opción “Ordenar por” elija la variable continua (edad), en la opción “Ordenar
según” elija Valores y por último en la opción “Criterio de ordenación” seleccionar De
menor a mayor. Finalice haciendo clic en Aceptar. (Figura 14)

Figura 14

12
A continuación los individuos aparecerán en el ejemplo ordenados de menor a mayor edad.
Ahora usted deberá formar los grupos de la variable continua (edad) y codificar los mismos. En
el ejemplo se consideraron los siguientes grupos de edad: 20 a 29 (codificado como 1); 30 a 39
(codificado como 2) y 40 a 49 años (codificado como 3). Luego deberá completar la columna de
la nueva variable con los códigos considerados según corresponda. (Figura 15)

Figura 15

Para realizar una tabla de frecuencias con la nueva variable usando tablas dinámicas
existentes, debe actualizar los datos. Esto puede hacerse seleccionando la opción “Datos”
dentro de la barra de herramientas de la tabla dinámica, allí dentro de “Conexiones”
seleccionar en la opción “Actualizar todo” (ver figura 16)

13
Figura 16

Después de este procedimiento aparecerá la variable grupo etáreo junto con las demás
variables a la derecha de la tabla como se muestra en la figura 17, y podrá ser usada para el
análisis que desee.

Figura 17

14

You might also like