You are on page 1of 24

FACULTAD DE CIENCIAS BASICAS

MANUAL DEL LABORATORIO DE ESTADISTICA

CARTAGENA
2010

1
MANUAL DEL LABORATORIO ESTADISTICA

CONTENIDO

INTRODUCCIÓN

GENERALIDADES DEL ENTORNO DE TRABAJO DE EXCEL Y STATGRAPHICS

PRÁCTICAS

1. TABLA Y GRAFICOS PARA VARIABLES CUALITATIVAS

2. TABLAS Y GRAFICOS PARA VARIABLES CUANTITATIVAS

3. MEDIDAS DESCRIPTIVAS : MEDIDAS DE TENDENCIA CENTRAL, DE VARIACION,


DE POSICION Y DE FORMA,

4. ANALISIS EXPLORATORIO DE DATOS, DIAGRAMA DE CAJAS Y BIGOTES

5. ANALISIS DE DOS VARIABLES CUALITATIVAS, TABLAS DE CONTINGENCIA Y


MARGINAL

6. TECNICAS DE CONTEO

7. TABLAS Y GRAFICOS DE PROBABILIDAD PARA VARIABLES ALEATORIAS


DISCRETAS

8. ANALISIS DE LA DISTRIBUCION BINOMIAL

9. ANALISIS DE LA DISTRIBUCION DE POISSON

10. ANALISIS DE LA DISTRIBUCION DE HIPERGEOMETRICA

11. ANALISIS DE LA DISTRIBUCION NORMAL


GENERALIDADES DEL ENTORNO DE TRABAJO DE EXCEL Y STATGRAPHICS

1. Generalidades para trabajar en Excel

La hoja de cálculo Excel de Microsoft es una aplicación integrada en el entorno Windows cuya
finalidad es la realización de cálculos sobre datos introducidos en la misma, así como la
representación de estos valores de forma gráfica. A estas capacidades se suma la posibilidad
de utilizarla como base de datos.

Excel trabaja con hojas de cálculo que están integradas en libros de trabajo. Un libro de trabajo
es un conjunto de hojas de cálculo y otros elementos como gráficos, hojas de macros, etc. El
libro de trabajo contiene 16 hojas de cálculo que se pueden eliminar, insertar, mover, copiar,
cambiar de nombre,...

Cada una de las hojas de cálculo Excel es una cuadrícula rectangular que tiene 16.384 filas y
256 columnas. Las filas están numeradas desde el uno y las columnas están rotuladas de
izquierda a derecha de la A a la Z, y con combinaciones de letras a continuación. La ventana
muestra sólo una parte de la hoja de cálculo. La unidad básica de la hoja de cálculo es una
celda. Las celdas se identifican con su encabezamiento de columna y su número de fila. La hoja
de cálculo se completa introduciendo texto, números y fórmulas en las celdas.

Introducir Información en la hoja de Calculo


Son las celdas de la hoja de cálculo las que deben contener la información. Dentro de una celda
de Excel puede haber dos tipos de información: datos y fórmulas. La información introducida
será interpretada como una fórmula siempre que el primer carácter introducido sea un signo
igual (=). En otro caso, será interpretada como dato, que puede ser numérico o de texto.

La información tecleada se introduce en cada momento en la celda que se encuentre


seleccionada a través de la barra editora de texto de la parte superior del documento y se edita
en la celda cuando se indica el fin de edición.

Una celda está seleccionada cuando tiene el contorno más grueso, y para seleccionarla hay
que hacer un clic sobre ella. El fin de edición se indica con un clic en el icono correspondiente
de la barra editora, pulsando la tecla retorno de carro o la tecla Intro que se encuentra en el
teclado numérico

Introducir Cálculos
Los cálculos que se realizan en una hoja de cálculo se llevan a cabo mediante fórmulas. Para
introducir una fórmula en una celda de Excel hay que empezar por un signo igual (=). Si en la
fórmula se introducen referencias a celdas en lugar de valores en número se podrán ver
actualizados los cálculos automáticamente cuando se modifique un dato en esa referencia.

Al hacer modificaciones de las fórmulas se recalculará automáticamente con los nuevos datos.
Excel proporciona más de 300 funciones.

Por ejemplo

Se selecciona la celda que debe recoger el total de población, escribir un signo igual (=) y
seleccionar la opción Fórmula | insertar función. Le aparecerá el asistente para funciones:
· PASO1: Las Categorías de funciones se agrupan por tipos. La categoría Todas incluye todas
las funciones que están agrupadas en las demás categorías. Dentro de cada categoría los
nombres de las funciones están agrupados por orden alfabético.

PASO2: Introducir los datos necesarios para realizar el cálculo.


Esta es la estructura básica de una función introducida con el menú Fórmula. En primer lugar
aparece la función y, debajo los elementos sobre los que debe aplicarla. Por ejemplo en la
suma se necesita Numero1, esto sería el rango de celdas que deseamos sumar. Basta con
seleccionar las celdas correspondientes en la hoja de cálculo para que aparezcan en el
recuadro.

-El punto y coma equivale a una y otra, es decir, =SUMA ( B3;B4) equivale a sumar B3 y B4.
-Los dos puntos equivalen a rango, es decir, desde...hasta.... Por tanto, =SUMA (B2:B7)
equivale a sumar desde B2 hasta B7.

Repetición de cálculos: llenados automáticos: se quiere calcular el total de la columna


Extensión en la celda C8 según el ejemplo, se podrá volver a introducir una fórmula de suma
como en la celda B8 para la población. Esta fórmula debería ser =SUMA(C2:C7), es decir, igual
en estructura a la suma anterior.

En las dos sumas, la fórmula introducida equivale a sumar desde 6 celdas más arriba hasta 2
celdas por encima de la celda que debe recoger el cálculo: los factores del cálculo están en
ambos casos en la misma posición relativa respecto a la celda que contiene la fórmula. Esto es
muy útil cuando se trata de calcular los totales de dos columnas paralelas.
Presentar fórmulas en pantalla

Las fórmulas aparecen en pantalla como resultados y no la fórmula en sí. Para presentar las
fórmulas en pantalla o para imprimir, se elige el menú Herramientas Opciones. Dentro del
cuadro del cuadro Opciones de la ventana podrá marcar Fórmulas entonces aparecerán las
fórmulas en las celdas correspondientes.

El resto de posibilidades que ofrece esta ventana puede ser útil en otras ocasiones.

Cuando en Excel introduce una fórmula que hace referencia a otra u otras celdas hay varias
formas de hacerlo según el uso que vaya a hacer posteriormente de ella.
Una referencia relativa indica la posición relativa de una celda con respecto a la que contiene la
fórmula y cuando se copia en otra posición modifica y actualizar las posiciones. Son referencias
posiciónales. ej.: C4.

Una referencia absoluta es una introducción explícita y única de otra celda en un cálculo, no de
su posición relativa. ej:$C$%.

En la hoja de cálculo se trabaja normalmente con referencias relativas. Es el tipo de referencia


que emplea Excel por defecto. Para trabajar con referencias absolutas se debe especificar
escribiendo el signo $ delante de la letra de la columna y del número de fila. Por ejemplo $A$3
se refiere exclusivamente a la celda A3 y, al aplicar llenados -hacia abajo o hacia la derecha- u
operaciones de y pegar las referencias que tengan el signo $ delante no serán actualizadas.
También puede incluir referencias mixtas. Son referencias mixtas $C4 o C$4. En el primer caso
la columna es absoluta y la fila relativa, y en el segundo caso la columna es relativa y la fila
absoluta.

Barra de formula: muestra contenido de la celda en la que se encuentra el apuntado.

Barra de estado: escribe los mensajes de control con las que se está trabajando. 8 -
Referencias absolutas y referencias relativas
EXPERIENCIA # 1

1. TABLA Y GRAFICOS PARA VARIABLES CUALITATIVAS

1. OBJETIVOS

Objetivo General

Tabular y graficar datos de tipo cualitativos utilizando diferentes paquetes estadísticos.

Objetivos Específicos

 Aprender a manejar varias herramientas de Excel y Statgraphics1 para la


construcción de tablas y gráficos.

 Identificar las tablas y gráficos para datos cualitativos.

 Desarrollar habilidades que conduzcan a una efectiva toma de datos de un


ensayo o experimento aleatorio.

2. Recursos y programas a utilizar

 Base de datos cualitativos

 Excel

 Statgrapchis
3. GENERALIDADES

3.1 Descripción de Variables Cualitativas

Las variables CUALITATIVAS, también llamadas CARACTERES, VARIABLES


CATEGÓRICAS o ATRIBUTOS, son aquellas que no necesitan números para
expresarse; cada forma particular en que se pueden presentar se denominan
modalidades. Por ejemplo, el sexo de una persona es una variable cualitativa y “varón”
o “mujer” son sus únicas modalidades. En consecuencia, para una variable cualitativa,
cada dato no es más que la información de que un determinado elemento de la
muestra presenta una determinada modalidad. Entre las variables cualitativas cabe
distinguir:

1) las variables cualitativas ORDINALES, que son las que teniendo más de dos
modalidades tienen establecido un orden natural entre las mismas, de forma que sus
modalidades se enuncian siguiendo una cierta ordenación ascendente o descendente
y no de otra manera. Por ejemplo, la variable “gravedad del pronóstico de lesiones
traumáticas” podría tener como orden natural entre sus modalidades “leve”,
“moderado”, “grave”, etc., pero nunca diríamos “grave”, “leve”, “moderado”, etc. en
este orden.

2) las variables cualitativas PURAS, que no tienen un orden natural preestablecido


entre sus modalidades, y podemos utilizar cualquier ordenación para ellas, como por
ejemplo el grupo sanguíneo o la nacionalidad de una persona (no hay que confundirse
con ordenaciones arbitrarias, como el orden alfabético, pensando que convierten en
ordinales a las variables, ya que no significan una verdadera ordenación natural de las
modalidades).

3) las variables DICOTOMICAS, que tienen sólo dos modalidades posibles, y en las
que ni siquiera tiene sentido plantearse si son o no ordinales; El hecho de tener sólo
dos modalidades les confiere características especiales. Cabe citar como ejemplos el
ya citado del sexo, el pertenecer o no a una asociación, o en general cualquier
situación que sólo admita una respuesta “sí o no”.

Distribución de Frecuencias

●Supongamos que tenemos N observaciones de una variable cualitativa.

●Supongamos que la variable puede tomar valores pertenecientes a k clases o


categorías:

Por ejemplo, la variable color de los ojos, presenta en este caso 4 modalidades

verde
Color de ojos =
{azul
cafe
negro
, k=4
● Representamos mediante n1, n2,…, nk el número de datos que aparecen en cada
una de las k categorías.

● Frecuencia absoluta de la clase i-ésima (ni): número de observaciones en la


clase i.

● Frecuencia relativa de la clase i-ésima (fi): es la proporción de datos en la clase


ni
i-ésima, es decir, f I= . La suma de las k frecuencias relativas es igual a la
N
unidad: f1 + f2 +…+ fk=1

- Estas frecuencias nos permiten comparar las frecuencias de las categorías en


conjuntos de datos con distinto número de observaciones

● Distribución de frecuencias: es la tabla que representa las categorías de una


variable y sus respectivas frecuencias.

- Nos indica cómo se distribuye la frecuencia total entre las categorías

- Es el resumen más importante de la información contenida en una variable


cualitativa

4. Construcción de tablas de distribución de frecuencias y gráficos de variables


cualitativas con Excel

4.1 Construcción de tablas de distribución de frecuencias

Consideremos la siguiente la variable de estudio, Clasificación social según sus


gastos teniendo en cuenta varios factores económicos y sociales como son:

1trabajadores agrarios

{
2 empresarios agrarios
3 obreros
SOC= 4 autonomos
5 clase media
6 clase alta
7 retirados

A continuación se muestran los datos recopilados en 75 hogares (o unidades de


gasto) correspondiente a la variable de estudio:

1 4 2 3 4 4

6 1 4 6 3 3

3 2 6 6 1 7

5 3 2 3 4 3
6 5 4 4 6 4

7 3 2 6 5 4

5 1 2 2 6 1

4 3 4 6 6 6

6 3 2 3 2 7

7 7 4 3 5 6

2 6 1 7 2  

6 6 4 7 2  

3 5 1 5 3  

Paso 1. Abra un libro de Excel, copie los datos de la tabla anterior en el libro y luego
se colocan los datos en una columna como se muestra a continuación:

Paso 2. Construya una tabla con los siguientes encabezados: Categorías, ni, fi. En la
columna “Categorías”, coloque los valores o etiquetas que se asignaron a cada
modalidad ósea: 1,2,…,7
Paso 3. Para hallar los valores de la frecuencia absoluta existen en Excel al menos
dos formas de realizarlo:

Forma 1: Inserte al lado de la primera categoría la función =Contar. Si ( ) rellene los


campos de la siguiente forma:

Rango: Es el conjunto de datos en la columna A, se selecciona dando Clic derecho


sobre el primer valor ubicado en la columna que corresponde a la celda A1 y se
extiende hasta la celda A76 y se fijan con la tecla F4, eso se simboliza $A$1:$A$76.

Criterio: Se selecciona el valor de la primera categoría que corresponde en la tabla de


ejemplo a la celda C3, a continuación le damos Intro y luego se extiende la formula
hasta el último valor de la categorías.
Eso nos permite calcular la frecuencia absoluta de cada categoría. La frecuencia
relativa se calcula introduciendo una formula en la que cada frecuencia absoluta se
divide sobre el total de los datos.

La tabla final quedara de la siguiente forma:

Forma 2. : Otra forma de calcular las frecuencias de cada categoría en un libro de


Excel es a través del la opción Análisis de Datos del Menú Datos. Esta opción a
veces no está instalada en el menú, pero a través de la opción complementos de Excel
se instala fácilmente.

El procedimiento para calcular la distribución de frecuencias por medio de esta opción


es la siguiente:
Se construye la tabla de distribución de frecuencias como el procedimiento anterior:

Luego a partir de la secuencia de instrucciones: DATOS- ANALISIS DE DATOS-


HISTOGRAMAS , se despliega un cuadro de dialogo como el siguiente:

Rango de entrada: se seleccionan la columna de datos a tabular, deben están en


columnas o filas

Rango de clases: son las categorías o clases en que se han dividido los datos, Si no
se tienen esas clases, Excel le asignara valores de manera automática.

Rotulo: Es el nombre de la columna de datos, no es necesario seleccionarlo.

Opciones de salida: son las celdas del libro donde se desea que salgan los
resultados del proceso de tabulación y las formas en que se desean que salgan los
resultados, tiene varias opciones.

Rango de salida: celda o lugar en la hoja de trabajo donde se desea que salgan los
resultados del proceso de tabulación.
En una hoja nueva: celda o lugar en otra hoja de trabajo donde se desea que salgan
los resultados del proceso de tabulación.

En un libro nuevo: los resultados saldrán en la hoja de un libro nuevo.

Pareto (histograma ordenado) : los resultados de esta opción es una tabla de


distribución de frecuencias donde las categorías se ordenan de acuerdo al valor de su
frecuencia, Excel lo hace de mayor a menor

Porcentaje acumulado: cuando los datos corresponde a una escala ordinal, de


intervalos o de razón, esta opción permite calcular la frecuencia relativa acumulada de
cada clase.

Crear grafico: permite construir el grafico del conjunto de datos a tabular.

Para la situación del ejemplo seleccionaremos el conjunto de datos, rango de clases y


el rango de salida, la celda $C$13,

La ventana de salida sería la siguiente:


Luego se puede copiar la columna de frecuencias en la tabla ya construida. La
columna correspondiente a la frecuencia relativa se calcula insertando la formula
correspondiente.

El resultado final seria:

4.2 Construcción de gráficos para variables cualitativas

Para las variables cualitativas se utilizan varios tipos de gráficos como son:

El diagrama de barras o rectángulos, consistente en asociar a cada modalidad de la


variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen
situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Si las
bases de los rectángulos se dibujan todas iguales, para cumplir la regla fundamental
antes citada basta tomar como alturas de los rectángulos directamente las frecuencias,
sin mayor complicación (el rectángulo de una modalidad con frecuencia 7 tendrá altura
7 y así con todas). Los rectángulos suelen representarse separados en este tipo de
gráficas, que también pueden aparecer con las barras horizontales y las modalidades
situadas verticalmente.

Para realizar este grafico en Excel, existen varios métodos

Método 1.

Se selecciona la columna correspondiente a la frecuencia absoluta o relativa, luego


con la tecla F11, Excel creara automáticamente el grafico en una hoja diferente a las
que están los datos. Luego en las herramientas de gráficos se puede cambiar el tipo
de grafico, guardar como plantilla, datos, etiquetas orientación, estilo, etc.

Método 2.

Se selecciona en la tabla de distribución de frecuencia la columna a la cual se quiere


construir el grafico, puede ser la columna de la frecuencia absoluta o la relativa.

Luego se van a la barra del menú y con la secuencia:

INSERTAR- COLUMNA- COLUMNA AGRUPADA- ENTER, se genera


automáticamente el grafico en forma de columna o barras verticales.
El resultado final seria:

Si se desea cambiar el color, forma, seleccionar otros datos. Se da un clic izquierdo


sobre el grafico a modificar y aparecerá en la barra del menú un ventana llamada
HERRAMIENTAS DE GRAFICO, allí podrá realizar los cambio que desee. Otra forma
es dando clic derecho sobre el grafico a modificar y se abrirá una ventana de dialogo
donde encontrara varias opciones para modificar el grafico.

- El diagrama de sectores, que refleja como sectores de un círculo las frecuencias


de cada modalidad. Como el radio es constante en un círculo, para cumplir la regla
fundamental de proporcionalidad basta hacer al ángulo de cada sector
proporcional a la frecuencia, lo que se consigue multiplicando los 360º del círculo
por la frecuencia relativa de cada modalidad. Este tipo de gráficas es muy útil para
comparar los resultados de una variable cualitativa en dos o más muestras.

Construcción de diagramas de sectores o circulares

Para realizar este grafico se siguen los mismos pasos que en el diagrama de barra,
pero a la hora de seleccionar diagrama de barras se selecciona circular, como se
muestra en la pantalla

El resultado sería:
5. Construcción de tablas de distribución de frecuencias y gráficos para
variables categóricas con Statgraphics:

5.1 Construcción de tablas de distribución

Aprenderemos a realizar análisis estadísticos para datos categóricos en


STATGRAPHICS, utilizando los datos anteriores.

Inicialmente, damos doble click en el icono de STATGRAPHICS, que se encuentra en

el escritorio . Obtenemos la siguiente ventana:

Observemos que el entorno es muy parecido al de Excel, la diferencia es que se


pueden personalizar las columnas, es decir, podemos dar el nombre a cada columna,
especificar con qué tipo de variable se está trabajando. Para especificar esto, vamos
a dar doble click sobre la columna en que queremos trabajar o seleccionar la columna
y darle click derecho, en este caso, obtenemos las siguientes opciones:

Escogemos la opción modificar columna y obtenemos el siguiente cuadro de dialogo


Compuesto por el nombre de la variable, un comentario con respecto a la variable de
estudio, y el tipo de variable.

Para nuestro ejemplo, la variable de estudio es el nivel socioeconómico, y el tipo de


variable es de tipo numérico, si escogemos la opción carácter en tipo de variable, no
vamos a poder ingresar los datos que en este caso son números. Luego de escoger
todas las opciones necesarias, le damos aceptar; inmediatamente el nombre de la
columna cambia y podemos ingresar los datos en la columna nivel socioeconómico.
Para realizar el análisis de esta variable, escogemos las siguientes opciones:

Esta ruta me lleva a un cuadro de dialogo, que me indica las variables que tengo en el
libro de datos eso se encuentra en lado izquierdo de dicho cuadro, damos doble click
sobre la variable a analizar:

En el momento que damos aceptar obtenemos el siguiente análisis:

Del lado izquierdo van a estar las tablas y del lado derecho los gráficos.
OTRO EJEMPLO EN STATGRAPHICS, DE DATOS CATEGORICOS:

Una encuesta entre un grupo de madres-solteras, para analizar los problemas


económicos que enfrentan, en determinada comunidad; arrojó los siguientes
resultados acerca del número de niños en el hogar.

1 4 2 3 5 3 5 3 3 5

1 1 2 1 4 1 2 1 4 1

2 1 1 2 1 2 3 2 3 3

3 1 3 4 1 1 3 5 4 2

2 5 1 4 2 3 1 2 5 1

You might also like