You are on page 1of 13

Contenidos Claves de Asignatura

Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

Conceptos de Estadística Descriptiva.

0. Introducción.

Actualmente la Estadística como disciplina ha experimentado un considerable crecimiento. Lo


anterior se debe principalmente a: la tendencia mundial del planteamiento cuantitativo que se usa
de forma creciente en todas las ciencias como también en las áreas de los negocios y la economía
y a la disponibilidad de poderosos sistemas de computación que permiten manejar volúmenes
considerable de información, esto conlleva, a: recopilar, procesar, interpretar, presentar y
representar datos numéricos de forma acertada que ayude a tomar la mejor decisión de acuerdo a
la información que tenemos.

De este modo, la estadística es una poderosa disciplina que nos entrega procedimientos para la
obtención de los datos, como asimismo proporciona las herramientas que permiten extraer la
1
información .

1. ¿Qué es la Estadística?
Como se esbozó en el párrafo precedente, la Estadística es una disciplina que diseña medios e
instrumentos en donde el hombre trate de comprender la generalidad de los procesos que se
presentan en la vida.

En la literatura podemos encontrar diferentes definiciones de Estadística, sin embargo, una


definición precisa es:

“La Estadística es un conjunto de procesos y herramientas que permiten: recopilar,


procesar, interpretar, presentar, representar, analizar datos alfa numéricos, que nos ayude a
realizar inferencias sobre el comportamiento general de la población en estudio, y por lo
tanto implique el poder entender el comportamiento de los fenómenos, para tomar la mejor
2
decisión posible” .

La etapa de recopilación, procesamiento, interpretación, representación y análisis de los datos se


llama Estadística Descriptiva, es decir, comprende cualquier actividad relacionada con los datos,
mientras que la generalización, inferencia y toma de decisión se conoce como Estadística
Inferencial o Inferencia Estadística.

2. Conceptos básicos relativos a la Estadística.

• Población: corresponde a un conjunto de elementos, personas, o medidas que tienen


entre sí alguna característica común, y que es objeto de estudio. Por ejemplo, los
estudiantes de una determinada carrera del DuocUc, los habitantes de un país, el conjunto
de piezas defectuosas y no defectuosas que produce una fábrica en un día determinado.

1
Departamento de Evaluación, Medición y Registro Educacional. Nociones Básicas de Estadística.
Universidad de Chile.
2
Escobedo, C. (2008). Apuntes de Estadística para Geógrafos. Universidad de Chile.

1
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

• Muestra: La constituye un subconjunto de la población. Por ejemplo 30 de los


estudiantes de una determinada carrera.

Observación. En todo estudio se analiza una muestra representativa para determinar el


comportamiento de la población, esto se hace simplemente por razones de costos y de

tiempo. Sin embargo, los CENSOS de población y vivienda, son los únicos estudios donde
se analiza a toda la población.

• Variable: Característica o propiedad asociada a un conjunto de unidades observables de


una población o muestra. Llamaremos observación o dato a cualquier valor cualitativo o
cuantitativo asociado a una variable. Por ejemplo: la altura de un conjunto de personas, el
sueldo semanal de los trabajadores de cierta empresa, la nacionalidad de los estudiantes
de una determinada carrera, el número de hijos de un grupo de personas.

• Parámetro: Se denomina así, a toda aquella característica medible de una población.


Por ejemplo, la calidad de servicio de una determinada empresa es medida en función de
ciertos parámetros tales como: reclamos recibidos, atendidos, no atendidos, tiempo de
atención, tiempo de respuesta, entre otros.

• Estadístico o Estadígrafo. Se denomina así, a toda característica medible de una


muestra que permita obtener conclusiones respecto del comportamiento de ciertos
parámetros. Por ejemplo, la moda, media, mediana, varianza, desviación estándar, entre
otros.

3. Tipos de Variables.

3.1 Variables Cuantitativas.


Sus valores expresan algo medible a través de números, es decir, cuanto de algo se posee. Las
variables cuantitativas, según la naturaleza de los datos numéricos que originan, se pueden
clasificar en:

2
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

• Discretas. Son aquellas cuyo recorrido adoptan ciertos valores a lo largo de un


intervalo. Ejemplos de variables discretas son los siguientes: número de hijos en una
familia, cantidad de automóviles usados vendidos en un fin de semana, etc.

• Continuas. Aquellas cuyo recorrido es un conjunto no numerable (por ejemplo, un


intervalo de números reales). Ejemplos de variables continuas son: estatura de los
estudiantes de un tercer año medio en centímetros, peso de una caja de naranjas en
kilos, etc.

3.2. Variables Cualitativas.


Sus valoren corresponden a conceptos, atributos, o cualidades. Estás se pueden clasificar en:

• Nominales. Permiten clasificar o distinguir entre categorías. Nombran, pero no miden


la variable. Ejemplo: Nacionalidad, Estado civil, etc.

• Ordinales. Permiten establecer relaciones de orden entre los datos de la variable:


mayor, menor o igual. Ejemplo: Nivel socioeconómico (alto, medio, bajo), rendimiento
académico (excelente, regular, deficiente), etc.

La clasificación anterior se ve representada en el siguiente esquema:

Variables

Cuantitativas Cualitativas

Discretas Continuas Nominales Ordinales

Ejemplo 1.1

Considerando a los trabajadores y al producto (bolsas de azúcar) que se fabrica en cierta industria,
se podría obtener información como la siguiente:

¿Qué edad tienen los operarios?, ¿cuál es su escolaridad?, ¿qué oficios tienen?, ¿cuál es el
ingreso mensual?, ¿cuál es el defecto más común en las bolsas de azúcar?, ¿cuál es el nº de
bolsas mal selladas por línea?, ¿cuál es el peso de cada bolsa?, ¿cuántas bolsas están altamente
dañadas en línea de producción A?

3
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

Variable Tipo de dato Datos

Edad Continuo 25,28,35,42,44

Escolaridad Ordinal Básica, media, técnica, profesional, postgrado

Oficio Nominal Ingeniero eléctrico, técnico mecánico,


operador, auxiliar

Ingreso($) Continuo 550.000, 300.000, 256.000, 130.000, 800.000,


45.000

Tipo de defectos Nominal “Mal selladas”, “rasgadas”, “manchadas”

Nº de bolsas Discreto 5, 10, 2, 6, 3, 2, 9, 15, 25

Peso (Kg) Continuo 50.5, 48.5, 49, 50, 51.3, 55.7, 60

Nivel de deterioro Ordinal “alto”, “medio”, “bajo”, “sin defectos”

4. Tablas de Frecuencias.

Una forma eficaz de presentar ordenadamente un grupo de observaciones, es a través de tablas


de distribución de frecuencia. En simple palabras una tabla de distribución de frecuencia, es y
presenta la cantidad de valores observa dos que entran en cada clase. La estructura de la tabla
depende de la cantidad y tipo de variable (cualitativa o cuantitativa) que se están analizando,
siendo las más simple, las referidas a una variable.

Para la construcción de una tabla de frecuencias de debe elegir adecuadamente el número de


clases a utilizar, que depende de la cantidad de observaciones que se quieran resumir. Por lo
general la distribución de frecuencias debe tener como mínimo 5 clases, pero no más de 15,
aunque algunos autores han minimizado esta cantidad a 8.

4
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

4.1 Elementos de una Tabla de Frecuencia.


En una tabla de frecuencia se encontrarán cuatro tipos distintos de frecuencias, cada uno de estos
dispuestos en una columna de la tabla. Si el tamaño de la muestra que se estudia es n, es decir, se
tienen n observaciones o datos, se definen las frecuencias como sigue:

• Frecuencia absoluta. Este tipo de frecuencia lo denotaremos por fi, y representa el


número de elementos que pertenecen a la clase i-ésima.

• Frecuencia absoluta acumulada. Se denota por Fi, y corresponde a la suma de la


frecuencia absoluta de la i-ésima clase y todas las anteriores.

• Frecuencia relativa. Se denota por hi, y corresponde al cuociente entre la frecuencia


• absoluta de la i-ésima clase y n. También es posible expresarla en forma porcentual
multiplicando este cuociente por 100.

• Frecuencia relativa acumulada. Se denota por Hi, y corresponde a la suma de la


frecuencia relativa de la i-ésima clase y todas las anteriores.

Ejemplo de Tabla de distribución de frecuencias para variable discreta

i X
fi Fi hi (%) Hi (%)
(Clase) (Variable)
1 x1 f1 F1 h1 H1

2 x2 f2 F2 h2 H2

… … … … … …

k xk fk Fk=n hk Hk=100%

Total n 100%

Para una muestra de tamaño n, de la cual se han extraído ‘k’ clases distintas, una tabla de
frecuencia de variable discreta se representa así:

Observe que:

k k

∑ fi = n ∑h i = 100%
i =1 i =1

5
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

Ejemplo 1.2

La información que se presenta en la siguiente tabla corresponde al número de artículos


vendidos en cierto día, por una muestra de vendedores de una gran tienda comercial.

i x fi Fi hi (%) Hi (%)
1 2 5 5 10% 10%
2 4 12 17 24% 34%
3 5 15 32 30% 64%
4 6 10 42 20% 84%
5 7 8 50 16% 100%
Total 50 --- 100%

Algunas conclusiones que se pueden extraer del ejemplo son:

• La tabla contiene 5 clases, pues la variable artículos vendidos, toma 5 valores distintos,
que en orden ascendente son {2, 4, 5, 6, 7}.

• La muestra está constituida por 50 empleados de la tienda.

• f3=15, y representa que 15 empleados de la tienda venden 5 artículos cada uno en ese día.

• F3=32, y representa que 32 empleados de la tienda venden no más de 5 artículos en este


día. Observe que la información de estos 32 empleados incluye a la clase 3 (5 artículos
vendidos) y a todas las anteriores.

• h3=30%, y representa que el 30% de los empleados de la tienda venden 5 artículos cada
uno en ese día.

• H3=64%, y representa que el 64% de los empleados venden no más de 5 artículos cada
uno en ese día.

4.2 Tabla de Distribución de Frecuencias para Variable Continua.


Si la variable es continua o si la naturaleza de los datos es muy heterogénea es conveniente
agrupar los datos de intervalos de clases.

Para una muestra de tamaño n, de la cual se han extraído ‘k’ intervalos de clases, una tabla de
frecuencia se representa así:

6
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

i Xi-1’ - Xi’ Xi
fi Fi hi (%) Hi (%)
(Clase) (intervalos) (Marca de clase)

X 0 '+ X 1 '
1 X0’ – X1’ X1 = f1 F1 h1 H1
2
X 1 '+ X 2 '
2 X1’ – X2’ X2 = f2 F2 h2 H2
2
… … … … … … …

X k −1 '+ X k '
k Xk-1’ – Xk’ Xk = fk F k= n hk Hk=100%
2
Total n 100%

Observaciones

• Cada intervalo es cerrado por la izquierda y abierto por la derecha, salvo el último que es
cerrado por la izquierda y por la derecha.

• La marca de clase, Xi, corresponde al punto que está en la mitad de los extremos del
intervalo i-ésimo, y es representativa de los datos que pertenecen a esta clase. Luego
X i −1 '+ X i '
Xi = .
2
• En [X0’, Xk’] están contenidos todos los datos de la muestra.

• La amplitud del intervalo i-ésimo, denotada por Ai, se define como: Ai = Xi-Xi-1.

• En general, en el intervalo Xi-1’ - Xi’, a Xi-1’ se le llama límite inferior del intervalo i-ésimo y
a Xi’, límite superior del intervalo i-ésimo.

Ejemplo 1.3

La tabla corresponde a los sueldos semanales que paga en la actualidad una empresa comercial
en miles de pesos:

7
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

i Sueldos Xi fi Fi hi (%) Hi (%)

1 50-100 75 7 7 7% 7%

2 100-120 110 20 27 20% 27%

3 120-140 130 33 60 33% 60%

4 140-160 150 25 85 25% 85%

5 160-180 170 11 96 11% 96%

6 180-200 190 4 100 4% 100%

Total 100 --- 100% ---

Algunas conclusiones de la tabla son:

• Los sueldos en esta empresa oscilan entre los $50.000 y los $200.000.

• La amplitud del intervalo de clase 5 es 20, pues 180 – 160 = 20.

• El 27% de los empleados (H2) ganan no más de $120.000 semanales.

• 25 empleados de esta empresa (f4) ganan entre $140.000 y $160.000 semanales.

4.3 Construcción de una Tabla de Frecuencias.


La elección del número de intervalos en la construcción de una tabla de frecuencia es muy
importante, sin embargo, no existen reglas establecidas para determinarlos.

Todos los software estadísticos construyen y permiten modificar las tablas de frecuencias, pero no
todos usan los mismos criterios para definir los intervalos de clases, no obstante, debemos tener
presente que cualquiera que estos sean deben ser considerado todos los datos.

Cuando el número de intervalos de clase no está definido o dado por la experiencia, aplicaremos
algunas convenciones.

1) Para el caso de variable discreta

• Se eligen tantas clases como datos distintos existan. Si el número de datos distintos
muy grande (superior a 15, por ejemplo) es conveniente agrupar los datos en intervalos
de clases, es decir, considerar a la variable como continua.

8
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

2) Para el caso de variable continua

• Para una muestra de tamaño n, calcular el número de clases k, como sigue:


k = 1 + 3,3 ⋅ log n (Fórmula de Sturges). Si k es fraccional se aproxima
aritméticamente. Por ejemplo, si k=7,2 entonces se considerarán 7 clases de
intervalos. Si k=7,6, se considerarán 8 clases de intervalos.

• La amplitud o el ancho de cada intervalo se calcula según la fórmula:

X máx − X mín rec X


Ai = =
k k

Donde Xmín y Xmáx, son el mínimo y el máximo valor observado de la variable,


respectivamente, y recX, llamado rango o recorrido de la variable X, es la diferencia
entre los valores máximo y mínimo observados. El cuociente se aproxima al entero
inmediatamente mayor. Por ejemplo si Ai = 12,2, entonces la amplitud de cada intervalo
será 13.

Ejemplo 1.4

Se desea tabular la información obtenida de una muestra de tamaño 56. El valor máximo
observado de la variable fue 120 y el mínimo 40. ¿Cuántas clases de intervalos es
conveniente utilizar? ¿Cuál será la amplitud de cada intervalo?

Si n = 56, entonces según la fórmula de Sturges, k=1+ 3,3log (56)= 6,8


Luego, conviene utilizar 7 intervalos.

Si k= 7, entonces (120-40)/7 = 80/7 = 11,4. Por lo que cada intervalo tendrá una amplitud
Ai=12.

5. Gráficos.

La representación gráfica de los datos, es una de las herramientas que nos permite entender de
forma práctica y sencilla los resultados entregados por la tabla de distribución de frecuencias.

Un gráfico estadístico es la representación en el plano o en el espacio de la información


estadística, con el fin de obtener visualmente las características relevantes de la masa de datos y
que facilitan la comprensión de éstas. El tipo de gráfico adoptado para mostrar el comportamiento
de los datos depende de las características del problema que se desea describir mediante
técnicas estadísticas, y del tipo de variables involucradas en él.

9
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

1) Gráfico circular o de torta

• El gráfico circular es útil para representar proporciones o porcentajes de distintas clases


dentro de una muestra.

• La muestra es representada por un círculo y cada una de las clases que la componen,
por un sector de éste.

• El ángulo de cada sector mantiene la misma proporción de 360° que la de la clase


representada respecto del tamaño total de la muestra.

• Para determinar el ángulo del sector circular correspondiente a la clase i-ésima,


utilizamos la proporción:
fi α
=
43 360º

• A modo de ejemplo, si una clase corresponde al 25% del total de la muestra, le


corresponderá un sector del círculo cuyo ángulo sea el 25% de 360º, es decir, 90°.

Ejemplo 1.5

La siguiente tabla corresponde a la distribución de las ventas diarias (en miles de pesos) de un
grupo de empleados de una tienda.

Ventas fi

200-300 6

300-400 15

400-500 13

500-600 9

Total 43

Obteniéndose un gráfico como el que sigue:

Distribución de empleados según


niveles de venta (miles de pesos)

200-300
21% 14% 300-400
400-500
500-600

35%
30%

10
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

2) Gráfico de barras

• Este tipo de gráfico se usa para representar la distribución de frecuencias de variables


cualitativas y cuantitativas discretas.

• Cada categoría se representa por una barra cuyo largo indica la frecuencia de
observaciones en dicha categoría.

• En el eje horizontal (X) se representan las clases y en el eje vertical (Y) la frecuencia
(frecuencia absoluta, relativa o relativa porcentual). Sobre cada clase se levanta una barra
igual a su frecuencia.

Ejemplo 1.6

La tabla siguiente muestra el número de medicamentos que se clasifican en una hora por
número de empleados de una farmacia:

Medicamentos por Hora fi


20 15
30 20
40 25
50 30
60 10

El gráfico de barras correspondiente al ejemplo anterior es:

11
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

3) Histograma

• Los histogramas son registros gráficos que permiten representar frecuencias absolutas y
relativas para variables continuas.

• Consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la


frecuencia del intervalo sobre el cual se levantan.

• En el eje horizontal (X) se representan los intervalos de clase (o las marcas de clase) y en
el eje vertical (Y) la frecuencia correspondiente (frecuencia absoluta, relativa o relativa
porcentual). Sobre cada intervalo (o marca de clase) se dibuja un rectángulo de base igual
a la amplitud del intervalo y altura igual a su frecuencia.

Ejemplo 1.7

La siguiente tabla corresponde a la distribución de las ventas diarias (en miles de pesos) de un
grupo de empleados de una tienda.

Ventas fi

200-300 6

300-400 15

400-500 13

500-600 9

Total 43

El histograma de los datos anteriores es:

12
Marzo 2011 / Programa de Matemática / Asignatura Estadística I
Contenidos Claves de Asignatura
Nombre Asignatura: ESTADÍSTICA I Sigla: EST400

4) Polígono de frecuencias

• Esta gráfica es utilizada para representar y observar el comportamiento suavizado de una


distribución de frecuencias.

• Se forma trazando una línea que una los puntos de las intersecciones de las marcas de
clase y las frecuencias de cada una.

• En el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de
la primera clase con datos y otra después de la última.

• El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y lo que
podría ser una línea separada del eje se convierte, junto con éste, en un polígono.

Ejemplo 1.8

Polígono de frecuencias
Peso línea de producción A
11
512.5, 10
10

8
537.5, 7
7

6
462.5, 5
5
487.5, 4
4
No. of obs.

3
437.5, 2 562.5, 2
2

1
412.5, 0
0
400 425 450 475 500 525 550 575

13
Marzo 2011 / Programa de Matemática / Asignatura Estadística I

You might also like