You are on page 1of 43

ESTADSTICA

Prof. Mara Franci lvarez - Notas de Ctedra


1

UNIDAD I: ESTADSTICA DESCRIPTIVA

ROL DE LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN

Segn el Diccionario de la Real Academia Espaola, Estadstica es la ciencia que utiliza
conjuntos de datos numricos para obtener, a partir de ellos, inferencias basadas en el
clculo de las probabilidades.
La Estadstica es el instrumento matemtico ms adecuado para analizar fenmenos cuya
caracterstica fundamental es la variabilidad. La Estadstica no puede estudiar un fenmeno
en forma individual, la formulacin de un problema estadstico es siempre a nivel de grupo
(Domenech Massons, 1975).
Se podra expresar un concepto ms detallado, de la siguiente manera: la Estadstica es la
tcnica que se utiliza para recopilar, organizar, presentar, analizar e interpretar informacin
numrica, con la finalidad de extraer conclusiones y/o probar hiptesis acerca de una
poblacin, a partir del conocimiento de una parte de ella.
Se diferencian dos grandes reas dentro del estudio de esta asignatura: la estadstica
descriptiva y la estadstica inferencial. La Estadstica Descriptiva tiene como propsito
fundamental mostrar las caractersticas de un determinado fenmeno o poblacin
estudiada, cuando las observaciones comprenden a todo el universo bajo estudio. La
Estadstica Inferencial es la que permite formular conjeturas o predicciones acerca de las
caractersticas de una poblacin, basndose en los estadsticos calculados en una
subpoblacin observada (muestra). El valor de las conclusiones depende de la
representatividad de la muestra.
La Estadstica tiene un rol fundamental en el proceso de investigacin desde el momento
del diseo de la misma, si las tcnicas seleccionadas son cuantitativas. El diseo de la
muestra es tarea del tcnico en estadsticas y a partir de all, su trabajo es fundamental en la
recoleccin, procesamiento y anlisis de los datos.

DATOS, ESCALAS DE MEDICIN Y CAPTACIN.

El dato es una mediacin que sirve como enlace entre el sujeto y el objeto. Por dato
entendemos cada uno de los elementos de informacin que se recoge durante el desarrollo
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
2
de una investigacin y con base en los cuales, convenientemente sintetizados, podrn
extraerse conclusiones de relevancia en relacin con el problema planteado.

Variables: tipos
Una variable es una caracterstica observable o un aspecto discernible en un objeto de
estudio, que puede adoptar diferentes valores o expresarse en varias categoras.

Clasificacin de las variables:
Cualitativas o cuantitativas
Continuas o discretas
Dependientes o independientes

Variables cualitativas: son aquellas cuyos elementos de variacin tienen un carcter
cualitativo no susceptible de medicin numrica. Ej.: sexo
Variable cuantitativa: son aquellas en que las caractersticas pueden presentarse en
diversos grados e intensidad, tienen un carcter numrico. Ej.: ingresos.
Variables continuas: son aquellas que pueden tomar cualquier valor dentro de un
intervalo dado. Ej.: ventas
Variables discretas: son las que slo asumen valores enteros. Ej.: nmero de asignaturas
aprobadas
Variables dependientes: reciben este nombre las variables a explicar, el objeto de la
investigacin, a explicar en funcin de otros elementos. Ej.: tasa de escolarizacin
Variables independientes: son las variables explicativas, o los factores susceptibles de
explicar las variables dependientes. Ej.: edad o sexo respecto a la tasa de mortalidad.

Escalas de medicin
Medir algo es determinar cuntas veces una cierta unidad de medida cabe en el objeto
medido. La medicin de un objeto no fsico resulta un proceso similar, con la diferencia de
que no existe una unidad de medida generalmente reconocida. Por lo tanto para medir un
concepto complejo ser necesario definir las dimensiones que integran la variable,
encontrar los indicadores que la reflejen y construir luego una escala apropiada para el
caso.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
3
Una escala puede concebirse como un continuo de valores ordenados correlativamente, con
punto inicial y final. Para que una escala aporte informacin objetiva, debe reunir dos
requisitos bsicos:
a) Confiabilidad: se refiere a la consistencia interior de la misma, a su capacidad para
discriminar en forma constante entre un valor y otro.
b) Validez: indica la capacidad de la escala para medir las cualidades para las cuales ha
sido construida y no otras parecidas. Una escala tiene validez cuando verdaderamente
mide lo que afirma medir.
Existen diferentes tipos de escala o categoras, se acostumbra clasificarlas en cuatro tipos
generales:
Categoras nominales, son aquellas en que slo se manifiesta una equivalencia de
categoras entre los diferentes puntos que asume la variable. Entre las categoras no
cabe ninguna jerarqua, ningn ordenamiento.
Categoras ordinales, distinguen los diferentes valores de la variable jerarquizndolos
simplemente de acuerdo con un rango. La distancia entre un valor y otro no queda
definida sino que es indeterminada.
Escalas de intervalos iguales, adems de poseer la equivalencia de categoras y el
ordenamiento interno entre ellas, tiene la caracterstica de que la distancia entre sus
intervalos est claramente determinada y que estos son iguales entre s. La limitacin
que poseen es que no definen un cero absoluto, un valor lmite que exprese la ausencia
completa de la cualidad medida.
Escala de cocientes o razones, posee todas las propiedades de las escalas anteriores y
aade la existencia de un cero real.
Las categoras de las variables deben ser mutuamente excluyentes, esto quiere decir que
cada dato recogido slo puede pertenecer a una y slo una de las categoras de la escala.
Otro requisito importante es que deben ser exhaustivas, es decir, que en ella puedan
ubicarse todos los valores posibles de la variable.
Cada indicador correspondiente a una variable nos da informacin parcial y fragmentada,
que debe ser sintetizada o integrada para llegar a un valor nico, que exprese en realidad lo
que ocurre con la variable. Para lograrlo es que los valores de los indicadores se suman en
forma ponderada, obtenindose un valor total que se denomina ndice.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
4
Universo y muestra
Universo, poblacin o colectivo: constituye la totalidad de un conjunto de elementos, seres
u objetos que se desea investigar y de la cual se estudiar una fraccin (muestra) que se
pretende que rena las mismas caractersticas y en igual proporcin.
Muestra: parte o fraccin representativa de un conjunto de una poblacin, que ha sido
obtenida con el fin de investigar ciertas caractersticas del mismo. El problema consiste en
asegurar que el subconjunto sea representativo de la poblacin, de manera que permita
generalizar al universo los resultados obtenidos sobre la muestra.

Unidad estadstica y unidad de relevamiento
La unidad estadstica est representada por cada uno de los elementos individuales que en
su conjunto constituyen la poblacin objeto de estudio. Es el elemento del conjunto sobre
el cual queremos determinar la existencia o no de un cierto atributo. En un censo de
poblacin la unidad estadstica es el individuo.
La unidad de relevamiento est formada por una o ms unidades estadsticas; es la que se
selecciona para aplicar el cuestionario. En el censo la unidad de relevamiento es el hogar.

Relevamiento
Un relevamiento esttico es aqul en que los datos son obtenidos en un mismo momento
(da) en todas las unidades de relevamiento. Es un corte, una foto. Ej.: censo.
Relevamiento dinmico es el que se obtiene a travs del tiempo en forma sucesiva y a
intervalos regulares. Ej.: encuesta permanente de hogares, registros educativos.

LA ELABORACIN DEL CUESTIONARIO
Requisitos fundamentales:
Un cuestionario es un instrumento de recopilacin de datos, rigurosamente estandarizado,
que traduce y operacionaliza determinados problemas que son objeto de investigacin. Esta
operacionalizacin se realiza mediante la formulacin escrita de una serie de preguntas
que, respondidas por los sujetos de la encuesta, permiten estudiar el hecho propuesto en la
investigacin o verificar hiptesis formuladas.
El cuestionario debe responder a dos requisitos fundamentales: validez y confiabilidad.
Un cuestionario es vlido si los datos obtenidos se ajustan a la realidad sin distincin de los
hechos. La confiabilidad del cuestionario est dada por la capacidad de obtener iguales o
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
5
similares resultados aplicando las mismas preguntas acerca de los mismos hechos o
fenmenos.
Para comprobar estos requisitos pueden introducirse elementos de control:
Comprobacin por otras fuentes de informacin.
Aplicar el cuestionario a personas que se sabe poseen la caracterstica investigada.
Contrastar las respuestas con el comportamiento real.
Utilizacin de preguntas que sirven para aclarar respuestas y controlar el grado de
comprensin de los encuestados.

Tipos de preguntas
Pueden clasificarse en tres categoras:
1. Preguntas abiertas: son aquellas en que el entrevistado construye la respuesta con su
propio vocabulario, sin tener alternativas predeterminadas.
2. Preguntas cerradas dicotmicas, de alternativa fija, slo pueden ser contestadas por
<si> o por <no> y en algunos casos <no se> o <sin opinin>.
3. Preguntas categorizadas o de opcin mltiple, las respuestas posibles ya estn
estructuradas; el interrogado slo debe optar por una de ellas. Las alternativas pueden
ser cualitativas o indicar un orden. Ejemplos:
Estilo o modo de formular las preguntas
Hay una serie de normas generales al respecto, no es una lista exhaustiva, son las ms
importantes:
v Las preguntas deben ser sencillas, claras, concretas y concisas. No deben dar lugar a
interpretaciones dudosas o falsas.
v En la eleccin del vocabulario debe tenerse en cuenta el marco de referencia
(lingstico) del encuestado.
v La pregunta debe posibilitar una sola interpretacin. No se debe preguntar <Es Ud.
Propietario o inquilino de la casa que ocupa?>
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
6
v Cuando la pregunta es de opcin mltiple, sta debe presentar en forma adecuada las
que se dan en relacin con la cuestin investigada.


v Las preguntas no deben sugerir las respuestas, incitando a responder en un sentido ms
que en otro. No es correcto preguntar <No cree conveniente modificar el sistema de
transporte?>, sino <Cree conveniente modificar el sistema de transporte?>.
v Se han de evitar todos los trminos vagos, como: mucho, poco, frecuente, regular, a
veces; ya que ellos pueden tener un alcance diferente segn sea la persona que
responde.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
7
v Cada pregunta debe contener una sola idea y referirse a un solo sujeto; sino se
transforma en una pregunta de doble caon. Ej.: Esta Ud a favor de la implementacin
de un servicio de remises o de otro tipo de transporte?

Otras consideraciones:
Un elevado nmero de preguntas puede fatigar al sujeto que debe responder y desmejorar
la calidad de las respuestas. Este riesgo es menor cuando las preguntas son fciles de
entender y responder. En el mbito universitario, el factor primordial est constitudo por
el inters que despierta el tema a investigar.
El orden en que se incluyen las preguntas tiene mucha importancia, ya que preguntas
sobre temas polmicos pueden predisponer a cambiar las respuestas siguientes.
Suelen incluirse preguntas de control que permiten averiguar o comprobar la veracidad y
consistencia de determinadas respuestas.
Procedimiento
Para preparar un cuestionario a ser utilizado en una entrevista estructurada o en
autoadministracin, es necesario respetar algunas etapas:
Explicitar los objetivos del mismo, para determinar los indicadores a utilizar.
Preparacin del formulario.
Impresin del cuestionario tratando de darle un aspecto agradable y atractivo, si es
autoadministrado debe contener solicitud de cooperacin y las instrucciones a seguir en
el llenado del mismo.
Prueba del cuestionario, con una pequea muestra.
Correccin del cuestionario con base en los resultados de la prueba.
Impresin definitiva.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
8
ORGANIZACIN Y PRESENTACIN DE DATOS ESTADSTICOS

Una vez realizada la ordenacin, tabulacin y elaboracin de los datos, hay que proceder a
la presentacin sistemtica de los mismos, a travs de tres formas fundamentales: escrita,
tabular y grfica.
Representacin tabular:
Consiste en ordenar los datos numricos en filas y columnas, con las especificaciones
correspondientes acerca de su naturaleza.
Todo cuadro o tabla estadstica posee los siguientes elementos:
1. Ttulo
2. Columna matriz
3. Encabezamiento de las columnas
4. Cuerpo
5. Numeracin del cuadro o tabla
6. Fuente de datos
7. Nota al pie
8. Nota de encabezado
A continuacin se describe someramente cada una de las partes.
1- Ttulo: Debe responder sintticamente a las preguntas: qu? dnde? cmo?
cundo?; es decir, debe expresar de qu se trata, cmo se compone, dnde y cundo
sucedi la informacin. El ttulo debe reunir dos cualidades fundamentales: claridad y
concisin.
2- Columna matriz: situada a la izquierda del cuadro abarca la variable que domina el
contenido de las dems columnas; si la variable es cualitativa se ordenar
alfabticamente; cuando es cuantitativa se ordena en forma ascendente o descendente;
si son fechas se ordena cronolgicamente.
3- Encabezamiento de las columnas: comprende los ttulos de cada columna de datos o de
un conjunto de columnas, en este caso habr subttulo de columna.
4- Cuerpo: es el lugar donde estn expresados los datos en filas y columnas.
5- Numeracin del cuadro o tabla: Cuando hay ms de un cuadro corresponde numerarlos
para poder hacer la referencia en el texto.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
9
6- Fuente de datos: La finalidad es indicar el origen de los datos, citando el ttulo del
documento de donde se tomaron, ao de edicin y editorial u organismo que los
produjo.
7- Nota al pie: Cuando los signos convencionales no son suficientes, se utilizan notas al
pie con el fin de aclarar los datos contenidos en la tabla. Los signos convencionales que
se utilizan ms frecuentemente son:
Un guin (-) para sealar que la magnitud es cero o no alcanza a la mitad del ltimo
nmero dgito usado.
Un punto (.) para indicar que no existe el concepto en el periodo correspondiente o
no puede ser obtenido.
Tres puntos (...) significa que el dato no ha sido compilado o elaborado a la fecha
de la publicacin.
Un asterisco (*) seala que la cifra es provisional o estimada.
8- Nota de encabezado: Para aclarar el contenido del cuadro en general, como la unidad
de medida.
MODELO
Tabla 1.4. TTULO
Nota de encabezado:
Provincia
(Columna matriz)
Poblacin
(miles)
Densidad
Por km
2

Aumento anual
%


Cuerpo


Fuente: INDEC- Censo Nacional de poblacin- Anuario estadstico. 1995.
Nota al pie: Slo se considera la poblacin continental.

Distribuciones unidimensionales.

Las distribuciones unidimensionales son las que consideran una sola variable y pueden
presentarse como series simples o datos agrupados; a su vez, pueden diferir en el tipo de
variable: cualitativa, cuantitativa discreta o continua.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
10
La serie simple es la que contiene pocos valores de la variable y todos ellos poseen valores
diferentes. Cada valor representa una observacin y se simboliza con x
i
: x
1
, x
2
, ..., x
n
segn
el orden en que se presentan. Con x se representa la variable que se estudia y el subndice
indica el orden en que la variable fue observada.
Cuando el nmero de datos es grande, es necesario construir una distribucin de
frecuencias, o agrupacin de datos.
Una distribucin de frecuencias es una tabla que asocia cada categora de la variable con el
nmero de veces que se repite cada una de ellas. Se ordenan en una columna los valores de
la variable (y
i
) y en otra columna se especifica el nmero de observaciones que presentaron
ese valor o caracterstica (n
i
).
Frecuencia absoluta: es el nmero de veces que se repite el valor de una variable (n
i
). La
suma de todas las frecuencias absolutas es el nmero total de observaciones (n).
n
i
=n
Frecuencia relativa: es la proporcin de veces que ocurre un valor de la variable, es el
cociente entre la frecuencia absoluta y el nmero total de observaciones (h
i
)
h
i
= n
i
/n
La suma de todas las frecuencias relativas es siempre igual a uno. h
i
= 1
Frecuencia absoluta acumulada: es la suma de las frecuencias absolutas, de los valores de
la variable, menores o iguales al que se est considerando (N
i
).
Se obtienen con los siguientes clculos:
N
1
= n
1

N
2
= n
1
+ n
2
= N
1
+ n
2

N
3
= n
1
+ n
2
+ n
3
= N
2
+ n
3
.
N
k
= n
1
+ n
2
+ n
3
+...+ n
k
= n

Frecuencia relativa acumulada: Es la sumatoria de las frecuencias relativas, de los
valores de la variable, menores o iguales al que se est considerando (H
i
).
H
1
= h
1

H
2
= h
1
+ h
2
= H
1
+ h
2

H
3
= h
1
+ h
2
+ h
3
= H
2
+ h
3
.
H
k
= h
1
+ h
2
+ h
3
+...+ h
k
= 1
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
11

Cuando los valores de la variable son muchos para enumerarlos individualmente o cuando
la variable es continua, se presentan los datos en una distribucin de frecuencias por
intervalos.
Intervalo de clase: es un intervalo numrico cerrado en el extremo inferior y abierto por el
superior (el ltimo puede ser cerrado o abierto). Para definir los intervalos de la variable
debemos hallar el valor mximo y el mnimo de las observaciones y redondeamos por
defecto y por exceso si es necesario. Restando el valor mximo y el mnimo encontramos
el rango de variabilidad de la variable:
Rango o recorrido = valor mximo de x
i
valor mnimo de x
i

El nmero de intervalos se fija arbitrariamente, pero es aconsejable que sea mayor a cuatro
y menor que once y tienen igual amplitud.
La amplitud del intervalo (c), se obtiene dividiendo el rango por el nmero de intervalos:
c = rango / nmero de intervalos
Si la amplitud del intervalo as calculada es un nmero decimal, se extiende el recorrido
convenientemente para que el resultado sea un nmero entero.
El extremo inferior del intervalo se simboliza en este apunte con y
i-1
, mientras que el
extremo superior del intervalo ser y
i
.
Marca de clase: (y
i
) es el punto medio del intervalo, obtenido como semisuma de los
extremos del intervalo.
y
i
= (y
i-1
+ y
i
)/ 2


Diagrama de tallo y hoja
Es otra manera de representar la frecuencia de un intervalo de valores, y que a la vez
permite visualizar los valores individuales de la variable.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
12
Ejemplo: Supongamos que los siguientes datos representan la cantidad de cajas de un
producto determinado que se vendieron en un supermercado durante 50 das:

02 06 06 08 09 10 11 11 12 12
13 13 14 14 14 15 15 16 17 18
18 18 19 19 20 20 20 21 23 26
27 27 29 30 31 32 33 33 34 36
37 39 40 43 45 52 61 63 64 69

Si se representan estos datos en forma de diagrama de tallo y hoja, obtenemos la siguiente
disposicin:
0 26689
1 0112233444556788899
2 000136779
3 012334679
4 035
5 2
6 1349

Con slo observar el diagrama se deduce que la distribucin es asimtrica y sesgada hacia
la derecha, ya que la mayora de las observaciones estn contenidas en los valores ms
bajos.
Tambin nos permitira observar los valores atpicos de la serie o outliers.
Los outliers son evidencia de un evento extraordinario y son de inters especial. Cuando
estos son inesperados sera conveniente evaluar la calidad de los datos obtenidos, ya que
pueden provenir de un error de relevamiento o de carga de los datos. Si la calidad es buena,
el investigador deber tomar una decisin fundamentada del tratamiento de los mismos.

Distribuciones bidimensionales
Son aquellas que relacionan 2 variables cualitativas o cuantitativas. Cuando ambas
variables son cualitativas se las llama tablas de contingencia. Una de las variables se ubica
en las columnas y otra en las filas. Ejemplo:

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
13
Sexo
Nacionalidad Masculino Femenino Total
Argentino 15 20 35
Extranjero 5 10 15
Total 20 30 50


Los valores numricos indican frecuencias o cantidad de observaciones. Los valores que
aparecen en los totales de filas y columnas se denominan frecuencias marginales. Se
pueden obtener las frecuencias relativas, dividiendo cada frecuencia absoluta por el total de
observaciones. La suma de todas las frecuencias relativas da como resultado la unidad.

Representacin grfica:
Los grficos contienen la informacin y las mismas disposiciones acerca del ttulo, las
notas y la fuente que las especificadas para las tablas, adems, debe consignarse
claramente la variable representada en cada eje y cules son sus categoras.
No existe una normativa respecto a la utilizacin de los grficos, pero se deben considerar
reglas generales para su utilizacin. Se pueden diferenciar segn sean las distribuciones
unidimensionales o bidimensionales y segn el tipo de variables.

Distribuciones unidimensionales:
Distribucin de
frecuencias de variable:
Tipo de grfico Tipo de frecuencias
Cuantitativa discreta Grfico de bastones
Grfico acumulativo
n
i
o h
i

N
i
o H
i

Cuantitativa continua Histograma y/o polgono
Ojiva
n
i
o h
i

N
i
o H
i

Cualitativa Grfico de barras
Grfico circular
Grfico de anillo

n
i
o h
i


PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
14
Distribuciones bidimensionales:
Distribuciones de
frecuencias
Tipo de grfico Tipo de frecuencias
o datos


Series cronolgicas
Grfico lineal mltiple
rea apilada
rea 100% apilada
Adems, los de tablas de
contingencia


n
i
o h
i



Tablas de contingencia

Grfico de barras mltiples
Grfico de barras apiladas
Barras 100% apiladas


n
i
o h
i


Pares de datos cuantitativos
Diagrama de dispersin
Recta de regresin

Pares ordenados


A continuacin se caracteriza rpidamente cada uno de los grficos y se adjunta ejemplo.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
15
Grficos de distribuciones unidimensionales
Grfico de ordenadas o bastones:
Se utiliza para representar distribuciones de frecuencias de variables discretas con pocos
valores. Se marcan los valores de la variable sobre el eje de las abscisas y se levanta una
ordenada para cada uno de ellos que es proporcional a la frecuencia del mismo.
Histograma:
Consiste en utilizar rectngulos que se levantan con base en el eje de abscisas y cuyas
alturas son proporcionales a la frecuencia de cada intervalo de la variable.
Tabla III.1. Distribucin de frecuencia de grupos de edades.
Edades Frec.absoluta Frec. Acumulada
25<= x < 30 1 1
30<= x < 35 1 2
35<= x < 40 9 11
40<= x < 45 12 23
45<= x < 50 1 24




Polgono de frecuencias:
Expected
Normal
Frecuencia de edades de las personas encuestadas.
ISCE- Setiembre de 1999
Grupos de edades
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
20 25 30 35 40 45 50
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
16
Se construye localizando las coordenadas correspondientes a las marcas de clase de cada
intervalo y la frecuencia correspondiente. Es til para comparar varias distribuciones entre
s o con una poblacin terica.

Grfico acumulativo de frecuencias:
Hay dos polgonos acumulativos de frecuencias que suelen llamarse ojivas. Uno es el
acumulativo menos que y el otro es el desacumulativo ms que.
El acumulativo menos que se grafica con las frecuencias acumuladas y se marca la
frecuencia correspondiente al intervalo, en el extremo superior del mismo; eso indica que
la frecuencia marcada en el grfico corresponde a los valores de la variable menores al
valor superior de un determinado intervalo.
Las frecuencias desacumuladas se calculan comenzando por el total de los casos
observados y descontndole las frecuencias absolutas de cada uno de los intervalos
inferiores. Con las frecuencias desacumuladas se grafica la ojiva ms que, marcando el
extremo inferior del intervalo.
y
i
Menos que y
i-1
Ms que
30 1 25 24
35 2 30 23
40 11 35 22
45 23 40 13
50 24 45 1
Fuente: Tabla III.1.
Fuente: Encuesta ISCE, 1999.
Polgono acumulativo de frecuencias
0
5
10
15
20
25
25 30 35 40 45 50
Edades
F
r
e
c
u
e
n
c
i
a
s
Menos que
Ms que
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
17
Grfico circular:
Representa la importancia relativa de cada valor de la variable al total.
Tabla III.2. Cantidad de familias segn nmero de hijos.
N de hijos por familia N de familias
0 105
1 140
2 165
3 90
4 50

Grfico de barras:
Permite comparar las frecuencias de las categoras de la variable. Se denominan grficos
de barras cuando stas se colocan en forma horizontal y grficos de columnas cuando se
ubican en forma vertical. Pero en este texto se los nombra como grficos de barra.
Porcentaje de respuestas de los alumnos, segn su relacin
con las personas que aportan dinero para sostener el hogar
0 10 20 30 40 50 60 70 80
El padre
La madre
Los hermanos
El alumno
Otros

Fuente: elaboracin propia basada en lainformacin de la DINIECE ONE 2000.
Distribucin de las familias segn nmero de hijos.
Ciudad XX - 1999
sin hijos
19%
1 hijo
25%
2 hijos
31%
3 hijos
16%
4 hijos
9%
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
18

El grfico de barras simples nos permite mostrar los valores que asume una variable en
distintos aos o la frecuencia de cada categora de una variable cualitativa. Colocando en el
eje horizontal la variable y en el vertical la frecuencia, puede ser absoluta o relativa.

Grficos de distribuciones bidimensionales
Grfico lineal simple o mltiple:
Se utiliza para series cronolgicas cuando se quiere observar la tendencia de la/s variable/s
a travs del tiempo. En el eje horizontal va el tiempo y en el vertical las dems variables.
Si se grafica una sola serie, se obtiene un grfico lineal simple; si se toman varias series, el
grfico es lineal mltiple.













Fuente: Ministerio deEducacin de la Provincia de Crdoba Departamento de Estadstica.


Grfico de reas apiladas:
Presenta la tendencia del aporte de cada categora o valor de la variable, a lo largo del
tiempo (en este caso a diferentes edades).
Evolucin de la matrcula de nivel primario por Sexo
Perodo 1996-2001
68
70
72
74
76
78
1996 1997 1998 1999 2000 2001
Ao
M
a
t
r

c
u
l
a

(
e
n

m
i
l
e
s
)
Varones
Mujeres
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
19
Poblacin total de la ciudad de Crdoba. Censo 2001.
0
50.000
100.000
150.000
200.000
250.000
300.000



0

-

4



5

-

9

1
0

-

1
4

1
5

-

1
9

2
0

-

2
4

2
5

-

2
9

3
0

-

3
4

3
5

-

3
9

4
0

-

4
4

4
5

-

4
9

5
0

-

5
4

5
5

-

5
9

6
0

-

6
4

6
5

-

6
9

7
0

-

7
4

7
5

-

7
9

8
0

-

8
4

8
5

y

m

s
Grupos deedad
P
o
b
l
a
c
i

n
Mujeres
Varones

Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001..

Grfico de reas 100% apiladas:
Presenta la tendencia del porcentaje que aporta cada valor o categora a travs del tiempo
(en este caso a diferentes edades).
Poblacin total de la ciudad de Crdoba. Censo 2001.
0%
20%
40%
60%
80%
100%



0

-

4



5

-

9

1
0

-

1
4

1
5

-

1
9

2
0

-

2
4

2
5

-

2
9

3
0

-

3
4

3
5

-

3
9

4
0

-

4
4

4
5

-

4
9

5
0

-

5
4

5
5

-

5
9

6
0

-

6
4

6
5

-

6
9

7
0

-

7
4

7
5

-

7
9

8
0

-

8
4

8
5

y

m

s
Grupos deedad
P
o
b
l
a
c
i

n
Mujeres
Varones

Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001..

Grfico de Barras agrupadas
Compara valores o categoras de una variable para cada uno de los valores o categoras de
otra variable. Cada variable debe tener pocas categoras, de lo contrario es muy confuso.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
20
Cobertura de salud de la poblacin de la ciudad y provincia de
Crdoba, por grandes grupos de edad. 2001
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
0-14 15-64 65 y ms 0-14 15-64 65 y ms
Capital Provincia
Tiene
No tiene

Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001.

Grfico de Barras apiladas
Compara entre categoras de una variable, el aporte de cada valor al total de una categora
de la otra variable.
Poblacin por grupos de edad y sexo, en la ciudad y provincia
de Crdoba. 2001.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
1.600.000
1.800.000
Varones Mujeres Varones Mujeres
Capital Provincia
65 y ms
15-64
0-14

Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001.

Grfico de Barras 100% apiladas:
Compara entre categoras de una variable, el porcentaje que cada valor, de la otra variable,
aporta al total.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
21
Importancia relativa de cada grupo de edad, en la ciudad y
provincia de Crdoba, por sexo. 2001.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Varones Mujeres Varones Mujeres
Capital Provincia
65 y ms
15-64
0-14



Diagrama de dispersin:
Compara pares de valores de dos variables cuantitativas (una puede ser aos).



PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
22

PARMETROS DE POSICIN Y DISPERSIN

Medidas descriptivas
Hay tres tipos de medidas que describen la distribucin de frecuencias de un conjunto de
datos. Las medidas descriptivas que se calculan con base en los datos de una poblacin se
denominan parmetros. Si las medidas se calculan con base en los datos de una muestra,
se conviene en llamarlos estadsticos.

1) Las MEDIDAS DE POSICIN O DE TENDENCIA CENTRAL, es un nmero que
representa el valor central de un conjunto de datos. La mayora de las distribuciones
muestran una tendencia definida a agruparse en torno a un cierto punto, este punto es
una medida de posicin o promedio.
Las medidas de posicin ms comunes son: media aritmtica, mediana, modo, cuartiles,
deciles y percentiles.

Media Aritmtica
Datos sin agrupar (serie simple): Si los datos no estn agrupados la media se calcula
sumando todos los valores y dividindolos por el nmero de observaciones.
Si tenemos 6 observaciones: x
1
, x
2
, x
3
, x
4
, x
5
, x
6

Se calcula haciendo: M(x) = X =
6
x x x x x x 6 5 4 3 2 1 + + + + +

En general para n observaciones, se expresa: M(x) = x =
n
x
n
i

1


Datos agrupados: Se utiliza la marca de clase para representar el intervalo y realizar el
clculo. La media se calcula sumando los productos de la marca de clase por la frecuencia
del mismo intervalo, y dividiendo la sumatoria por el nmero de observaciones.
En smbolos:
M(y) = y =
n
n y i
k
i

1
.
=

k
i ih y
1
siendo k el nmero de intervalos.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
23

Propiedades de la media aritmtica:
1. La suma de los desvos con respecto a la media aritmtica es siempre igual a cero.
Se entiende por desvos (z
i
) a la diferencia entre los valores de la variable y un valor
constante, en este caso ese valor es la media.
z
i
= y
i
y = y
i
M(y)


La propiedad se simboliza:
0
1
=

k
i in z
Se distribuye el sumatorio:
Se reemplaza el sumatorio de n
i
por n y luego se indica la frmula de la media, al final se
cancela n y se obtienen dos expresiones iguales:
= n y n y
k
i i .
1

k k
i i
i i n
n
n y
n y
1 1
=

=
k k
i i i i n y n y
1 1
0

2. La suma de los cuadrados de los desvos con respecto a la media, debidamente
ponderados, da un mnimo. Significa que la suma de los cuadrados de los desvos con
respecto a la media, es siempre menor que el valor que se obtiene cuando los desvos
son respecto a cualquier otra constante.
En smbolos:
mnimo
1
2
=
i
k
n z
i

[y
i
M(y)]
2
. n
i
= mnimo
3. La media de una constante es igual a dicha constante.
En smbolos: M(y) = a siendo y
i
= a
Aplicando la definicin de media: M(y) = a
n
an
n
n a
n
n a i i
= = =

.


=
k
i
k
i i
k
i i n y n y n z
1 1 1
=

k
i in z
1

=
k k
i i )ni y
i
(y n z
1 1
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
24

4. La media de una constante por una variable es igual a la constante por la media de la
variable.
En smbolos: M(a.y) = a .M(y)
M(a.y) = ) (
.
y aM
n
n y
a
n
n ay i i i i
= =



5. La media de una variable ms una constante, es igual a la media de la variable ms la
constante.
En smbolos: M(y + a) = M(y) + a
Aplicando la definicin de media aritmtica, distribuyendo el sumatorio y reemplazando
por expresiones idnticas, se obtiene:

M(y + a)=
= a y M
n
n
a y M
n
n a
n
n y
n
n a n y
n
n a y i i i i i i i i i
+ = + = + =
+
=
+

) ( ) (
. . . . ). (


6. La media de una muestra es igual a la media de las submuestras calculada con
ponderaciones iguales a los tamaos de las submuestras.

M(y) =
n
n M n y M n y M n y M k k. ... ). ( ). ( ). ( 3 3 2 2 1 1 + + + +
siendo n= n
1
+ n
2
+...+ n

7. La media aritmtica de una suma de variables, expresadas en la misma unidad de
medida, es igual a la suma de las medias aritmticas de cada una de las variables.

M(x + y +w) = M(x) + M(y) + M(w)

Mediana (Me)
La mediana es el elemento central, en un conjunto de observaciones dispuestas en orden de
magnitud.
Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con
respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior,
ordenados de menor a mayor.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
25
El orden de elemento de la mediana =
2
1 + n

Si el nmero de observaciones es impar, la mediana es el valor central. Si el nmero de
observaciones es par, la mediana ser el valor promedio de las dos observaciones centrales.

Ejemplo: Si tenemos cinco observaciones de edades: 22 25 20 26 21
Se ordenan: 20 21 22 25 26 y resulta que 22 es la mediana, ya que separa la serie en dos
partes iguales. Me= 22 aos

Si se agrega una observacin de 27 aos, n=6.
20 21 22 25 26 27 en este caso se promedian los dos valores centrales: (22 + 25)/2 = 23.5
Me = 23.5 aos

Datos agrupados: Se utiliza una frmula de interpolacin:
Me= y
j-1
+ c.
j
j
n
N
n
1
2


Siendo: y
j-1
es el extremo inferior del intervalo j
c es la amplitud del intervalo
N
j-1
es la frecuencia absoluta acumulada del intervalo anterior a j
n
j
es la frecuencia absoluta del intervalo j
Para ubicar el intervalo j, o clase mediana, se divide por dos el nmero total de
observaciones y se busca ese resultado en la columna de las frecuencias absolutas
acumuladas. La primera frecuencia acumulada que supere el resultado de n/2, es N
j
y el
intervalo al cual ella pertenece es el j.
Propiedad de la mediana:
La suma de los valores absolutos de los desvos de la variable respecto de la mediana,
debidamente ponderados, da como resultado un mnimo.
[ y
i
Me(y)] . n
i
= mnimo

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
26
Moda, modo o valor modal
El modo se define como el valor o categora de la variable que se presenta con la mayor
frecuencia. Cuando existe slo un modo, la distribucin se llama unimodal, si se presentan
dos valores de mayor frecuencia, la distribucin es bimodal.

Caractersticas de las medidas de tendencia central.
La media es el promedio de uso ms frecuente, para calcularla se necesitan todos los
valores observados. Si todos ellos se hallan agrupados cerca de la media, y si la
distribucin es algo simtrica, es vlido considerar a la media como un promedio
representativo. Los valores extremadamente atpicos (outliers) la afectan indebidamente y
debido a ello el resultado es escasamente representativo; se dice que la media es una
medida no resistente.
Por el contrario, la mediana no se encuentra afectada por los valores extremos y representa
mejor a una distribucin cuando ella es asimtrica. Adems es posible calcular la mediana
aunque la distribucin sea de extremos abiertos. La mediana es una medida de posicin
resistente.
El modo es de empleo apropiado si un valor prximo al centro de la distribucin se repite
con mayor frecuencia. Adems, tambin puede obtenerse si los extremos son abiertos.

Relacin entre la media, la mediana y el modo.
Si se representan los datos de una distribucin en un histograma o un polgono de
frecuencias con muchas clases, la curva se suaviza y se aproxima a una campana. Si una
distribucin es simtrica se representa por una curva que puede dividirse con una lnea
vertical en dos partes iguales, que son como imgenes en un espejo.
Si una distribucin es simtrica (Figura B), la media, la mediana y el modo coinciden (G).
En cambio, si la distribucin es asimtrica hacia la derecha (Figura A), es comn que se
ubique primero el modo (D), luego la mediana (E)y por ltimo la media (F). Si fuera
asimtrica hacia la izquierda (Figura C), se ubicara primero la media (H) y por ltimo el
modo (J).

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
27
Si la distribucin es moderadamente asimtrica, es posible hallar un valor aproximado de
uno de los promedios conociendo los otros dos.

Modo = media 3 (media mediana)
Mediana =
3
modo media 2 +

Media =
2
modo mediana 3


PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
28
Cuartiles:
Los cuartiles dividen la serie en cuatro partes que contienen igual nmero de
observaciones.
El primer cuartil es la mediana de las observaciones que son menores a la mediana o
segundo cuartil. El tercer cuartil es la mediana de las observaciones mayores a la mediana.
Datos no agrupados: Si la serie es no agrupada se divide el nmero de observaciones por
cuatro y esto nos da un nmero de orden de los datos ordenados, se toma el
inmediatamente superior si el resultado es un decimal o el promedio de los datos
correspondientes al orden dado y el inmediato superior, si el resultado es entero.
Datos agrupados: Se utiliza frmula de interpolacin similar a la empleada para calcular la
mediana.
Primer cuartil = Q
1
= y
j-1
+ c.
j
j
n
N
n
1
4



Tercer cuartil = Q
3
= y
j-1
+ c.
j
j
n
N
n
1
4
3




Diagrama de caja o boxplot
Es un diagrama que permite ubicar en uno de los ejes los siguientes valores:
Mnimo, primer cuartil, mediana, tercer cuartil y mximo. El otro eje no es una escala sirve
de apoyo nicamente.
Ejemplo: suponemos que los siguientes datos se refieren a las ventas diarias de un
comercio (en miles de $) durante 50 das.
2 6 6 8 9 10 11 11 12 12
13 14 14 14 15 15 16 17 18 18
18 19 19 20 20 20 20 22 23 26
27 28 29 30 31 32 33 33 34 36
37 39 40 43 45 52 61 63 64 69
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
29


Mediana Mnimo Mximo Cuartil 1 Cuartil 3
20 2 69 14 33

Las medidas de tendencia central y las escalas de medicin:
El clculo de la media requiere una escala de intervalo o proporcional.
La mediana, en cambio, puede emplearse tambin en las escalas ordinales.
El modo, puede utilizarse en cualquier tipo de escala, ya que designa al valor de mayor
frecuencia y no requiere de un clculo sofisticado.

2) Las MEDIDAS DE DISPERSIN O VARIABILIDAD, nos permiten conocer la
homogeneidad o concentracin de los datos acerca de una medida de tendencia central.
Se conocen varias medidas de dispersin, algunas de clculo muy sencillo como el
recorrido y el rango intercuartlico; otras de clculo bastante complicado como la varianza
y la desviacin estndar.
Recorrido
Es la diferencia entre el valor mximo y mnimo. Como es una medida basada en dos
datos solamente no es muy til para medir la variabilidad, ya que la inclusin de los casos
extremos en una muestra es cuestin del azar.

Max = 69.00000
Min = 2.000000
75% = 33.00000
25% = 14.00000
Median value:
Med = 20.00000
Ventas diarias de la empresa XX, agosto-setiembre 1999.
Miles de $
0
10
20
30
40
50
60
70
80
VENTAS
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
30
Rango intercuartlico
El rango intercuartlico es la distancia entre el tercer y el primer cuartil:
RI = Q
3
Q
1
Nos da idea de la homogeneidad del 50% central de los datos. Los cuartiles y el rango
intercuartlico son medidas resistentes, ya que no se encuentran afectados por valores
atpicos de la variable.
El RI suele ser til para determinar la existencia de valores outliers. Se construye un
intervalo cuyos extremos se obtienen multiplicando el RI por 1.5 y ese resultado se resta de
Q
1
y se suma de Q
3
.
Q
1
1.5 RI = y
RI-1

Q
3
+ 1.5 RI = y
RI
Aquellos valores de la variable que no estn incluidas en el intervalo se pueden considerar
outliers.
y
RI-1
> outliers > y
RI
Esta regla de deteccin no debe reemplazar el sentido comn en la determinacin de
valores atpicos.
La desviacin cuartlica es la mitad del RI, sera de utilidad para evaluar la simetra de la
distribucin. Una distribucin puede considerarse simtrica si la desviacin cuartlica
coincide con la diferencia entre la mediana y el primer cuartil o entre el tercer cuartil y la
mediana.
Simtrica RI/ 2 = Me Q
1
= Q
3
Me

Varianza
La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media
aritmtica.
Datos no agrupados: La varianza de n observaciones es la suma de los desvos con
respecto a la media aritmtica, elevados al cuadrado, dividida por el total de observaciones.

V(x) =
n
x M x
n
i
2
1
)] ( [


=
n
x
i
2
- [M(x)]
2



PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
31
Datos agrupados: Se debe tener en cuenta que la media es ponderada por la frecuencia de
cada clase.
V(y) =
n
n y M y i i

. )] ( [
2
=
n
n y i
i
.
2
- [M(y)]
2
Los desvos se elevan al cuadrado, ya que por propiedad de la media la suma de los desvos
respecto a ella es igual a cero. La varianza as calculada est en una unidad de medida
diferente a la que tienen los datos originales. Se resuelve tomando la raz cuadrada y de esa
manera se obtiene la desviacin estndar.

Desviacin estndar
Datos no agrupados: DS(x) = ) (x V
Datos agrupados: DS(y) = ) ( y V

La desviacin estndar mide la dispersin de los datos alrededor de la media aritmtica, y
slo es til si se utiliza la media como medida de tendencia central. Si la varianza o la
desviacin estndar es igual a cero indica que no existe dispersin y que todos los datos
tienen el mismo valor. De otra forma siempre es positiva.
La desviacin estndar tiene utilidad de tipo comparativo, ya que el nmero en s mismo
no expresa grado de variabilidad, ya que depende de la unidad de medida y de la media.
Las DS de dos distribuciones pueden emplearse para comparar la variabilidad de ambas si
las medias son similares y de esa manera se evala la representatividad de esas medidas de
posicin. A mayor dispersin, menor representatividad de la media.
Otra aplicacin de la DS como instrumento de anlisis se da en su relacin con la media de
una distribucin normal (simtrica). En una distribucin normal, el 68,3% de los datos
quedan entre la media menos una DS y la media ms una DS. Por otra parte, la media
2DS incluye aproximadamente el 95% de las observaciones. La media 3DS incluye
alrededor de 99,7% de los datos.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
32


Coeficiente de variacin
El coeficiente de variacin es una medida de dispersin relativa, que permite comparar
dos distribuciones expresadas en cualquier unidad de medida, fue ideado por Karl Pearson
(1857-1936).
CV =
) ( y M
DS
. 100
Ser ms dispersa la distribucin que posea el CV mayor, y menos dispersa la que presente
un CV menor. Se debe recordar que la dispersin est en relacin inversa con la
representatividad de la media. Quiere decir que la distribucin que posea el mayor CV,
tendr a su vez la media menos representativa y viceversa.

3) Medidas de Asimetra

En una distribucin simtrica, la media, la mediana y el modo son iguales. Esto significa
que el valor de la variable o clase central es el de mayor frecuencia, y que las frecuencias
que poseen los valores mayores a ella son similares a las frecuencias de los valores
menores.
Karl Pearson ide tambin un coeficiente de Asimetra para medir la magnitud y la
direccin de la asimetra:
As
P
=
DS
Me y M ] ) ( [ 3

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
33
Hay otro ndice de asimetra que est referido a la relacin entre los cuartiles y la mediana,
es el ndice de Yule:
As
y
=
Me
Me Q Q
2
2 3 1 +

Ambos ndices se interpretan de la misma manera:
Si el coeficiente es cero la distribucin es simtrica. As=0 simetra
Si el coeficiente es negativo, la asimetra es hacia la izquierda. As<0 asimetra
negativa
Si el coeficiente es positivo, la asimetra es hacia la derecha. As>0 asimetra
positiva

4) Medidas de curtosis o puntiagudez
Estas medidas miden la deformacin vertical de la curva.
No especificaremos su clculo, ya que no desarrollamos contenidos necesarios en ello.
Slo mencionaremos que una curtosis sin deformacin es la de la curva normal.
Si la puntiagudez es mayor que la que presenta la distribucin normal, la distribucin es
leptocrtica. Si es menor es platicrtica.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
34
GUA DE EJERCICIOS UNIDAD I

1- En cada una de las siguientes situaciones, indicar: a) Poblacin que es objeto de
estudio, b) Muestra, c) unidad estadstica y d) Tipo de variable que se analiza.
Se desea investigar la proporcin de desempleados que hay en la provincia de Crdoba
en un momento determinado; para ello se realiza la EPH del primer semestre del ao y
se seleccionan aleatoriamente 1.000 personas en las edades correspondientes a la PEA.
Se desea investigar el coeficiente intelectual de los alumnos que ingresan a una
institucin universitaria, para ello se realiza un test apropiado a todos los ingresantes a
la carrera en un momento determinado.
En la produccin de cubiertas de una determinada fbrica, se realiza un estudio para
determinar el tiempo promedio de duracin de las mismas, para ello se someten a
prueba todas las cubiertas producidas el primer da del mes.
Un tcnico de control de calidad de una lnea de armado de automviles, selecciona
determinadas piezas y anota para cada una de ellas la siguiente informacin: si est o no
defectuosa, el nmero de identificacin de la persona que coloc la pieza y el peso de la
pieza.
Los directivos de una institucin educativa privada de nuestra ciudad desean conocer la
opinin de los padres de sus alumnos acerca de los servicios que les brinda la
institucin. Para ello seleccionan una muestra de 300 alumnos, elegidos aleatoriamente
de los registros de las distintas secciones.
El Ministerio de Educacin de la provincia desea conocer la evolucin de la matrcula
escolar de nivel medio en la Provincia. Para ello se seleccionaron 400 escuelas de los
distintos departamentos de Crdoba.

2- La siguiente tabla presenta los montos de 40 prstamos personales de una entidad
financiera de consumidores, ordenados por su magnitud (en $):

300 550 850 1100 1500
300 560 850 1200 1600
350 600 900 1200 1650
350 600 900 1250 1800
450 685 950 1250 1900
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
35
450 700 1000 1300 2000
500 750 1000 1400 2500
500 750 1000 1500 3000

a) Clasificar los datos en una tabla de frecuencias con 7 intervalos.
b) Representar grficamente las frecuencias absolutas y relativas, simples y
acumuladas.
c) Calcular la media, el modo, la mediana y los cuartiles.
d) Calcular recorrido intercuartlico, varianza y desviacin estandar.
e) Graficar en Boxplot.
f) Determinar si existen valores outliers, utilizando como extremos Q
1
- 1.5RI y Q
3
+
1.5RI

3- Una muestra de 20 obreros de una pequea compaa obtuvo los siguientes salarios en
una semana determinada, dispuestos en orden ascendente: 440, 440, 440, 440, 440,
440, 440, 440, 555, 555, 660, 660, 680, 680, 680, 700, 730, 730, 730, 730. Presentar la
informacin a travs de una distribucin de frecuencias.

4- Los salarios semanales de un grupo de profesionales son los siguientes:

153 123 129 132 147 138 137 134 131 147
134 148 125 139 146 145 148 135 152 128
138 138 122 146 137 151 145 124 132 138
137 146 138 146 140 137 129 126 117 136
128 127 146 144 137 128 142 141 136 138
Construir una distribucin de frecuencias con ms de 5 intervalos.


5- Los datos correspondientes a gastos por consumo semanal de alimentos per cpita
familias seleccionada en la provincia de Crdoba, son los siguientes:

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
36

Consumo per cpita en $ N de
familias

80-100 4
100-120 10
120-140 16
140-160 18
160-180 28
180-200 22
200-220 2

a) Calcular medidas de posicin y dispersin solicitadas en el ejercicio anterior.
b) Indicar qu porcentaje de familias consume menos de $140.
c) Indicar qu porcentaje consume ms de $100.

6- Una empresa de gas y electricidad utiliza varias fuentes para generar energa. En el
cuadro siguiente se presentan las fuentes y los porcentajes de energa obtenidos de cada
una, el ao pasado y hace 10 aos.

Fuente de energa Hace 10 aos
%
Ao pasado
%
Carbn 16.8 62.6
Nuclear 26.9 34.1
Gas 55.9 2.9
Otros 0.4 0.4
Total 100.0 100.0

a) Representar grficamente de modo que pueda observarse la importancia de cada fuente
de energa para los dos momentos analizados.
b) Representar en forma grfica, reflejando la importancia de cada fuente en el ltimo
periodo.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
37

7- La siguiente tabla nos proporciona informacin referente a la demanda laboral en dos
sectores, en la ciudad de Crdoba expresada en funcin del nmero de avisos
clasificados publicados en un diario local, en un periodo determinado:

Demanda laboral
Mes Servicio
domstico
Oficina y
comercio

Junio 30 70
Julio 45 87
Agosto 46 92
Setiembre 87 160
Octubre 47 180
Noviembre 60 205
Diciembre 40 150
Enero 46 130
Febrero 47 180
Marzo 56 210
Abril 68 265
Mayo 57 236
Junio 56 255
Julio 65 220
Agosto 60 276
Setiembre 55 295

a) Representar en forma grfica la informacin suministrada de modo tal que se observe la
evolucin de las variables analizadas.
b) Construir un grfico de zonas.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
38
8- Se hace un registro del tiempo que tardan en frenar sobre superficie hmeda 25
automviles conducidos a 80 km/h . Los datos en segundos se muestran en una
representacin de tallo y hojas:

6 3 7 6 3 9
7 4 2 0 1 1 2 0 5
8 5 4 5 5 6
9 4 1 0 0 5
10 5 4

a) Determinar la media y la desviacin estndar de estos tiempos de frenado.
b) Determinar qu porcentaje de observaciones se halla a una y dos desviaciones estndar
respecto de la media, (regla emprica).

9- Una empresa especializada en la fabricacin de ejes para mquina est planeando la
compra de una mquina de corte controlada por computadora. El ingeniero de la
empresa prueba dos mquinas de diferentes fabricantes. Los dimetros en centmetros
de las barras cortadas por la mquina fueron los siguientes :

Mquina 1 : 2.001 2.000 2.004 1.998 1.997
Mquina 2 : 2.002 2.008 1.995 1.990 2.005

a) Calcular la media y la desviacin estndar para cada caso y comentar acerca de los
resultados obtenidos de las dos mquinas.
b) Indicar qu promedios es ms representativo.


10- Suponga que los precios al menudeo de determinados artculos han sufrido los cambios
que se muestran en la tabla siguiente:
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
39

Artculo Aumento % Gasto
mensual
promedio
Leche 10 2000
Carne molida -6 3000
Ropa -8 3000
Combustible 20 5000
a) Determinar el cambio porcentual promedio de los precios al menudeo sin referencia al
promedio de gastos que se incluye en la tabla.
b) Determinar el cambio porcentual promedio de los precios al menudeo ponderado por el
promedio de gastos.
c) Cul de los dos promedios calculados sera ms apropiado como medida del impacto
de los cambios de los precios sobre este consumidor especfico ?

11- Tres profesores de Estadstica registran una calificacin media en sus estudiantes de
75, 69, 89 puntos respectivamente; siendo el nmero de alumnos para cada clase de 35,
18 y 27 respectivamente.
Determinar la calificacin media para todos los estudiantes.

12- La empresa A tiene 100 empleados con sueldo promedio mensual de $1700, la empresa
B tiene 200 empleados con sueldo promedio mensual de $1500.
a) Cul es el promedio mensual de las dos empresas en conjunto ?
b) Si a las dos empresas se le agrega una tercera con 50 empleados que registran un sueldo
promedio $2000, Cul es el sueldo promedio de las tres ?

13- Determinar los nuevos promedios, si en las empresas del punto anterior se producen los
siguientes cambios:
a) Aumentan todos los salarios $100.
b) Aumentan todos los salarios un 25%.
c) Aumentan todos los salarios un 15% ms $50.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
40
14- La siguiente informacin corresponde a los saldos en cuenta corriente de un grupo de
clientes de un banco :

Saldos n
i

200-270 1
270-340 7
340-410 6
410-480 4
480-550 2
a) Calcular el saldo promedio y la mediana.
b) Calcular la desviacin estndar.
c) Aplicar la regla emprica restando y sumando 1 y 2 desviacin estndar a la media.
d) Calcular la nueva media y varianza si se establece un impuesto del 7% sobre los saldos.

15- Disponemos de la siguiente informacin :

Medidas de dispersin
y posicin.
Distribucin
A
Distribucin
B
Media 110 100
Mediana 100 90
Desviacin estndar 20 20

a) Cul es la distribucin ms dispersa ?
b) Cul es la media ms representativa ?
c) Cmo es la asimetra de cada una de ellas ?

16- La informacin obtenida de 30 establecimientos textiles, referida a personal ocupado y
a sus ingresos por ventas en millones de $, es la siguiente :
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
41

Ventas \ personal
ocupado
10-30 30-50 50-70 70-90 Frecuencias
marginales
0-100 4 2
100-200 4 5
200-300 6 3 1
300-400 2 3


a) Calcular la media aritmtica de las ventas.
b) Calcular la media del personal ocupado.
c) Cul de las dos medias es ms representativa de los datos?

17- La siguiente informacin correspondiente a empleados administrativos de una empresa
que cuenta con 60 empleados, en ese sector, discriminados por sexo, se refiere al
nmero de errores de facturacin cometidos por 24 empleados de la misma:

0V 1V 1M 0M 2V 3M 3V 6V 6M 5M 4M 4V
5M 5V 3V 3V 1M 2V 2M 4V 3V 3M 4M 2V

a) Presentar los datos en tablas y grficos, con los respectivos encabezados y ttulos.
b) Analizar la informacin con medidas descriptivas que considere convenientes.

20. Responder las siguientes preguntas para reforzar los aspectos tericos:
a. Qu medida de tendencia central es la ms sensible a los valores extremos?
b. Cuando un conjunto de datos tiene valores extremos, qu medida de tendencia central
conviene usar?
c. Si uno de los valores mayores a la media de los datos se sustituye por un valor muy
grande, qu le pasa a la media: aumenta, disminuye o se mantiene igual?, de qu manera
afecta a la moda?.
d. Cul es la diferencia entre un parmetro y un estadstico?.
e. Cul es la diferencia entre una distribucin simtrica y una sesgada?.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
42
f. Indique donde se localizan la media, la mediana y la moda en cada una de las
siguientes distribuciones:
i. Sesgada a la derecha.
ii. Simtrica.
iii. Sesgada a la izquierda.
iv. Valores concentrados en el extremo superior de la escala.
v. Valores atpicos en el extremo superior.
g. Qu forma tiene una distribucin descrita por las siguientes medidas: media = 46,
mediana = 42 y moda = 39?
h. Qu forma tiene una distribucin descrita por las siguientes medidas: media = 105,
mediana = 110 y moda = 115 ?

21. Calcular las medidas de posicin y dispersin estudiadas en los ejercicios que no se
hayan solicitado.
22. Representar en forma grfica la informacin del ejercicio 18.

LISTADO DE PREGUNTAS O TEMAS, PARA ORIENTAR EL ESTUDIO DE LOS
ALUMNOS DE ESTADSTICA (NO ES EXHAUSTIVA).
1. Concepto de Estadstica Inferencial.
2. Clasificacin de variables.
3. Tipos de escala de medicin.
4. Caractersticas de un cuestionario bien formulado.
5. Qu tipo de grfico es ms adecuado para cada tipo de variable, en las uni y
bidimensionales?
6. Clasificacin de las medidas descriptivas.
7. Cul es la utilidad de cada medida?
8. Propiedades de la media y la mediana. Aplicacin.
9. Qu medidas de tendencia central pueden calcularse con las diferentes variables y/o
escalas?
10. Para qu sirve el coeficiente de variacin?
11. Para qu sirve la Regresin por mnimos cuadrados y la correlacin entre variables?
12. Interpretacin del coeficiente de correlacin y de determinacin.

PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
43
PRCTICO:
1. De una base de datos creada a partir de una encuesta realizada en un grupo de
estudiantes, se tomaron algunas variables y se calcularon las siguientes medidas:

Variables Media Mediana Q
1
Q
3
Varianza DS

Edad 22 19 18 24 25
Estado civil 3.5 3 1 5 16
Altura 1.69 1.68 1.65 1.73 0.10
Nmero de
integrantes
3 3 2 4 1.5
Sexo 1.5 1.6 1.3 1.7 0.2
Instruccin 2.5 2 1.5 3 9
Nmero de horas
de trabajo
6 8 4 9 3
Se pide:
a- Determinar el tipo de variable o escala y las categoras o valores que puede asumir cada una
de ellas.
b- En qu variables las medidas calculadas no tienen sentido?.
c- Dentro de las variables cuantitativas, cual es la que muestra una mayor dispersin y cual
posee la media ms representativa. Por qu?
d- Analizar la asimetra de ALTURA.
e- Averiguar si existen valores atpicos (outliers) en EDAD, si el valor mnimo que se present
es 18 y el mximo 37. Si existen, en qu extremo de la distribucin estn ubicados ( inferior
o superior)?
f- Qu tipo/s de grfico es apropiado para representar las frecuencias relativas de SEXO,
ALTURA Y NMERO DE INTEGRANTES.




PDF created with pdfFactory trial version www.pdffactory.com

You might also like