You are on page 1of 93

INSTITUTO LATINOAMERICANO DE CIENCIA Y ARTES, A. C.

ESCUELA DE CIENCIAS POLITICAS Y ADMINISTRACION PÚBLICA


SISTEMA UNIVERSIDAD ABIERTA

ESTADÍSTICA

Guía de Estudio
Cuarto Semestre

Ciencias Políticas y Administración Pública

2007
Datos curriculares de la asignatura

Asignatura: Estadística
Licenciatura: Ciencias Políticas y Administración
Pública
Semestre: Cuarto
Área: Técnica-Instrumental
Secuencia: Investigación de Operaciones
Carácter: Obligatoria
Créditos: 08
Clave: 0427
PRESENTACIÓN

El Instituto Latinoamericano de Ciencia y Artes, A. C. inicia la


implantación del Sistema Universidad Abierta en el año de 2007 como
una opción educativa en la que el énfasis está en el aprendizaje más
que en la enseñanza.

El Sistema Universidad Abierta forma parte de un amplio proceso


de adecuación académica y organizativa cuyo fin es responder con
mayor calidad y eficacia tanto a las necesidades sociales y profesionales
de la localidad como a la creciente demanda educativa, en general, y del
ILCA en particular.

El propósito de esta opción educativa universitaria reside en que el


estudiante se involucre en un proceso amplio y abierto de comunicación
y de relación con su entorno -social, escolar/académico, laboral,
familiar, cultural- aprendiendo a integrar el conocimiento relevante en
ciertas materias, a combinar y adquirir capacidades, destrezas y hábitos
de estudio, experiencias de aprendizaje permanente e independiente a
fin de lograr una formación universitaria suficiente para el ejercicio
profesional de la carrera que haya elegido.

Para esta nueva modalidad, nuestra Institución ha llevado a cabo


diferentes acciones encaminadas a alcanzar una mayor calidad y eficacia
del aprendizaje que demandan los estudiantes de los sistemas
educativos abiertos.

Sabemos que la relación entre tutores-docentes, material didáctico


y estudiantes es fundamental en esta opción abierta. Mientras mayor
sea la calidad y rigor académico de los tutores-docentes y de los
alumnos, y mientras más amplia sea la oferta de materiales educativos
para promover el aprendizaje independiente, mayor será la posibilidad
de formar estudiantes autodidactas, competentes y futuros profesionales
universitarios.
Con objeto de satisfacer lo anterior, se han organizado sesiones de
trabajo con los tutores-profesores para la preparación de materiales
didácticos escritos y audiovisuales; se ha diseñado e impartido un curso
de actualización didáctica para los tutores/profesores y han participado
en la planeación y preparación del curso de introducción a la
metodología de estudio para los alumnos, acorde con opción educativa.

Por consiguiente, esta guía de estudio constituye un instrumento


fundamental para el aprendizaje independiente en un sistema abierto.
Cada uno de los componentes que integran esta guía tiene una
correspondencia directa con los distintos momentos del proceso de
aprendizaje; han sido integrados en una secuencia lógica con el fin de
que el estudiante pueda avanzar y profundizar en el conocimiento, así
como alcanzar los objetivos académicos de las asignaturas contando con
la orientación, guía y estímulo experimentado del tutor/docente.

Los contenidos de la guía son perfectibles y deben ser revisados


periódicamente para su actualización y mayor efectividad. Las
observaciones que resulten de las experiencias de los tutores/docentes y
de los estudiantes nos permitirán, sin duda, enriquecer y mejorar esta
herramienta didáctica que ahora está en sus manos. Las aportaciones
que nos hagan llegar conducirán a seguir avanzando en fortalecer el
sistema abierto de nuestra Institución de la que ahora forma parte.

Damos a usted la más cordial bienvenida y deseamos que realice


con empeño, responsabilidad y éxito sus estudios en el Sistema
Universidad Abierta del Instituto Latinoamericano de Ciencia y Artes, A.
C.

Sistema Universidad Abierta


Escuela de Ciencias Políticas y Administración Pública
SUGERENCIAS PARA LA UTILIZACIÓN DE LA GUÍA DE ESTUDIO

La presente guía de estudio ha sido elaborada con el propósito de


que usted trabaje en forma independiente, es decir, sin la presencia
continua del tutor. Ello significa, que durante el curso deberá
responsabilizarse plenamente del estudio y el trabajo de los contenidos
académicos según las indicaciones de esta guía. De este modo, estará
en condiciones de solicitar y participar óptimamente en las sesiones de
tutoría.

Con el objeto de lograr un mejor aprovechamiento de la guía de


estudio, es importante que tenga conocimiento de lo siguiente:

La guía está organizada en unidades temáticas y presenta una


serie de componentes didácticos que le permitirán orientar su
aprendizaje: las introducciones de cada unidad lo relacionan con las
temáticas centrales que integran el curso; los objetivos de la unidad
indican los aspectos relevantes del conocimiento que usted tiene que
lograr; con la lectura de la bibliografía básica obligatoria podrá conocer,
analizar y comprender ampliamente los temas del curso; con la
realización de las actividades de aprendizaje y las preguntas de
evaluación sugeridas, usted podrá apropiarse de los conocimientos y
valorar sus resultados en el aprendizaje.

La guía incluye, asimismo, una programación tentativa entre el


número de unidades de aprendizaje y el número de sesiones de tutoría
programadas por semestre, con la finalidad de que usted siga un ritmo
adecuado en el estudio y en la realización de sus actividades, evitando
retrasos o atiborramientos perjudiciales.

Por último, presenta un formato para registrar los criterios de


evaluación y acreditación que normarán el curso. Esta actividad deberá
realizarse junto con el tutor. El conocimiento inicial de estos criterios le
será de gran utilidad para organizarse apropiadamente y llevar a buen
término el curso.
Algunas recomendaciones en el uso de esta guía son las siguientes:

o Trabaje las unidades de aprendizaje según el orden secuencial que


presentan: no se salte ni adelante unidades. Inicie con la lectura
de las introducciones y reflexione sobre los objetivos de
aprendizaje que se le ponen.

o Lea los textos mencionados en la bibliografía básica en el orden en


que aparecen; después, realice las actividades de aprendizaje. No
dude en ampliar y enriquecer su información consultando también
la bibliografía complementaria.

o Al concluir el estudio de una unidad, conteste las preguntas de


evaluación, ello le permitirá valorar sus logros. Si encuentra que
algún tema no le es suficientemente claro, revíselo nuevamente y
consulte al tutor precisando con antelación sus dudas.

o Revise desde el inicio del curso los datos de la bibliografía básica y


complementaria de cada unidad y enliste los libros más
solicitados. Es recomendable que los compre a fin de ir integrando
su biblioteca personal. Al respecto puede pedir orientación al
tutor.

o Realice siempre anotaciones a lo largo de las lecturas, escriba las


preguntas y dudas que vayan surgiendo: si estás no son
contestadas al término de la lectura, busque ahondar en el tema
auxiliándose de otros, discutiendo con sus compañeros o
recurriendo a su tutor.

Recuerde que la modalidad educativa de estudios abiertos requiere


un gran esfuerzo, compromiso y disciplina personal: haga una buena
planeación de sus actividades personales y de su tiempo, ejercítese en
el empleo de estrategias y técnicas de estudio, ponga en práctica
hábitos pertinentes para el estudio y la investigación, no dude en pedir
apoyo u orientación cuando lo requiera. Estamos seguros que con todo
ello usted se convertirá en un estudiante exitoso; un estudiante SUA.

Sistema Universidad Abierta


CPyAP
ÍNDICE

Introducción general 11

Objetivos generales 13

Criterios de evaluación-acreditación 14

Cuadro programático de tutorías 15

Unidad 1. Datos y descripción (estadística descriptiva) 17

Unidad 2. Modelos de probabilidad (estadística inferencial) 27

Unidad 3. Dependencia probabilística 33

Unidad 4. Introducción al teorema del límite central y estimación 39

Anexo: Respuestas a las preguntas de autoevaluación 45

Bibliografía general 89
Ciencias Políticas y Administración Pública

10
Estadística

Introducción general

La Estadística es el conjunto de técnicas que se emplean para la recolección,


organización, análisis e interpretación de datos. Los datos pueden ser cuantitativos, con
valores expresados numéricamente o cualitativos, en cuyo caso se tabulan las características
de las observaciones. La estadística nos sirve para tomar mejores decisiones a partir de la
comprensión de las fuentes de variación y de la detección de patrones y relaciones en datos
económicos y administrativos.

La Estadística descriptiva está conformada por un conjunto de técnicas que se


utilizan para organizar y evaluar la información proveniente de una masa de datos. Con
estas técnicas es posible obtener distribuciones, gráficas y parámetros que permiten conocer
y cuantificar el comportamiento global.

La Estadística descriptiva intenta representar el comportamiento de una masa de


datos a través de parámetros que indiquen las tendencias más representativas de éstos. Es
importante reconocer que la información individual no tiene un significado estadístico, por
ello todos los parámetros estadísticos requieren al menos dos datos para evaluarse. Esta
consideración implica que siempre que se realice la evaluación u organización de la
información, se pierde el dato individual, éste pasa a formar parte del comportamiento
global representado a través de parámetros o gráficos.

11
Ciencias Políticas y Administración Pública

La Estadística inferencial comprende las técnicas con las que, con base únicamente
en una muestra sometida a observación, se toman decisiones sobre una población o proceso
estadístico. Dado que estas decisiones se toman en condiciones de incertidumbre, suponen
el uso de conceptos de probabilidad.

Mientras que a las características medidas de una muestra se les llama estadísticas
muestrales, a las características medidas de una población estadística, o universo, se les
llama parámetros de la población. El procedimiento para la medición de las características
de todos los miembros de una población definida se llama censo. Cuando la inferencia
estadística se usa en el control de procesos, al muestreo le interesa en particular el
descubrimiento y control de las fuentes de variación en la calidad de la producción.

12
Estadística

Objetivos generales

1. Seleccionar el método más apropiado para organizar la información.


2. Seleccionar el método gráfico más adecuado para representar la información
estadística.
3. Identificar y evaluar los distintos parámetros de la Estadística.
4. Comprender el manejo de los conceptos de la Estadística inferencial.
5. Aplicar las técnicas de la inferencia estadística.

13
Ciencias Políticas y Administración Pública

Criterios de evaluación – acreditación

CRITERIO PORCENTAJE CONDICIONES

• El alumno deberá presentar tres exámenes parciales. Podrá reponer uno de ellos,
sólo en caso de haber aprobado por lo menos dos, con la finalidad de mejorar la
calificación del que no acreditó.

14
Estadística

Cuadro programático de tutorías

Sesión Unidad de Temas


Aprendizaje

1 Presentación del programa. Introducción general al curso.


Formas de trabajo. Criterios de evaluación.

Unidad 1.
1. Organización y representación gráfica de la información
Datos y descripción 1.1 La información estadística
2 (estadística descriptiva) 1.2 Variable
1.3 Organización de la información
1.4 Representación gráfica de la información

2. Evaluación de parámetros
2.1 Medidas de tendencia central
3 2.2 Medidas de posición
2.3 Medidas de dispersión
2.4 Medidas de concentración

4 Primer examen parcial

Unidad 2.
1. Definición clásica y estadística de probabilidad
Modelos de probabilidad 2. Probabilidad matemática
(estadística inferencial) 2.1 Experimentos aleatorios
2.2 Espacio de eventos
5 3. Elementos de la teoría de las probabilidades
3.1 Definición y axiomas
3.2 Propiedades
3.3 Sucesos mutuamente excluyentes y sucesos
independientes
3.4 Regla de la adición
3.5 Regla de la multiplicación (probabilidad condicional)
3.6 Teorema de la probabilidad total
3.7 Teorema de Bayes
3.8 Análisis combinatorio
3.9 Permutaciones
3.10 Combinaciones

15
Ciencias Políticas y Administración Pública

Sesión Unidad de Aprendizaje Temas

Unidad 3.
1. Variable aleatoria
Dependencia probabilística 2. Distribución de probabilidad univariada, discreta y
continua
2.1 Función de distribución de probabilidad
2.2 Función de densidad de probabilidad
2.3 Propiedades y medidas de asociación de las
6 distribuciones de probabilidad
3. Distribuciones discretas
3.1 Binomial
3.2 Hipergeométrico
3.3 Poisson
4. Distribuciones continuas
4.1 Normal

7 Segundo examen parcial

Unidad 4.
1. Teorema del límite central
Introducción al teorema del 2. Estimación
8 límite central y estimación 2.1 Estimación puntual
2.2 Estimador insesgado
2.3 Estimador consistente
2.4 Estimador eficiente
2.5 Estimador suficiente

3. Métodos de estimación
9 3.1 Estimación por intervalos
4. Cálculo del tamaño de la muestra

Tercer examen parcial,


10 aclaración de calificaciones
y reposición de alguno de
los exámenes anteriores

16
Estadística

Unidad 1. Datos y Descripción (estadística descriptiva)

Introducción

En esta unidad, se presentan un conjunto de técnicas que comúnmente se utilizan


para organizar la información con fines estadísticos, así como para representarla
gráficamente con el propósito de visualizar el comportamiento global.

Este material tal vez no agote toda la gama de posibilidades para la organización y
representación gráfica, pero sí cubre los principales métodos utilizados en la Estadística
descriptiva y en la paquetería para PC.

Uno de los aspectos que forman parte de la Estadística descriptiva es el estudio de


las reglas y procedimientos para la recolección, organización y procesamiento de
información.

Los datos, que representan la materia prima para la Estadística, se obtienen a través
de encuestas, observaciones, experimentos o de información contenida en estudios previos.
La captación de información a través de encuestas se utiliza típicamente en el
levantamiento de censos o muestras.

Un censo es la indagación de las características de todos los elementos que


componen a la población en estudio, mientras que una muestra es una indagación
restringida a unos cuantos de los elementos que constituyen a la población en estudio.

17
Ciencias Políticas y Administración Pública

Una encuesta es el instrumento mediante el cual se recopila la información que se


desea obtener de una población sin ejercer ningún control sobre las variables que se desean
estudiar. Por ejemplo:
a) El ingreso mensual de los alumnos del Instituto Latinoamericano de Ciencia y
Artes, A. C.
b) La inversión anual de las empresas que producen partes automotrices.
c) El Producto Interno Bruto.

A diferencia de la encuesta, en un experimento se controla el comportamiento de


alguna(s) variable(s), para analizar el cambio que sufre(n) otra(s), por ejemplo:
a) Estudiar la preferencia de los consumidores a distintos tipos de presentación de un
producto.
b) Estudiar la conductividad térmica de un sólido variando la temperatura.
c) Estudiar la respuesta de individuos a una nueva droga, variando la dosis
suministrada.

Las formas de obtener información son muy diversas, dependen del tipo de estudio
que se pretende llevar a cabo. Así, las técnicas a utilizar en cada caso son muy distintas, no
es igual realizar un muestreo que un censo o que un experimento.

La organización de la información y su representación gráfica son de gran utilidad


porque permiten apreciar de manera general el comportamiento del fenómeno en
consideración. Sin embargo, la organización por sí sola carece de objetividad sin la
evaluación de parámetros que cuantifiquen el comportamiento estadístico de la
información. Por esta razón, en esta unidad se aborda el tema de los parámetros
estadísticos, sin los cuales la gran masa de datos ordenados puede carecer de sentido al no
poderse interpretar, que es el objetivo principal de la Estadística descriptiva.

18
Estadística

Temario

1. Organización y representación gráfica de la información


1.1 La información estadística
1.2 Variable
1.3 Organización de la información
1.3.1 Serie simple de datos
1.3.2 Distribución de clases y frecuencias
1.3.3 Distribución por intervalos de clases y frecuencias
1.4 Representación gráfica de la información
1.4.1 Diagramas de pastel
1.4.2 Histograma y polígono de frecuencias
1.4.3 Ojivas
2. Evaluación de parámetros
2.1 Medidas de tendencia central
2.1.1 Moda
2.1.2 Mediana
2.1.3 Media aritmética
2.1.4 Media geométrica
2.1.5 Media armónica
2.2 Medidas de posición
2.2.1 Cuantiles
2.3 Medidas de dispersión
2.3.1 Rango
2.3.2 Varianza y desviación típica
2.3.3 Coeficiente de variación
2.3.4 Coeficiente de asimetría
2.3.5 Coeficiente de curtosis
2.4 Medidas de concentración
2.4.1 Curva de Lorenz
2.4.2 Índice de Gini

19
Ciencias Políticas y Administración Pública

Objetivos de la unidad

1. Identificar cuándo una variable es cuantitativa y cuándo cualitativa.


2. Diferenciar un valor observado de uno posible.
3. Organizar una serie simple de datos en una distribución de frecuencias.
4. Organizar una distribución de frecuencias en una de intervalos de clases y
frecuencias.
5. Construir diagramas de pastel, histogramas, polígonos de frecuencia y ojivas de
diversos tipos.
6. Establecer la diferencia entre una medida de:
• Tendencia Central
• Posición
• Dispersión
• Concentración
7. Conocer el procedimiento de cálculo y el significado de las siguientes medidas de,
para una serie simple de datos o para datos agrupado:
• Tendencia central (media, mediana, moda, media armónica y media
geométrica)
• Posición (cuantiles)
• Dispersión (rango, varianza y coeficiente de variación)
• Concentración (índice de Gini)
8. Calcular la asimetría y la curtosis de una serie simple de datos o de datos grupados.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.

HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales.


México, FCPyS-UNAM (Serie Estudios, núm. 13), 1970.

SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

20
Estadística

Actividades de aprendizaje

1. De la siguiente lista de variables indique con una letra Q si es cuantitativa y con una
C si es cualitativa.
a) La edad de un individuo
b) La religión de una persona
c) La temperatura
d) El clima
e) La humedad
f) La belleza
g) La escolaridad de una persona
h) El PIB
i) La nacionalidad
j) El estado civil
2. De la siguiente lista de variables indique con una D si es discreta o con una C si es
continua.
a) Salario de un individuo (en pesos).
b) Estatura de una persona (en mieras).
c) Producto Interno Bruto.
d) El índice de Precios al Consumidor
e) El número de automóviles que circulan por una carretera en un día
f) El número de personas atendidas en un hospital en un día
3. La inversión anual de un grupo de industrias textiles es la siguiente (en miles de pesos)
10, 12, 8, 40, 6, 8, 10, 30, 2, 8, 6, 14, 16, 20, 25, 28, 30, 26, 30, 4, 6, 10,
18, 17, 13, 17, 21, 7, 6, 8, 14, 7, 15, 19, 27, 22, 0, 14, 6, 8, 9, 11, 13,
15, 18, 20, 30, 60, 12, 6, 5, 5, 6, 8, 7, 12, 15, 36, 30, 52

a) Construya una distribución de clases y frecuencias (absolutas y relativas) con


ocho intervalos de 8 unidades de longitud.
b) Calcule las frecuencias acumuladas de cada clase.
c) Construya un histograma y un polígono con las frecuencias absolutas y las
relativas.

21
Ciencias Políticas y Administración Pública

4. El número de accidentes de trabajo semanales por mil horas-hombre, de una fábrica


durante un año es:
Mes Accidentes Mes Accidentes
Enero 3, 3.2, 3.7, 3.7 Julio 3, 2.9, 3.5, 3.1
Febrero 2.8, 3.7, 3.3, 4 Agosto 3.1, 2.7, 2.8, 3.4
Marzo 3.2, 3.9, 2.9, 3.8, 3.3 Septiembre 2.4, 3.3, 4.6, 3.3, 4.3
Abril 3.2, 1.8, 5.3, 2.6 Octubre 2.1,3.5,4,3.6
Mayo 4, 3.9, 4.4, 3.2 Noviembre 3.2, 2.5, 3.4, 3.4
Junio 3.8, 4.7, 2.3, 4.3, 4.2 Diciembre 3.5. 3.7, 3.6, 3.5, 2.6

a) Construye la distribución de clases y frecuencias (absolutas y relativas), con 8


intervalos de longitud 0.5.
b) Calcule las frecuencias acumuladas relativas y absolutas por clase.
c) Dibuje el histograma y el polígono con frecuencias relativas y absolutas.
5. De acuerdo con el censo nacional de población de 1970, la población
económicamente activa de 12 años y más por grupos quinquenales de edad fue:

GRUPO QUINQUENAL F
DE EDAD (AÑOS) (NO. DE INDIVIDUOS)
De 12 a 14 339,615
De 15 a 19 1,783,772
De 20 a 24 2,042,290
De 25 a 29 1,719,700
De 30 a 34 1,403,740
De 35 a 39 1,366,196
De 40 a 44 1,058,956
De 45 a 49 911,326
De 50 a 54 639,951
De 55 a 59 531,732
De 60 a 64 454,205
De 65 a 69 326,399
De 70 a 74 201,376
De 75 y más 178,799
Total 12,955,057

Encuentre:
a) Límite superior e inferior de cada clase.
b) Límite superior e inferior real de cada clase.
c) Punto medio por clase.
d) Rango de cada clase.

22
Estadística

e) Frecuencias relativas por clase.


f) Frecuencias acumuladas por clase.
g) Frecuencias relativas y acumuladas por clase,
h) Frecuencias porcentuales por clase.
Grafique:
a) El histograma absoluto y el porcentual.
b) El polígono de frecuencias absoluto y el porcentual.
c) La ojiva P.M. vs far.
d) La ojiva más de...
e) La ojiva menos de...
De la ojiva del inciso c responda las siguientes preguntas:
a) Aproximadamente cuántos individuos son mayores de edad (más de 18 años).
b) Aproximadamente cuántos individuos tienen más de 43 años.
c) Aproximadamente cuántos individuos tienen menos de 30 años.
6. De acuerdo con el censo nacional de población de 1970, la población
económicamente activa de 12 años y más por grupos de ingreso mensual fue:

Grupo de ingreso mensual Total nacional


(pesos) (núm. de individuos)
Hasta 99 983,167
De 100 a 199 1’143,200
De 200 a 299 1'261,656
De 300 a 499 1'811,073
De 500 a 599 603,157
De 600 a 999 2'531,144
De 1,000 a 1,199 682,605
De 1,200 a 1,499 790,718
De 1,500 a 1,999 657,008
De 2,000 a 2,499 293,995
De 2,500 a 3,499 324,356
De 3,500 a 4,999 231,012
De 5,000 a 7,499 117,766
De 7,500 a 9,999 82,326
De 10,000 a 14,999 37,828
De 15,000 y más 69,458
Total 11'620,469

23
Ciencias Políticas y Administración Pública

De acuerdo con el censo nacional de población de 1980, la población


económicamente activa por grupos de ingreso mensual fue:
Grupo de ingreso mensual Total Nacional
(pesos) (No. de individuos)
De 1 a 590 663,523
De 591 a 1,080 924,692
De 1,081 a 1,970 1'174,108
De 1,971 a 3,610 2'828,538
De 3,611 a 6,610 4,557,499
De 6,611 a 12,110 2'575,653
De 12,111 a 22,170 878,397
De 22,171 y más 451,217
Total 14'053,627

a) Con los datos anteriores construya una ojiva de P.M. vs fa, para cada uno de los
censos. Haga las comparaciones pertinentes.
b) De la ojiva para 1970 estime el porcentaje de la PEA cuyos ingresos son:
i. superiores a $300.
ii. inferiores a $1500.
iii. entre $400 y $1200.
c) Construya las tablas de cada censo utilizando salarios reales, en unidades
monetarias de la base del índice de Precios al Consumidor y haga algunas
comparaciones generales entre cada censo.

Preguntas de evaluación

1. Explique lo que entiende por:


• variable
• constante
• valor posible
• valor observado
2. ¿Cuándo se dice que una variable es cualitativa y cuándo cuantitativa?
3. ¿En qué consiste una serie simple de datos?
4. ¿En qué consiste una distribución de frecuencias?

24
Estadística

5. ¿Cómo se obtiene una distribución de clases y frecuencias?


6. ¿Qué representa el punto medio?
7. ¿Cómo se construye un diagrama de pastel?
8. ¿Qué diferencia hay entre los histogramas para:
a) Una serie simple de datos.
b) Una distribución de frecuencias.
c) Una distribución de clases y frecuencias?
9. ¿Qué es una ojiva y cuántos tipos de ojivas se pueden construir?
10. ¿.Cuáles son las diferentes medidas de tendencia central?
11. ¿Cuáles son las diferentes medidas de Posición?
12. ¿Cuáles son las diferentes medidas de Dispersión?
13. ¿Cómo son los Coeficientes de Asimetría y de Curtosis?
14. ¿Qué es una medida de Concentración?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.

MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo


Editorial Iberoamericano, 1990.

SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

25
Ciencias Políticas y Administración Pública

26
Estadística

Unidad 2. Modelos de probabilidad (estadística inferencial)

Introducción

El comportamiento de ciertos fenómenos sociales no puede determinarse con


exactitud debido a su naturaleza aleatoria, por lo que para estudiarlos podemos utilizar
como herramienta la teoría de probabilidades, ya que ésta proporciona modelos
matemáticos que podemos adecuar para cada fenómeno en cuestión, es decir, el estudio de
la teoría de probabilidades nos mostrará las posibilidades que se tienen en función a
diferentes modelos (distribuciones de probabilidad), de elaborar el modelo matemático que
describa con bastante aproximación el comportamiento del fenómeno aleatorio.

En concreto, hemos dicho que dado un fenómeno aleatorio, podemos ajustar un


modelo matemático que describa su comportamiento en forma aproximada, para que de
esta manera, podamos determinar los parámetros que caractericen a nuestro fenómeno, a
través de los parámetros del modelo (media, varianza, desviación estándar, etc.). Este
proceso sólo es posible debido al estudio del comportamiento de ciertos fenómenos
aleatorios, determinando la ley de probabilidades que tienden a seguir, para, de esta forma,
establecer la confiabilidad en los resultados del fenómeno en estudio, determinar el número
de experimentos necesarios para obtener resultados confiables, probar los resultados bajo
ciertos supuestos, o bien, predecir su comportamiento en relación con los experimentos
realizados.

27
Ciencias Políticas y Administración Pública

Es a partir del cálculo de probabilidades donde la Estadística ha adquirido un


amplio desarrollo, puesto que ha dado lugar a la Inferencia Estadística, es decir, la
estadística se convierte en una técnica inductiva, que por medio del estudio de una parte de
la población puede conocer, en forma aproximada, el comportamiento de la misma.

28
Estadística

Temario

1. Definición clásica y estadística de probabilidad


2. Probabilidad matemática
Experimentos aleatorios
Espacio de eventos
3. Elementos de la teoría de las probabilidades
Definición y axiomas
Propiedades
Sucesos mutuamente excluyentes y sucesos independientes
Regla de la adición
Regla de la multiplicación (probabilidad condicional)
Teorema de la probabilidad total
Teorema de Bayes
Análisis combinatorio
Permutaciones
Combinaciones

Objetivos de la unidad

1. Señalar cuál es la diferencia existente entre la definición clásica y la estadística de


probabilidades.
2. Explicar, con sus propias palabras, el concepto de modelo matemático.
3. Diferenciar los diversos conceptos probabilísticos tratados en la presente unidad.
4. Manejar, dado algunos problemas específicos, correctamente las reglas de adición y
multiplicación.
5. Resolver un problema, utilizando el teorema de Bayes.

29
Ciencias Políticas y Administración Pública

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.

HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales.


México, FCPyS-UNAM (Serie Estudios, 13), 1970.

SPIEGEL, Murray. Estadística. México, Mc Graw Hill (Serie Schaum's), 1970.

Actividades de aprendizaje

1. Explique la definición clásica de probabilidad.


2. Explique la definición estadística de probabilidad.
3. ¿Qué entiende por modelo matemático?
4. ¿Qué entiende por fenómeno aleatorio?
5. ¿Qué entiende por espacio de eventos?
6. Si denominamos a águila por A y sol por S en una moneda equilibrada, indique cuál
es el espacio de eventos del lanzamiento de 3 monedas.
7. Si el conjunto A está formado por los siguientes elementos:
A = 0, 3, 5, 7 y el B = 0, 1, 2, 4 encuentre:
A∩B, A∪B, Ac y Bc
8. Si el universo está formado por los números enteros U= {...., -2, -1, 0, 1, 2, ...,}
Encuentre la probabilidad de hallar al menos un 3 en 2 lanzamientos de un dado.
9. Si se lanzan simultáneamente 2 dados, ¿Cuál será la probabilidad de que los puntos
sumen 10?
10. Si se extraen 2 bolas al azar de una urna que contiene 10 bolas rojas, 30 bolas
blancas, 20 azules y 15 naranjas, halle la probabilidad de que: (para todos los casos
la selección se considerará con reemplazo y sin reemplazo)
a) Ambas sean blancas.
b) Una blanca y una roja.
c) Ninguna sea naranja.
d) Las 2 sean blancas o rojas o de ambos colores.
e) La segunda no sea azul.

30
Estadística

f) La primera sea naranja.


g) Al menos una sea azul.
h) No más de una roja.
11. Dos dados son tirados n veces en forma sucesiva ¿cuál es la probabilidad de obtener
al menos una vez el evento (6, 6)?
12. Se extraen 4 cartas al azar de 52, se desea calcular la probabilidad de:
a) Extraer un as exactamente.
b) La probabilidad de al menos un as.
c) La probabilidad de ningún as.
13. Suponga que se tienen 2 fábricas. Sea A1 el suceso de fabricación de herramientas en
la fábrica 1, y sea A2 el suceso de fabricación de herramientas en la fábrica 2. Sea X
el suceso que representa una herramienta defectuosa. Si la probabilidad de
encontrar una herramienta defectuosa en la fábrica 1 es 3/5 y en la fábrica 2 es 2/3
¿Cuál es la probabilidad de encontrar una herramienta defectuosa?
14. Suponga que se tienen 2 urnas, la primera que contiene 10 bolas blancas y 5 bolas
rojas, y la segunda que contiene 3 blancas y 3 rojas. ¿Qué probabilidad existe de
que la bola blanca sea de la primera urna?
15. Muestre mediante un diagrama de árbol los ordenamientos que pueden hacerse de 4
libros tomados de 3 en 3, sin repetición. Suponiendo que A, B, C y D son los libros.
16. ¿Cuántos ordenamientos de 5 estudiantes (1, 2, 3, 4, 5) podemos hacer al colocarlos
de 2 en 2, sin repetirlos, y cuántos repitiéndolos?
17. ¿De cuántas maneras podemos elegir 4 personas de un total de 9, si nos interesa el
puesto que ocupan (Director, Subdirector, etc.)?
18. ¿De cuántas formas diferentes pueden ser colocadas en una fila de 5 lugares, 5
personas?
19. ¿De cuántas maneras pueden colocarse 8 torres en un tablero de ajedrez, de manera
que ninguna de las 8 torres se “coman”?
20. Con 5 estadísticos y 6 economistas quiere formarse un comité de 3 estadísticos y 2
economistas ¿cuántos comités diferentes pueden formarse? Si:
a) No se impone restricción alguna.
b) Dos estadísticos determinados deben estar en el comité.
c) Un economista determinado no debe estar en el comité.

31
Ciencias Políticas y Administración Pública

21. ¿A qué denominamos un suceso mutuamente excluyente?


22. ¿A qué denominamos un suceso independiente?

Preguntas de evaluación

1. ¿Cuál es la definición clásica de probabilidad?


2. ¿Cuál es la definición estadística de probabilidad?
3. ¿Por qué utilizamos modelos matemáticos?
4. ¿En qué consiste el que un fenómeno sea aleatorio?
5. ¿Qué es un espacio de eventos?
6. ¿Cómo se define formalmente el concepto de probabilidad y cuáles son los axiomas
que fundamentan tal definición?
7. ¿Qué diferencia a un suceso mutuamente excluyente de un suceso independiente?
8. ¿Qué significado tiene la regla de adición?
9. ¿Qué significado tiene la regla de multiplicación?
10. ¿Cómo encontraría la probabilidad total de un suceso en un fenómeno dado?
11. ¿En qué consiste el teorema de Bayes?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.

MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo


Editorial Iberoamericano, 1990.

SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

32
Estadística

Unidad 3. Dependencia probabilística

Introducción

En esta unidad, desarrollaremos los elementos teóricos generales de los modelos


probabilísticos, así como los modelos que comúnmente se utilizan, precisando las
características y parámetros que los determinan (media, desviación estándar, etc.). A estos
modelos se les conoce genéricamente con el nombre de distribuciones de probabilidad.

El comportamiento de los fenómenos aleatorios pueden ser discreto o continuo


dependiendo de los valores que asuma la variable aleatoria, las cuales son determinadas por
las características especiales de los eventos aleatorios del experimento. En consecuencia, la
distribución de probabilidad será discreta o continua dependiendo del comportamiento que
tenga la variable aleatoria. Por ejemplo, el número de personas que pertenecen a la
población económicamente activa en familias de 6 miembros describe una distribución de
probabilidad discreta; por otro lado, los tamaños de los tornillos producidos por una
máquina describen una distribución de probabilidad continua.

33
Ciencias Políticas y Administración Pública

Temario

1. Variable aleatoria
2. Distribución de probabilidad univariada, discreta y continua
Función de distribución de probabilidad
Función de densidad de probabilidad
Propiedades y medidas de asociación de las distribuciones de probabilidad
3. Distribuciones discretas
Binomial
Hipergeométrica
Poisson
4. Distribuciones continuas
4.1 Normal

Objetivos de la unidad

1. Identificar cuándo una variable aleatoria tiene un comportamiento discreto o


continuo y determinar sus características.
2. Determinar, dado un problema, el tipo de función de densidad de probabilidad que
le corresponda de acuerdo con el comportamiento de la variable aleatoria.
3. Calcular los valores de los parámetros de la distribución de probabilidad ajustada.
4. Interpretar el significado de los valores que asumen los parámetros, de un problema
dado.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.

HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales.


México, FCPyS-UNAM (Serie Estudios, 13), 1970.

SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

34
Estadística

Actividades de aprendizaje

1. En la extracción de cartas de una baraja, deseamos conocer el número de corazones


rojos que pueden aparecer en una mano de 5 cartas. ¿Qué describe la variable
aleatoria? ¿Qué valores toma la variable aleatoria? ¿Qué características presenta?
2. El número de personas que llegan a una caja registradora en un supermercado es de
n por minuto. ¿Qué describe la variable aleatoria? ¿Qué valores toma la variable
aleatoria? ¿Qué características presenta?
3. En el ingreso a la escuela de Ciencias Políticas y Administración Pública, deseamos
conocer la edad a la que ingresan sus alumnos. ¿Qué describe la variable aleatoria?
¿Qué valores toma la variable aleatoria? ¿Qué características presenta?
4. Los salarios que perciben los obreros en cierta zona industrial son entre $250.00 y
$307.55 pesos diarios. ¿Qué describe la variable aleatoria? ¿Qué valores toma la
variable aleatoria? ¿Qué características presenta?
5. La probabilidad de que un equipo A gane es 1/2. A juega con B un torneo. El primer
equipo que gane 2 juegos seguidos o un total de 3 gana el torneo. Hallar el número
esperado de juegos en el torneo.
6. Una variable aleatoria puede tomar sólo los valores 1 y 3. Si la media es 8/3,
encontrar las probabilidades para estos 2 puntos y encontrar la varianza.
7. Si el número de accidentes en una jornada laboral, en cierta zona industrial sigue el
comportamiento:

X = No. de accidentes 0 1 2 3
P(X) = Probabilidad de accidentes 1/6 2/6 2/6 1/6

¿Cuál es el número esperado de accidentes por jornada? ¿Cuál es la desviación típica?


8. ¿Cuál es la función de densidad binomial y cuáles son los parámetros que la
determinan?
9. En la serie mundial de béisbol, la serie concluye cuando un equipo tiene ganados 4
partidos. Sea p la probabilidad de que el equipo A gane un juego y supongamos que
esta probabilidad permanece constante en la serie. Mostrar que las probabilidades de
que la serie termine en 4 ó 5 juegos son 0.125 y 0.25 respectivamente, cuando p=
1/2 y p= 2/3.

35
Ciencias Políticas y Administración Pública

10. Supongamos que el tiempo registrado muestra que un promedio de 5 de los 30 días
de noviembre son días de lluvia, (a) Suponiendo una distribución binomial con cada
día como un evento independiente, encuentre la probabilidad de que el próximo
mes de noviembre tengamos cuando mucho tres días de lluvia, (b) Dar razones
fenomenológicas que justifiquen no usar la distribución binomial.
11. Sea X una variable aleatoria de una distribución binomial con E[X] = 2 y σ2 = 4/3.
Hallar la distribución de X.
12. ¿Cuál es la función de densidad hipergeométrica y cuáles los parámetros que la
determinan?
13. Una muestra de tamaño 3 es extraída de una caja de 12 artículos. Si 4 de los
artículos son defectuosos, ¿Cuál es la probabilidad de objetos no defectuosos en la
muestra?
14. Considérese el caso de 10 votantes de los cuales 7 son de cierto partido A y 3 de
otro distinto B. Se ha tomado una muestra de 5 de ellos. ¿Cuál es la probabilidad de
que en la muestra haya 3 del partido A?
15. ¿Cuál es la función de densidad de poisson y cuáles los parámetros que la
determinan?
16. Con los datos del problema 10 utilice la aproximación de poisson a la distribución
binomial y compare los resultados para ver que tan buena es la aproximación.
17. Supongamos que el número de artículos de cierta clase comprados en una tienda
durante una semana sigue una distribución de poisson con μ = 50. ¿De cuánto será
la existencia que el comerciante tiene para producir la probabilidad de 0.98 para que
sea capaz de satisfacer la demanda? Usar la aproximación a la normal.
18. Supongamos que en una tienda entran 60 personas por hora, (a) ¿Cuál es la
probabilidad que durante un intervalo de 5 minutos no entre alguno en la tienda?,
(b) ¿Cuál es el intervalo de tiempo en el cual la probabilidad es 1/2 para que no
entre alguna persona en este intervalo?
19. ¿Cuál es la función de densidad uniforme y cuáles los parámetros que la determinan?
20. ¿Cuál es la función de densidad normal y cuáles los parámetros que la determinan?
21. Tenemos una máquina automática que estampa piezas, si controlamos la longitud de
la pieza X que está distribuida normalmente con esperanza matemática igual a 50
mm. Y no mayor que 68 mm. Encontrar la probabilidad de que la longitud de una

36
Estadística

pieza tomada al azar sea:


a) Mayor que 55 mm.
b) Menor que 40 mm.
22. Un fabricante sabe por experiencia que el 6% de sus productos es defectuoso. Si se
vende el producto en cajas de 100 unidades y garantiza que cuando mucho 10
unidades son defectuosas. ¿Cuál es la probabilidad de que en una caja falle la
garantía de calidad?
23. Supongamos que el número de llamadas telefónicas que llegan a un conmutador
siguen una distribución de poisson a razón de 10 llamadas por minuto. Si el
conmutador puede manejar cuando mucho 20 llamadas por minuto. ¿Cuál es la
probabilidad de que en un período de un minuto se sature? Usar aproximación
Normal.
24. Para n = 12 y p = 1/4. Dibujar en la misma gráfica:
a) El polígono binomial
b) El polígono poisson
c) La curva normal apropiada para ordenadas
d) Notar el alcance para el cual (b) y (c) se aproximan a (a).
25. Los errores aleatorios de la medición obedecen a una ley normal con desviación
cuadrática media σ = 20 mm. Y esperanza matemática μ = 0. Hallar la probabilidad
de que de tres mediciones independientes el error de por lo menos una de ellas no
sea mayor en valor absoluto de 4 mm.

Preguntas de evaluación
1. ¿Qué se entiende por variable aleatoria?
2. ¿Qué es una variable discreta?
3. ¿Qué es una variable continua?
4. ¿Qué es una distribución de probabilidad?
5. ¿Qué es la función de distribución de probabilidad?
6. ¿Qué es la función de densidad de probabilidad?
7. ¿Qué es la distribución Binomial?
8. ¿Qué es la distribución Hipergeométrica?

37
Ciencias Políticas y Administración Pública

9. ¿Qué es la distribución de Poisson?


10. ¿Qué es la distribución Normal?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.

MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo


Editorial Iberoamericano, 1990.

SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

38
Estadística

Unidad 4. Introducción al teorema del límite central y estimación

Introducción

En la tercera unidad de esta guía hemos estudiado las distribuciones teóricas de la


población con respecto a una cierta variable: edad, peso, ingreso, etcétera, la cual está
determinada por ciertos parámetros, como por ejemplo, la media aritmética u y la varianza
a2 para la distribución normal; la proporción P de casos favorables para la distribución
binomial, etcétera.

Hemos partido del supuesto de que el valor de dichos parámetros es conocido, lo


que no siempre es cierto, puesto que como sabemos se deben conocer todos los valores de
la variable para determinarlos. En múltiples ocasiones nos encontramos con que los valores
de los parámetros no se pueden conocer, es el caso del ingreso, del gasto, de las estaturas,
etc., sin embargo, es necesario tener una aproximación a su valor para poder inferir otros
valores de dicha población, con lo cual se hace necesario encontrar una estimación de estos
parámetros.

39
Ciencias Políticas y Administración Pública

Así, por ejemplo, supongamos que se desea conocer el ingreso promedio de las
familias mexicanas; un procedimiento sería realizar un censo que abarcara a todas las
familias mexicanas, lo cual requiere de una cantidad estratosférica de recursos y de tiempo;
después de efectuado el censo, sería válido dudar de que se hubiera proporcionado con
veracidad la magnitud de su ingreso.

Debido a las dificultades señaladas, muchas veces se prefiere descartar al censo a


favor de un muestreo y con los datos obtenidos estimar el ingreso promedio.

Esta problemática es la que da lugar a la teoría de la estimación que desarrollaremos


en estas unidades, es decir, a partir de una muestra aleatoria extraída de una población se
estiman los parámetros de la misma; ahora bien estas aproximaciones o estimadores son
mejores entre más próximos se encuentren al valor verdadero de la población. Asimismo,
estudiaremos las propiedades que debe cumplir un buen estimador y los métodos de
obtención de estos estimadores a partir de los datos muestrales.

40
Estadística

Temario

1. Teorema del límite central


2. Estimación
Estimación puntual
Estimador insesgado
Estimador consistente
Estimador eficiente
Estimador suficiente
3. Métodos de estimación
Estimación por intervalos
Estimación de medidas por intervalos de confianza
Estimación de proporciones por intervalos de confianza
4. Cálculo del tamaño de la muestra

Objetivos de la unidad

1. Explicar la diferencia entre estimación puntual y por intervalos.


2. Identificar las características de estimadores puntuales conocidas como
insesgamiento, consistencia, eficiencia y suficiencia.
3. Calcular un intervalo de confianza correspondiente a dos poblaciones.
4. Calcular, tomando como base los datos de dos poblaciones, el tamaño adecuado
para cada muestra satisfaciendo un nivel determinado de precisión.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.

HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales.


México, FCPyS-UNAM (Serie Estudios, 13), 1970.

SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

41
Ciencias Políticas y Administración Pública

Actividades de aprendizaje

1. Explique:
a) El concepto de estimador insesgado, consistente, eficiente y suficiente.
b) La diferencia entre estimación puntual y por intervalos.
2. ¿Qué utilidad aporta el cálculo de estimadores?
3. De una población de 450 se obtiene una muestra aleatoria simple de 81 unidades, la
media aritmética y desviación estándar de los ingresos mensuales en la muestra fue
de $1,200.00 y de $270.00 respectivamente:
a) ¿Podría decir cuáles son los parámetros de la población?
b) ¿Cuáles son los estadísticos?
c) ¿Cuál es la estimación de punto del ingreso medio mensual en la población?
d) ¿Cuál es la estimación de intervalo a un nivel de confianza del 99.73%
suponiendo que la desviación estándar de la población es σ = 270?
4. Determine los estimadores insesgados y eficientes de μ y σ2, tomando como base
los siguientes datos. Una muestra de cinco medidas del diámetro de una esfera se
registran como: 6.33, 6.37, 6.36, 6.32, 6.37 cm.
5. Se requiere encontrar el intervalo de confianza del 95% para el coeficiente
intelectual medio de los estudiantes de cierto colegio. Se ha tomado una muestra
aleatoria de 5 estudiantes y los resultados obtenidos son: 160, 170, 165, 175, 180.
¿Cuál es el intervalo buscado?
6. Dos grupos de cerdos fueron cebados con dietas diferentes. Se tomó una muestra
aleatoria de 9 cerdos de cada grupo y las medias muéstrales encontradas fueron X1
= 80Kg y X2 = 90 Kg, se admite que los pesos estaban distribuidos normalmente y
las desviaciones típicas eran σ1 = 9Kg y σ2 = 18Kg. Encuentre el intervalo de
confianza del 90% para la diferencia de medias.
7. En 1969 la especialidad de Relaciones Internacionales de la Facultad de Ciencias
Políticas y Sociales de la UNAM tenía un total de 356 egresados. Se diseñó una
muestra aleatoria simple con objeto de investigar la situación ocupacional de estos
egresados. La muestra se calculó para un nivel de confianza de 95%, precisión de
8% y estimado P= 0.7. ¿Cuántos egresados deberá contener la muestra?

42
Estadística

8. Determine los tamaños de muestra requeridos para estimar el ingreso promedio de


una población de 1500 empleados, con los siguientes niveles de confianza: Z1 =
90%, Z2 = 95%, Z3 = 98% y con precisiones de ε1 =25, ε2 =50, ε3 =100. La
desviación estándar para dicha población es 250.

Preguntas de evaluación

1. ¿Cuál es el teorema del límite central?


2. ¿Qué es un estimador y qué es una estimación?
3. ¿Cuándo se dice que un estimador es insesgado?
4. ¿Cómo se define la consistencia?
5. ¿Cuándo se dice que un estimador es más eficiente que otro?
6. ¿Cuándo se dice que un estimador es suficiente?
7. ¿Cuál es la diferencia entre estimación puntual y por intervalos?
8. ¿A qué se llama confianza?
9. ¿Cómo se calculan los intervalos de confianza?
10. ¿Cómo se calcula el intervalo de confianza para estimar la media?
11. ¿Cómo se calcula el intervalo de confianza para estimar proporciones?
12. ¿Cómo se estima el tamaño de la muestra?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.

MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo


Editorial Iberoamericano, 1990.

SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

43
Ciencias Políticas y Administración Pública

44
Estadística

ANEXO: Respuestas a las preguntas de autoevaluación

Unidad 1. 

1. Cuando la característica asociada a individuos u objetos puede asumir diferentes


valores, se dice que dicha característica es una variable, en caso contrario se
denomina constante, por ejemplo:
i) El número de automóviles vendidos diariamente, es una característica que se
modifica cada día.
ii) La estatura de los individuos de una población es una característica que asume
un valor distinto para cada individuo,
iii) El ingreso de la PEA es una característica que varía de individuo a individuo.

Los valores observados de una variable son aquellos que se obtienen a través de una
muestra, un censo o un experimento. Mientras que, los valores posibles de una variable son
todos aquellos que puede asumir una variable, aún aquellos que no sean observados. Esto
es, los valores observados son un subconjunto de los valores posibles. Por ejemplo, la
estatura de una persona adulta normal puede estar en un intervalo de valores que van desde
un metro cuarenta centímetros, hasta dos metros y diez centímetros, este intervalo
representa los valores posibles de la variable, mientras que, los valores observados serán
aquellos que se obtengan al levantar una muestra o un censo.

2. Se dice que una variable es cuantitativa cuando su valor se puede expresar


numéricamente. Si una variable se expresa a través de categorías por sus atributos se
denomina cualitativa. Por ejemplo, la edad de una persona se expresa
numéricamente, sin embargo su estado civil se expresa a través de atributos.

Las variables cuantitativas se dividen en dos categorías: discretas y continuas. Las


discretas se definen como un conjunto finito o infinito de valores que es posible numerar u
ordenar. Mientras que, las continuas se definen como un conjunto infinito de valores que es
imposible numerar.

45
Ciencias Políticas y Administración Pública

En una variable continua siempre existen uno o más valores entre dos puntos contiguos,
lo que imposibilita la numeración del conjunto. Por ejemplo, la estatura de un individuo se
mide, por cuestiones prácticas, hasta centímetros, sin embargo, esto no quiere decir que no
existan estaturas en milímetros, millonésimas de milímetro, etc.

Esto implica que en medio de dos valores muy próximos existen uno o más valores que
no se han numerado. Si se acordara que las estaturas sólo se expresaran hasta centímetros,
los valores que asume la variable sí se podrían numerar y en este caso la variable ya no
sería continua sino discreta. Suele ocurrir que una gran variedad de variables discretas son
ordenadas de acuerdo al orden que siguen los números naturales, sin embargo, esto es sólo
una coincidencia, porque muchas variables que impliquen conteo asumirán valores
naturales, por ejemplo, el número de automóviles que entran a un estacionamiento en una
hora.

3. La forma más elemental de organizar los valores de una variable se denomina Serie
Simple de Datos y consiste en ordenarlos en forma creciente. Ejemplo:

La cantidad de pares de zapatos vendidos diariamente durante un mes por una casa
comercial es como sigue:

31, 35, 41, 48, 43, 52, 38, 41, 55, 37, 34, 43, 50, 40, 45
48, 48, 47, 56, 57, 45, 32, 45, 43, 45, 47, 53, 50, 38, 46

Pares de zapatos vendidos diariamente por una casa comercial.

La variable, en este caso, representa el número de pares vendidos:


X = 31, 35, 41, 48, 43, 52, 38, 41, 55, 37, 34, 43, 50, 40, 45
48, 48, 47, 56, 57, 45, 32, 45, 43, 45, 47, 53, 50, 38, 46

Organización de la información de acuerdo con la talla del par vendido.

4. La siguiente etapa en el ordenamiento de los datos consiste en la denominada


distribución de frecuencias, en esta etapa los datos cuyo valor numérico se repite
son agrupados en una misma categoría. De esta manera se cuenta el número de
veces que un valor de la variable se ha repetido, a lo que se denomina frecuencia
absoluta.

46
Estadística

5. Frecuentemente, la información estadística es muy abundante, como sucede en un


censo nacional, motivo por el cual resulta poco práctico agrupar la información
utilizando distribuciones de frecuencias. En estos casos se establecen diferentes
categorías de valores, en las cuales se clasifican los datos de acuerdo con su valor
numérico. Así, una masa de datos puede ser clasificada en varias categorías
numéricas.

La distribución por intervalos de clase es el mecanismo típico para el ordenamiento de


la información. Cuando el número de datos es reducido, no es recomendable utilizar este
procedimiento por las causas que a continuación se exponen.

En los intervalos de clase se agrupan los individuos u objetos cuyo valor numérico de la
variable se encuentra comprendido entre los límites de dicha clase. Si bien el censo no
especifica cuál es el ingreso de cada individuo, la masa de datos agrupada en el intervalo es
tan grande que seguramente la distribución de valores dentro del intervalo es homogénea o
uniforme. Sin embargo, cuando la información no es abundante es posible que algunos
valores se concentren hacia algún extremo del intervalo, lo que ocasiona que los límites del
intervalo no sean representativos. Esto es, al construir un intervalo de clase se debe
procurar que la información ahí agrupada se distribuya homogéneamente a lo largo del
intervalo.

6. Se denomina punto medio o marca de clase al valor medio del intervalo de clase, el
cual se obtiene de sumar los límites inferior y superior de cada clase y dividir entre
dos, esto es:
(Li+ Ls)/ 2
El punto medio representa el valor numérico que se le asigna en promedio a cada
individuo u objeto que pertenece a esta clase.

En la práctica no conviene construir muchos intervalos de clase porque se dificulta


el manejo de muchas clases, lo típico es manejar de 6 a 15 grupos o categorías. Existe una
regla empírica muy utilizada que depende del número total de observaciones y del número
de observaciones por intervalo, esta es:
No. de intervalos = No. total de observaciones/No. de observaciones por intervalo

47
Cienciias Políticass y Administtración Públlica

El número de observacciones por inntervalo es asignado


a de acuerdo a laa experienciaa y
requerrimientos del que manejaa la informacción.

El cálculo del númeroo de intervallos y la longgitud de los mismos en que se ordeena


una masa
m de datos no es exaccto y único, más bien depende
d del criterio y neecesidades del
d
que orrganiza la infformación.

ficamente laa información


7. Existe un sinnúmeroo de formaas de repreesentar gráfi
estadística, dependienddo de los finnes y propósitos que se tengan.
t Las que
q se utilizzan
con más frrecuencia soon los diagraamas de pasttel, los histoogramas y laas ojivas, enttre
otros.

Laa representación gráficaa es un insstrumento úttil en el esstudio y com


mprensión del
d
compoortamiento de mación estaddística. Mucchas observaaciones y coonclusiones se
d la inform
puedenn hacer a priimera vista, antes de realizar una evaaluación cuaantitativa.

Soon diagramass circulares en


e forma dee pastel, en loos cuales caada rebanadaa representa un
rubro o categoría respecto a un
u total. Por ejemplo, las categorías establecidass para la PE
EA,
es possible represeentarlas en foorma de un diagrama dee pastel supooniendo quee cada clase es
una reebanada. En la figura siguiente se muuestra la fraccción de pasttel que correesponde a caada
clase.

A B
Diagra
ama de pastel do
onde cada interva
alo de clase está
á representado por
p una rebanada
a.

48
Estadística

8. Los histogramas son diagramas en forma de barras consecutivas, en donde la altura


de cada barra corresponde a la frecuencia absoluta y el ancho de la base al rango de
cada clase, en distribuciones de clases y frecuencias. En distribuciones de
frecuencia el ancho de cada barra es sólo representativo, por lo cual sólo importa
que la barra esté centrada en el valor que representa.

Histograma de la distribución de intervalos de clase y frecuencias de la Población Económicamente Activa


por grupos de ingreso mensual en el estado de Aguascalientes, según el censo de 1990.

Histograma de la distribución de clases y frecuencias de la venta de pares de zapatos.

9. Generalmente las ojivas son gráficas acumulativas de las frecuencias, por esta razón
es creciente el comportamiento de esta función.

Existen varios tipos de ojivas, dependiendo de las necesidades y usos de la información


estadística, casi para todas es necesario acumular las frecuencias clase por clase, por esta
razón, es importante distinguir tres tipos de frecuencias: absoluta, acumulada y relativa.

La primera es la correspondiente al conteo de individuos u objetos que poseen un


mismo valor de la variable (datos agrupados por valor de la variable) o que pertenecen a
una misma categoría (datos agrupados por intervalo de clase). La segunda es el resultado de

49
Ciencias Políticas y Administración Pública

sumar sucesivamente las frecuencias absolutas hasta llegar al total de la población. La


tercera se calcula dividiendo la frecuencia absoluta entre el total de datos, es posible
combinar los dos últimos procedimientos para calcular las frecuencias relativas-acumuladas
o acumuladas-relativas dependiendo del orden que se siga, esto es, dividir entre el total de
datos y luego acumular los resultados o acumular y después dividir entre el total,
respectivamente.

Dentro de los diversos tipos de ojivas que se pueden construir, existen dos de
particular interés, la ojiva “más de...” y la “menos de...”. La primera consiste en ir
desagregando los elementos de cada clase del total, empezando por la primera, luego la
segunda, etc., en este caso la gráfica es decreciente. Mientras que, en la ojiva “menos de”
las frecuencias se van agregando clase por clase, como en una ojiva convencional. En
ambos casos el encabezado de cada clase se comienza con la frase “más de...” o “menos
de...” y se establece un valor de la variable que esté comprendido en el intervalo en
cuestión.

Ojiva “mas de...”, utilizando las frecuencias “desacumuladas”.

50
Estadística

Ojiva “menos de...”, utilizando las frecuencias acumuladas.

10. Estas medidas permiten evaluar la tendencia que tiene la gran masa de datos, esto
es, el valor de la variable alrededor del cual se aglomera la mayoría de las
observaciones. Las medidas que se estudiarán son la moda, la mediana, la media, la
media geométrica y la media armónica.

La Moda 

El valor de la variable que en una serie de observaciones se repite con mayor


frecuencia se denomina valor modal o moda. En algunos casos puede ocurrir que este valor
no exista o bien que no sea único.

Hasta aquí se ha evaluado la moda para una serie simple de datos, sin embargo, su
obtención se vuelve un poco más complicada para una distribución de clases y frecuencias.
En este caso, se puede demostrar de manera muy sencilla que la expresión es:


Mo = Linf +
∆    ∆

donde:

Linf, límite inferior de la clase modal


Δi-1, frecuencia de la clase modal menos frecuencia de la clase anterior a la modal
Δi+i, frecuencia de la clase modal menos frecuencia de la clase posterior a la modal
rMo, rango del intervalo de la clase modal

51
Ciencias Políticas y Administración Pública

La Mediana 

Es el valor de la variable que le corresponde al elemento que se encuentra


exactamente a la mitad de todos los datos, una vez que éstos han sido ordenados de menor a
mayor. Así, para una serie simple de datos hay dos posibilidades, si el número de datos es
impar o par. En el primer caso, la mediana corresponde al valor del dato que divide en dos
partes iguales a la serie. En el segundo, el valor de la mediana se obtiene de promediar los
dos datos que se encuentran a la mitad de la serie, esto es, en este caso la mediana está
asociada a un dato ficticio.

La mecánica para calcular la mediana en el caso de datos agrupados se complica un


poco, pero el principio es el mismo, esto es, se trata de obtener el valor de la variable para
el dato que divide en dos partes iguales la masa de datos. En una distribución de clases y
frecuencias los datos se encuentran ordenados por categorías de acuerdo al valor de la
variable en estudio, por lo cual el dato intermedio se encuentra incluido en una de estas
categorías. Para saber en qué categoría se encuentra es necesario acumular las frecuencias
de cada una.

La expresión utilizada en el caso de datos agrupados es:


   
Md   Linf       

donde:

Linf, es el límite inferior de la clase en donde se localiza la mediana.


(i-1)Md, es la frecuencia acumulada hasta la clase anterior a la clase en que se localiza la
mediana.
rMd, es el rango de la clase en donde se localiza la mediana.
Md, es la frecuencia absoluta de la clase en que se localiza la mediana.

52
Estadístiica

La Me
edia Aritmé
ética 

Es la med
dida de tenndencia cenntral más im
mportante pues,
p a difeerencia de las
l
anterioores, involuccra a todos los datos enn su cálculoo. La media, para una seerie simple de
datos, se calcula su
umando éstoos y dividiénndolos por ell número total, esto es:

X=
N

La media representa
r e punto de equilibrio
el e dee todos los datos,
d por ejeemplo, si caada
dato fuera
fu una pessa y fuera coolocada una en cada valoor a lo largoo de una reglla graduada en
años, empezando
e por
p la menorr edad y term
minando conn la mayor. La
L edad prom
medio o meddia
seria el
e punto en donde
d se equuilibra dicha regla si se sooporta en unna cuña.

18 19 20 21 2
22 23 24 255 26 27

21.33 años
a

Si se consttruye un hisstograma, se puede locallizar el puntto en donde está la meddia.


Como se podrá ob
bservar, la loocalización de
d la media no
n depende sólo
s del valoor de los datoos,
sino de la diferenccia que hay entre
e ellos.

La expresiión de la media para datos agrupadoos es muy paarecida a la expresión


e paara
una seerie simple de datos, sólo es neccesario agreegar la conntribución del número de
elemenntos de cadaa valor o cateegoría, esto es:
e

X=
N

53
Cienciias Políticass y Administtración Públlica

Dondee:
r
N=∑ i es el número
n totall de datos
i=1

r es el número de clases
c o cateegorías.
i es el
e número dee datos por cllase.
xi es el punto med
dio de cada clase.

Esta expresión se puedde desglosar por sumanddos de la siguuiente manerra:

X = =   +    +   +…
…+  
N

de aquuí se puede observar


o quee cada puntoo medio estáá multiplicaddo por un facctor del tipo

que reepresenta el peso o factor de pondderación de cada categooría. Este faactor indica la
d datos (N)) con que contribuye cadda clase al valor del punnto medio de la
fraccióón del total de
mismaa. Por esta raazón, el valoor de la mediia no sólo deepende del valor
v del punnto medio, siino
de la cantidad
c de datos
d que esttén agrupadoos en la categoría o clasee corresponddiente.

Algunas prropiedades im
mportantes de
d la media son las siguiientes:

M(a) = a

M(a X)
X = a M(X)

M(X+Y) = M(X) + M(Y)

donde a es una con


nstante. Estaas expresionnes se puedenn demostrar utilizando laa definición de

mediaa y se cumpleen para una serie


s simple de datos o datos
d agrupaados.

54
Estadístiica

La Me
edia Geomé
étrica 

Es una medida de tenddencia centraal para variabbles que siguuen un compportamiento de


tipo geométrico,
g como
c es el caso del crrecimiento de
d la población, el creciimiento de un
capitall depositado
o a plazo fijoo, etc. Si la variable enn estudio no sigue un coomportamiennto
geoméétrico, difíciilmente la media geom
métrica seráá un indicaador de tenddencia centrral
adecuaado.

La media geométrica para una serie


s simplee de datos se
s calcula a través de la
expressión:

Mgg =    .  .    .… . = ∏

donde significa la productoria, es decir, sinntetiza el prooducto de loos valores dee Xi, desde quue
i = 1 hasta
h que i = N.

La media geométrica
g p datos aggrupados se calcula
para c a traavés de la exppresión:

Mg = = ∏

donde Xi es el pu
unto medio de
d la clase, fi la frecuenncia y r el número
n de cllases. En esste
caso el
e cálculo dee la media geométrica
g se complica con la fórm
mula precedennte, porque Xi
elevaddo a la fi pueede sobrepassar los límitees de una callculadora, poor ello conviene utilizarr el
siguiennte artificio::

Primero see expresa la ecuación


e antterior como:

M =
Mg =( .  .  .… . )1/N

luego se obtiene el logaritm


mo de esta expresión. Sin embarrgo, antes de
d aplicar los
l
logarittmos, es imp
portante recoordar algunass propiedadees de los missmos.

55
Cienciias Políticass y Administtración Públlica

i) log(a b) = log a + log b

ii) log (a /b) = log a . log b

iii)) log a b = b log a

All aplicar las propiedades


p del inciso iiii) a la expreesión anterior, se tiene:

log Mg
M = log( .  .  .… . )1/N = log ( .  .  .… . )

aplicanndo la propiedad del incciso i) queda:

logg Mg = log
g( .  .  .… . ) = (log + log + log +…+ log )

aplicanndo nuevam
mente la proppiedad del incciso iii) a caada sumandoo:

log Mgg = ((log + log + log +…


…+ log ) = ( log + log + log +…
…+

log )

Esta expresión se puedde escribir enn forma abreeviada como:



Log Mg = ( log + log + log +…+
+ log )=  

Para obtener la meddia geométrrica y no su logaritm


mo, se debbe obtener el
antiloggaritmo de laa expresión precedente,
p esto es:

Para logariitmos base 10:

Mg = anti log (llog Mg) =

Para logarittmos naturales:

Mg = anti ln(ln Mg) =

56
Estadístiica

La Me
edia Armón
nica 

Esta mediaa es utilizadda en fenóm


menos en loss cuales unaa variable ess inversamennte
proporrcional a la otra,
o por ejem
mplo, la veloocidad y el tiempo,
t o la productividaad y el tiemppo.
Por essta razón su utilidad se restringe
r a loos casos antees señaladoss. Para una serie
s simple de
datos la
l media arm
mónica se exxpresa de la siguiente
s maanera:

N
Ma=

Para datos
d dos la expresión de la media
agrupad m armóniica es:

N
Ma=

11. Las medid


das de posicción son parrámetros quee indican el valor de laa variable paara
algún porccentaje de laa población. Se llaman de
d posición porque
p se ubbican en vallor
que tiene la variable, de
d acuerdo all porcentaje de la poblacción seleccioonado.

Los Cu
uantiles 

Los cuantiles proporcionan el valoor que asumee la variable para una fraacción del tootal
de la población.
p Por
P ejemplo, si una poblaación es dividida en tress partes los cuantiles
c serrán
tres y se denomin
nan primero, segundo y tercer
t tercilees. El primeero nos indicca el valor que
q
asumee la variable para el prim
mer tercio dee la poblacióón, el segunddo para los dos
d tercios y el
terceroo para el totaal de la pobllación. Si la población se
s divide en cuatro se llaaman cuartilees,
en cinnco quintiles,, en diez decciles y en cien percentilees. El últimoo cuantil siempre indicaa el
total de
d la població
ón por eso coincide con el límite supperior de la última
ú clase..

57
Ciencias Políticas y Administración Pública

Las medidas de posición tienen mayor importancia cuando se maneja una gran masa
de información, en una serie simple de datos resulta poco práctico ubicar los cuantiles si los
datos no han sido organizados en una distribución de clases y frecuencias, en cuyo caso los
cuartiles se encuentran a través de la siguiente expresión:

     
Cr = Lic +  

los quintiles a través de la expresión:


     
Qr = Liq +  

los deciles a través de la expresión:


     
Dr = Lid +  

los percentiles a través de la expresión:


     
Pr = Lip +  

12. Como se podrá apreciar, existe una gran variedad de parámetros para distintos
propósitos, en esta sección se tratarán los relacionados con la dispersión de la
información.

Rango 

La medida de dispersión más sencilla es el rango, que es la diferencia entre el dato


de mayor valor y el de menor valor en una serie simple de datos. Para distribuciones de
clases y frecuencias es la diferencia entre el límite superior de la última clase y el límite
inferior de la primera.

58
Estadístiica

El rango es una medidda demasiadoo burda, sin embargo, da


d una idea de
d la variaciión
máxim
ma que podríía tener la vaariable en cuuestión.

Varia
anza y Desv
viación Típiica 

Es la mediida de dispersión más im


mportante, pues
p es consistente y ponnderada. Miide
la disppersión cuad
drática mediia de los dattos respecto a la media,, para una serie simple de
datos se
s escribe:

S2 =
N

La importaancia de quee la dispersióón de los daatos en tornoo a la media sea elevadaa al


cuadraado radica en
e el hechoo de que lass dispersionnes pequeñas no contribbuyen muchho,
mientrras que las grandes
g pesann cuadráticaamente más.

Para una distribución


d de clases y frecuencias la varianza se escribe en
e la siguiennte
forma:

S2 =
N

Al igual qu
ue en la meddia, la disperrsión es pondderada por los factores fi/N, esto es, la
variannza no sólo depende
d de la magnitudd de la dispeersión, sino del
d “peso” que
q tenga caada
clase respecto
r a laas demás.

La varianzza por sí soola no dice mucho, perro si se obtiene su raízz cuadrada, se


obtienne la desviacción típica o estándar, que
q indica laa distancia promedio
p enntre los punttos
medioos y la mediaa, esto es, enntre el centrro de cada clase
c y el puunto de equillibrio de toddos
los dattos.

59
Ciencias Políticas y Administración Pública

Algunas propiedades importantes de la varianza son:

a) Var(a) = a
b) Var(aX) = a Var(X)
c) Var(a+X) = Var(X)

la demostración de estas propiedades se realiza aplicando la definición de la varianza.

Coeficiente de Variación 

La varianza es una medida de la variación absoluta. Cuando se desea comparar la


dispersión de dos o más grupos de datos conviene utilizar el concepto de coeficiente de
dispersión, que se define como el cociente entre la desviación típica y la media, esto es:

S
CV =

Por ejemplo, dos distribuciones poseen la misma varianza S2, sin embargo, una
tiene una media de 50 y otra de 450, esto quiere decir que la primera tiene un coeficiente de
dispersión mayor que la segunda, esto es, la dispersión relativa de los datos respecto al
punto de equilibrio de la distribución es menor en el segundo caso que en el primero, sin
embargo, la dispersión absoluta es la misma.

La Asimetría 

13. La asimetría es un parámetro estadístico que mide el grado de simetría respecto a la


media de una serie de datos agrupados. En general, las tres medidas de tendencia
central, media, mediana y moda no coinciden. Sin embargo, como la media es el
punto de equilibrio de una distribución, la condición para que una distribución sea
simétrica es que la moda y la mediana coincidan en valor numérico con la media,
esto es:

60
Estadística

 = Md = Mo

Por esta razón, una forma de medir la asimetría ha sido evaluar la distancia entre la
media y la moda, o la media y la mediana y estandarizarla dividiendo entre la desviación
típica. Particularmente, el primer y segundo coeficientes de asimetría de Pearson, están
basados en este principio:
3( – Mo)
Asimetría =
S

3( – Md)
Asimetría =
S

Otra forma de evaluar el grado de asimetría de una serie de datos agrupados consiste
en recurrir al tercer momento respecto a la media y dividirlo por la desviación típica al
cubo, esto es:

> 0 Asimetría positiva


a3 = m3/S3 = 0 Simétrica
< 0 Asimetría negativa

Asimetría positiva Simétrica Asimetría negativa


Media - - - - - - - - Mediana …………… Moda ___________

Este coeficiente es adimensional y no depende de ninguna medida de tendencia


central, excepto de la media. Los términos del tercer momento (Xi-X)3 son positivos cuando
Xi >X y negativos cuando Xi < X, de manera que la suma de todos los términos resultará
positiva o negativa de acuerdo al peso de cada rama a la derecha o izquierda de la media. El
grado de asimetría tiene tres categorías.

61
Ciencias Políticas y Administración Pública

La Curtosis 

La curtosis es una medida de la heterogeneidad u homogeneidad de una


distribución, geométricamente representa el grado de abultamiento (o agudez) de la
distribución. La curtosis se mide con ayuda del cuarto momento respecto a la media,
dividiendo éste por el cuadrado de la varianza, esto es:
> 3 Leptocúrtica
a4 = m4/S4 = = 3 Mesocúrtica
<3 Platocúrtica

Platocúrtica Mesocúrtica Leptocúrtica

14. Una medida de concentración mide el ritmo de acumulación de una variable, en este
sentido, es muy similar a la técnica utilizada para obtener una ojiva. Esta medida de
la concentración para una serie de datos agrupados se denomina Índice de Gini, y
no es una medida promedio como las estudiadas con anterioridad, es una medida
que se obtiene de consideraciones geométricas sobre la curva de Lorenz.

Curva de Lorenz 

Como se recordará, las ojivas son gráficas acumulativas de los valores de la variable
y muestran gráficamente el ritmo de acumulación de una variable, por esta razón, la forma
gráfica de apreciar la concentración de una variable tiene que estar relacionada con las
ojivas. La curva de Lorenz es una ojiva invertida, esto es, las frecuencias acumuladas se
grafican en el eje X y el producto de f por X acumulado se gráfica en el eje Y.

62
Estadística

Curva de Lorenz

Índice de Gini 

Este índice tiene su origen en la curva de Lorenz, pues es el resultado de encontrar


el área entre esta curva y la recta que une el inicio y el fin de la misma. Esta recta
corresponde al caso ideal en el que la concentración sea homogénea, esto es, que cada clase
o valor de la variable contribuya con la misma frecuencia (en valores o clases igualmente
espaciadas), línea AC. El caso opuesto lo representan las rectas AB y BC, en donde la
concentración de la variable está acumulada en un solo individuo u objeto.
La expresión para el índice de Gini es la siguiente:

XiYi+1 – Xi+1Yi
IG =
(100)2

donde:
Xi = ia%

Yi = ( iXi)a%

63
Ciencias Políticas y Administración Pública

Curva de Lorenz

Unidad 2. 

1. La probabilidad de que se presente determinado suceso es igual al cociente del


número de casos que son favorables a este suceso por el número total de casos
posibles, con tal que todos estos casos sean mutuamente simétricos.

2. Si un total de c eventos mutuamente simétricos, de entre los cuales a nos son


favorables, y suponiendo que repetimos nuestro juego n veces, de las cuales f nos
son favorables porque aparecen algunos de los eventos, entonces n-f veces no serán
a nuestro favor, de donde podemos definir la razón frecuencial como f/n.

En el caso en que n → ∞ (sea n grande), esta razón (f/n) tenderá el valor a/c, puesto que
cada uno de los c casos posibles se presentará n/c veces, pero a de ellas son favorables, o
sea na/c, por lo que f ≡ na/c será el número de veces que ganemos.

3. La intención de la teoría de probabilidades en cualquiera de las disciplinas que la


utilicemos, consiste en proporcionar un modelo matemático adecuado a la
descripción del comportamiento (aleatorio) de nuestro fenómeno. A veces, el
comportamiento puede ser muy similar a los modelos más conocidos (Binomial,
Poisson, Normal, etc.), pero en otras, se deberá dar una descripción del
comportamiento de nuestro fenómeno en términos de modelos que nosotros
construyamos.

64
Estadística

Un modelo matemático será aceptable en la medida en que éste se ajuste al


comportamiento del fenómeno estudiado. En general, el modelo puede resultar más sencillo
que el fenómeno, pero hay que tener en cuenta que por muy adecuado que sea nuestro
modelo, nunca lo podremos ajustar exactamente a nuestro fenómeno debido a su naturaleza
aleatoria, por lo que en este sentido representará una aproximación.

4. Que un fenómeno o suceso sea aleatorio, quiere decir que no podemos afirmar un
resultado a priori de su comportamiento. Por ejemplo, una moneda al ser arrojada,
tiene 2 posibilidades, que caiga sol, o bien águila, sin embargo, no podemos
predecir cuál de los 2 resultados será el que aparecerá. Ahora la pregunta adecuada
sería: ¿De dónde proviene la aleatoriedad de un fenómeno?

El que un fenómeno sea aleatorio proviene de la variabilidad de las condiciones en que


se lleva a cabo éste, es decir, cuando no hay posibilidades de fijar las condiciones en que se
produce nuestro fenómeno; por otra parte, si fijáramos todas las posibles fuentes de
variación de nuestro fenómeno, no tendríamos un fenómeno aleatorio, sino determinista,
puesto que conoceríamos a priori el resultado.

Hay que señalar que un fenómeno no es determinista o aleatorio, sino depende de las
condiciones en que se realice éste, para que sea lo uno o lo otro. Esto es, la arbitrariedad de
las condiciones es lo que nos permite fenómenos o eventos aleatorios.

5. Se denomina espacio de eventos aquel que contiene todos los eventos de un


experimento aleatorio.

6. La probabilidad es una idealización de la proporción de veces que ciertos resultados


ocurrirán en repetidos sucesos de un experimento, así, un modelo de probabilidad
para eventos, será uno para el cual la probabilidad de que un evento A ocurra, será
denotado por P(A), es igual a la proporción de veces que el evento A se espera que
ocurra en repetidos eventos de un experimento. Puesto que P(A) es una función
definida sobre conjuntos, tales como A, es decir, una función-conjunto.

65
Ciencias Políticas y Administración Pública

De acuerdo con lo anterior, construimos 3 axiomas de la teoría de probabilidades:

a) o ≤ P(A) ≤ 1; para todo evento A


b) P(S) = 1
c) P (A1∪A2∪A3∪…) = P(A1) + P(A2) + …, para cualquier sucesión finita o infinita de
eventos A1, A2, A3, … mutuamente excluyentes.

7. SUCESOS MUTUAMENTE EXCLUYENTES Y NO MUTUAMENTE EXCLUYENTES.

Dos eventos A y B son mutuamente excluyentes si no pueden presentarse


simultáneamente, es decir, al ocurrir uno imposibilita la ocurrencia del otro; en caso
contrario se dirá que son no mutuamente excluyentes, o sea que la ocurrencia de uno no
imposibilita la ocurrencia del otro.

Para eventos mutuamente excluyentes tendremos:


A∪B=AóB=A+B

Para eventos no mutuamente excluyentes tendremos:


A ∪ B = A + B - AB

SUCESOS INDEPENDIENTES Y SUCESOS DEPENDIENTES.

Se dice que dos sucesos A y B son independientes cuando la ausencia o presencia de A


es independiente de la presencia o ausencia de B. En caso contrario se dirá que son
dependientes.

De esta propiedad vemos que:

A ∩ B = (A) (B) para eventos independientes


A ∩ B = (A) (B/A) para eventos dependientes donde / significa dado.

66
Estadística

8. Dados los eventos A y B los cuales tienen probabilidades P(A) y P(B)


respectivamente. La probabilidad del evento unión de A y de B para eventos no
mutuamente excluyentes será:
P(A ∪ B) = P(A + B) = P(A) + P(B) - P(A ∩ B ) = P(A) + P(B) - P(AB)

Y para eventos mutuamente excluyentes:


P(A ∪ B) = P(A) + P(B)

Puesto que A ∩ B = AB = 0 (ya que A y B son mutuamente excluyentes).

9. REGLA DEL PRODUCTO DE PROBABILIDADES (PROBABILIDAD


CONDICIONAL).

Sea A y B dos eventos, la probabilidad del evento intersección para eventos


independientes y dependientes será:

P(A ∩ B) = P(A) P(B) para eventos independientes


P(A ∩ B) = P(A) P(B/A) para eventos dependientes

Para mostrar de dónde proviene el inciso (b), es necesario suponer un espacio de


eventos S al cual pertenecen todos los eventos de B y al cual a su vez pertenecen los
eventos de A, donde B es posterior a la ocurrencia de A.

Si en m eventos simples se presentan los eventos de B la probabilidad de que ocurra el


evento A ∩ B, puesto que A es posterior a la ocurrencia de B en el espacio de eventos S,
será:

Número de veces que ocurra A∩B


Número de veces que ocurra B

Que representamos por P(A/B) y que recibe el nombre de probabilidad de A dado B. Si


X es el número de veces que se presenta el suceso A∩B, tendremos:

67
Ciencias Políticas y Administración Pública

Número de veces (A∩B) X


P(A/B) = =
Número de veces B m

De acuerdo con la definición clásica de probabilidad es:

Números de casos favorables de (A ∩ B)


Número de casos posibles
P(A/B) = P(A∩B) =
P (B) Números de casos favorables de B
Número de casos posibles de B

Esta fórmula representa la probabilidad condicional, debido a que la aparición de los


sucesos A viene restringida a lo que haya sucedido previamente en B, por lo que queda:

P (A ∩ B) = P(B) x P(A/B)

Si ahora B está sujeto a lo que suceda en A, la expresión quedaría:

P (A ∩ B) = P(A) x P(B/A)

Puesto que A ∩ B = B ∩ A

O sea P(A) P(B/A) = P(B) P(A/B)

Lo anterior origina el teorema de las probabilidades compuestas:

TEOREMA: Si la verificación de un evento supone la ocurrencia de 2 eventos A y B,


su probabilidad es igual al producto de la probabilidad de ocurrencia de A, por la
probabilidad de que B ocurra cuando A se ha presentado.

10. Sean A1, A2,…, Ak eventos mutuamente excluyentes, tales que A1 ∪ A2, ∪,…, Ak =
S (espacio total de eventos). Por otra parte, sea X un evento arbitrario de S.
Entonces:
P(X) = P(A1) P(X/A1) + P(A2) P(X/A2) +… P(Ak) P(X/Ak)

68
Estadística

11. Sea A1, A2, …, Ak un espacio completo de eventos, y sea X un evento cualquiera de
S, entonces:
P(Ai) P(X/Ai)
P(Ai/X) =
P(Ai) P(X/Ai) +...+ P(Ak) P(X/Ak)

Unidad 3. 

1. El conjunto de todos los posibles eventos resultantes de la realización de un


experimento aleatorio nos produce el espacio completo de eventos, también llamado
espacio muestral. De esta forma, cada fenómeno aleatorio genera su espacio
completo de eventos, el cual puede estar constituido por un conjunto de eventos
infinito o bien finito, dependiendo del tipo de evento generado por la
experimentación.

Si el espacio completo de eventos S lo relacionamos con el sistema de números


reales de acuerdo a cierta regla de asociación, definiremos como variable aleatoria a este
proceso funcional, es decir, es el valor de la función asociado a cada evento del espacio
completo con un número real, del conjunto de los reales. Entonces la serie de números
reales asociados a los eventos aleatorios de un espacio muestral es lo que llamamos la
variable aleatoria. Desde luego, existe una condición especial del evento que define el valor
del número real asignado. Denotemos a la variable aleatoria por X(w).

La regla de asociación mencionada, es sencillamente la que nos da el fenómeno


aleatorio a estudiar, puesto que, este fenómeno produce su propio espacio de eventos.

Esta regla de asociación o función es uno a uno, es decir, le asocia a una variable
aleatoria solamente un valor real del conjunto de números reales (R).

Dependiendo del espacio completo de eventos, tendremos que la serie de números


reales puede ser finita o infinita, la cual llamaremos el intervalo de definición de la variable
aleatoria X(w). De tal forma que este intervalo de definición puede ser continuo o
discontinuo o de ambas formas en un cierto intervalo.

69
Ciencias Políticas y Administración Pública

Entonces, la variable aleatoria describe en valores reales el comportamiento de los


eventos resultantes de un fenómeno aleatorio.

2. Una variable aleatoria es discreta cuando la función asocia un conjunto numerable


de valores tomados de la recta de los reales para asociarlos al espacio muestral, de
tal forma que entre uno y otro valor posible sucesivo no haya valores intermedios,
es decir, medie una cierta distancia.

La discreción de la variable aleatoria, proviene del fenómeno aleatorio a tratar, por lo


que dicha variable también puede ser infinita siempre y cuando sus valores sean
numerables.

3. En general todos los fenómenos que se presentan tanto en las ciencias sociales como
en las exactas son de carácter continuo, puesto que están relacionados con
mediciones del comportamiento intrínseco del fenómeno aleatorio, como por
ejemplo, la medición de las estaturas de los estudiantes; la medición del diámetro de
los anillos de un motor; el ingreso de la población económicamente activa; el precio
de cierto producto en el mercado.

Esto quiere decir que, tanto la continuidad como la discreción de la variable aleatoria,
están determinadas por el tipo de fenómeno aleatorio a estudiar, ya que depende del
conjunto de valores reales que le asignemos.
Así, la variable aleatoria continua se define como la función que asume un conjunto de
valores no numerables (infinito) del sistema de números reales, donde entre uno y otro
valor sucesivo que puede tomar la variable aleatoria hay un conjunto infinito de valores
intermedios, es decir, la distancia entre uno y otro valor sucesivo es tan pequeña que tiende
a cero.

4. La variable aleatoria asigna valores reales a los eventos de un fenómeno aleatorio, y


también, este fenómeno tiene asociado un espacio completo de eventos, es decir,
una distribución de eventos o bien una distribución de valores de la variable
aleatoria.

70
Estadístiica

¿P
Por qué distriibución?
Poorque existee un rango de valores que puedee tomar, y no solameente un valoor,
conseccuentementee, las probabbilidades quee se les pueden asignar a cada valoor que tome la
variabble aleatoria o a un conjuunto de ellass, nos produce una distriibución de probabilidade
p es,
cuyo intervalo
i de definición es
e [0, 1], porrque la probbabilidad estáá normalizadda, es decir, la
probabbilidad de occurrencia dee cualquier evento
e de unn fenómeno aleatorio es 1. Asimism
mo,
la probbabilidad dee no-ocurrenncia de cualqquier eventoo de un fenóómeno aleatoorio es 0. Así,
A
los inntervalos de definición de la variiable aleatorria pueden ser cerradoos, abiertos o
semiceerrados y ten
nemos que:

P( Ω) = P(-∞ < X(w)


X < ∞) = P(-∞, ∞) = 1

Similarmen
nte para un evento
e falso o vacío:

P(Ω) = P(- ∞ > X(w) > ∞) = 0

buciones dee probabiliddad por estar definidass precisameente sobre las


Las distrib l
variabbles aleatoriaas tienen la característicca de ser disscretas o conntinuas, de acuerdo
a con el
compoortamiento de
d la variablee aleatoria.

Así, si la variable
v aleaatoria tiene un
u comportam
miento discrreto, la probbabilidad de un
eventoo o conjunto de eventos estará dada por la probaabilidad de éste, o bien, por
p la suma de
probabbilidades dee los eventoos del conjuunto, las cuuales serán discretas, siimbólicamennte
tendreemos:

P(x) para la probabilidadd de un evennto.

En forma parecida podemos encoontrar la probabilidad dee que la varriable aleatorria


continnua tome valo
ores en un inntervalo [a, b].
b Así, tenemos:

71
Cienciias Políticass y Administtración Públlica

P(a ≤ x ≤ b) =

donde f(x) es una función de densidad


d de probabilidad
p d.

5. Como unaa variable aleatoria definne una distrribución de probabilidad


p des, de la cuual
podemos encontrar
e la probabilidad
p d de a lo más λ eventos, donde λ es algún valor de
la variablee aleatoria, denominarem
d mos a esta nueva
n funcióón, función de
d distribuciión
de probabiilidad, para distinguirla de otras, puuesto que es una funciónn acumulativva.
Es decir, siimbólicamennte tenemos:

P(-∞, λ)
λ = P(-∞ < x(w) ≤ λ)) = P(x(w) ≤ λ)

Dada la existencia dee variables aleatorias


a diiscretas ó continuas,
c teenemos que la
funcióón de distribu
ución de proobabilidades para una disstribución diiscreta es:

P(x ≤ λ)
λ = F(λ) =

En una distribución dee tipo continuuo:

P(x ≤ λ)) = F(λ) =

donde (x) es la fu
unción de deensidad de prrobabilidad de la variablle aleatoria x(w).
x

La función
n de distribuución es unaa función accumulativa, puesto
p que λ puede tom
mar
cualquuier valor dee R, y de ésta manera representaráá la probabilidad de cuaalquier evennto
desde -∞ hasta ell valor λ incclusive, es decir,
d acumuula la probabbilidad de loos eventos del
d
espaciio de eventoss.

72
Estadístiica

Las propieedades que tiiene dicha fuunción son laas siguientess:

a) 0 ≤ F(x) ≤ 1 (propiedad dee normalizaciión a la unidaad)

b) F (-∞) = 0 (propiedad dee que no aparrezca algún evvento)

F (∞) = 1 (propiedad dee que aparezccan todos los eventos)

c) F(x) ≤ F(y) (propiedad dee ser función monótona creeciente)


Si x ≤ y

d) lim F(x) = F(x)


F (continua porr la derecha)
+
y→ x

6. La idea dee función de


d densidad es aquella en la que cada
c valor de la variabble
aleatoria tiene
t asignadda una probbabilidad dee ocurrenciaa y tiene vaariantes en su
significado
o para variabbles aleatoriaas discretas o continuas.

En el caso
c discreto
o la podemos definir de la siguiente manera:

DE N: Sea x una variable aleatoria discreeta. Entonces la función f definida por


EFINICIÓN p
f(x) = P {X = x} es
e denominadda función de
d densidad discreta
d de x.
x
En el caso
c continu
uo se define:

DEFINICIIÓN: Una fuunción de deensidad paraa una variabble aleatoria continua x es


una fuunción f que posee las sigguientes propiedades:

a)

(x) 0

b)

c)

donde a y b son cu
ualquiera dos valores de x que satisffacen a < b.

73
Cienciias Políticass y Administtración Públlica

En caso de
d variables aleatoriass discretas también se deben cum
mplir las trres
propieedades ya señaladas paraa el caso conntinuo, con las siguientees modificacciones para los
l
incisos b) y c):

b)

c)

Para tooda a < b

7. La distribución Binoomial es unn miembro de la famiilia Bernoulli (es aquella


distribució
ón cuyo espacio
e de eventos está
e compuuesto por dos eventtos
complemen
ntarios, dondde a uno de ellos lo desiignamos porr el evento éxito,
é y el otrro,
por el even
nto fracaso: lo cual implica que en la realizacióón de un solo experimennto
se podrá presentar
p unno u otro, pero
p no am
mbos. Si porr otra partee, previamennte
conocemoss la probabilidad de quee ocurra el evento
e éxitoo y lo denotaamos por P, la
probabilidaad del evennto fracaso estará
e mplemento a la unidad, es
dada por el com
decir, 1 - p,
p que la deenotaremos por
p q. De essta forma: 1 - p = q; o bien
b p+q=l
puesto quee aquí se preesenta una dicotomía
d enn las alternaativas de realización de un
mente dos característiccas
fenómeno aleatorio, es decir, se presenttan únicam
ntarias.
complemen

Enn los fenómeenos binomiales se denoomina éxito a la ocurrenncia de uno de los eventtos
de la dicotomía,
d y fracaso a la ocurrencia del
d evento contrario.

Si tenemos n eventos
e mueestrados (noss referimos a una muestrra de tamañoo n extraída de
una pooblación “m
muy grande””) de los cuaales k preseentan cierta característicca y n-k no la

presenntan, entoncees habrá formas de encontrar


e loss k eventos entre
e los n muestrados.
m

74
Estadístiica

Loo que signiffica que si pk es la prrobabilidad de obtener k elementoos con cierttas


caracteerísticas, pu
uesto que cada
c evento es indepenndiente de los
l demás, por tanto las
l
probabbilidades p se multipliccarán. Y si (1 - p)n-k es
e la probabbilidad de obbtener (n - k)
elemenntos sin dicha caractterística, supponiendo similarmente
s e independeencia e iguual
probabbilidad entree los (n - k)
k eventos; tendremos que
q de una muestra dee tamaño n la
btener k con cierta caraccterística es:
probabbilidad de ob
!
P x – k; n = (11 – p)n-k = = =
! !

donde: x = 0, 1, 2,, 3,…, n

8. Esta distrib
bución perteenece a la familia
fa Bernooulli, porquee aquí tambbién existe una
u
dicotomía o policotom n se considdera a cada evento con la
mía, exceptoo que aquí no
misma pro
obabilidad dee ocurrenciaa, es decir, al
a obtener unna muestra la
l hacemos sin
s
reemplazarr nuevamennte el elemeento muestreeado. Por loo que la prrobabilidad de
ocurrenciaa del siguiennte elemento en muestreear se ve conndicionada a la extracciión
anterior, o sea se trata de eventos dependiente
d s, a diferenccia de lo quee ocurría en las
l
distribucio
ones binomiaal o multinom
mial, donde cada evento era indepenndiente.

Si tenemos N objetos, de los cuales M tienen cierrta característica A, N - M no tendrrán


dicha característicca (A), vemoos que la proobabilidad de
d ocurrencia de que el primer evennto
presennte la caracteerística A seerá y la prrobabilidad de
d ocurrenciia de que el primer evennto

sea A (sin caracterrística) será = . La probbabilidad de que el segunndo evento sea


s

A seráá: y de que
q el segunndo sea A serrá: . Si extraem
mos una muesstra de tamaaño

n de la
l población
n de N y see desea conoocer la probbabilidad de que k de ellos
e tengan la
caracteerística A y de que n - k no la tengann, tendremoss que:

Loos casos favo


orables de seeleccionar k objetos con característicca A de un tootal de M serrá:

75
Cienciias Políticass y Administtración Públlica

y el reesto de la mu
uestra (n-k), serán aquelllos de tipo Ā y podrán seer seleccionaados de:

Formas differentes. Asíí los casos favorables


f dee seleccionarr n objetos de
d los cualess k
de elloos son de claase A será:

Y los casos posiblles de selecccionar una muestra


m de taamaño n de la poblaciónn de tamaño N
serán:

De lo anterior, podemoos decir quee la probabillidad de seleeccionar k obbjetos de claase


A en una
u muestra de n será, dee acuerdo a la
l definiciónn clásica de probabilidad
p d:
  ú      
P = (X = K) = =
ú      

donde: x = 0, 1, 2, …., k, ….,


… M, que es la funcióón de densiddad de probbabilidad de la
distribbución hiperg
geométrica.

9. La distribu
ución de Poisson
P es utilizada
u paara determinnar las probbabilidades de
ocurrenciaa de eventoss poco probaables o alteernativamentte, que muyy posiblemennte
ocurran, essto es, cuanddo p es un vaalor cercano a cero y q es
e muy cercaano a la uniddad
y con una muestra
m de tamaño
t n graande (n>50)..

Coonsideremos la función de
d densidad binomial, quue como sabemos tiene la
l forma:

….       ….
F(x) = =
! !

Si mulltiplicamos y dividimos por nx la exppresión anterior queda:

76
Estadístiica


….
F(x)) = (1-p)qn--x
  !

de aquuí reconocem
mos que en laa distribucióón binomial np
n = μ = λ. Entonces:
E

f x    n‐x  

 1  1‐ 1/n
1    1 ‐2
2/n  …..  1 ––  x – 1 /n   λx / x!   1 – p n / 1 – p
p x 

Por otrro lado:

1 – p n         

Al enccontrar el lím
mite de la succesión:
Z 1/z
(1 + Z) cuuando z →0, tenemos que:

entoncces si z = -p tenemos:

λ
  λ 

mite cuando n → ∞ de la expresión:


Ahoraa bien, el lím

     ….  
es:  

77
Ciencias Políticas y Administración Pública

por lo que cuando n → ∞, p → 0 y np permanece constante, tenemos:

λ   λ
f x        donde x = 0, 1, 2, ….
!

que es la función de densidad de la distribución de Poisson y se puede enunciar en el


siguiente teorema:

“Si la probabilidad de un suceso en un solo evento p tiende a cero, y además el


número de eventos n es infinito de manera tal que la media μ= np permanezca constante,
entonces la distribución binomial se acerca de la distribución Poisson con media λ”.

10. La distribución Normal o Gaussiana es una distribución importante en el sentido de


que matemáticamente es un modelo de comportamiento común, y que muy
frecuentemente se encuentra en los fenómenos sociales, económicos, físicos, etc. Lo
característico de este tipo de distribución es debida a que su función de densidad, es
una función simétrica, esto es, que la media, la mediana y la moda son iguales, es
decir, coinciden tomando el mismo valor.

La distribución normal de probabilidad es una distribución de probabilidad continua


tanto simétrica como mesocúrtica. La curva de probabilidad que representa a la distribución
normal de probabilidad tiene forma de campana.

La distribución normal de probabilidad es importante para la inferencia estadística por


tres razones:

78
Estadístiica

• Se sabe que las medidas


m obteenidas en muuchos proceesos aleatorioos siguen essta
distribu
ución.
• Las pro
obabilidadess normales suelen
s serviir para aproxximar otras distribucionnes
de prob
babilidad, coomo las distrribuciones biinomial y dee Poisson.
• Las distribucioness de estadíssticas como la media muestral
m y la proporciión
muestral tienen diistribución normal
n cuanndo el tamañño de muesstra es grandde,
indepen
ndientementte de la distriibución de laa población de origen.

Como sucede en todaas las distribbuciones conntinuas de probabilidad


p d, un valor de
probabbilidad de un
na variable aleatoria continua sólo puede deterrminarse parra un intervaalo
de vallores. La alttura de la fuunción de deensidad, o cuurva de probbabilidad, de una variabble
con diistribución normal
n está dada
d por:

x     

Dondee:
μ es la mediaa de la distribución
σ la varianzaa de la distribbución

Podemos notar
n de la gráfica
g que la
l curva se aproxima
a asiintóticamentte al eje de las
l
x, haccia ambos laados de la media
m μ, lo que
q significa que los vaalores muy alejados de la
mediaa, ya sea a la izquierda o a la derechaa, tienen pocca probabiliddad de realizzarse, debidoo a
que el área bajo laa curva es cada vez menoor.

79
Cienciias Políticass y Administtración Públlica

Además, la desviaciónn típica σ medida


m a am
mbos lados de
d μ nos da los puntos de
inflexiión de la cu
urva, lo que nos permitte obtener una
u medida del ancho de
d la curva, es
decir, de la magn
nitud de desviación de los
l valores de la variabble aleatoria en torno a la
mediaa. En forma práctica,
p parra simplificaar el cálculoo de la probaabilidad paraa cada ocasiión
en quee se tenga un
na distribuciión normal, se
s realiza unn cambio de variable de x por z conn el
objetoo de tener un mún de valores y que se pueda aplicaar a cualquieer caso en que
na tabla com q
se tengga una distriibución norm
mal.

Entoncces:

Z     

(Esta es
e la distribu
ución normall de probabilidad con μ = 0 y σ = l.

Unida
ad 4. 

na variable aleatoria coon media μ y varianza σ2, entoncees, la variabble


1. “Sea X un
aleatoria

Z   
tiene una
u distribucción que se aproxima
a a laa distribucióón normal esstándar cuanddo n → ∞”.

Desde un punto
p de vistta práctico, este
e teoremaa es excesivaamente impoortante, porqque
permitte el uso de la curva noormal cuandoo la variablee X tiene unna distribuciión que difieere
considderablementee de la norrmal. Desdee luego, la mayoría dee las distribuciones de X
difiereen de la norrmal debidoo al tamaño de n, el cuual, cuando n es grandde garantiza la
aproxiimación norrmal de X. Experimento
E os de muestrreo han mosstrado que para
p n > 50 la
forma de f(x) (fun
nción de dennsidad de prrobabilidad)) influye muuy poco sobrre la forma en
que see distribuye X para algunna f(x).

80
Estadístiica

uiente figura,, por ejempllo, se muesttra la distribbución empírrica de  paara


En la sigu
100 muestras
m de tamaño
t n = 10, donde X tiene una distribuciónn uniforme que
q viene daada
por f(xx) = 1 con X ε [0, 1]. Laa convergenccia hacia la normal
n es muuy rápida aqquí, aunque n =
10 no es una muesstra grande.

Si X1 = 1 ó 0 represennta la ocurrenncia de éxitoo o fracaso en


e el i-ésimoo evento y si X
denotaa el número total
t de suceesos en n eveentos, entoncces:

    X1  …...  Xn      

Puuesto que, la media y la varianza


v de Xi son dadass por p y pq respectivam
mente, tenem
mos
que la variable Z del
d teorema de
d límite cenntral es:

 μ √  √  
    
Z            
σ    
 

2. Generalmeente estos parámetros


p (valores esstadísticos de
d la poblaación) no son
conocidos o bien no puueden ser coonocidos, poor lo que se hace necesaario estimarloos,
btener un vaalor o conjunnto de valorees que se approximen lo más posible al
es decir, ob
valor verdaadero del paarámetro; estta estimaciónn se hace a partir
p de una muestra x1, x2
,...., xn de valores extrraídos de dicha poblacióón, cuya disstribución dee probabiliddad
regularmen
nte es descoonocida, peroo nos podem mar a ella porr F(x ; θ), que
mos aproxim q
es la funcción de disstribución de
d probabiliidad teóricaa con un parámetro
p fi
fijo
do θ. A estee parámetro desconocido
desconocid d o θ es al quee pretendemoos conocer por
p
l estimaciónn. Hemos dee tener claro que cualquier estimadorr puntual es un
medio de la
número qu metro poblacional descoonocido θ, sin decir naada
ue se aproxiima al parám
sobre qué tan
t próximo está el estim
mador Ô de dicho
d metro θ.
parám

81
Ciencias Políticas y Administración Pública

La estimación de parámetros de la población es un importante problema de la


inferencia estadística, en la que a partir de los estadísticos muéstrales (tales como la media,
varianza, proporción de la muestra) se estiman los correspondientes parámetros de la
población (es decir, media, varianza, proporción de la población, etc.). Entonces, tenemos
que la teoría de la estimación se divide en dos campos esenciales, la teoría de la estimación
de punto y la teoría de la estimación de intervalo.

Los valores muéstrales son utilizados para formar una relación funcional Ô =
f(x1,....,xn ) que no contiene ningún valor desconocido. Esta relación Ô es denominada
estimador de θ.

Como las xi son variables aleatorias que tienen la distribución F(x ; 0), el estimador
Ô es una variable aleatoria cuya distribución dependerá por lo general de θ. Observe que
para cada muestra de tamaño n que sea obtenida, puede calcularse un valor de Ô, este valor
se conoce como estimación de θ: dicho de otra forma, una estimación es un valor
observado de la variable aleatoria Ô = f(x1 ,....,xn).

Cabe señalar que el parámetro θ es estimado por una cantidad única, razón por la
cual este tipo de estimación es conocida como estimación puntual.

Algo deseable de cualquier estimador Ô es que con alta probabilidad sus


estimaciones sean muy cercanas al verdadero parámetro poblacional θ, para esto es
necesario que la distribución de Ô esté bastante concentrada alrededor de θ.

3. Se dice que el estimador Ô = f(x1,....,xn ) es insesgado si su promedio es igual a θ,


es decir, si cumple:
E(Ô) = θ

4. Una propiedad deseable de todo estimador, es que a medida que el tamaño de la


muestra aumente, la dispersión alrededor del parámetro θ disminuya, esto es, para
cualquier número ε arbitrariamente pequeño:

82
Estadística

Lim p(| Ô – θ | < ε) = 1


N→∞

A todo estimador que cumpla con esta propiedad se le conoce como estimador
consistente. Así, un estimador Ô = f(x1 ,....,xn) es consistente si su varianza E(Ô - θ)2,
tiende a tomar el valor cero cuando el tamaño de la muestra n tiende a tomar valores muy
grandes, es decir, tiende a infinito.

5. Otra propiedad de los estimadores es la eficiencia, decimos que si tenemos dos


estimadores Ô1 y Ô2, donde ambos son insesgados, el seleccionar de entre ellos “al
mejor” sería escoger al estimador más eficiente, lo cual se determina si la varianza
de éste σ2 Ô1 es menor que la del otro σ2 Ô2. Por lo que tenemos que Ô1 es más
eficiente que Ô2 si:

E(Ô1-θ)2 < E(Ô2-θ)2

La eficiencia relativa de Ô1 con respecto a Ô2 se encuentra a partir de la razón:

E(Ô1 - θ)2
E(Ô2 - θ)2

Si esta razón es mayor que 1, entonces Ô2 es más eficiente que Ô1 y en caso


contrario (menor que uno), se dice que Ô1 es más eficiente que Ô2.

6. Debido a que cualquier información que sea recabada implica un costo, tanto
monetario como de tiempo, es importante no desperdiciar información, es por esto
que existen los estimadores que en su cálculo incluyen toda la información
disponible: los estimadores suficientes.

Ejemplo: La media es un estimador suficiente para la media poblacional μ, a diferencia


de la mediana y la moda en cuyo cálculo no interviene toda la información disponible.

83
Ciencias Políticas y Administración Pública

7. Todo estimador puntual Ô no es más que una aproximación al parámetro


desconocido θ, debido a este desconocimiento no tenemos información precisa de
la proximidad entre ambos. Esta falta de información da lugar a la necesidad de que
una estimación se acompañe simultáneamente con un enunciado de la probabilidad
de esa estimación.

Un estimador de intervalo es aquel estimador Ô que toma un conjunto de valores


sucesivos entre dos puntos I y S, tal que el intervalo contiene al parámetro poblacional θ
con una probabilidad previamente determinada. Es decir, debido al desconocimiento de θ
nunca puede ser conocido el valor de la distancia | Ô - θ |, pero afortunadamente sí se puede
dar una medida en términos probabilísticos de la proximidad de Ô con respecto a θ.

8. En 1937 el profesor J. Neyman propuso un método de estimación, conocido como


intervalos de confianza, el cual permite dar aproximaciones de θ en la forma I < θ <
S junto con un valor de la probabilidad asociado a este intervalo, donde I y S se
obtienen a partir de una muestra.

Así, considérese una muestra aleatoria de tamaño n extraída de una población normal de
varianza σ2 y supóngase que el estadístico muestral es Ô. El problema consiste en estimar el
parámetro θ de la población utilizando un intervalo de valores de la variable aleatoria X.
Puesto que σ2 es la varianza de la población, tenemos que σ2Ô es la varianza de la
distribución muestral del estimador Ô. Aunque θ es un valor desconocido, se sabe por la
teoría del muestreo que Ô es una variable aleatoria con distribución de probabilidad cuya
media y varianza están dadas por μÔ y σ2 Ô.

9. Supongamos que Ô ≡ , aunque el valor de μ es desconocido sabemos que  es una


variable aleatoria cuya distribución de probabilidad (distribución muestral de )
tendrá por media y varianza μ y σ2 .

Además, por el teorema central del límite,  está distribuida normalmente con media μ

y varianza de tal forma que para encontrar el valor de a en la relación de probabilidad

p(-a < X < a) = β se estandariza, quedando:

84
Estadística

–       
p      
σ  σ  σ 

sustituyendo Z=
σ 
resulta:
 
p(-Z < < Z) = β
σ 
de donde:
p( – Z σ  < μ <  + Z σ ) = β

observa que el intervalo  + Z σ  cubre la media poblacional μ con probabilidad β, lo cual


puede ser interpretado de la siguiente forma: Al ser el intervalo mencionado una variable
aleatoria que cambia para cada muestra de tamaño n extraída de la población, entonces el β
% de dichos intervalos contiene a la media.

10. Supongamos que x1, x2,….., xn son los valores obtenidos de una muestra aleatoria
de tamaño n extraída de una población cuya media μ es desconocida pero cuya
varianza σ2 se supone conocida, se distinguirán dos casos:

a) La población está normalmente distribuida.


b) La muestra es grande (n ≥ 30) y la media puede considerarse normalmente

distribuida con media μ y varianza σ2  =

En ambos casos la probabilidad de que la dispersión de |  - μ | sea menor o igual a zσ


será igual a 1 - α, que es el intervalo de confianza.

Si la varianza de la población no es conocida, comúnmente se estima calculando la


varianza S2 de la muestra, con lo cual los intervalos de confianza para la media μ pueden
expresarse:

85
Cienciias Políticass y Administtración Públlica

-Z  μ   + Z

11. Si el estim
mador Ô es laa proporciónn de éxitos enn una muestrra de tamañoo n extraída de
una poblaación binom
mial en la que
q p es laa proporciónn de éxitos (es decir, la
probabilidaad de éxito)), los límitess de confiannza para p vienen
v dadoss por p ± zσ
σp,
donde p es
e la proporcción de éxittos en la muestra
m de taamaño n. Coon los valorres
obtenidos de
d σp, se tiene que los líímites de connfianza paraa la proporcióón poblacionnal
son dados por:

p z =p z

Para el casso de muestrras en una población


p innfinita, o conn reemplazam
miento en una
u
poblacción finita, para
p muestras de tamaño n >30, y por:

p z =p z

si el muestreo
m es sin
s reemplazo de una pobblación finita de tamaño N.

Para calcu
ularse estos límites
l de coonfianza pueede utilizarsse el estimaddor muestrall p
para laa proporción
n poblacionaal p, que genneralmente da
d una aproxximación sattisfactoria paara
do más exaacto para obbtener estos límites de confianza a un nivel de
n >300. Un métod
confiaanza determin
nado por z, es
e transform
mar la proporrción p a unidades tipificcadas.

Z=

86
Estadística

donde despejando p, queda:

       
p=
 

Para poblaciones que tienen una distribución binomial se pueden encontrar


intervalos de confianza para la media de la población, o sea para la proporción de éxitos en
que no se conoce ésta por medio de utilizar la proporción de éxitos de una muestra p, así los
límites de confianza para la proporción p en la población se obtienen a partir de la relación:

p ± zασp

donde p es la proporción en la muestra extraída.

Como estamos utilizando la tabla normal de áreas, es decir, aproximando la


distribución binomial a la normal, en ambos casos se requiere de muestras “grandes”, o sea,
mayores de 25 observaciones.

Entonces, de manera general el intervalo para proporciones es:

p(p – zαp p p + zαp) = 1 - α

12. El concepto de intervalo de confianza se utiliza también para la determinación del


tamaño de la muestra. Por dos razones es importante estimar el tamaño de la
muestra n antes de hacer una investigación: la primera, consiste en que si se
selecciona una muestra muy pequeña, la precisión del intervalo puede ser muy baja
por lo tanto, éste carecerá de utilidad, implicando un aumento posterior de los
costos al aumentar la muestra; la segunda razón, es que si se trabaja con una
muestra grande se están desperdiciando recursos económicos y de tiempo.

87
Ciencias Políticas y Administración Pública

Una pregunta frecuente que se plantea el estadígrafo es ¿cuántos casos necesito? La


respuesta depende, por supuesto, de lo que se pretenda hacer con los resultados de la
muestra. Por lo regular, lo que hemos de hacer es remontarnos hacia atrás, a partir de los
datos que esperamos obtener, para poder determinar el tamaño desconocido de la muestra.
Una vez que hemos decidido el intervalo de confianza deseado, podemos poner los valores
correspondientes en la fórmula y decidir la amplitud de dicho intervalo. Esto significa que
para poder resolver nuestra fórmula con respecto al tamaño de la muestra n, hemos de
conocer las demás cantidades de la fórmula, para que ésta se convierta en un sencillo
problema algebraico.

Antes de poder dar respuesta a la cuestión del tamaño de la muestra, necesitamos


obtener los siguientes elementos de información:

1) El nivel de confianza a utilizar


2) el grado de exactitud con que deseamos apreciar el parámetro y,
3) alguna estimación razonable de los valores de cualquiera de los parámetros que
puedan aparecer en la fórmula.

Estos elementos de información se requieren debido a que:

1) Es necesario establecer el grado de confianza de los valores puesto que inciden en el


tamaño de la muestra.
2) El grado de precisión de los resultados proporcionados por la muestra para
establecer más o menos cuánta aproximación se desea.
3) Se requiere conocer la tendencia de los estadísticos de acuerdo con el
comportamiento histórico de dichos parámetros.

88
Estadística

Bibliografía general

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.

HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales.


México, FCPyS-UNAM (Serie Estudios, 13), 1970.

MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo


Editorial Iberoamericano, 1990.

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.

SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

89
APUNTES 

"
DATOS DEL TUTOR
NOMBRE 

CORREO ELECTRÓNICO

DIRECTORIO DEL GRUPO


NOMBRE 
} CORREO ELECTRÓNICO 
 
NOMBRE 
} CORREO ELECTRÓNICO 
 

FECHAS DE TUTORÍA

n s
o t
p u
q v
r w

You might also like