You are on page 1of 208

 

                                  

 
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

ESTADISTICA I –CÓD. 248‐

PROFESOR: AIDA BEATRIZ CASTEGNARO

SEDE PATERNAL ‐ F.C.E. de la U.B.A.

CURSO 248‐38 LU. MI.Y JU 09 a 11 hs ‐ AULA :

CURSO 248‐40 LU. MI.Y JU 11 a 13 hs ‐ AULA:

CONTENIDOS DE ESTA GUÍA

1. CONTENIDOS DEL CURSO

2. GUIA PRÁCTICA Y ORIENTACIONES TEÓRICAS

3. ETICA EN LA ESTADISTICA

4. ESTADISTICA CON EXCEL

5. ALFABETO GRIEGO

6. NORMAS IRAM

7. TABLAS BÁSICAS ESTADÍSTICAS PARA EL CURSO

8. PROGRAMA OFICIAL DE LA ASIGNATURA

9. BIBLIOGRAFIA UTILIZADA

FECHA DE LOS EXAMENES


1. PARCIALES: 1°Parcial:  2° Parcial:

2. RECUPERATORIO:

3. FINAL:

DATOS DEL ALUMNO: N° Reg: __________E‐MAIL:___________________________@_______.____Cel.:__________


0
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CRONOGRAMA DEL CURSO: Ju.14/03/19 al Ju.04/07/19


 
Semana   Fecha 
PROPUESTA PARA EL PRIMER CUATRIMESTRE 2019 – CURSO PRESENCIAL 
PRESENTACION DEL CURSO – MATERIALES Y FECHA DE PARCIALES 
0  Ju. 14/03/19  UN. 5 DEL PROGRAMA: ESTADISTICA DESCRIPTIVA. NIVELES DE MEDICION – 
DATOS SUELTOS 
Lu 18/03/19  E.D.: DATOS AGRUPADOS 
1  MEDIDAS DE ORDEN SUPERIOR – VAR.CODIFICADOS 
Mi.20/03/19 
A.E.D y AUTODIAGNÓSTICO DE E.D. APLICACIONES DE LA DESVIACION ESTANDAR
Ju. 21/03/19 
Lu. 25/03/19  DATOS BIVARIADOS:  COVARIANZA Y CORRELACIÓN 

2  Mi. 27/03/19  PROBABILIDAD 

Ju. 28/03/19  PROBABILIDAD 
Lu. 01/04/19  PROBABILIDAD 
3  Mi. 03/04/19  PROBABILIDAD 
Ju. 04/04/19  TEOREMA DE BAYES ‐ APLICACIONES 
   Lu.  08/04/19  VARIABLES ALEATORIAS 
4  Mi. 10/04/19  DISTRIBUCIONES DE PROBABILIDAD DISCRETA: BERNOULLI ‐BINOMIAL  
   Ju. 11/04/19   
Lu. 15/04/19  HIPERGEOMÉTRICA – POISSON.  
5  Mi. 17/04/19   VARIABLE ALEATORIA CONTINUA 
Ju. 18/04/19  FERIADO 

Lu. 22/04/19  DISTRIBUCION NORMAL. 

Mi. 24/04/19  APROXIMACIONES DE LAS DISTRIBUCIONES DE PROBABILIDAD 
Ju. 25/04/19  AUTODIAGNOSTICO  
Lu. 29/04/19  DISTRIBUCIÓN DEL MUESTREO. PROPIEDADES DE LOS ESTIMADORES 
7  Mi. 01/05/19  FERIADO 
Ju. 02/05/19  PRIMER PARCIAL DE ESTADISTICA 
Lu. 06/05/19  DISTRIBUCIÓN DEL MUESTREO. TEOREMA CENTRAL DEL LÍMITE 

8  Mi. 08/05/19  ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA 
ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA DE LA MEDIA , DE LA 
Ju. 09/05/19 
PROPORCIÓN, DE LA VARIANZA Y DEL DESVIO POBLACIONAL 
Lu. 13/05/19   ESTIMACIÓN PUNTUAL Y POR INTERVALOS de CONFIANZA 
9  Mi. 15/05/19  AUTODIAGNOSTICO 
Ju. 16/05/19  TEST DE HIPOTESIS 
10  Lu. 20/05/19  TEST DE HIPOTESIS 

1
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Mi. 22/05/19  TEST DE HIPOTESIS 
Ju. 23/05/19  TEST DE HIPÓTESIS PARA DOS POBLACIONES 

Lu. 27/05/19  NUMEROS INDICES 
 
11  Mi. 29/05/19 
NUMEROS ÍNDICES  
EL MODELO DE LA REGRESIÓN LINEAL.  DFERENCIAS  CON CORRELACION. 
Ju. 30/05/19 
SUPUESTOS DE LA REGRESIÓN.  
Lu. 03/06/19  TABLA ANOVA 
12  Mi. 05/06/19  REGRESIÓN LINEAL – INTERVALO de CONFIANZA Y DE PREDICCIÓN 
Ju. 06/06/19  REGRESIÓN LINEAL – PRUEBA DE SIGNIFICANCIA “t” y “F” 
Lu. 10/06/19  2° PARCIAL 
13  Mi. 12/06/19  SIN CLASES 
Ju. 13/06/19  NOTAS Y REVISIÓN DEL 2°  PARCIAL  
Lu. 17/06/19  FERIADO 
14  Mi.19/06/19  RECUPERATORIO 
Ju. 20/06/19  FERIADO 
NOTAS Y REVISIÓN DEL RECUPERATORIO.  
Lu. 24/06/19 
  SERIES CRONOLÓGICAS 
15 
Mi. 26/06/19  SERIES CRONOLOGICAS 

Ju. 27/06/19  FINAL  
Lu. 01/07/19  NOTAS Y REVISION DE EXAMENES FINALES 
Mi.03/07/19  NOTA FINAL DEL CURSO: LECTURA 
16 
Ju. 04/07/19  NO HAY CLASES 
 
FECHAS DE REMANENTES 2019
TURNOS FECHAS DE INSCRIPCIÓN FECHA EN QUE
EN EL SISTEMA INTERACTIVO SE RINDE
MARZO 6 y 7 de febrero 2019 18 al 22 de marzo de 2019
MAYO 8 y 9 de mayo de 2019 27 al 31 de mayo de 2019
AGOSTO 6 y7 de agosto de 2019 26 al 30 de agosto de 2019
OCTUBRE 2 y 3 de octubre de 2019 21 al 25 de octubre de 2019
DICIEMBRE 20 y 21 de noviembre de 2019 9 al 13 de diciembre de 2019

2
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

ORGANIZACIÓN DE ESTA GUIA


El cronograma del curso responderá al orden establecido de los temas que se encuentran consignados en
el punto siguiente titulado “CONTENIDO DE NUESTRO CURSO DE ESTADISTICA”
Se han utilizado imágenes referenciales para ir guiando la presente guía con propósitos didácticos,

Contenido Teórico

Actividad: Ejercicios de aplicación

Actividad: Autodiagnóstico

Consideración importante a tener en cuenta

Aspectos de Ética en la estadística

Excel en Estadística

RECOMENDACIONES PARA EL CURSO:

APROBAR O NO APROBAR: Depende de cuánto preparado esté: El paso a paso, es un aspecto


fundamental en el aprendizaje de los temas estadísticos, los que deberán ser comprendidos y asimilados
secuencialmente. No subestime los contenidos iniciales porque permiten comprensiones futuras.
El abordaje didáctico tiene una trayectoria desde lo empírico a lo abstracto para asimilar los temas.
Descubrir la realidad del mundo. Pensar con criterio estadístico tratando cuantitativamente la fuente de
datos que lo rodea. Interpretar las medidas estadísticas es un punto de partida interesante que permite
entender cómo tomar decisiones racionales y también enfrentar de modo científico futuras investigaciones.

NOTA IMPORTANTE
Ciertos contenidos y los ejercicios escogidos de la bibliografía citada en esta guía (ver referencias bibliograficas)
han sido reproducidos en la presente guía. Asimismo, algunos conceptos teóricos han sido extractados de su
libro origen (Kurincic, Gabriela; Loureiro de Pérez, Emma; Levin Balderas, del Valle y otros.)
MI RECONOCIMIENTO
Se agradece toda la colaboración al PROF. ACTUARIO FÉLIX FRANCO quien fuera mi Profesor en
mi época de estudios en la carrera de Ciencias Económicas y quien me brindara colaboración a
posteriori y muchísimo material de lectura y de apoyo didáctico para el curso junto a largas charlas, lo
que me ha dado un crecimiento en la materia, como así también se agradece al Prof. Actuario Juan
Ramón Garnica Hervas por todo su apoyo, confianza, recomendaciones y material brindado.

A todos los alumnos con quienes compartiendo cursos e inquietudes seguimos mejorando esta guía
para beneficios de la comunidad educativa.
Para los profesionales de Ciencias Económicas, La matemática aislada, carece de sentido. Necesitamos
experimentarla en la realidad, justificarla como una necesidad para analizar e interpretar los hechos.
Como matemática aplicada a problemáticas especiales, para comprender la realidad, le damos sentido
a lo que enseñamos y por qué lo enseñamos.

3
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CONTENIDO DE NUESTRO CURSO DE ESTADISTICA


Por razones didácticas se inicia la Un.5 del Programa para generar conocimientos previos básicos.
I - ANALISIS DE DATOS –UNIDAD TEMÀTICA Nro.5 del Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los elementos necesarios para lograr un análisis descriptivo objetivo de los
datos representativos de situaciones que se presentan en las aplicaciones.
Contenidos de prácticas para desarrollar:
 DATOS UNIVARIADOS    
 ETAPAS. RECOLECCIÓN DE DATOS,  
 NIVELES DE MEDICIÓN Y DATOS CATEGORICOS 
 ESTADISTICA DESCRIPTIVA………………………….. 
o DATOS SIN AGRUPAR……………………… 
o DATOS AGRUPADOS…………………...….. 
o PROPIEDADES DE MEDIA Y VARIANZA. 
o A.E.D………………………………………………. 
o MOMENTOS EMPÍRICOS………………….. 
o TRANSFORMAC. DE VAR.DE CÁLCULO… 
 EL USO DE EXCEL EN LA ESTADISTICA………… 
 INTERPRET. Y USOS DE LA DESVIAC‐ TCHEBYCHEV. 
 DATOS CUANTITATIVOS BIVARIADOS    
o COVARIANZA Y CORRELACIÒN…………….   
 AUTODIAGNÓSTICO ….…………………………………… 

II – TEORIA DE LA PROBABILIDAD –UNIDAD TEMÀTICA Nro.1 del Programa Nº 3496/13


Objetivos del Aprendizaje: Introducir la noción de aleatoriedad como resultado del conocimiento incompleto de los fenómenos
fácticos y de la probabilidad como medida de dicha aleatoriedad.
Contenidos de prácticas para desarrollar:
 PROBABILIDAD – ENFOQUES…………………….. 
 ESPACIO MUESTRAL. REGLAS DE CONTEO….  
 CÁLCULO DE PROBABILIDADES…………………. 
 TEOREMA DE BAYES…………………………………. 

III – VARIABLES ALEATORIAS –UNIDAD TEMÀTICA Nro.2 del Programa Nº 3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos que permitan el análisis de las variables involucradas en los
problemas económico, sus características, sus medidas y sus relaciones.
Contenidos de prácticas para desarrollar:
 VARIABLES ALEATORIAS…………………………. 

IV –DISTRIBUCIONES BÁSICAS DE PROBABILIDAD–UNIDAD TEMÀTICA Nro.3 del


Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos que permitan estudiar el comportamiento probabilístico de las
variables relacionadas con la toma de decisiones.
Contenidos de prácticas para desarrollar:
 DISTRIBUCIONES DE PROBABILIDAD…………… 
 BERNOULLI 
 BINOMIAL……………………………………………….. 
 HIPERGEOMETRICA …………………………………. 
 POISSON ………………………………………………… 
 NORMAL…………………………………………………. 
 F.G.M……………………………………………………… 
 APROXIMAC. DE DISCRETAS A DISCRETAS…….. 
 APROXIMAC.DE DISCRETAS A CONTINUAS……. 
 AUTODIAGNÓSTICO………………………………….. 

4
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

V– LOS INTERVALOS DE CONFIABILIDAD –UNIDAD TEMÀTICA Nro.6 del Programa Nº


3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos para comprender las nociones de muestra aleatoria, parámetro
poblacional, estimador puntual, estimación puntual y por intervalo.
Contenidos de prácticas para desarrollar:
  TEOREMA CENTRAL DEL LÍMITE………………….... 
 DISTRIBUCIÓN DEL MUESTREO ……………………  
 ESTIMACIÓN PUNTUAL………………………………… 
 ESTIMACIÓN POR INTERVALOS……………………… 
 AUTODIAGNÓSTICO…………………………………….. 

VI – LOS TESTS DE HIPÓTESIS -UNIDAD TEMÀTICA Nro.7 del Programa Nº 3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para tomar decisiones en condiciones de incertidumbre y
medir los posibles errores asociados con esta situación.
Contenidos de prácticas para desarrollar:
 TEST DE HIPÓTESIS………………………………………………… 
 AUTODIAGNÓSTICO…………………………………………….. 
 
VII – LOS NÚMEROS INDICE DE PRECIOS Y CANTIDADES – UNIDAD TEMÁTICA Nro. 9
del Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para la construcción, el análisis y la utilización de números
índices de precios y cantidades
Contenidos de prácticas para desarrollar:
 NUMEROS INDICES………………………………………….. 
 AUTODIAGNÓSTICO…………………………………………. 

VIII – LA CORRELACIÓN Y LOS M.R.L.S.–UNID. TEMÀTICA Nro.10 del Programa Nº3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos para analizar el grado de relación entre variables observables y.
explicar el comportamiento de una variable a partir de dicha relación con otras variables de su entorno económico.
Contenidos de prácticas para desarrollar:
 DE LA CORRELACIÒN A LA REGRESIÓN……………… 
 MODELO DE REGRESIÓN LINEAL………………………… 
 SUPUESTOS DEL M.R.L.S ……………………………………. 
 CONSTRUCCIÓN DE I.C. e I.de PREDICCIÓN……….. 
 PRUEBAS DE SIGNIFICANCIA…………………………….. 
 AUTODIAGNÓSTICO…………………………………………. 
 ESTADISTICA EN EXCEL…………………………………….. 

IX – LAS SERIES CRONOLÓGICAS –UNIDAD TEMÀTICA Nro.8 del Programa Nº3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para el análisis temporal clásico fundado en la
descomposición de los fenómenos económicos dinámicos en los factores tendencia-ciclo y estacionalidad.
Contenidos de prácticas para desarrollar:
 SERIES CRONOLÓGICAS…………………………..... 
 AUTODIAGNÓSTICO…………………………………….. 
ETICA Y ESTADISTICA
Objetivos del Aprendizaje Reconocer los aspectos éticos en el manejo de la información estadística a partir de las consideraciones
tratadas en cada una de las unidades temáticas.
REFERENCIAS BIBLIOGRÁFICAS………………………………………...
ALFABETO GRIEGO…………………………………………………………...
NORMAS IRAM…………………………………………………………………
TABLAS ESTADÍSTICAS .……………………………………………………...

5
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

¿Qué es esa cosa llamada estadística?


“El sentido común no es tan común”
Voltaire
¿Por qué estudiar estadística? 
Lind,  Marchal,  Mason  en  su  libro  de  Estadística,  expresan  las  tres  razones  que  justifican  estudiar 
Estadística 
 
 Porque los datos se hallan en todas partes 
 Las técnicas estadísticas se utilizan para la toma de decisiones que afectan a nuestras vidas 
 Siempre estará tomando decisiones que involucran datos 

Los datos y la información 
Los datos son valores correspondientes a los atributos o propiedades que identifican y describen a cada 
unidad de análisis, unidad experimental 
 
Pueden ser de dos tipos: cualitativos y cuantitativos cuando además permiten establecer las diferencias 
entre los valores en cantidad y grado. 
 
Este conjunto de datos ya procesados se transforma en información para la toma de decisiones. 
 
La Estadística, en principio permite recolectar los datos de las unidades de análisis, los que a través de un 
proceso se transforman en información y se pueden tomar para decisiones en condic. de incertidumbre.   
 
¿Por qué se recolectan datos?  
Los datos se recolectan por alguna inquietud, o para probar alguna conjetura, o para investigar.  
En general, se dice: que las razones básicas para recolectar los datos pueden ser: 
 satisfacer una curiosidad 
 medir el desempeño de un proceso de producción, relacionado con la evaluación, control de calidad 
 cursos de acción alternativas para ampliar la toma de decisiones 
 satisfacer una curiosidad 
 decisiones sobre causas‐efectos 

Los datos primero se recogen y luego se requiere compilarlos.  
Ej. El INDEC es un organismo que recolecta los datos y constituye una FUENTE PRIMARIA. Por otro lado, 
una FUENTE SECUNDARIA es quien compila dichos datos, que puede estar en cabeza de quien es fuente 
primaria o puede ser otro. 
 
Aplicaciones 
Las aplicaciones concretas de los conocimientos de estadística a las siguientes áreas: 
 Contabilidad y Auditoría: en la selección de muestras para evaluar la razonabilidad de EECC 
con menor coste, tiempo y esfuerzo y por otro lado, la identificación y valoración de riesgos 
y su probabilidad de ocurrencia a los que está sometido la empresa que le pueden generar  
La Estadística que se aplica se denomina “Contabilidad Administrativa” de uso interno y no 
regulado  por  normas  externas,  por  tratarse  de  un  sistema  de  información  que  genera 
reportes  para  la  toma  de  decisiones  económicas  que  cubre  las  necesidades  de  la 
administración cuyas funciones son planificación, control y la toma de decisiones. Permite 
comparar resultados presentes y pasados para planificar y prever los futuros. 
También se ocupa de la Contabilidad financiera   
6
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

 Administración: descripción y características de la población 
 Producción: control de calidad. El corregir a tiempo los contratiempos 
 Economía: en los pronósticos de inflación, tasas de interés y desempleo 
 Finanzas: en los pronósticos, evaluación de proyectos y volatilidad  de los mercados 
 Gubernamental: Censos 
 Mercado:  Investigación  de  mercado.  Búsqueda  de  liderazgo  en  el  mercado  en  cuanto  a 
ventajas competitivas ‐en los costos, en su calidad. Análisis decisorio sobre una expansión 
geográfica 

La investigación. Enfoques. Técnicas y Tipos de Estudios. 

Enfoques de 
Investigación

Cualitativo Cuantitativo Mixto

Es  el  investigador  el  que  está  en  contacto  con  esos  datos  como  fuente  de  su  investigación.  La 
palabra investigación proviene del latín Investigare, en inglés “Research” y refiere a un conjunto de pasos, 
por eso remite a un proceso cuidadoso, sistemático y empírico para conocimiento.  
Como sostiene Sampieri en su libro Metodología de la Investigación han surgido distintas corrientes 
de pensamiento para la búsqueda del conocimiento, polarizándose en dos muy diferenciados enfoques, 
el cualitativo y el cuantitativo. Según el tipo de formación de quien lleva a cabo la investigación utiliza uno 
u  otro  enfoque,  considerando  que  la  investigación  constituye  un  proceso  cuidadoso,  sistemático  y 
empírico en el esfuerzo de generar conocimiento, en el que cada uno de los enfoques tienen sus propias 
características que conduce a un tipo de observaciones, de recolección de datos con distintas técnicas, 
compilación y evaluación del fenómeno objeto de estudio. Aunque,  entre los enfoques emergió un tercer 
tipo: el enfoque mixto como combinación de ambos. En detalle exponemos que: 
 
‐ El  enfoque  cualitativo:  es  aquel  conjunto  de  prácticas  interpretativas,  que  utiliza  los  datos 
recolectados  sin  la  necesidad  de  la  medición  numérica  para  descubrir  o  afinar  preguntas  de 
investigación  en  un  proceso  de  interpretación.  Se  basa  en  un  proceso  inductivo  –al  ir  de  lo 
particular a lo general de explorar y describir‐.  
La  realidad  se  define  a  través  de  las  interpretaciones  de  los  participantes  en  la  investigación 
respecto de sus propias realidades.  
En  este  enfoque  la  reflexión  es  el  puente  que  vincula  la  investigación  con  los  participantes.  Es 
holista y sin pretensión de generalizar pues la recolección de datos es no estandarizada –subjetiva‐ 
 
- El enfoque cuantitativo: es aquel que utiliza los datos recolectados para probar hipótesis, con base 
en la medición numérica y el análisis estadístico para establecer patrones de comportamiento y 
probar teorías. Pretende generalizar los resultados. 
 Esos datos del mundo real se miden (Sampieri & Otros, 2006, pp. 5‐6) y le cabe dos tipos de análisis 
estadístico  a  través  de:la  estadística  descriptiva  que  permite  obtener  información  sobre  las 
características de los datos y,  
o la estadística inferencial que permite poner a prueba las hipótesis del investigador. 
7
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

 
- El  enfoque  mixto:  combinan  ambos  enfoques.  También  denominado  enfoque  integrado 
multimodal. 

Las técnicas en la investigación transitan desde la perspectiva cualitativa a la cuantitativa 
Datos 
Estudio  Datos  Textos. 
secundarios  Trabajo de 
Censo Experimento Observaciona secundarios  Diarios.Histor Ensayos 
de  campo
l estadísticos ias de vida
documentos

 
  INVESTIGACIÓN CUANTITATIVA INVESTIGACIÓN CUALITATIVA 
 
Supuestos en cada uno de los paradigmas de los enfoques cuantitativo y cualitativo 
 
  Enfoque Cuantitativo  Enfoque Cualitativo 
Supuestos:  Paradigma Positivista – Paradigma constructivista
Post positivista 
Ontológico  La realidad es objetiva  La realidad es subjetiva y múltiple 
‐naturaleza de la realidad‐ 
Epistemológico  Hay distancia  No  hay  distancia.  El  investigador  está 
‐relación  entre  el  investigador  inmerso en el contexto de interacción 
y aquello que se investiga‐ 
Axiológico   El  investigador  se  despoja  de  El  investigador  asume  que  sus  valores 
‐el  papel  de  los  valores  en  la  sus propios valores, de  lo  que  forman parte del proceso de investigación
investigación‐  es justo o injusto 
Metodológico  Aplica la lógica deductiva (de lo  Aplica la lógica inductiva (de lo particular 
‐procedimientos  utilizados  general a particular, es decir de  a  lo  general‐  de  los  datos  a  las 
para  la  construcción  de  las leyes y teoría a los datos)  generalizaciones y la teoría) 
evidencia empírica‐     
  Es  un  proceso  empírico  Es  un  proceso  empírico  en  espiral  o 
  secuencial y probatorio  circular, sin secuencia. 
     
Usa técnicas estadísticas  Análisis en profundidad y en detalle.  
 
  Observación naturista. 
 
Operacionalización  de  Conceptos y categorías a lo largo de todo 
  conceptos teóricos.  el proceso 
    Confianza, autenticidad 
  Confiabilidad de resultado por  Parsimonia  científica  (usa  menos 
  validación interna  categorías o dimensiones de análisis 
     
  Estructurado,  Abierto,  flexible,  construido  durante  el 
Diseño de la investigación  predeterminado.  trabajo de campo o realización del estudio
     
Naturaleza de los datos  Es  cuantitativa  y  se  analizan  Es  cualitativa,  en  forma  de  textos, 
estadísticamente los datos  narraciones,  significados,  imágenes, 
piezas  audiovisuales,  objetos  personales, 
documentos.  
Aplicativos  SPSS; Excel; Minitab…  Atlas.ti 
Nos interesa conocer las etapas de investigación cuantitativa que hace uso de la estadística.  
 

8
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

En este curso de Estadística observamos que los saberes y técnicas que nos suministra, permitirán abordar 
el tipo de enfoque cuantitativo, utilizando las técnicas que le son propias para la recolección de datos.  
 
Las fases en el proceso de investigación son las siguientes. 
• Idea de investigación
Fase 1

• Planteo del problema de investigacion
Fase 2

• Revision de la literatura (Estado del arte)
Fase 3 • Desarrollo del marco teórico

• Alcance de estudio
Fase 4

• Planto de la hipótesis de investigacion
Fase 5 • Definicion de las variables

• Desarrollo del diseño de innvesigación. Marco Metodológico
Fase 6

• Definción y selección de la muestra
Fase 7

• Recolección de los datos
Fase 8

• Analisis de los datos
Fase 9

• Elaboráción del reporte de resultados
Fase 10

 
Los diferentes tipos de estudios aplicando la estadística que se pueden realizar son: 
- Estudio  exploratorio:  investiga  un  problema  poco  estudiado,  del  que  se  sabe  poco;  indagan  en  forma 
innovadora, ayuda a identificar conceptos o preparan para oros estudios, describen. 
- Estudio descriptivo: busca identificar propiedades, características, perfiles de personas, grupos, objetos, 
procesos  o  cualquier  otro  fenómeno  que  se  somete  a  análisis.  Por  lo  que  miden  concepto,  describen 
tendencias de un grupo o población. 
- Estudio correlacional: asocia variables con el propósito de conocer la relación que existe entre dos o más 
conceptos, categorías o variables en un contexto en particular, midiendo el grado e asociaciones entre las 
mismas.  Tiene  un  valor  explicativo,  aunque  parcial.  El  investigador  debe  tener  cuidado  en  esa  relación 
encontrada  pues  puede  tratarse  de  una  aparente  asociación  de  las  variables,  llevando  a  correlaciones 
espurias.  Este  tipo  de  estudio  ofrece  predicciones,  explican  la  relación  entre  variables  y  cuantifican 
relaciones entre variables. 
- Estudio explicativo: pretende establecer las causas de los eventos, sucesos o fenómenos que se estudian, 
por lo que van más allá de la descripción.  
- Estudio de diferencias entre grupos. 

La utilización del enfoque cuantitativo para estos tipos de estudios el investigador es neutral, pues deja 
de  lado  sus  propios  valores,  creencias  y  con  procedimientos  rigurosos  y  objetivos  hace  el  estudio 
distanciado físicamente y también distanciado psicológicamente del fenómeno de investigación. 
 
Si nos preguntamos ¿QUE ES LA ESTADÍSTICA? Comenzaríamos diciendo que:   
Es  aquella  rama  de  la  matemática  que  resulta  útil  para  la  investigación  de  corte  cuantitativa.  Pero,  la 
respuesta a esa pregunta, además de constituir una herramienta para investigar 
    
La Estadística como disciplina científica  
es el conjunto de métodos sistemáticos que se aplican a la 
9
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

a. Recopilación 
b. Presentación 
c. Análisis e 
d. Interpretación 
de los datos para la toma de decisiones    
La Estadística se divide en dos ramas: 
-  Estadística Descriptiva                            ‐ Estadística Inferencial 

Para poder abordar ambas ramas pasa por la 
Probabilidad. 
 
En el campo curricular, la estadística como asignatura brindada en los cursos de las carreras de Ciencias 
Económicas responde a necesidades concretas, destinado a resolver situaciones específicas, cuyo objetivo 
es brindar una estadística aplicada, a diferencia de la estadística matemática más propia de estadística II, 
en una sola materia que concentra diferentes contenidos en amplitud dada la riqueza de conocimientos 
que contiene el programa de la asignatura. Por eso, de ciencia abstracta ser estudiada como ciencia fáctica 
o empírica que toma los conocimientos de origen matemático para ser usados en forma instrumental a la 
resolución de determinados problemas en determinados contextos. 
Estadística: ciencia de los grandes números 
La  irregularidad  que  presentan  los  resultados  aislados  y  su  impredecibilidad  son  superadas  por  la 
regularidad y predictibilidad que muestran los resultados medios, cuando se repiten muchas veces las 
observaciones o experimentos aleatorios. Por ello, se denomina a la estadística la ciencia de los grandes 
números. (Act.Garnica Hervas, Juan R. exProf. Titular de Estadística Actuarial, Estadística, Estad. para Adm.) 
 
 
Para esclarecer la forma en que se tratará veremos  un esquema (Berenson, Krehbiel y Levine). 
 
DIAGRAMA DE LA PRESENTACIÓN DE LOS CONTENIDOS

OBTENCIÓN DE  FENÓMENOS DINAMICOS
PRESENTACIÓN Y  CONCLUSIONES ACERCA DE  ELABORACIÓN DE 
TEORÍA DE LAS 
DESCRIPCIÓN DE LA  POBLACIONES BASADAS SÓLO  PRONÓSTICOS 
PROBABILIDADES
INFORMACIÓN EN INFORMACIÓN DE UNA  CONFIABLES DE LAS 
MUESTRA VARIABLES DE INTERÉS

Probabilidad: Tipos
Distribucione de 
Recolección de Datos
muestreo

Variables Aleatorias Regresión Lineal 
Simple
Presentación de Datos  Distribuciones de  Estimación de 
en Tablas y Gráficos Probabilidad Discretas Intervalo de Confianza Números Indices

Distribución Normal  Series Cronológicas

Medidas Descriptivas 
Cuantitativas o 
Numéricas Otras Distribuciones 
Continuas Prueba de Hipótesis

Fuente: Berenson, Levine y Krehbiel “Estadistica para Administración” 4ta. Edición

10
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO


TIPO DE DATOS
TIPO DE ANÁLISIS CUANTITATIVOS CUALITATIVOS O CATEGORICOS
 Descripción de un   Arreglo ordenado,    Tabla de resumen 
grupo o diversos   Representación gráfica en Diagrama de   Gráfica de Barras 
Tallo y hoja   Gráfica de Pastel 
grupos 
 Distribuc de frecuencias: absoluta,   Diagrama de Pareto. 
relativa, porcentaje   Tabla de resumen de frecuencias 
 Simple y Acumulada 
 Representación gráfica en  Histograma 
, Poligono de frec. acumuladas (Ojiva) 
Poligono de porcentaje  acumulado 
 Medidas estadísticas: 
 Media aritm, geométrica,moda, 
mediana,cuantiles, rango, rango 
intercuartilico, desviac. estánd 
varianza, coefic. de variación 
 Repres gráfica:Caja y bigotes. 
 Inferencia de un   Estimación del intervalo de confianza   Estimación  de intervalo. de 
para la media.  confianza para una proporción 
grupo 
 Prueba Z para la media    Prueba Z de hipótesis para la 
 Prueba t para la media  proporción. 

 Análisis de relación   Diagrama de dispersión   Tabla de contingencias 


entre dos variables   Gráfica de series de tiempo   Grafica de barras agrupad 
 Covarianza   Prueba de Chi Cuadrada de 
 Coeficiente de correlación  independencia 
 Regresión lineal simple 
 Prueba t de correlación 
 Comparación de dos   Pruebas para la diferencia en las   Prueba Z para la diferencia entre 
medias de dos poblaciones  dos proporciones 
grupos 
independientes   Prueba de Chi Cuadrada para la 
 Prueba de Prueba F para la diferencia  dif. entre dos prop. 
entre dos varianzas 
 Comparación de más   Análisis de varianza de una vía   Prueba de Chi cuadrado para la 
diferencia entre más de dos 
de dos grupos 
proporciones 

 Análisis de la relación   Regresión múltiple   
entre dos o más 
variables 

11
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

I - ANALISIS DE DATOS –UNIDAD TEMÀTICA Nro.5 del Programa Nº 3496/13


Objetivos del Aprendizaje: Proporcionar los elementos necesarios para lograr un análisis descriptivo objetivo de los datos
representativos de situaciones que se presentan en las aplicaciones

ESTADISTICA DESCRIPTIVA
ETAPAS DE LA ESTADISTICA DESCRIPTIVA

RECOLECCIÓN ORGANIZACIÓN Y  CARACTERIZACIÓN 


ETAPA  1

ETAPA 3
ETAPA 2
DE PRESENTACIÓN DE DATOS
DATOS DE ANÁLISIS E 
INTERPRETACIÓN
•ENCUESTAS DATOS 
•OBSERVACIÓN •TABLAS
•EXPERIMENTACIÓN •GRAFIC0S

Fuentes Secundarias

ETAPA 1: RECOLECCIÓN: FUENTE DE DATOS  Objetivo: Cómo recoger los Datos


CARACTERISTICAS DE PREGUNTA PORQUE ES PREGUNTA CORRECTA
LAS PREGUNTAS INCORRECTA INCORRECTA
1 CLARAS, , ¿Ver Usted TV? CONFUSA ¿Acostumbra Ud. ver TV diariamente?

PRECISAS Y
¿Le gusta a Ud. el deporte? Le gusta usted el deporte verlo en TV,
COMPRENSIBLES VAGUEDAD escucharlo en radio o prácticarlo? y de
DE los términos qué deporte se trata?

¿Votará usted en las próximas, elecciones? En las próximas elecciones para elegir
Presidente…del día ….¿piensa ir a votar?
¿Es estable su empleo? Múltiples ¿Es estable en su empleo, considerando
significados: que tiene 1 año o más en el mismo?
caract. De la
-Ha asistido recientemente al cine? temporalidad
(que es reciente: 1 semana, 1 mes, ) ¿qué es estable? Durante las últimas 2 semanas ha ido Ud.
¿qué es reciente al cine?
¿qué edad es
-Ha trabajado desde joven? joven? -A partir de que edad empezó a trabajar?

12
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

2 BREVES (CONCISAS) Como Ud. sabe el próximo …. serán las DEMASIADAS En las próximas inscripciones del
inscripciones a las materias virtuales, nueva PALABRAS 2°Cuatrimestre a cursos virtuales ¿piensa
modalidad de distancia en nuestra FCE ¿piensa inscribirse?
Ud. acudir a la inscripción de materias virtuales
para el segundo cuatrimestre de este año?
VOCABULARIO DIRECTO, ¿ pernocta Ud. cerca de la Facultad? Vocabulario ¿Vive cerca de la Facultad a menos de 10
SIMPLE Y FAMILIAR PARA no familiar cuadras?
LOS PARTICIPANTES
3 NO DEBEN INDUCIR A ¿Acostumbra a ingerir algún tipo de bebida? Incomoda la Algunos de sus amigos acostumbran
RESPUESTAS verdad de la consumir algún tipo de bebida
(PREGUNTAS INCÓMODAS) respuesta alcohólica?
Y luego, preguntar
¿Cuál es su tipo de bebida favorita?
4 . NO DEBEN INDUCIR A una ¿Son los trabajadores argentinos poco Tendenciosa ¿Qué tan productivos son los trabajadores
determinada RESPUESTA productivos? argentinos? Sumamente productivos- Más
(PREG. TENDENCIOSAS) bien productivos-Más bien
improductivos- Sumamente
improductivos.
¿Suele tener tiempo para leer el diario? Y
¿Acostumbra a leer el diario? luego: ¿Con qué frecuencia?
5 NO PUEDEN APOYARSE EN El Gobierno Nacional entregó planes conectar Tendenciosa. ¿Considera beneficioso la entrega de
INSTITUCIONES porque considera que beneficia a una mejor computadoras para la educación en un
educación ¿Considera Ud. que es beneficioso? plan de ayuda?
6 Preguntas con Considera que la mayoría de las mujeres que NEGACION Considera que la mayoría de las mujeres
NEGACIONES:EVITARLAS están casadas preferiría no trabajar? prefieren estar en sus casas?

¿Los estudiantes no deben portar teléfonos Los estudiantes deben o no portar


celulares encendidos mientras están en clase? celulares encendidos en la clase?
7 Evitar PREG. Racistas, sexistas
Con varias respuestas
8 PREG. Con jerga linguistica ¿Qué onda con el curso de Estadistica? ¿Qué tan satisfecho se encuentra Ud. en
el curso de estadística?
9 PREG. Que se traslapan ¿Cuál es su edad? Se yuxtaponen Cuál es su edad?
18-19 los valores 18-19
19-20 20-21
20-21 22-23
1 PREG INCONGRUENTES ¿En qué´medida está usted satisfecho con el ¿En que´medida está usted satisfecho con
0 CON RELAC EN LAS OPC. DE curso? el curso?
RESP. ‐ Muy poco importante  ‐ Sumamente satisfecho 
‐ Poco importante  ‐ Mas bién satisfecho 
‐ Medianamente importante  ‐ … 
‐ Importante 
‐ Muy importante 
1 PREG. con términos EN OTRO ¿Qué efectos tiene en la empresa el …
1 IDIOMA

APLICACIONES TÉORICAS DE ANALISIS DE DATOS

ETAPA 1) FUENTE DE DATOS:


Las fuentes de datos pueden ser Primarias –cuando es el recolector de datos que las usa para su
análisis e interpretación y Secundarias – cuando otros son quienes utilizan los datos que han sido ya
recolectados.

Objetivo: Identificar la fuente de Datos, para ello indique Cuáles de los siguientes procedimientos
será considerado “Experimento” “Encuesta” o “Estudio Observacional u Observación Directa”

Un sondeo político de intenciones de voto individuales en las próximas elecciones 
Clientes de un centro comercial que serán entrevistados acerca del motivo por el cual compran allí  en Unicentro.
Comparación  de  dos  métodos  para  comercializar  una  póliza  anual  de  seguro  mediante  la  aplicación  de  cada 
método en áreas geográficas comparables.  
Evaluación  de  dos  conjuntos  diferentes  de  instrucciones  de  armado  de  un  juguete  haciendo  que  2  grupos 
comparables de niños lo armen siguiendo las instrucciones. 

13
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Envío a los suscriptores de una revista de evaluación de productos de un cuestionario para la calificación de los 
productos que han adquirido recientemente 
Comparación de los resultados de un nuevo método de capacitación para comercialización de pasajes aéreos por 
venta telefónica con el método tradicional. 

ETAPA 2: PRESENTACIÓN Y CARACTERIZACIÓN DE DATOS


La presentación y caracterización depende del tipo de dato que puede suministrarme el estudio de la
variable de interés.
De allí la importancia de conocer los NIVELES DE MEDICION de los datos, los que según dicho nivel
me suministra mayor tratamiento cuantitativo para caracterizar el objeto de estudio.

NIVELES DE MEDICIÓN de las VARIABLES


Variable: Características de los objetos o de los individuos.

En los siguientes tipos de NIVELES, complete el siguiente esquema según se trate de


variables categóricas y cuantitativas: discretas o continuas. Puede usar los distintos ejemplos que se
presentan para ubicarlos en el gráfico

Niveles de los datos
ESCALAS DE MEDICIÓN

NOMINAL ORDINAL de  INTERVALOS de RAZÓN‐


PROPORCIONAL
Concepto Clasificatorio Concepto Comparativo Concepto Métrico
Concepto Métrico

Características:
Características: Características: Características:

Ejemplos: Ejemplos: Ejemplos:


Ejemplos:

Exprese el nivel de medición para cada dato que responde a la variable


a) El número de unidades de un artículo en existencia........
b) El peso del contenido de un paquete de cereal................
c) El estado civil de las personas……….......
d) El número de artículos defectuosos producidos...............
e) El número de individuos de un área geográfica que reciben beneficios de desempleo..................
f) El grado de satisfacción con relación a la programación de cable (Muy Satisfactorio
Satisfactorio/Poco Satisfactorio/Malo) ………..........
g) El número promedio de clientes contactados por representante de ventas durante el mes.............
h) Total facturado en las ventas en $ de una determinada mercadería...............
i) El barrio de nacimiento de un grupo considerado.......................
j) La razón de activos circulantes contra pasivos circulantes.......
k) El tonelaje total embarcado en el despacho N° 140 a Londres......
l) La cantidad embarcada, en unidades en el despacho 140 a Londres.....
m) El volumen de tráfico en una autopista......................................
14
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

n) La asistencia de los miembros de la Asamblea Anual Extraordinaria......


o) La asignación de estrellas de la hotelería en un determinado sitio………

Tenga en cuenta que para diferenciar entre NIVEL DE INTERVALOS O NIVEL DE RAZÓN:
RECUERDESi una magnitud se la puede clasificar en
1. EXTENSIVA O ADITIVA: si tiene sentido la operación aritmética de adición.
2. INTENSIVA cuando la magnitud no es extensiva
Entonces 
p.1) clasifique en magnitud intensiva o extensiva
- El Volumen de las piletas de natación……………….
- El Peso de las cajas de cereal…………………………
- El perímetro en cada parcela vendida………………..
- La superficie de cada lote construido………………..
- La temperatura en la ciudad de Mar del Plata……….
p.2) Complete en función a la clasificación realizada del punto p.1) lo siguiente:

“los conceptos métricos extensivos” dan lugar a las ESCALAS de MEDICIÓN


DE ……..……………..
Los conceptos métricos intensivos dan lugar a las ESCALAS DE MEDICIÓN
DE ……………………

DATOS CATEGÓRICOS O CUALITATIVOS

Son el tipo de datos que responden a preguntas del tipo ¿Dónde vivis? ¿cuál es tu sexo? cuyas variables si
se le asignasen una denominación podría ser del estilo “Zona de Residencia” para la primera pregunta y
“Sexo” ó “Genero” para la segunda pregunta.
Las respuestas son los datos que respectivamente se registran en categorías y luego se pueden presentar su
frecuencia en una tabla y también en un gráfico.

Entonces, la presentación de este tipo de datos será en:


 Tabla de Resumen indica cantidad (fi) ;  la proporción (f r) y el porcentaje (%) de elementos en un conjunto 
de categorías. 
 Gráficos  los diferentes tipos de gráficos son: 
‐De Pastel: un circulo dividido en partes, en donde la suma de las partes totalice los 360° de esa torta. 
‐De  Barras:  en  donde  cada  barra  muestra  una  categoría  y  la  longitud  de  cada  barra  es  la  (fi)  ;    la 
proporción (f r) y el porcentaje (%) 
‐Diagrama de Pareto: Separa lo poco vital de lo mucho trivial. 

ETAPA 3
ESTADISTICA DESCRIPTIVA
–DATOS CUANTITATIVOS: DISCRETOS-
ORGANIZACIÓN, PRESENTACIÓN y DESCRIPCIÓN DE LOS DATOS SIN AGRUPAR

TRATAMIENTO CUANTITATIVO
MEDIDAS DESCRIPTIVAS O MEDIDAS ESTADISTICAS

Una descripción informativa de cualquier conjunto de datos está dada por la frecuencia de repetición 
u arreglo distribucional de las observaciones en el conjunto. 

15
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

El número de observaciones en una clase recibe el nombre de frecuencia absoluta de esa clase. También resulta 
interesante y funcional para determinadas medidas estadísticas trabajar con frecuencia acumulada u ojiva. 
A partir de una organización por tablas y una presentación por gráficos se puede descubrir patrones de distribución 
ocultos en el conjunto de datos. Además, se pueden caracterizar a través de las medidas numéricas que describen 
la población en estudio. 
Por ende, las medidas numéricas descriptivas se pueden clasificar en 
 Medidas de Posición  no toman en cuenta los valores de la variable de estudio sino su posición 
 Medidas Promedio  toman en cuenta todos los valores de la variable de estudio a los que se les aplica 
operadores algebraicos. 

Existen  medidas  numéricas  de  interés  para  cualquier  conjunto  de  datos:  la  localización  de  su  centro  y  su 
variabilidad,  luego  tenemos  las  denominadas  medidas  de  orden  superior,  que  también  son  de  forma  o  de 
deformación. 

 MEDIDAS DE TENDENCIA CENTRAL: son los valores de variable que se ubican en la zona de la escala donde 
se encuentra la mayor concentración de frecuencias. Es decir habla de la disposición del conjunto de datos 
para agruparse ya sea alrededor del centro o de ciertos valores numéricos 
 MEDIDAS DE VARIABILIDAD: es la dispersión de las observaciones en el conjunto de datos 
 MEDIDAS DE DEFORMACIÓN: comparan una serie de frecuencias con una distribución normal estándar. 
 

EJERCICIOS DE APLICACIÓN de TRATAMIENTO DE LA INFORMACIÓN


EN DISTRIB. DE FRECUENCIAS - REPRESENTACIONES GRÁFICAS Y CÁLCULO DE MEDIDAS

1)El gerente de personal determinó que los 19 empleados de la Planta de Ezeiza han faltado en el término
de un año el siguiente número de días.
5,10,10,8,10,17,12,8,16,6,15,6,5,7,10,6,16,5 y 8
1.1. Defina la Variable de interés para el estudio. ¿Qué puede concluir o interpretar con estos datos?
1.2. Grafique los resultados de las Frecuencias absolutas simples en un gráfico de bastones.
1.3. Grafique los resultados de las Frecuencias absolutas acumuladas en un gráfico escalonado.
1.4. En una tabla complete la distribución de frecuencias relativas de la variable
1.5. Determine el porcentaje de
personas que han faltado
a. exactamente 10 días
b. a lo sumo 10 días
c. al menos 10 días
1.6 Calcule la media aritmética, la
moda y la mediana
1.7 Calcule la amplitud de la
variación, la desviación media
1.8. Calcule la varianza, el
Media  9,47368421
desvío estándar y el coeficiente de variabilidad
Error típico  0,9188361
1.9. Comente los resultados devueltos por Excel y sus cálculos.
Rta: devolución de los valores En Excel Mediana  8
Moda  10
Rta: devolución de los valores En SPSS Desviación estándar  4,00511369
Varianza de la muestra  16,0409357
Rango  12
Mínimo  5
Máximo  17

16
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

2) Cuando el gerente de personal decide hacer el relevamiento completo de la empresa, le falta incluir a la
Planta de Ezeiza las ausencias de la Planta Matriz ubicada en San Isidro conformada por 31 empleados. Por
lo tanto, recogido los datos, en esta Planta Matriz las ausencias han sido:
1,1,5,8,9,11,12,16,14,15,11,12,5,8,4,9,23,12,20,21,21,22,23,24,2,1,9,6,20,31,15

2.1) Presente e interprete un resumen de las medidas estadísticas. Rta:


2.2) Grafique en un diagrama de tallos y hojas las ausencias en c/u de las Media  12,6129032
Mediana  12
plantas. ¿Qué observa?
Moda  1 ‐9 ‐ 12
2.3) Compare resultados.
Desviación estándar  7,92749401
2.4) Grafique en un diagrama de caja y bigotes las ausencias en cada una
Varianza de la muestra 62,8451613
de las plantas y las ausencias de la empresa en forma global una vez haya
Rango  30
aprendido acerca de este A.E.D. Interprete su gráfica
Mínimo  1
2.5) Puede calcular también las denominadas medidas de orden superior, es
Máximo  31
decir el coeficiente de asimetría y el coeficiente de curtosis.
 
CUADRO RESUMEN DE MEDIDAS EN DATOS SIN AGRUPAR –DISCRETOS 

Complete el cuadro con las medidas estadísticas

MEDIDAS
PROMEDIO Y DE POSICIÓN
SUBCLASIFICADAS en las MEDIDAS ESTAD.

TENDENCIA CENTRAL VARIABILIDAD OTRAS MEDIDAS DE


TENDENCIA CENTRAL Y
MEDIDAS DE FORMA

Media
Mediana Primer Cuartil Asimetría
Varianza Rango

Rango Segundo Cuartil


Intercuartílico

Tercer Cuartil Kurtosis

Deciles
Aritmética Geométrica Desvío estándar
ó Desvío medio
Desvío típico Percentiles
ó
Dispersión

Modo Coeficiente de
Variabilidad

Recuerde las NORMAS IRAM con la terminología y definiciones estadísticas.

3) MEDIDAS PROMEDIO Y MEDIDAS DE POSICIÓN

PROMEDIO: Para calcular un promedio se debe utilizar todos los valores de una serie de datos
MEDIDAS DE POSICIÓN: No utiliza todos los valores de una serie de datos. Su resultado
depende de la posición que ocupa dentro de la distribución de datos.

17
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Identifique con una cruz y justifique si las siguientes medidas son promedios o posición?

PROMEDIO POSICIÓN Justificación


Media
Mediana
Modo
Primer cuartil
Decimo Decil
Tercer Cuartil
Rango
Semirango (Xmax - Xmin )/2
RIC (Rango Intercuartilico)
Varianza
Desvío Medio
Desvío estándar o típico
Todos los momentos

MEDIDAS DE POSICIÓN BASADAS EN EL ORDEN


PARA DATOS SUELTOS –DATOS DISCRETOS-
Integre el cuadro para DATOS DISCRETOS

Algunos Cuantiles
Es el valor tal que por lo menos “el …%” de los datos son menores o iguales que ese valor y el resto
son mayores o iguales que ese valor
Denominación Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
El conj.de datos se divide (en partes iguales)en 
Para encontrar el valor del cuantil, con los
DATOS SIN AGRUPAR: me° = Q k° = Dk ° = Pk° =
Paso 1) Se ORDENAN en forma creciente
Paso 2) Se halla el Orden o posición que dentro de
la serie ocupa ese cuantil)
Paso 3) En esa posición se encuentra el valor del
cuantil:
-en forma directa si la serie es impar
-interpolando los 2 valores centrales si es par

18
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

PROPIEDADES DE LA MEDIA Y DE LA VARIANZA


Complete el siguiente cuadro con las propiedades de media –m- y varianza –VAR-.

Cuadro de Propiedades
MEDIA VARIANZA
Notación Notación

Características Características

m© VAR©

m (c + X) VAR (c + X)

m (c - X) VAR (c - X)

m (c . X) VAR (c . X)

X X
m  VAR  
c c
m(X + Y) VAR(X + Y)

ANÁLISIS EXPLORATORIO DE DATOS (A.E.D.)

DIAGRAMA DE CAJA DENOMINADO RESUMEN DE LOS CINCO NÚMEROS

*
*

Los cinco números son:


Xm Q1 me Q3 XM
menor valor Primer Cuartil Mediana Tercer Cuartil Mayor valor

El AE.D. permite detectar obervaciones atípicas que son datos inconsistentes con el resto de los
otros datos. Son los datos extremos, pero para considerarse inusuales debe verificarse que estén
fuera de los límites Inferior y Superior.
Se identifica un dato extremo como:
Aquel valor < que : Q1 - 1,5 veces la amplitud intercuartílica
Aquel valor > que: Q3 +1,5 veces la amplitud intercuartílica

19
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

RESUMEN DE LOS
CINCO NÚMEROS

Q1 Me Q3 XM
Xm

menor valor  
Primer Cuartil   Mediana Tercer Cuartil Mayor valor

R.I.C.
Rango Intercuartílico
Amplitud Intercuartilica
Dispersión media

Li = Q1 – 1,5 R.I.C. Ls = Q3 + 1,5 R.I.C.

Complete en el cuadro Comparativo del resumen de los cinco números que describe el tipo de
distribución de datos, cuáles de los signos corresponde y tachar los signos que no correspondan

COMPARACIÓN Tipo de distribución de datos


ASIMÉTRICA A LA IZQ SIMÉTRICA ASIMÉTRICA A LA DER
La distancia de
Xm a me Xm a me Xm a me Xm a me
Contra
la distancia de >= < >= < >= <
me a XM (me a XM me a XM me a XM

La distancia de
Xm a Q 1 Xm a Q 1 X m a Q1 Xm a Q 1
Contra
la distancia de >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
Q3 a X M correspondan) correspondan) correspondan)
Q3 a X M Q 3 a XM Q3 a X M

La distancia de
Q1 a me Q1 a me Q1 a me Q1 a me
Contra
la distancia de >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
me a Q3 correspondan) correspondan) correspondan)
me a Q3 me a Q3 me a Q3

1) Deberá seleccionar, cual corresponde Si ¿ >, <? tachando aquellos que no correspondan:
Cuánto más esparcidos están los datos  Son > = < Rango
R.I.C
Varianza
Cuánto más concentrados u homogéneos están los datos  Son > = < Desvío
Si todos los Xi son = (no hay variación de los datos)

RECUERDE que:
NINGUNA MEDIDA DE VARIACIÓN (Rango, RIC, VAR, DESVIO) ES MENOR A CERO

20
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

En la representación gráfica del diagrama de caja y bigotes –boxplot, se pone en evidencia si la


distribución de datos es sesgada. El “sesgo” es el grado de deformación horizontal de la distribución.

EJERCICIOS DE APLICACIÓN de ANALISIS DE DATOS SUELTOS


LA MEDIA ARITMÉTICA Y GEOMÉTRICA.

∏ ∏ -1

1) Las tasas de rentabilidad de los inmuebles han sido del 4%, 6%, 8%, 10% y 11% en los últimos cinco meses. 
Determine: a) la media aritmética y b) el factor de expansión o crecimiento acumulado. c) el factor de expansión 
o crecimiento medio y d) la media  geométrica.       
Rta: 0,078 –en tanto por uno- ó 7,8% b. 1,4537 c. 1,0777 d. 0,0777 -en tanto por uno- ó 7,32%

2) El número de habitantes en una localidad ha registrado la siguiente evolución demográfica: 10.000 a fines de 
2015; 10500 a fines de 2016; 12600 a fines del 2017 y 18900 a fines del 2018. Halle: 
a. la tasa de crecimiento anual (para cada uno de los años)   b.el factor de expansión demográfico acumulado  
c. el factor de expansión demográfico medio   d. la tasa de crecimiento promedio anual      
Rta: a) 0,05; 020 y 0,50  ‐ en tanto por uno‐  b) 1,89  c) 1,23638559 d) 0,23638559  
 
3) De los 80 operarios de la empresa “Cable sur” 60 cobran $ 140 la hora y el resto $ 260 la hora. ¿Cuánto cobran 
en promedio por hora? Justifique el resultado                      
Rta: $170 

Recuerde que: “las ponderaciones son valores que permiten asignar a cada variable en
estudio una determinada importancia”
 
4) Calcule la tasa media resultante de una inversión de $ 100.000 que al cabo de un año genera un valor final de 
$ 50.000 y al cabo de 2 años se transforma en un monto o valor final igual a la inversión inicial de  $ 100.000.
                       Rta.: 0 
                                            
5) Un depósito por $ 10.000 en una cuenta devengó las siguientes. tasas de interés: 7% el 1°año, 8% el 2°año, 10% 
el 3°año, 12% el 4°año y 18% el 5°año, generando un valor final de $ 16.800. Halle el factor medio de crecimiento 
anual y la tasa de crecimiento anual –en %‐     Rta: 1,109 y la tasa de crecimiento anual del 10,9% 
 
6) La tasa de crecimiento en un determinado cultivo de una localidad ha sido la siguiente: 
Calcule cuál fue el crecimiento 
2008  2009  2010  2011  2012  2013  2014 
promedio anual.   11% 
  9%  7,5%  8%  9,5%  10,8%  12% 

21
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

ORGANIZACIÓN, PRESENTACIÓN y DESCRIPCIÓN


DE LOS DATOS CONTINUOS AGRUPADOS EN DISTRIBUCIÓN DE FRECUENCIAS Y
REPRESENTACIONES GRÁFICAS Y CÁLCULO DE MEDIDAS ESTADÍSTICAS

EJERCICIOS DE APLICACIÓN de MEDIDAS ESTADISTICAS EN DATOS AGRUPADOS


POR INTERVALOS DE CLASE –DATOS CONTINUOS-

1) La cuantía de las cuotas que cobra mensualmente una compañía en concepto de Préstamos
línea Personales a reintegrar en 24 mensualidades, iguales y consecutivas han sido las siguientes:
CUANTÍAS MENSUALES en concepto de cuota cobrada por préstamos personales.
900 500 450 1900 1200 1250 2500 550 1650 1200
1000 550 950 600 750 1300 850 350 1400 700
300 1100 300 1600 1500 1000 1800 900 500 650
2000 1000 2000 450 750 850 600 3000 350 1500

1.1) ¿Cómo puede organizar los datos? y ¿Cuál es la cantidad de intervalos de clase que tomaría?
1.2) Calcule las medidas con los datos de la distribución de frecuencias e interprételas: a) rango;
b) mediana; c) modo; d) media;e) desvío medio; f) varianza; g) desvío estándar h) coeficiente
de variación o dispersión relativa; i) coeficiente de asimetría y j) coeficiente de kurtosis
I - Cálculo manual de las medidas
Importe de Fronteras de Marca de clase fi F
cuotas en $ Clase [ ; ) -Punto medio- i=1,2…h a
Intervalo de clase Inclusión Izq. Xi

SUMAS

II- Otro camino: “Reduciendo los cálculos”Cálculo con Variable modificada. Considerando c= ; w=
X*i fi

SUMAS

Como determinar los valores de c -constante- y w=


RESUMEN DE LOS VALORES SEGÚN LOS INTERVALOS DE CLASE Y AMPLITUD

Para h= 5 ; w= 541 Para h= 6 ; w=451 Para h= 7 ; w=386 Para h= 8 ; w=338

amplitud será tratado en el punto titulado “Datos de la VALORES ORIGINALES


media 1123,025
VALORES ORIGINALES
media 1041,15
VALORES ORIGINALES
media 1080,65
VALORES ORIGINALES
media 1075,40

variableXi: Varianza

Desvío
358351,30

598,62
Varianza

Desvío
320865,08

566,45
Varianza

Desvío
357497,28

597,91
Varianza

Desvío
372435,44

610,27

III – Método con Utilización de Software: Ej. Planilla C.V. 53,30%


Coef. de Asim 1,05784457
C.V. 54,41%
Coef. de Asim 1,07844912
C.V. 55,33%
Coef. de Asim 0,98242203
C.V. 56,75%
Coef. de Asim 1,03872129

Excel en la cual ingresa los datos, según la cantidad y


Coef.de Kurto 0,52018758 Coef.de Kurto 0,65861297 Coef.de Kurto 0,27659763 Coef.de Kurto 0,43513117

valores de c/ intervalo presentarán la siguiente VALORES CODIFICADOS


media codif -0,975
VALORES CODIFICADOS
media codif -0,850
VALORES CODIFICADOS
media codif -1,475
VALORES CODIFICADOS
media codif -1,200

respuesta que también debe saber interpretar. Varianza codi

Desvío codif.
1,224375

1,106515
Varianza codi

Desvío codif.
1,577500

1,255986
Varianza codi

Desvío codif.
2,399375

1,548992
Varianza codi

Desvío codif.
3,260000

1,805547
Coef. de Asim 1,05784457 Coef. de Asim 1,07844912 Coef. de Asim 0,98242203 Coef. de Asim 1,03872129
Coef.de Kurto 0,52018758 Coef.de Kurto 0,65861297 Coef.de Kurto 0,27659763 Coef.de Kurto 0,43513117

22
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

El procedimiento para la utilización de una hoja de cálculo tipo Excel se detalla a continuación:
EXCEL EN ESTADÍSTICA
Los estadísticos descriptivos se pueden calcular a través de planillas
de cálculo como Excel. Para ello, primero es necesario habilitar
el menú de Estadística.

 HABILITACIÓN DEL MENÚ DE ESTADÍSTICA


1) Hacer click con el botón izquierdo del mousse en la solapa “Archivo”
 Cuando se abre el abanico: Seleccionar la última que dice “Opciones”
 Al hacer click en “Opciones” se abren otras posibilidades: Ingresar
haciendo click en Complementos.
 Dentro de Complementos: Ir al final de todo
donde dice “Administrar complemento de Excel
 Hacer click en “Ir” a Administrar Complemento
de Excel.
 Tildar donde dice “Herramientas
para análisis”. Ya se encuentra listo su
Excel con los complementos
habilitados para poder utilizar el
tratamiento cuantitativo de los datos volcados en una
planilla de cálculo.

 UTILIZACIÓN DEL MENU ESTADISTICA


Ingresados los datos en la planilla de calculo mediante la elección del menú:
Herramientas / análisis de dato / estadística descriptiva

 Ingresar los datos en la caja de


dialogo y luego mediante la
elección dentro de la SOLAPA
“DATOS” que dice “Estadística
Descriptiva tal como se ve en la
figura se puede acceder al
tratamiento cuantitativo de los
datos obteniendo un resumen de
las medidas estadísticas, el dato
extremo inferior y superior para
determinar el rango
 Las medidas estadísticas que se obtienen son:

23
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

DATOS DE LA VARIABLE Xi TRANSFORMADOS EN VARIABLES CODIFICADAS Xi*


VARIABLE DE CÁLCULO
Xi *
es
- Una transformación afin deeslos valores observados Xi
- No representa magnitud
- Sus valores son ENTEROS
- Cada valor incrementa unitariamente
- Implica hacer 1° un cambio de origen y también un cambio de escala

∗ ∗



∗ ∗
; 0
∗ ∗
,


∗ .
∗ despejo
∗ .

/___________/___________/___________/___________/

Xi enValores Originales

/____________/___________/___________/___________/___________/___________/

Xi - C
CAMBIO DE ORIGEN

/_/_/_/_/_/_/_/_/

4- 3-2 -1 0 1 2 3 4
CAMBIO DE ESCALA

MOMENTOS EMPÍRICOS
Los momentos se definen a través de medias aritméticas. Los que usaremos son:
 MOMENTOS NATURALES a los que se les denomina también ABSOLUTOS 
 MOMENTOS CENTRADOS 

MOMENTOS NATURALES: definidos a través de medias aritméticas de potencias de la variable.


MOMENTOS CENTRADOS: definidos a través de medias aritméticas de potencias de los desvíos de la
variable.

Algunas aplicaciones:
 Definición de la varianza por diferencia de momentos 
 Determinación de las medidas de asimetría y curtosis de la distribución a partir de los momentos

24
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CUADRO RESUMEN

MOMENTOS
EMPÍRICOS

son

Operadores matemáticos
obtenidos a partir
de los
Valores observados de la variable

se calculan como

MOMENTO
El promedio aritmético MOMENTO
EMPIRICO
de la potencia k-ésima EMPÍRICO
ABSOLUTO
de los CENTRADO
DE
DE
ORDEN k
ORDEN k

desvíos de c/u de los


valores valores
individuales individuales
observados observados
de la de la
variable variable
Xi Xi
respecto a la media
aritmética

mak = mck =

La notación convencional:
mk : momento absoluto de orden k µk momento centrado de orden k
1) Complete: 

ma1 = mc1 =

ma2 = mc2 =

ma3 = mc3 =

ma4 = mc4 =

2) Exprese los momentos centrados de orden 2,3 y 4 en función a los momentos absolutos 
Deducir la fórmula sin omitir pasos intermedios 

Rta: mc3 = ma3 – 3 . ma1 . ma2 + 2 . ma13


mc4 = ma4 - 4 . ma1 . ma3 + 6 . ma12 . ma2 - 3 . ma14
25
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

ALGUNAS MEDIDAS DE POSICIÓN BASADAS EN EL ORDEN


PARA DATOS CONTINUOS AGRUPADOS EN INTERVALOS DE CLASE

Complete el cuadro con las medidas y relaciónelas con las resultantes para DATOS DISCRETOS.
Conviene realizar la ojiva como representación gráfica y comparar la búsqueda del valor con la
tabla de frecuencias.
Algunos Cuantiles
Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
Si el conjunto de datos se
divide (en partes iguales) en
DATOS AGRUPADOS
Valor del cuantil mek = Q k= Dk = P k=
En donde:
N=
Li =
k=
fi =
Fa =

CUADRO RESUMEN DE MEDIDAS EN DATOS CONTINUOS


AGRUPADOS EN INTERVALOS DE CLASE-

ACTIVIDAD: Complete el cuadro con las fórmulas resultantes

MEDIDAS
CLASIFICADAS 
EN 
DE 
DE  OTRAS 
TENDENCIA  MEDIDAS
VARIABILIDAD
CENTRAL

CUANTILES ó   FORMA
Varianza Rango FRACTILES
Media Mediana

Primer Cuartil

Desvio  Segundo Cuartil ASIMETRIA


Estandar Rango 
Modo Intercuartilico Tercer Cuartil

Quintiles
Desvio Medio
Coeficiente de 
Variabilidad Deciles CURTOSIS

Percentiles

26
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

EJERCICIOS ADICIONALES DE APLICACIÓN de MEDIDAS ESTADISTICAS EN


DATOS AGRUPADOS POR INTERVALOS DE CLASE –DATOS CONTINUOS-

2)A partir de los siguientes datos de una serie ∑ ; ∑ ; ,


Calcule la varianza, el desvío y el coeficiente de variación.
Rta: 8,25 ; 2,87; 52,18%

3)Dada la siguiente información sobre Salarios Semanales en miles de pesos de 42 operarios de la rama
“Construcción”. Se pide, paso previo a las mediciones la organización de
datos y su representación gráfica (Fte.Brufman, J)
3.1) Construir una serie de frecuencias de amplitud w=1 (1° intervalo de
clase 5,0 – 6,0)
3.2) Represente gráficamente el histograma y el polígono de frecuencias
3.3) Represente gráficamente las frecuencias acumuladas
3.4) Halle e interprete la media, la mediana, el modo ,el primer cuartil, el
segundo cuartil, el tercer cuartil y el rango intercuartílico. Comente la
asimetría
3.5) Ingrese en un Excel los datos y analice los resultados que devuelve el Excel
3.6) Ingrese los datos en una calculadora científica e interprete los valores que le devuelve.
Li - Ls xi fi Fa
i=1,2…h

SUMAS

Respuesta: Valores Originales


Para h= 6 ; w=1
Valores Codificados
Para h= 6 ; w=1
media 8,333 media codif -0,167
mediana 8,417
Varianza 1,853 Varianza codif 1,853
modo 8,571
Desvío 1,361 Desvío codif. 1,361
C.V. 0,163
Coef. de Asim -0,207 Coef. de Asime -0,207
Fuente: “Brufman, Juana”
Coef.de Kurtos -0,730 Coef.de Kurtosi -0,730

4)Dada la siguiente información sobre distancia recorrida medida en km –en valores originales-
Distancia en km xi fi Fi
Fronteras de clase i=1,2…h

0 - 1,99 2
2 - 3,99 5
4 - 5,99 4
6 - 7,99 8
8 - 9,99 1
SUMAS 20

27
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Se pide: 4.1) histograma 4.2) Gráfico del polígono de frecuencias 4.3) Gráfico de la frecuencias
acumuladas 4.4) media, el modo y la mediana 4.5) ¿Cuántas personas recorren menos de 5,5 km 4.6)
los cuartiles de 1° y 3° orden 4.7) la varianza, el desvío estándar y el coefic de Para
media
h= 5 ; w =2
5,10
Para h= 5
media codif
; w =2
0,050

variabilidad 4.8) la forma de la distribución de los valores de la variable: Varianza 4,99 Varianza cod 1,248

Asimetría y la curtosis 4.9)Realice la distribución de frecuencias utilizando Desvío 2,234 Desvío codif. 1,12

Variable modificada Xi* C.V. 43,80%


Coef. de Asime -0,313812
Coef. de Asim -0,313812
Coef.de Kurto -0,996004

Rta  Coef.de Kurtos -0,996004


mediana=1°Cua 5,5
modo 6,73
1° Cuartil 3,20
3° Cuartil 7,00
P(20) 2,80

Tabla de Distribución de Frecuencias con Valores Codificados


Distancia en km X*i fi
Fronteras de clase i=1,2…h

0 - 1,99 2
2 - 3,99 5
4 - 6,99 4
6 - 7,99 8
8 - 9,99 1
Totales 20

5) Se conoce la siguiente información de salarios anuales en miles de $ de una empresa.


Salario anual Cant. de
-miles de $- empleados
250-259,99 8
260-269,99 10
270-279,99 16
280-289,99 14
290-299,99 10
300-309,99 5
310-319,99 2
Totales

Se pide los cálculos y la interpretación de sus valores estadísticos hallados:


 Límite inferior de la 6° clase Rta: 300
 Límite superior de la 4° clase Rta: 289,99
 Las frecuencias del 3° intervalo de clase Rta: 16
 El % empleados que cobran menos de $ 280 miles anuales Rta: 52,3%
 Complete en el Cuadro las Frecuencias relativas de cada clase
y la frecuencia acumulada absoluta
 Cuál es el intervalo de clase con máxima frecuencia Rta: 3°
 El porcentaje de empleados que cobran menos de $ 300
pero al menos $ 260 miles anuales Rta: 76,9%
 Construir el histograma y luego el poligono de frecuencias
 Construir el polígono de frecuencias acumuladas –ojiva-
 La media aritmética; la media geométrica, el salario modal
 La mediana y el modo.
 La varianza, el desvío standard, el coeficiente de variabilidad
 El coeficiente de asimetría y el de curtosis

28
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

 El valor que deja por debajo, es decir que supera al 25% de los datos –Q1-
 el segundo cuartil y
 el valor que es superado por el 25% de los datos –Q3-
 El percentil 75
 Realice los cálculos por valores codificados en el caso de la varianza, el desvio , la media, el coeficiente
de asimetría y el de curtosis.

6)Si el tiempo en que ha tardado determinada tarea es el que describe la variable Xi


Tiempo xi fi Fa
i=1,2…h

4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2

Determine:
a)Tiempo medio de fabricación; b) Tiempo modal ; c) Tiempo mediano; d) Varianza; e)Desvío Standard
f) Coeficiente de simetría; g) coeficiente de curtosis ;
h) Complete con los valores codificados y calcule las medidas estadísticas

Tiempo xi X*i fi
4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2

Rta: VARIABLE ORIGINAL


Para h= 9 ; w=1
VARIABLE CODIFICADA
media aritm 6,537 media codif -1,963
mediana 6,5
Varianza 1,135631 Varianza codi 1,135631
moda 6,5
Desvío 1,06565989 Desvío codif. 1,06565989
C.V. 0,16301972 Coef. de Asim 0,91794547
Coef. de Asim 0,91794547 Coef.de Kurto 3,32978601
Coef.de Kurto 3,32978601

29
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTANDAR (Fuente Lind)


 
1) TEOREMA DE TCHEBYSHEV  (1821‐1894) 
Para un conjunto cualquiera de observaciones  (muestra o población), independientemente de cómo se 
distribuyen las observaciones 
La proporción mínima de los valores que se encuentran 
Dentro de “k” desviaciones estándar desde la media 
Es por lo menos   1  1  .100%                
 k2 
Donde k es una constante mayor que 1 
 
 
2) REGLA EMPIRICA 68‐95‐99,7 
 
 
 
 
 
 
 
 
En una distribución de frecuencias simétrica, con forma de campana 
Aproximadamente 
El 68% de las observaciones   estarán       Entre + 1 y ‐ 1 desviación estándar desde la media 
El 95% de las observaciones   estarán  Entre +2 y ‐2 desviaciones estándar desde la media 
El 99,7% de las observaciones    estarán  Entre +3 y ‐3 desviaciones estándar desde la media 
 
En conclusión:  
  Porcentaje de valores encontrados en intervalos alrededor de la media 

Intervalo  Tchebychev  Regla Empírica 


(para toda la distribución)  (Distribución campanular) 
( µ ‐ σ ; µ + σ )  Al menos 0%  Apróximadamente 68% 
 
( µ ‐ 2 σ ; µ +2 σ )  Al menos 75%  Apróximadamente 95% 
 
( µ ‐ 3σ ; µ +3σ )  Al menos   88,89%  Apróximadamente 99,7% 
 

EJERCICIOS DE APLICACIÓN de APLICACIONES DE DESVIACIÓN ESTANDAR 


 
 
1) El ingreso semanal medio de un grupo de observaciones muestrales es de $ 500; la desviación estándar es de $ 
40. De acuerdo con el teorema de Tchebyshev ¿al menos que porcentaje de ingresos semanales se encontrará 
entre $ 400 y $ 600? 
Rta: Entre 2,5 en más y  en menos de la media el 84% de los datos. 
 
2) La  distribución  de  los  pesos  en  una  muestra  de  1400  contenedores  para  carga  sigue  fundamentalmente  una 
distribución normal. Con base en la regla empírica  ¿ que porcentaje de los pesos se encontrarán entre la media y 
dos desviaciones estándar                        Rta:95% 
30
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

3) Un auditor detecta que las cuentas a cobrar de la empresa tiene una media de $ 2.950 y desviación típica de $ 
630. A) Halle el intervalo en el que pueda garantizarse que se encuentra l 60% de estos valores. B) Halle un 
intervalo en que pueda garantizarse que se encuentre el 80% de estos valores.   
 Rta.: a) 1954 y 3946  b)1541 y 4359 
4) La cantidad ingresada a la AFIP por Impuesto a las Ganancias año 2015 –en miles‐en los integrantes de toda una 
empresa son las siguientes 
Cantidad Ahorrada  N° empleados             

$ 30 a $ 35  3             

$35 a $ 40  7             

$40 a $ 45  11             

$ 45 a $ 50  22             

$ 50 a $ 55  40             

$55 a $ 60  24             

$ 60 a $ 65  9             

$65 a $ 70  4             

Total               

Calcule usando variable codificada: a) La varianza poblacional    ;          b)  desviación estándar poblacional 
c) Al menos que porcentaje de la cantidad ingresada se encuentra entre: c.1) más y menos 3 desviaciones 
estándar respecto de la media si no se conoce la distribución de datos c.2) más y menos de 1 desviaciones 
estándar respecto de la media si no se conoce la distribución de datos c.3) más 1,5 desviaciones estándar 
y menos de 1,5 desviaciones estándar respecto de la media si no se conoce la distribución de datos  d) 
Aproximadamente  entre  que  cantidades  está  el  92%  de  los  ahorros  ;e)  Aproximadamente  entre  que 
cantidades está el 68% de los ahorros ; f) Suponiendo que sigue una distribución normal  
. ¿Entre qué cantidades está el 68% de la cantidad ingresada? 
. ¿Entre qué cantidades está el 92% de la cantidad ingresada? 
. ¿Entre qué cantidades está el 95% de la cantidad ingresada? 
. ¿Entre qué cantidades está casi la mayoría de los datos  de la cantidad ingresada? 
Rta: a) Varianza Poblacional=55,96 $2; Desvío Poblac.= 7,48 c.1) 88,89% c.2) Se debe calcular para un valor k>1; 
c.3) 55,55% entre $ 40,32 y$62,76  d)El 91,84% de los datos está a más o menos 3,5 desvíos de la media, es decir 
entre $25,36 y $77,72 e) Entre 1,76 desvíos en más o menos de la media de $ 51,54 –entre$ 38,38 y $ 64,70‐  , f.1) 
a un desvío  , f.2) a 1,76 desvíos y f.3) a 3 desvíos. F.4) el 99,99% de los datos está a 4 desvíos de la media. 
  
5) De acuerdo con el teorema de Tchebyshev ¿al menos que porcentaje de cualquier conjunto de observaciones se 
encontrará a no más de 1,8 desviaciones estándar desde la media?                  Rta: 69% 

31
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

DATOS CUANTITATIVOS BIVARIADOS 
MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES: COVARIANZA  Y CORRELACION  
 
Objetivo: Temas  a comprender  Diferencias entre Covarianza y Correlación y su interpretación para 
luego, transferir los conocimientos a la unidad temática de Análisis de Regresión.  
 COVARIANZA: medida de asociación lineal o  de la relación lineal entre 2 variables llamadas variables 
bivariantes o bivariados.  
 
  COVARIANZA:
  Medida de relación lineal entre 2 variables.
Mide la variabilidad conjunta entre dos variables
 
Es una medida descriptiva de asociación lineal entre 2 variables (X e Y)
 
  ∑ . ∑ .
, COV. MUESTRAL
 
∑ .
  , COV. POBLACIONAL
 
  La COV. puede tomar cualquier valor No informa sobre la fortaleza de esa relación
  Indica el sentido de la relación lineal, si existe entre dos variables. Es decir si:
  COV>0 Relación lineal directa o creciente
  COV=0 No existe Relación lineal (X e Y son independientes)
 
COV<0 Relación lineal inversa o decreciente
 COEFICIENTE DE CORRELACIÓN: mide la intensidad de esa relación lineal. Es decir, indica el sentido, pero 
también el grado de la relación lineal entre 2 variables. 

COEFICIENTE DE CORRELACIÓN:
Medida de relación lineal CORRELACIÓN
entre 2 variables que indica la
fortaleza relativa de la asociación lineal entre 2 variables.
Indica sentido y grado de la relación lineal entre 2 variables
, ,

,. , ,. ,
Sus valores oscilan entre
1 1
Grado de correlación (según el valor hallado)
-1 … 0 … 1
Perfecta Fuerte Moderada Débil SIN CORREL. Débil Moderada Fuerte Perfecta

Una pregunta que podríamos hacernos es la siguiente:


Si la varianza muestral arroja un valor distinto al de la varianza poblacional y por ende, lo mismo
ocurre con el desvío por calcularse a partir de esa varianza, entonces:
¿el coeficiente de correlación también será diferente, según sea muestral o poblacional?

Antes de precipitarse a una respuesta, podría comprobar los resultados y luego pensar que ocurre. Observe
que en la fórmula del coeficiente de correlación se presenta el cociente entre dos valores que tendrán divisor
común, dado que en el numerador y denominador aparece cantidad de datos “n” o “n-1” pues se refiere a
promedios aritméticos de las medidas covarianza y de los desvíos.Si el coeficiente de correlación da cero
significa que ambas variables X e Y no están asociadas linealmente. Según sean los valores hallados de
correlación lineal entre dos variables la representación gráfica es similar a la siguiente.

32
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

REGLA PRÁCTICA:      Existe una relación si | |  

Recordar que Excel calcula siempre automáticamente la Covarianza Poblacional. 
Por lo tanto, si trabajo con una muestra puedo hacer COV. POBL . COV. MUESTRAL 
¿CAUSALIDAD o SIMPLE CORRELACIÓN? 
Las relaciones entre las variables se describen como tendencias, pero no como causa‐efecto. 
La sola correlación no prueba la exigencia de un efecto de causalidad, es decir, que el cambio en el valor de una 
variable causó el cambio de la otra variable. 
 
Debemos recordar que una Correlación Fuerte puede producirse también por:  
a) Simple coincidencia: casualidad
b) Por el efecto de una tercer variable que no se tomó en cuenta en el cálculo
c) Por una relación causa-efecto

CORRELACIONES FALSAS O ESPURIAS son aquellos casos en que la correlación es fuerte, es decir que la medida 
estadística presenta  una relación fuerte entre dos variables pero que es casual. (Ej. Una correlación fuerte entre 
la variable: consumo de aspirinetas y la otra variable: consumo de maníes. 
Se debe afirmar que la CAUSALIDAD implica CORRELACIÓN, pero la sola Correlación no implica Causalidad. 
 
EJERCICIOS DE APLICACIÓN de
COVARIANZA Y CORRELACIÓN del Producto – Momento de Pearson 
1) Halle las siguientes medidas estadísticas: a) la covarianza, b) el desvío estándar de la variable X y 
c) el desvío estándar de la variable Y en la siguiente información           
edad estatura en cm
x y
0 56
1 74
2 92
4 104
6 116
10 140
14 159          
2) Considerando la siguiente tabla de valores, calcule las medidas estadísticas halladas en el punto 
anterior 

33
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

edad estat en pulg
x y
0 22
1 29
2 36
4 41
6 46
10 55
14 63   
 
   3)Compare los resultados obtenidos con la tabla anterior y Complete la línea punteada)¿ Qué conclusiones 
extrae?................................. ……………………………………………………………..Otra utilidad que se encuentra en utilizar el 
Coeficiente de Correlación es ……………………………………………………………………………………………………………………………… 
 
Johnson Kubby también encuentra una forma práctica para determinar el coeficiente de correlación a 
través del trazado de un rectángulo que abarca todos los puntos del diagrama de dispersión y encuentra 
 1
que  r   1      
 k
¿Qué opinión le merece dicha fórmula en el marco de algún ejercicio? 
 
 
4) Los siguientes datos representan las calorías y la grasa total que contienen las raciones de una 
delicatesen para el café o té que se vende en la dietética. 
Producto               Calorías  Grasa total 
1 Barra Nature Crops barra Premium (quinoa, frutillas y yogurt)   170     3,0 gramos 
1 Barra de Arroz con Semillas (Amaranto, Chia y Sesamo) dulce leche     59    2,7 gramos 
1 Galleta de arroz bañada  Lulemu tipo alfajor sabor chocolate       45    2,4 gramos 
1 Chocolate sin azúcar agregada con leche Georgalos como barra   142    10 gramos 
1 Barrita de arroz yamani integral cubierta con chocolate genuino     66     3,1 gramos 
1 Nestlé Pop pochoclo acaramelado recubierto con baño repostería      97    4,3 gramos 
1 Choco arroz original de dulce leche Gallo          119     6,1 gramos 
a) Calcule la covarianza de la muestra 
b) Calcule el coeficiente de correlación.  
c) ¿Qué le parece de mayor utilidad para expresar la relación que existe entre calorías y grasa: la covarianza 
o el coeficiente de correlación? Explique el porque 
d) ¿Qué conclusiones deduce acerca de la relación entre calorías y grasa? 

5)Busque información relacionado al relevamiento de datos que representen el valor de exportaciones e 
importaciones de varios países en el año……. Posteriormente, calcule la covarianza, el coeficiente de  correlación e 
interprete ambos resultados. 

6) TRABAJO “Un acercamiento a la investigación: La Covarianza y Correlación en los


datos bivariados”

CONSIGNA:
1-ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
34
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una determinada posición
y construir un marco teórico sobre el tema que trata esas variables, tal como...” La cantidad de personas que
viajan al exterior están influenciadas por el tipo de cambio...”

2 -ETAPA DE RECOLECCIÓN DE DATOS. En esta parte del proceso deberán ponerse en contacto con
la fuente de datos. Para ello, podrán buscar algún cuadro del Instituto de Estadística y Censos que informe
acerca de salida de turistas del aeropuerto internacional de Ezeiza y Aeroparque. También debería
confirmarse que no exista otro aeropuerto internacional para no sesgar los datos, pues se estaría omitiendo
parte de la información. Siguiendo este ejemplo, debería conseguir los datos referidos al tipo de cambio en
igual momento.
La muestra deberá estar conformada de por lo menos seis unidades de análisis y se deberán identificar cual
es la variable explicativa (X) y cuál será la variable explicada (Y)

3 -TRATAMIENTO CUANTITATIVO DE LOS DATOS BIVARIADOS


3.1 Representar los pares ordenados en un gráfico de coordenadas. Dicho gráfico se denomina diagrama de
dispersión y permitirá identificar visualmente si los datos presentan una asociación lineal. Caso contrario, no
todo estudio que se realice de los mismos darán medidas prácticamente nulas. No una los puntos porque no
será tratado en este momento la función de regresión lineal, tema de la unid ad respectiva para el segundo
parcial.
3.2 Presentar los datos en una tabla, identificando cuál será la variable dependiente y cuál será la
independiente. Si bien, para estas medidas estadísticas es indistinto representar las variables en cualquiera
de los ejes por ser de naturaleza simétrica, cuando continuemos este trabajo con la función de regresión, se
necesita identificar la variable dependiente que es la explicada, por lo que para no trabajar dos veces, en esta
instancia lo representamos considerando cuál es X y cuál es Y.
3.3Construir las columnas necesarias en la tabla, tal que permita hallar en forma manual:
 la Covarianza
 la varianza y el resultante desvío para cada una de las variables
 el Coeficiente de Correlación.

3.4Cruzar los resultados del punto 3.3. con los valores informados en su calculadora y tildarlos en la tabla
dejando constancia de la forma: o.k. con calculadora
3.5Realizar la tabla del punto 3.3. en una planilla de cálculo tipo Excel (ver guía del curso sobre REGRESION)
y hallar tanto las medidas estadísticas como la representación del diagrama de dispersión.
3.6Interpretar las medidas estadísticas de covarianza y correlación en el marco del problema planteado.
3.7Expresar cuáles de las medidas suministran más información y qué consideraciones deberán tener en la
interpretación de los datos.
4.PRESENTACIÓN DE UN INFORME DE INVESTIGACIÓN. Que de cuenta de los siguientes puntos
obligatorios: (Para ello se ha tomado la Guía de Presentación de informes confeccionada por la Dra. Adriana
Fassio – F.C.E. – Escuela de Estudios de Posgrado, la que ha sido adaptada al curso )
Título: Informe de Investigación: La covarianza y correlación entre ……….. y ……….(especificar las dos
variables en estudio)
a. Presentación: en pocas palabras es una aproximación al trabajo que Ud. está presentando.  
b. Planteo del Problema: se trata de describir brevemente el tema que Ud. trata en este trabajo que puede ser 
presentado como la pregunta problematizante que pretende resolver con este estudio. 
c. Justificación: motivos que determinaron la elección del tema tratado. 
d. Objetivos: general y específicos 
Objetivo general: Da cuenta de los alcances de la investigación. Los objetivos se redactan a partir de un verbo 
en infinitivo, ya que expresan una acción a realizar (describir, explorar, analizar, determinar,  etc.). 

35
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

e. Objetivos  específicos:  Se  desarrollan  a  partir  de  la  operacionalización  del  objetivo  general.  Describen  con 
mayor precisión los productos logrados y las variables/aspectos relevantes estudiados para dar respuesta al 
tema/problema formulado.  
f. Hipótesis: son anticipos de respuesta al problema planteado. Las hipótesis se plantean como guía del  trabajo 
de investigación y/o para su verificación. Deben estar en concordancia con los objetivos y tipo de estudio. 
g. Marco teórico: es un pequeño resumen de lo que Ud. ha leído, se ha informado del tema del trabajo. Es el 
resultado  del  proceso  de  revisión  de  la  literatura  sobre  el  tema  (estado  del  arte)  y  la  identificación  de  los 
aspectos relevantes a tomar en cuenta para abordarlo con sus definiciones de las variables en estudios. Esta 
definición  operacional  de  cada  variable  es  importantísima  para  cualquier  investigación  futura,  para  quien  
retoma este trabajo  y puede continuarlo o ampliarlo.  En el marco teórico, es cuando el investigador toma 
postura personal a partir de la revisión del estado del arte.  Este punto del trabajo supone la referencia en el 
cuerpo del texto de los autores analizados para su construcción. Cuantas más referencias, más rico es el trabajo. 
Deberá evitarse los párrafos sin referencias o que no estén debidamente documentados. Se trata en la realidad 
de  referencias  científicas,  avaladas  por  comités  académicos.    Se  utilizan  las  normas  APA  en  su  edición  más 
reciente para las referencias 
h. Metodología: se menciona el Tipo de estudio correlacional dentro de la perspectiva cuantitativa.  
i. Fuentes de datos/herramientas de recolección utilizadas/ herramientas de procesamiento de los datos. 
Se  especifica  la  procedencia  de  los  mismos  y  fechas  de  recolección  o  presentación  con  los  sitios  webs 
correspondientes. 
j. Universo, muestra y unidad de análisis: especificar 
k. Resultados  del  trabajo  de  investigación:  Es  la  presentación  de  todos  las  tablas  y  gráficos  que  debió  haber 
realizado en la consigna.  Da cuenta de tanto del desarrollo del tratamiento cuantitativo de los datos como de 
los  hallazgos.  Conclusiones/reflexiones  finales:  Como  supone  el  broche  del  trabajo  de  investigación  y  es  el 
resultado final del desarrollo,  en las conclusiones, no pueden incorporarse ejes de discusión no planteados en 
los puntos correspondientes a los hallazgos. También se incluyen en la reflexión sobre las limitaciones de la 
investigación / consecuencias (si corresponde); sugerencias para investigaciones futuras y cualquier limitación 
encontrada en el proceso de investigación.  
l. Transferencia:  aporte/utilidad  del  trabajo  al  desarrollo  disciplinar/conocimiento  de  la  temática/ejercicio 
profesional según corresponda. 
m. Referencias  bibliográficas:  Deberán  listarse  por  orden  alfabético  según  apellido  del  primer  autor  de  la 
referencia a listar todas las referencias bibliográficas que han sido citadas en  todo el trabajo. Se seguirán las 
normas APA en su edición más reciente. 
Anexos:  Podrán    incorporarse  como  Anexos  documentos,  gráficos,  cuadros,  etc.  que  se  consideren 
complementarios y relevantes para el análisis del trabajo.  

EXCEL EN ESTADÍSTICA
   
Ya habilitado el menú de Estadística 
 
 Ingresar  los  datos  en  la  caja  de 
dialogo  y  luego  mediante  la 
elección  dentro  de  la  SOLAPA 
“DATOS”  seleccionar  lafunción  
“COVARIANZA” 
 Es  donde  aparece  el  siguiente 
cuadro de diálogo 
 

36
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

 
En rango de entrada se sombre la columna con  los valores 
asignados a la variable X e Y 
En  rango  de  salida  se  sombrea  el  espacio  en  donde  se 
espera obtener los valores de la función 
Si  se  quiere  que  aparezca  el  nombre  de  cada  variable  se 
sombrea ,pero se tilda la opción “Rótulo en la primera fila” 
para que no lo considere variable  
 
o bien 
se ingresa en la Opción “CORRELACIÓN” 

 
 
LA ÉTICA EN LA ESTADÍSTICA 
Por ser matemática aplicada, cuando se resuelve un determinado problema a partir de datos, se 
cubren dos etapas que aluden a dos tipos de tareas con relación al objeto de estudio, 
 PROCESAMIENTO DE LOS DATOS  Tarea que comprende un ANÁLISIS OBJETIVO. La objetividad apunta a 
realizar un tratamiento cuantitativo de los datos con aquellas medidas numéricas descriptivas más 
apropiadas para lo que se está estudiando. 
Ej.: Si los datos presentan asimetría, ¿debería usted reportar solo la media, cuando la mediana es útil? 
 INTERPRETACIÓN SUBJETIVA  Dado que la interpretación la realizan las personas,  depende desde la 
perspectiva de cómo ve el mundo, por tal razón: debería ser claro y neutral en sus conclusiones. 
  ÉTICA DEL DISCURSO en la ESTADISTICA  Cuando deba exponer resultados de trabajos  realizados, 
deberá documentar tanto los resultados buenos como los malos  y comunicar  los mismos de forma 
imparcial, objetiva y neutral. 

RESUMEN DE MEDIDAS NUMÉRICAS  


Tipo de análisis  Datos numéricos 
DESCRIBIR     
‐Tendencia central  Media aritmética, geométrica. Mediana. Moda.Cuantil  
‐Variación  Rango, Rango Intercuartílico.  
  Varianza, Desviación Estándar, Coeficiente de Variación.   
‐Forma  Asimetría, Kurtosis   
  AED: Gráfico de Caja y Bigotes.  
           Diagrama de Tallo y Hoja 
DESCRIBIR la relación entre dos variables  Covarianza 
numéricas  Coeficiente de Correlación 
 
 
 
 
 

37
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

AUTODIAGNÒSTICO DE ESTADISTICA DESCRIPTIVA.  
 
Marcar con una cruz la/s respuestas correctas a las siguientes expresiones: 
1) El modo es
- El valor de la variable con máxima probabilidad de ocurrencia
- El valor de la variable que divide a la distribución en dos grupos con igual cantidad de observaciones cada uno
- El valor de la variable que se repite con mayor frecuencia
- Una medida de posición y frecuencia
- Se grafica en el histograma de áreas.

2) La desviación estándar para el conjunto de valores de salarios de 3000, 3000,3000, 3000, 3000 y 3000 es
-3000 
-0 
-Ninguno de los valores anteriores

3) La media es aquella medida que


-divide los datos en dos mitades por comprender tanto el valor más chico como el más grande en el conjunto de
datos.
-Es considerada como el centro de gravedad de la masa
-La suma de todos los valores observados de la variable por su frecuencia simple absoluta
-La suma de todos los valores observados de la variable por su frecuencia relativa simple
-Resulta ser un valor comprendido entre el valor más chico y el más grande del conjunto de datos.

4) Las medidas de posición, -exceptuando el modo-


-No consideran todos los valores de la variable en estudio.
-Se grafican en el polígono de frecuencias acumuladas
-Toman en cuenta todos los valores de la variable en estudio.
-Se grafican en el histograma de áreas.

5) Una medida de tendencia central 


-es un valor cuantitativo que describe cuán dispersos se encuentran los datos alrededor de un valor central. 
-es un valor cualitativo que permite ser graficado 
-es un valor cuantitativo que localizan en algún sentido el centro de un conjunto de datos
• pueden ser medidas de posición o promedios (o momentos)
• siempre toman todos los valores de la variable
 
6) La mediana es
-El valor de la variable que divide a la distribución en dos grupos con igual cantidad de observaciones cada uno.
-El valor de la variable con máxima probabilidad de ocurrencia
-Una medida de tendencia central y de posición
-El valor de la variable que se repite con mayor frecuencia.

7) Las medidas de variabilidad


-Permiten determinan la representatividad de la media poblacional en algunos casos
-Permiten medir el grado de concentración o dispersión de los valores de la variable alrededor de un valor
central.
-Son el rango, el desvío y la media
-Miden el grado de variabilidad entre los valores de la variable en estudio y su valor central.

8) Para cualquier distribución de datos, la suma de todas las desviaciones con respecto a su media
-es distinto de cero
-es el desvío medio
-es la varianza
-es igual a cero

38
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

9) La suma de los cuadrados de las desviaciones de los valores observados con respecto a la media
-a veces será negativa.
-Es la varianza
-Es una medida de forma
-Siempre es positiva

10) La frecuencia de una clase


-Es el número de datos cuyos valores caen dentro de las fronteras de esa clase
-Es un elemento necesario para determinar el valor modal
-A veces es la misma en cada intervalo de clase
-No puede ser la misma en cada intervalo de clase

11) Las distribuciones de frecuencia


-se utilizan para presentar en una forma concisa grandes cantidades de valores repetitivos
-resultan convenientes en el caso de que el número de datos sea inferior a 20
-es un resumen tabular que muestra el dominio de una variable en intervalos
-no es ninguno de las anteriores

12) La desviación media absoluta es


-La media de los valores absolutos de las desviaciones de los valores de la variable respecto de su media
-La suma de los valores absolutos de las desviaciones de los valores de la variable respecto de su media
-Una medida de dispersión como lo es el rango
-La suma de los módulos de las desviaciones desde la media

13) Los momentos empíricos son


-Operadores matemáticos que se obtienen a partir de los valores observados de la variables
-Ponen de manifestó características de la distribución de frecuencias
-Denominados momentos centrados
-Ninguna de las anteriores

14) Un coeficiente de variabilidad bajo indica que

-La media es muy representativa de los valores que puede tomar la variable
-Los valores que toma la variable son homogéneos
-Los valores que toma la variable son heterogéneos
-El desvío es significativo con respecto a la media.

15) Un coeficiente de variabilidad alto indica que


-La media es poco representativa de los valores que puede tomar la variable
-Los valores que toma la variable son homogéneos
-Los valores que toma la variable son heterogéneos
-El desvío es significativo con respecto a la media.
-La media es muy representativa de los valores que puede tomar la variable

16) La varianza es el
-Momento centrado de orden 1
-Momento absoluto de orden 2
-La diferencia entre el momento centrado de orden 2 y el cuadrado del momento centrado de orden 1
-La diferencia entre el momento absoluto de orden 2 y el cuadrado del momento absoluto de orden 1

17) Las medidas de orden superior


• Permiten comparar una serie de frecuencias con una distribución normal
-Son medidas de tendencia central
-Son medidas que permiten comparar la asimetría y la altura de una serie de frecuencias con una curva normal.
-Son medidas de posición

39
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

18) Una curva mesocúrtica


-Puede ser asimétrica, sesgada a la izquierda
-Puede ser asimétrica, positiva
-Tiene mayor altura que una normal
-Tiene menor altura que una normal
• Siempre es simétrica

19) Una curva asimétrica negativa


-Tiene modo mayor a la media
-Tiene modo menor a la media
-Presenta poca concentración de valores bajos de la variable en estudio
-Presenta alta concentración de valores bajos de la variable en estudio

20) El momento centrado de orden 3


-Es la varianza
-Se denomina usualmente asimetría
-Se denomina usualmente kurtosis
-Ninguno de los anteriores

21) El momento absoluto de orden 1


-Es la media
-Arroja el valor 1
-Es igual al momento centrado de orden 1
-Es el promedio aritmético de los valores observados de la variable

40
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

II – TEORIA DE LA PROBABILIDAD –UNIDAD TEMÀTICA Nro.1 del Programa Nº 3496/13


Objetivos del Aprendizaje: Introducir la noción de aleatoriedad como resultado del conocimiento incompleto de los fenómenos
fácticos y de la probabilidad como medida de dicha aleatoriedad.

Recordemos que Lind, Marchal, Mason consideran como razones para el estudio de Estadística, la presencia de los 
datos en todas partes, en donde las técnicas estadísticas se usan para la toma de decisiones y dado que siempre un 
ser humano está tomando decisiones lo hace  con los datos que cuenta y esa decisión repercute en la vida. 
 
Al respecto, si definimos “decisión” podemos decir que es la resolución que el individuo toma como respuesta a un 
problema que debe ser resuelto.  Resulta ser el resultado de un proceso mental‐cognitivo del ser humano o de un 
conjunto de seres humanos  que conduce a la selección y ejecución de una acción.  
 
Un cartel en un escritorio de un importante editor de periódicos decía “No me traiga un problema si no trae una 
solución” 
 
Para tomar una decisión, no hay duda que es necesario conocer el problema, comprenderlo lo mejor posible y en 
función a la información con la que se cuenta poder dar una solución a ese problema. 
 
Por lo tanto,  las decisiones pueden ser consideradas bajo certeza, incertidumbre y riesgo. 
 
Pavesi,  Pedro  y  otros,  2004,  La  decisión,  Buenos  Aires:  Grupo  Editorial  Norma  parte  de  un  concepto  general 
definiendo  Incertidumbre – en sentido amplio‐ de la siguiente manera: Existe incertidumbre si el decisor cree que 
una variable puede adoptar uno de entre, por lo menos, dos niveles posibles, pero no puede asegurar cuál será 
dicho  nivel.  Pero,  esta  ignorancia  puede  darse  en  la  propensión  a  suceder  de  los  niveles  de  una  variable,  sino 
también de la identificación de los niveles posibles y también de las variables en juego. 
 
Sin embargo, considerando un enfoque estadístico, una decisión bajo incertidumbre significa “el desconocimiento 
absoluto de la propensión a suceder, es decir de la probabilidad de un estado determinado de los mundos inciertos.” 
Así, en este caso se conocen los estados posibles –sus variables y niveles y otros factores‐ pero no se conoce la 
probabilidad de tales estados. 
 
La resolución a problemas de decisión en tales casos lleva a considerar diferentes métodos, entre los cuales será el 
decisor quien adoptará el que en forma subjetiva considere más conveniente. El problema es que cada método  
puede arribar a resultados distintos. 
 
Uno de los métodos  
 
- Criterio de Laplace de razón insuficiente: 

Si una variable puede adoptar cuatro niveles cuya probabilidad se desconoce, entonces los cuatro niveles son 
equiprobables: no hay razón suficiente para atribuir una probabilidad mayor o menor a cualquiera de ellos. 
Dado,  que  si  esa  razón  existiera  para  preferir  uno  u  otro,  entonces  no  se  estaría  en  condiciones  de 
incertidumbre. 
 
- Criterio de Wald: 
Pensando en el criterio de la teoría de los juegos, empleado en la guerra, en tonde el enemigo no perdona y 
tratará  de  provocar  el  mayor  daño.  Entonces,  adoptando  una  posición  de  prudencia  máxima,  denominada 
conservadora se elige la alternativa cuyo peor resultado sea mejor que los peores resultados. Sigue diciendo 
Pavesi, es como considerar que el fin de la Bolsa es arruinar al inversor. Son los métodos maximin, minimix  o 
criterio pesimista. El decisor desconoce la propensión a suceder, desconoce la probabilidad de los estados del 
mundo incierto, si bien conoce cuáles y cuantos son esos estados. 

41
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

- Criterio  maximax o criterio optimista 
Es el extremo del criterio anterior, identificando el mejor resultado posible para cada alternativa y seleccionado 
el de mayor resultado posible. 
 
- Criterio de Hurwicks: 
Adopta una combinación lineal entre el criterio pesimista y el optimista. 
 
- Criterio de Savage: 
Considerando el pesimismo del maximín, aplicado al costo de oportunidad de la elección en vez de aplicarlo a 
los resultados 

 Riesgo: 
 
Una decisión bajo riesgo es aquella en la cual conocemos las probabilidades de ocurrencia de los estados posibles 
del mundo incierto. Se conoce cuántos estados son posibles y se le puede asignar una probabilidad mayor que cero 
a cada uno de ellos. 
 
Se  utilizan  medidas  estadísticas,  y  se  selecciona  una  vez  calculada  la  esperanza  matemática  como  promedio 
ponderado por las probabilidades de los resultados de cada alternativa, la alternativa que tenga mayor esperanza 
matemática y otras medidas aún más importantes. 
 
En las decisiones financieras se pueden utilizar  modelos determinísticos o modelos probabilísticos. 
Un modelo es determinístico cuando los resultados están determinados por las condiciones en que se da.  
En cambio un modelo probabilístico también denominado estocástico es cuando se conocen todos los resultados 
posibles, hay replica, pero se desconoce cuál será el resultado. 
 
La probabilidad es el concepto que ingresa en la consideración de las decisiones en condiciones de riesgo y es el 
aporte que nosotros haremos para materias posteriores. 

Definiciones e Interpretación del resultado de probabilidad 
La  Estadística  es  un  método  de  Toma  de  Decisiones  ante  la  incertidumbre  basada  en  la  Teoría  de  las 
Probabilidad. 
La Probabilidad es el lenguaje y es la medida de la incertidumbre y los riesgos asociados a ella. 
 
Podemos decir que la PROBABILIDAD es la expresión cuantitativa del sentimiento de incertidumbre respecto del 
resultado  de  un  fenómeno.  Se  basa  en  que  en    muchos  fenómenos  inciertos  existen  patrones  a  largo  plazo.            
          
El valor numérico hallado NUNCA ASEGURA de lo que ocurrirá en la próxima observación, ensayo.  
Pues el resultado da información de lo que ocurrirá si se repite una y otra vez 
ese ensayo en igual de condiciones y por lo tanto el resultado 
hallado  es  el  resultado  a  largo  plazo,  es  el  valor  esperado  a 
largo plazo. 

42
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

ENFOQUES DE PROBABILIDAD:

Actividad: Aplicación Teórica de PROBABILIDAD


Para cada situación subraye que enfoque de probabilidad es más útil aplicar según el
caso.
a) Obtener el número 2 o el 3 en el lanzamiento de un dado    Prob.Clásica   Prob. Subj. 
Prob.Frecuenc. 
 
b) Haya recesión económica el próximo año      Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
c) Sea defectuosa una partida elegida aleatoriamente de las  
20 partidas de   un   embarque que  se   sabe   tiene partes  
Defectuosas            Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
d) Sea defectuosa una partida elegida aleatoriamente de     un 
Gran embarque en donde no existe información sobre     el 
Porcentaje de Defectuosos como para estimar    Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
e) Una persona elegida aleatoriamente  de   entre    todas las 
Personas que  visitan   una    tienda  de calzado realice una  
Compra en esa tienda.          Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
f) Que para el próximo semestre incremente      el        índice 
MERVAL              Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
43
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

g) Si sabe que en una población de 50200 personas considera‐ 
das económicamente activas,  se   detectó   según la última  
encuesta de     Empleo   y    desempleo que 12.820 personas  
estaban desocupadas y desea conocer si selecciona una per‐ 
zona al azar de dicha población, cuál es la probabilidad      de 
que se encuentre desocupada        Prob.Clásica   Prob. Subj. Prob.Frecuenc. 
 
h) En una reunión empresarial, se realiza una encuesta con    el 
Objeto de conocer la opinión de los empresarios presentes  
Acerca de ¿cómo va a evolucionar la economía argentina   en 
El año 2016? Y ¿qué probabilidad cree usted que tiene el país  
de ingresar las marcas de celulares Iphone al país para que  
compitan en el mercado argentino?      Prob.Clásica   Prob. Subj. Prob.Frecuenc. 

ESPACIO MUESTRAL: conjunto de todos los resultados posibles (disjuntos o mutuamente


excluyentes , no se superponen y son colectivamente exhaustivos) Lo denotamos como Ω o bien como U
¿Qué significa cuando se dice que todos los resultados posibles son mutuamente excluyentes y colectivamente
exhaustivos?...........................................................................................................................
Un experimento aleatorio o estocástico: es proceso y observación. Se refiere a observaciones realizadas en las
cuales cualquier ACCIÓN O PROCESO tiene un resultado sujeto a incertidumbre.

APLICACIONES SOBRE PROBABILIDAD


1) Halle el espacio muestral. Especifique si el conjunto es finito o infinito en los sig. casos:
a. Experimento 1: Lanzar al aire una moneda.
b. Experimento 2: Lanzar un dado
c. Experimento 3: Seleccionar al azar un alumno del curso y se registra el peso y la altura Rtas: 
a. Experimento  1: Lanzar al aire una moneda.  

U=
{0; 1} El espacio muestral es un conjunto finito
b. Experimento  2: Lanzar un dado  

U= {1; 2; 3; 4; 5; 6} El espacio muestral es un conjunto finito

c. Experimento  3: Se selecciona al azar un alumno del curso y se registra el peso y la altura   

U= { (x;y) ε R: x>0, y>0} El espacio muestral es un conjunto infinito


2) De acuerdo a los resultados de cada experimento (Espacio Muestral) presentados se clasifican en:
 DISCRETOS cuando los resultados son separables y contables 
o Finito (si hay un número limitado de resultados posibles) 
o Infinito numerable(si hay un número ilimitado de resultados, entonces si bien la cantidad de 
resultados posibles es infinita, podemos hacer una correspondencia uno a uno con los enteros 
positivos) 
 CONTINUO cuando los resultados no son separables y el número de resultados es infinito no numerable. 
Es decir que la cantidad de resultados posibles es infinita, y no se puede hacer una correspondencia uno a 
uno con los enteros positivos 

44
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Otro caso: Si repetimos el experimento de lanzar al aire una moneda “n” veces. Cada uno de los resultados
posibles se denomina suceso. El espacio muestral también es un suceso ya que representa la suma de
sucesos simples y el conjunto vacío también es un suceso. Entonces denominamos al suceso A: cara y al
suceso B: ceca. ; n(1): son las veces que sale el suceso A y n(2): las veces que sale el suceso B.
La frecuencia relativa del suceso A denotada como ; mientras que la frecuencia relativa del
suceso B denotada como fB
Las propiedades de la frecuencia relativa:
1)   0 1 
2) 1, si solo ocurre el suceso A en las “n” repeticiones 
3) 0, si no ocurre el suceso A en las “n” repeticiones 
4) Si A y B son sucesos excluyentes  + =1 
5) Cuando  n  ∞ la     converge en probabilidad    P(A) =    
n  ∞ 

La probabilidad clásica se define como el cociente entre casos favorables y casos igualmente posibles.
Veamos: 
Las propiedades de la probabilidad
1 0        0 1 
2) Si S= U  n = N       y P(S)=1 
3) Si =  Φ          n= 0        y  P(S)=0 
̅
4) Si   es complemento de S  (N‐n) : cantidad de resultados del suceso  ̅ 
      ̅ 1   = 1 – P(S) ; es decir:  ̅ 1 – P(S), despejando:  ̅  P(S)  = 1 

CONTEO DE PUNTOS MUESTRALES

El conteo nos permite determinar la cantidad de eventos o sucesos posibles del espacio muestral.

Teorema - PRINCIPIO FUNDAMENTAL DEL CONTEO


“Si una operación puede realizarse en N1 formas y si por c/u de estas una segunda
operación puede llevarse a cabo en N2 formas, entonces las dos operaciones pueden
realizarse juntas en N1 N2 formas”

APLICACIONES sobre CONTEO

Ej. 1) Una inmobiliaria ofrece la posibilidad de seleccionar el estilo de Viviendas tipo: Casa, Dùplex,
Departamentos, con una sola planta, dos plantas. ¿De cuántas maneras posibles puede un comprador
ordenar una de estas viviendas?
Soluciòn: Dado que N1 = (3) y N2 = (2) Entonces, un comprador puede elegir entre N1 N2 = (3). (2) = 6
viviendas posibles

Otra forma de representarlo es con diagrama del árbol, cada Nj = j ramas.


Ej. 2) Una Compañía de celulares ofrece las marcas Samsung, Nokia, Alkatel, Sony, BB, con
facturación Plan 1, Plan 2, Plan 3 y Plan 4, que a su vez cada plan ofrece Internet o sin Internet¿De
cuàntas maneras posibles puede un cliente ordenar uno de estos celulares?
Soluciòn: Dado que N1 = (5) y N2 = (4) N3 = (2)

45
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Entonces el número de formas diferentes en que un cliente puede ordenar un teléfono celular es N1 N2 N3 =
(5). (4). (2) = 40

Ej.3) Halle cuántos puntos muestrales hay en un espacio muestral cuando se lanza 3 dados una sola
vez , es lo mismo que decir un dado que se lanza 3 veces.
Soluciòn: El 1er. Dado puede caer en cualquiera n1 =6 maneras, al igual que el 2do. dado y el 3er. Dado.
Por lo tanto la cantidad de puntos muestrales es N1 N2 N3 = (6). (6). (6) = 216

Ej. 4) Si en la metodología de evaluación en las materias de la F.C.E. de la UB.A. contempla: ausente


- promocionado – regularizada – insuficiente. Considerando que Ud. Se inscribe en 3 materias a)
¿Cuál es el número de formas posibles de terminar el cuatrimestre? Y Construya el árbol con todas
las formas posibles. b) y si usted se inscribió en 4 materias ¿cuál es el número de formas. c)
considerando todo el plan de estudios con 33 materias ¿de cuántas maneras posibles se pueden
concluir la carrera?
a) N1 N2 N3 = (4) 4).( 4) = 43 = 64 b) N1 N2 N3 N4 = (4) 4).( 4) .(4) = 44 =256 c) 433
Veamos:
Caso particular
PRINCIPIO FUNDAMENTAL DEL CONTEO
N1 =N2 =…=Nn N 1 N2 N 3 … Nn

Nn
cantidad de formas de
combinar “n” objetos
con ”N” opciones c/u.
cantidad de formas o grupos en
que se ordenan “n” objetos de N
n≤N
Si
Dos grupos son diferentes si Dos grupos son diferentes si
Difieren en algún elemento o únicamente cuando tienen
En el orden de los mismos algún elemento diferente
INTERESA LA POSICIÓN INTERESA LA PRESENCIA
IMPORTA EL ORDEN- - NO IMPORTA EL ORDEN-
VARIACIONES COMBINACIONES
! !
N Vn = . … NCn =
! ! !
Si
n=N
PERMUTACIONES
PN = N!
Es la variación de N elementos tomados de a n.

El FACTORIAL N!= N (N-1) (N-2)… 3.2.1


Es el Producto de N factores decrecientes, en donde el primer factor es N y el último factor es 1.
El factorial de N indica la cantidad de formas en que se ordenan N objetos. Se trata de permutaciones de
N objetos.
Cada ordenamiento diferente de un conjunto de objetos se denomina permutación.
Propiedad: 0! =1
Veamos esta interesante relación
! . . … . … . . . . … . !
= N.(N-1)(N-2)…(N-n+1)
! … . . !

46
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

1) En una carrera de 8 ciclistas ¿Cuántos resultados  distintos (ordenamientos) pueden darse? 
n1 n2 n3 n4 n5 n6 n7 n8   =  (8) . (7) . (6). (5) . (4) . (3) . (2) . (1) 
8 7 6 5 4 3 2 1

N!= N . (N-1) . (N-2)…3.2.1


CASO 1: VARIACIONES : NPn o bien NVn =

Es el número de formas de ordenar “n” objetos seleccionados de “N” objetos, sin interesar el orden. Es
decir, existe un conjunto general denominado “N” del cual extraemos una muestra “n” de forma ordenada.
Entonces, se denomina Variaciones de N elementos tomados de a n, a la cantidad de grupos de “n”
elementos que se pueden formar con N elementos, considerando que dos grupos son distintos, si difieren
en algún elemento o en el orden. Por eso, se dice que “importa el orden”
Condición: N≥n
!

!
2) Deloitte busca estudiantes de la carrera de actuario para ocupar 4 cargos distintos. Si de los avisos que 
reciben los alumnos, se presentan 20 solicitudes de empleo. ¿Cuántas posibilidades diferentes se dan, 
suponiendo que todos pueden ser elegidos?   

n1 n2 n3 n4 = (20). (19). (18). (17) Rta: 116280

3) ¿Cuál es el número de maneras distintas que se pueden presentar  las letras ABC tomadas de a 2, importando 
el orden de presentación?                    Rta: 6  

AB
AC -IMPORTA EL ORDEN-
BA
!
BC n Vr 6
!
CA
. . … . !
CB n Vr =
!
. 1 . 2 … 1

Se trata de Variaciones Simples: Número de formas o maneras de ordenar “r” objetos seleccionados de n
objetos en donde importa el orden. Son permutaciones de n objetos tomados de r en r.

4) ¿Cuántas permutaciones posibles con  5 letras ABCDE se pueden hacer si se las coloca en orden de a 2? 

Rta: 20
5) ¿De cuántas maneras pueden quedar asignados los títulos de campeón y subcampeón? Si son cuatro 
competidores                            Rta: 12 
AB   ‐  BA   ‐ CA  ‐  DA 
AC   ‐    BC   ‐  CB  ‐  DB 
AD ‐    BD  ‐    CD  ‐ DC 

! . .
n Vr =12
!

Veamos las características en este caso 1.


NVn = N . (N-1) . (N-2)…(N-n+1)
NVn = número de permutaciones de N objetos tomados de n en n , importa el orden

47
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

En donde N es el total de objetos y n: número de objetos del subconjunto y donde


Observemos que si el numerador de NVn lo escribimos como N!= N.(N-1) . (N-2) …(N-n+1). (N-n)!
debemos luego dividir por (N – n)!, para llegar a la expresión de NPn idéntica a la expresión
NPn = N . (N-1) . (N-2)…(N-n+1). Por ello, también podemos expresar el número de permutaciones de N
objetos tomados de n en n como:
!
NVn = . . …
!
PERMUTACIONES PN
Cada ordenamiento diferente de un conjunto de objetos se denomina permutación.
Se denomina Permutaciones a la variación de N elementos tomados de a N, considerando que dos grupos
son distintos, si difieren en el orden.
Si en la NVn = N=n entonces hablamos de Permutación. PN = N!

Caso 2: COMBINACIONES: NCn


Es el número de combinaciones de N elementos tomados de n en n. Si observamos por ej. El ejercicio 3
anterior en el número de permutaciones de N objetos tomados de n en n están repetidos los elementos, es
decir que se presentan permutaciones con iguales elementos pero en diferente orden entre ellos. Por eso, si
consideramos que dos conjuntos de objetos son idénticos si contienen exactamente los mismos elementos,
sin tener en cuenta la forma en que están ordenados, entonces debiéramos sacarlos de NVn
Es decir, Si no nos interesa o carece de importancia ese orden y el interés reside en el número de
combinaciones de n objetos tomados de n en n “sin importar el orden”, entonces tenemos que eliminar de
NVn aquellos conjuntos con elementos repetidos n! Siempre hay menos combinaciones que variaciones.
Concluyendo, se llaman combinaciones de N elementos tomados de a n a la cantidad de grupos de n
elementos que se pueden formar con N elementos, considerando que dos grupos son distintos, si tienen
algún elemento diferente. Por lo tanto, se dice que acá “no importa el orden”
Nos queda la fórmula que represente el número de formas de ordenar “n” objetos de “N” objetos sin
importar el orden.
!
NCn = . =
! !
nCr: número de combinaciones de n objetos tomados de x enx

Así que NVn= NCn . n! de modo que:


NCn =
!

! !
Si sustituimos NPn por el valor nos queda NCn =
! ! !
6) ¿Cuál es el número de combinaciones que se pueden hacer con las letras ABC tomadas de a 2 si no interesa 
el orden?                        Rta: 3 

AB
AC -NO IMPORTA EL ORDEN-
BA
3
BC NCn 3
2
CA
CB
Se trata de Combinación: Número de formas o maneras de ordenar “r” objetos seleccionados de n objetos en
donde NO importa el orden.
Aplicación: Número de muestras posibles en un muestreo aleatorio sin reposición de sus elementos.

Recordemos que En Variaciones: interesa la “posición” de los elementos en el grupo formado.


48
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

En Combinaciones interesa la “presencia” de los elementos en el grupo formado


Como se expresó anteriormente: cada ordenamiento diferente de un conjunto de objetos se denomina
permutación. En el caso de que no nos interese el total de permutaciones de todos los ”n” objetos sino el de
permutaciones de algún subconjunto de objetos podemos ver dos casos específicos:
Caso 1: en un orden nPr o denotado como nVr
Caso 2: no importa el orden nCr
NOTACIONES BÁSICA DE PROBABILIDAD

P( Probabilidad del complemento de A Probabilidad de que no ocurra A


P(A/B) Probabilidad condicional de A dado B Probabilidad de que ocurra A dado que ha ocurrido B
P(A⋂ Probabilidad conjunta de A y B Probabilidad de que ocurran tanto A como B
P(A⋃ Probabilidad de la Union A y B Probabilidad de que ocurra A , o bien B, o ambos.

EJERCICIOS DE APLICACIÓN de PROBABILIDADES

1) Un comercio cuenta con 180 clientes de los cuales 54 son incobrables. Si por cada cliente se cuenta con
un resumen de situación y se extrae al azar un resumen.
a) ¿Cuál es la probabilidad de que pertenezca a un cliente incobrable?
b) ¿Cuál es la probabilidad de que pertenezca a un cliente no incobrable?
Rta: a) 0,30; b) 0,70

2) Una organización vende 1000 billetes de lotería. Hay 10 premios grandes y 100 premios chicos y todos
deben repartirse. El proceso de selección de los ganadores es tal que al principio todos los billetes tienen
las mismas probabilidades de ganar un premio grande y todos tienen las mismas probabilidades de ganar
un premio chico. Ninguno puede ganar más de un premio.
a) ¿Cuál es la probabilidad de ganar un premio grande con un único billete?
b) ¿cuál es la probabilidad de ganar un premio chico?
c) ¿Cuál es la probabilidad de ganar algún Premio?
Rta: a) 0,01 b) 0,10 c) 0,11
3) ¿Cuál es la probabilidad de acertar un pleno (acertar justo al número que sale) en la ruleta? Rta. 1/37

4) YPF observó que el 75% de los clientes compran nafta INFINIA, el 80% nafta SUPER y el 65%
consume las dos. ¿cuál es la probabilidad de que un cliente consuma al menos una de las dos?

Rta: 0,90
5) En una tirada de ruleta ¿Cuál es la probabilidad de:
a. Que salga el número cero.
b. Que salga el número par
c. Que salga el número par, mayor
Rta: a) 1/37; b) 18/37; c) 9/37

6) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados


a. Salga la suma 7
b. Salga la suma 11
c. salga la suma de 7 ú 11
d. salga la suma 8 ú 11
Recuerde presentar el espacio muestral

49
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Rta: 6/36; 2/36; 8/36; 7/36

7) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos, si se pueden
diferenciar los dados? Presente el espacio muestral.
Rta: ¼
8) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos si no se pueden
diferenciar los dados? Presente el espacio muestral
Rta: 1/6

9) Se lanza una moneda equilibrada dos veces. a) ¿Cuál es la probabilidad de que ambos lanzamientos de
cara?
b) Responda, si la probabilidad hallada se interpreta como que si el ensayo se repite: la probabilidad
de que suceda es ese valor hallado
Rta: ¼.
10) Se lanzan 3 monedas. ¿Cuál es la probabilidad de obtener: a) ninguna cara; b) dos caras; c) menos de
dos caras d) una o tres caras, d) 4 caras? Rta: a) 1/8; b) 3/8 ; c) ½; d) ½ ; e) 0

11) De un mazo de 52 cartas de póker, compuesto por 13 cartas de trébol, 13 de corazones, 13 de diamantes
y 13 de picas, se extrae al azar una carta. Calcular la probabilidad de:
a. Extraer un trébol
b. Extraer un trébol o un corazón
c. Extraer un trébol o un corazón o un diamante
d. No extraer trébol. Rta. a) ¼ ; b) ½; c) ¾; d) ¾

12) ¿Cuál es la probabilidad de sacar en un mazo de cartas de 52 naipes, un as o un rey? Rta.: 2/13
13) ¿Cuál es la probabilidad de sacar un 1 o una espada o ambos en un mazo de 48 naipes que no tienen
comodines? Rta = 15/48

14) ¿Cuál es la probabilidad de extraer 2 bolas rojas consecutivas sin devolver a la urna que tiene 3 rojas y
dos bolas verdes? Rta: 3/10

15) ¿Cuál es la probabilidad de obtener un as (A), un rey ® o un dos (D) al extraer un naipe de mazo
debidamente barajado de 52 naipes? Rta: 3/13
16) Una carpeta de “Ajustes Manuales para dar de alta en la Cartera Pasiva de Clientes” contiene 12
cuentas de clientes, de las cuales se detectó que 4 de ellas contienen un error de procedimiento en sus
cuantías.
a) Si un auditor selecciona aleatoriamente una cuenta. ¿Cuál es la probabilidad de que ésta contenga el
error?
b) Si un auditor selecciona aleatoriamente dos de estas cuentas (sin reemplazo): b.1) ¿Cuál es la
probabilidad de que las dos contenga un error de procedimiento? b.2) ¿de que ninguna de ellas tenga
error?
c) Si el auditor selecciona aleatoriamente tres cuentas ¿Cuál es la probabilidad de que ninguna de ellas
contenga un error de procedimiento? Rta: 0,33; 0,09; 0,42 y 0,25

17) De una caja que contiene 3 biromes negras y 4 biromes verdes, se extraen 4 sin reposición. Calcule la
probabilidad de que sean:
a. 1 verde y 3 negras (en ese orden)
b. 2 verdes y 2 negras (en ese orden)
Rta: a) 1/35; b) 3/35
18) En una administración de cartera existen 300 clientes, de los cuales 100 son clientes grandes y los
restantes son chicos por su envergadura. De los clientes grandes el 20% son de Azul y el resto de otros
50
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

lugares del Gran Buenos Aires. Además, el 10% de la cartera total son clientes chicos y de Azul. Asimismo,
para corroborar los datos también se sabe que en la administración hay 250 clientes de los otros lugares
del Gran Bs.As. Determine la probabilidad de que:
a. Un cliente sea de la zona de Azul Rta 1/6
b. Si se eligió un cliente de Azul que este sea chico. Rta 3/5
c. Un cliente sea de Azul o grande Rta: 13/30
d. Un cliente sea de Azul y grande Rta: 1/15
e. Para ello, construya una tabla de asociación y la correspondiente tabla de contingencias,
expresando cada una de los valores que directamente surgen de la tabla y definiéndolos.

19) En el Aeropuerto de Trelew se registraron 500 pasajes de mujeres y 800 de varones, de los cuales el 3%
de las mujeres son turistas y el 5% de los varones son varones turistas. Determine la probabilidad de que
seleccionado al azar un pasajero sea:
a. turista
b. no sea turista
c. varón y no turista
d. mujer y turista
e. mujer y no turista
f. mujer o turista
g. Luego, determine la probabilidad de que sabiendo que es turista, sea varón.
h. Probabilidad de que sea mujer, si se sabe que no es turista.
Rta: a) 0,0423; b) 0,9577; c) 0,5846; d) 0,0115; e) 0,3731 f) 0,4154 g) 0,73 y h) 0,3896
20) En el bar de la Facultad se consume café y té. Se conoce que el 30% consume café, el 60% consume té
y el 5% consume ambos. ¿Cuál es la probabilidad de que elegida una persona al azar, consuma algún tipo
de bebida? Rta: 0,85

21) En un curso conformado por 100 estudiantes, se selecciona al azar un estudiante y se quiere hallar la
probabilidad de que sea un estudiante varón o sea un estudiante menor o igual a 20 años. Se conoce que el
60% son mujeres y el 48% son mujeres mayores de 20 años y el 80% de la población son mayores de 20
años.
Rta: 0,52

B
A P A . P
A
P
B
∑ P A . P
A
22) En una fábrica hay 3 máquinas A1, A2 y A3, que producen el 20%, el 30% y el 50% respectivamente,
de la producción total. La máquina A1 genera 5% de defectos La máquina A2 genera 10% de defectos
La máquina A3 genera 15% de defectos. Si se extrae de la producción un artefacto defectuoso, se desea
saber la probabilidad de haber sido fabricada por la máquina A1.
P (A1/B)=0,08695

23) Frente a denuncias de recipientes con menos contenidos de lo indicado, el gerente comercial no sabe
de qué planta puede provenir, por tal razón se comunica con el gerente de control de procesos de producción
y obtiene la siguiente información
Planta A1 55% total de la producción 3% de recipientes defectuosos
Planta A2 45% total de la producción 4% de recipientes defectuosos
Cuál es la probabilidad de que las botellas defectuosas (B) hayan sido llenadas por la Planta “A”
P (A1/B)=0,4782
51
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

24) En una entidad financiera hay un sistema de alarma. En una noche cualquiera la probabilidad de que:
Suene la alarma cuando hay robo es 0,99
Suene la alarma si no hay robo es 0,01
Ocurra un robo es 0,002
Calcular la probabilidad de que si suena la alarma (B) haya robo (A1)
P (A1/ B)= 0,16555
25) Tres bibliógrafos idénticos contienen facturas en dos colores, las blancas son a cobrar dentro de los 30
días y las rosas a cobrar en plazos más extensos. A continuación se indica los colores de las facturas en
cada bibliógrafo:
Bibliógrafo 1 Bibliógrafo 2 Bibliógrafo 3
6 blancas 3 blancas 8 blancas
2 rosas 5 rosas 10 rosas
Si un empleado recibe una factura que otro extrajo de alguno de esos bibliográfos, la que resulta ser blanca.
Calcule la probabilidad de que esta factura blanca provenga del segundo bibliógrafo.
P (A2/B)= 27/113= 0,2389

26) Dos impresoras láser de diferentes marcas Marca Epson y Marca HP imprimen diariamente 700 y 1000
hojas respectivamente. La experiencia nos indica que la impresora Epson imprime hojas con error en la
proporción del 3% mientras que la impresora HP imprime con error en la proporción del 5%. De la
impresión diaria, se elige una hoja al azar y de ella resulta que tiene error de impresión.
¿Cuál es la probabilidad de que la hoja elegida provenga de la impresora HP? P (A2/B)= 50/71

27)En una entidad financiera que tiene cien mil cuentas de ahorro activas se procedió a realizar una auditoría
de la que resultó gran cantidad de cuentas con diferencias las que se informan seguidamente juntamente
con el oficial de inversiones responsable de esas cuentas
Cartera de cuentas de ahorro Cantidad de cuentas Cuentas con diferencias Oficial de Inversiones
Grupo 1 900 40 Díaz, Horacio
Grupo 2 600 50 Benítez, Marcela
Grupo 3 1.700 60 Martínez, Isidoro
Grupo 4 800 100 Opico, Germán
Si se seleccionó una cuenta de uno de los grupos al azar y resulta ser con diferencias. Determine la
probabilidad de que dicha cuenta provenga del oficial de inversiones Martínez, Isidoro que atiende ese
grupo 3.

P (A3/B)= 6/25= 0,24

28) Del total de piezas de una fábrica que ensambla auto- partes, el 65% provienen del proveedor del Sur y
el 35% del proveedor del Norte. Un estudio reveló que el 98% de las piezas compradas al proveedor del
Sur son piezas de buena calidad mientras que el 95% de las piezas compradas al proveedor del Norte son
de buena calidad.
Si una máquina se descompone por ensamblar una pieza mala: a) ¿Cuál es la probabilidad de que sea del
proveedor del Sur? B) ¿Cuál será la probabilidad de que sea del proveedor del Norte?
P (A1/B)= 0,4262 P (A2/B)= 0,5738

29) Un concesionario de auto sabe que el 10% de las personas que ingresan al local y preguntan, compran
un auto. Por ello, la concesionaria decide ofrecer una cena gratis con un vendedor a todas aquellas personas
que están dispuestas a escuchar la presentación completa del vendedor, así aumentaría la probabilidad de
éxito en las ventas. También se sabe que algunas personas hacen cualquier cosa por una cena gratis y
también que otras personas no quieren cenar con un vendedor, aunque tenga ganas de comprar un auto.

52
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Por ese motivo, se pretende comprobar la eficacia del incentivo. El proyecto se hizo durante 6 meses y el
40% de las personas que compraron un auto cenó gratis. También cenó gratis el 10% de las personas que
no compraron un auto.
a) ¿tienen las personas que aceptan la cena una probabilidad mayor de comprar un auto?
b) ¿qué probabilidad hay de que una persona que no acepta una cena gratis compre un auto?
P (A1/B)= 0,308 y P (A1/B)= 0,069

AUTODIAGNÓSTICO DE CONCEPTOS TEÓRICOS DE PROBABILIDAD

Conteste V (Verdadero) o F (Falso) o de corresponder, integre las líneas que requiere completar

1. En la teoría de la probabilidad, el resultado de algún experimento se conoce como actividad.


2. La probabilidad de que dos o más eventos estadísticamente independientes se presenten de manera
simultánea o consecutivamente es igual a la suma de sus probabilidades marginales.
3. Utilizando el teorema de Bayes podemos desarrollar las probabilidades, basándonos en nueva
información; a estas probabilidades se les conoce también como probabilidades posteriores.
4. En probabilidad clásica, podemos determinar a priori las probabilidades basadas en un razonamiento
lógico antes de que cualquier experimento se lleve a cabo.
5. El conjunto de todos los resultados posibles de un experimento se conoce como espacio muestral del
experimento
6. En condiciones de dependencia estadística, una probabilidad marginal puede calcularse para algún
evento simple si se toma el producto de las probabilidades de los eventos conjuntos en los que se
presenta el evento simple.
7. Cuando una lista de eventos que resulta de algún experimento incluye todos los resultados posibles, se
dice que la lista es colectivamente excluyente.
8. Una probabilidad subjetiva no es otra cosa que aplicar un juicio u opinión personal
9. Cuando la presentación de algún evento no tiene efecto sobre la probabilidad de presentación de algún
otro, se dice que los dos eventos son estadísticamente independientes
10. Cuando se usa el planteamiento de frecuencia relativa, los cálculos de probabilidad se hacen menos
precisos para grandes cantidades de observaciones.
11. Simbólicamente, una probabilidad marginal se expresa como P (AB).
12. Si A y B son dos eventos estadísticamente dependientes, la probabilidad de que se presenten A y B es
P(A) + P (B).
13. La probabilidad clásica supone que c/u de los resultados posibles de un experimento es igualmente
probable.
14. Una razón por la cual los tomadores de decisiones de alto nivel utilizan la probabilidad subjetiva es que
deben enfrentarse a situaciones únicas.
15. Una lista es _________si incluye todos los resultados posibles que se pueden tener de un experimento
16. Una desventaja del planteamiento subjetivo de la probabilidad es que presupone eventos diferentes.
17. El planteamiento de frecuencia relativa de la probabilidad proporcionará probabilidades estadísticas
correctas después de 100 intentos.
18. Cuando se utiliza el planteamiento subjetivo de la probabilidad, dos personas con la misma información
pueden proporcionar respuestas distintas, pero igualmente correctas
19. A y B son eventos independientes si P (A|B) = P (B)

53
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

20. Si un evento no se ve afectado por el resultado de otro evento, se dice que ambos eventos son: a)
Dependientes. b) Independientes c) Mutuamente excluyentes d) Todos los anteriores e) Tanto b)
como c).
21. ¿Por qué los eventos resultantes de lanzar una moneda al aire son mutuamente excluyentes?
a) Porque el resultado de cualquier lanzamiento no se ve afectado por los resultados de los lanzamientos
que le anteceden. b) Porque no se pueden presentar cara y cruz en el mismo lanzamiento. c) Porque la
probabilidad de obtener cara y la probabilidad de obtener cruz son las mismas. d) Por todas las
anteriores.e) a) y b), pero no c).

22. Si Ay B son eventos mutuamente excluyentes, entonces P (A o B) =P(A) +P (B). ¿De qué manera
cambia el cálculo de P(A o B) si A y B no son mutuamente excluyentes?
a)P (AB) debe restarse de P(A) b) P (AB) debe sumarse a P(A) c) Ninguno de los anteriores.

23.La probabilidad incondicional también se la conoce como Probabilidad Marginal

24. La probabilidad de que un valor escogido al azar de una determinada población sea mayor que la
mediana de la población es: a) 0,25 b) 0,50 c) 1 d) 0,67

25. La probabilidad simple de que ocurra un evento se conoce com:


a) Probabilidad conjunta b) Probabilidad bayesiana c) Probabilidad condicional d) Probabilidad
Marginal

Integre los espacios en blanco

1. El conjunto de todos los resultados posibles de una actividad es __________________


2. Uno de los resultados posibles de hacer algo es un____________. La actividad que produjo este
resultado es un______________
3. Una representación gráfica de los conceptos de probabilidad, que utiliza símbolos para representar
resultados, es __________________.
4. Los eventos que no se pueden presentar juntos se conocen ________________.
5. La probabilidad de que se presente un evento, dado que ya se presentó otro, se conoce como
probabilidad________________
6. En términos de sus supuestos el planteamiento menos restrictivo del estudio de la probabilidad es el
_______________________
7. Una lista es _________________si incluye todos los resultados posibles que se pueden tener de un
experimento.
8. Tres planteamientos diferentes del estudio de la probabilidad son el planteamiento _______________,
el planteamiento _______________________y el planteamiento _____________________.

LA ÉTICA EN LA ESTADÍSTICA 

Al manejar conceptos de probabilidad debiera explicarse el significado de la probabilidad de ganar la lotería si compra un billete
en el que debe contener 6 números ganadores de la lista de 54 números.
Ej. “un aviso en donde se afirma…Seguiremos hasta que hagamos de cada concursante un millonario”
54
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

III – VARIABLES ALEATORIAS –UNIDAD TEMÀTICA Nro.2 del Programa Nº 3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos que permitan el análisis de las variables involucradas en los
problemas económicos, sus características, sus medidas y sus relaciones.

V.A.D: Se dice que es aleatoria o estocástica cuando:……………………………………………………


………………y es discreta dado que…………………………………………….Puede ser…………….
Función de Probabilidad:
Se denomina Función a Probabilidad a la función que………………………………………………………..
……………………………………………………………………………y satisface las siguientes condiciones:
a……………………………………………. y b…………………………………………………..

EJERCICIOS DE APLICACIÓN de VARIABLES ALEATORIAS

1) Las tres tablas muestran variables aleatorias asociadas a sus probabilidades. Sólo una de ellas es
realmente una distribución de probabilidad. a) ¿Cuál es?, b) Utilizando la distribución de probabilidad
correcta encuentre la probabilidad que X sea: b.1) exactamente 15 ; b.2) no más de 10 y b.3) más de 5.
c) Halle la varianza, desvío, coeficiente de variación

x P(x) x P(x) x P(x)


5 0,50 5 0,10 5 0,30
10 0,30 10 0,30 10 0,30
15 -0,20 15 0,20 15 0,20
20 0,40 20 0,40 20 0,40

2) Sea la Variable Aleatoria X con la siguiente distribución de probabilidades (Kurincic)

x 0 1 2 3 4 5
P(x) 2/15 1/3 0 1/5 1/15 4/15
a) Grafique la función de probabilidades.
b) Grafique la función de distribución de las probabilidades acumuladas.
c) Halle
P(X>2) Rta: 8/15
P(X  2) Rta: 8/15
P(X  1) Rta: 7/15
P(X <1) Rta: 2/15
F (1) Rta: 7/15
F (6) Rta: 1
P (3  X<5) Rta: 4/15
P (x<1 ó x>4) Rta: 6/15

55
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

3) Describir el espacio muestral y hallar las funciones de probabilidad y de distribución para el tiro
de un dado. Grafique la función de probabilidad.

4) El Gerente de Ventas de una sucursal está analizando el número de ventas que por día se realizó
en un determinado artículo y para ello compiló información de los últimos 50 días. El resultado
fue el siguiente:
a. 1 día con 38 ventas.
b. 2 días con 34 ventas
c. 3 días con 33 ventas
d. 6 días con 32 ventas
e. 13 días con 31 ventas
f. 25 días con 30 ventas
Calcular: a) Probabilidad de que en un día se efectúen a lo sumo 32 ventas
b) Probabilidad de que en un día se efectúen más de 30 ventas
c) Cantidad esperada de ventas diarias, su varianza y su desvío estándar.

5) Calcule la esperanza matemática y la varianza de la siguiente distribución de probabilidad discreta.

X P(x)
0 0,20
1 0,40
2 0,30
3 0,10
6) Un agente colocador de fondos tiene que optar entre tres carteras de inversión alternativas. En base
a información reunida, estima que las condiciones económicas futuras del país pueden seguir tres
escenarios: a) escenario en que desmejoren: probabilidad del 30%; escenario en que sigan sin
cambio: probabilidad del 50% y de que haya un crecimiento en la economía: probabilidad del 20%.
Considerando cada una de las condiciones económicas citadas, los beneficios que obtendría serían
los siguientes
Escenario de la economía Beneficio de la cartera en miles de $
A B C
-Negativo 500 -2000 -7000
- Neutro 1000 2000 -1000
- Positivo 2000 5000 20000
a) Calcule el beneficio esperado para cada cartera. Justifique cuál cartera elegiría.
b) Calcule la desviación estándar para cada cartera y la variabilidad relativa. Justifique utilizando
esta medida qué cartera elegiría.

7) Se define una variable aleatoria como la cantidad de caras que pueden resultar al lanzar una
moneda tres veces. Defina el espacio muestral. Halle la función de probabilidad y la función de
distribución.

56
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

IV –DISTRIBUCIONES BÁSICAS DE PROBABILIDAD–UNIDAD TEMÀTICA Nro.3 del


Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos que permitan estudiar el comportamiento probabilístico de las
variables relacionadas con la toma de decisiones.

Introducción: ENSAYOS BERNOULLI Para pensar

Analice para cada una de las situaciones siguientes, si una serie de ensayos Bernoulli
proporciona un modelo razonable y justifique su respuesta.

Situación A: Usted en el día de la fecha en función de una muestra de un listado de acciones


para invertir en la Bolsa desea determinar si cada uno de esos títulos han subido con respecto a la semana
anterior. El ensayo será seleccionar una acción y determinar si su precio subió respecto al período anterior.

Situación B: Al finalizar el año, los empleados de una firma son calificados mediante la siguiente
escala de valoración: excelente, aceptable o insatisfactorio. Un ensayo consiste en determinar la calificación
para un empleado de la firma.

Situación C: Cada 30 minutos en el horario de 11 a 13 hs se hacen llamadas telefónicas a cierto


número de hogares seleccionados al azar. Quien contesta la pregunta se le pide que responda si está
viendo una determinada programación –suponga que es de FoxPlay-. El ensayo consiste en llamar a un
hogar y determinar si alguien en la casa está viendo FoxPlay.

Situación D: Una caja tiene 6 gomas de tinta-lápiz y 14 gomas de lápiz o bien de tinta. Se extrae
una goma al azar, se mira y se devuelve a la caja. Cuál es la probabilidad de sacar una goma de tinta-lápiz.

Respuestas:
Situación A: La hipótesis de independencia es dudosa, pues en cualquier período de tiempo hay una
tendencia fuerte de los precios de estos activos a modificar sus precios en forma conjunta, a causa del
cambio en la tasa de interés, noticias políticas…Es decir, que para las acciones de la lista el resultado
depende del cambio en el precio de otras.

Situación B: Los ensayos Bernoulli son buen modeloSi definimos “éxito” tener una calificación
excelente y “fracaso” al complemento (aceptable o insatisfactorio). Pero, si hay restricciones en el número
de calificaciones excelentes no se cumple la hipótesis de independencia.

Situación C: La hipótesis de probabilidad constante de un ensayo a otro no se cumple pues el nivel de


audiencia se modifica en ese horario y la probabilidad de encontrar a alguien viendo el programa puede
variar del momento en que se haga la llamada.

Situación D: Este experimento tiene dos resultados posibles si definimos: la goma de tinta lápiz es éxito
y el resto es fracaso. Definiendo la V.A.D. como el número de gomas de tinta-lápiz. La probabilidad de
éxito permanece constante, pues existe reposición de elementos.
P(x=1) = p = 6/20 = 3/ 10 = 0,3
La probabilidad de fracaso será P(x=0) = (1-p) = 1 – 0,30 = 0,70

57
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

TIPO DE DISTRIBUCIONES DISCRETAS

Una distribución de Probabilidad: indica toda la gama de valores que pueden presentarse como resultado
de un experimento. La diferencia con una distribución de frecuencias relativas, es que esta última describe el pasado.
En cambio la distribución de probabilidad describe que tan probable es un evento futuro.

Calcularemos las medidas : media que se denomina esperanza matemática, valor esperado, varianza, desviación
estándar , describiremos sus características y calcularemos probabilidades usando una distribución.
Las medidas estadísticas también serán halladas a partir de la F.G.M, siglas que significan Función Generatriz de
Momentos. Determinaremos la F.G.M. para algunas de las distribuciones.

F.G.M. –Función Generatriz de Momentos-  es una Función que permite deducir a través de las derivadas sucesivas,
los momentos absolutos de distinto orden.

Recordemos que la FGM (t) = E(ext)


En donde: X es una V.A. con función de densidad f(x) y
T es una variable real auxiliar
Se llama Función Generatriz de Momentos –F.G..M. – a la esperanza matemática de la función (ext)

Algo de la demostración matemática.: Una F.G.M. para X existe, si existe una constante positiva “b” tal que la FM
es finita para | | .
. . . .
La serie 1 . +….
! ! !

Suponiendo que u´k es finita para k=1, 2,3,…. Tenemos que


. . .
E(ext)= ∑ ext. p(x) = ∑ 1 . ⋯ . p(x) =
! ! !

= ∑ p(x) + . ∑ . ∑ . ∑ . ∑ .
! ! !

Recordemos que la derivada de una suma finita siempre es igual a la suma de las derivadas (suponiendo que todas
las derivadas existen).
En consecuencia, E(ext) es una función de todos los momentos alrededor el origen para k= 1,2,3,4…

¬
t=0

58
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

DISTRIBUCIÓN BINOMIAL

!
1
! !

Siendo:
P(x)=Probabilidad de x éxitos en “n” pruebas con probabilidad de éxito “p” constante para cada prueba.
X= número de sucesos en la muestra (X= 0, 1,2, ….,n)
n= tamaño de la muestra –número de observaciones de las pruebas.
p = probabilidad de “Suceso éxito”
q= (1-p) = probabilidad de “Suceso fracaso”

ENUNCIE LAS CARACTERÍSTICAS DE LA DISTRIBUCIÓN BINOMIAL.


 ……
 ……
 ……
 …….
 …….

EJERCICIOS DE APLICACIÓN de DISTRIBUCIÓN BINOMIAL

1) Se realiza un experimento que consiste en tirar una moneda 10 veces.


Cuál es la probabilidad de obtener: a) exactamente 6 caras; b) 8 o más caras. Rta: 0,2051 b) 0,0547

2) En un examen final de estadística con 20 preguntas, cada una con 4 respuestas alternativas. Suponiendo
que todas las preguntas son independientes y que las respuestas serán calificadas como “Bien” o “Mal”.
Calcule la probabilidad de obtener:
a) exactamente 7 respuestas correctas. b) 7 o más respuestas correctas
c) ninguna respuesta correcta d) todas las respuestas correctas
Rta: a) 0,1124; b) 0,2143 c) 0,0032 y d) 0

3) El Sector “Control de Calidad” va a inspeccionar los ítems defectuosos. Se conoce que la producción
total de un cierto proceso es perfecta en un 80%. Para detectar los ítems defectuosos es necesario
destruirlos una vez hecha la inspección. Si se extrae una muestra aleatoria de 17 ítems de un cierto día de
producción en donde se completó 20.000 unidades. ¿Cuál es la probabilidad de contar con 3 o menos
unidades defectuosas? Rta: 0,5489

4) Si el 8% de los “expansores de conectividad inalámbrica” fabricados presentan reclamos por defectos


de recepción. Hallar la probabilidad de que: a) en una muestra de 10 aparatos no haya ninguno defectuoso
y b) de que en un lote compuesto de 20 aparatos se encuentren menos de 5 aparatos defectuosos.
Rta: a) 0,4342; b) 0,981

5) En un estudio reciente se encontró que el 5% de los usuarios de telefonía celular tienen equipo Iphone.
En una muestra de 20 usuarios.
a)¿Cuál es la probabilidad de que por lo menos la cuarta parte tenga Iphone?
b) ¿Cuál es la probabilidad de que menos de 5 tengan Iphone?
c) Exprese y represente la forma de este tipo de distribución.
Rta: a) 0,002 Y b) 0,998

59
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

6) El 34% de los clientes de una Sucursal Bancaria tienen Cuenta Corrientes. Se toma una muestra al azar
de 15 clientes.
6.1.- ¿Cuántos clientes con Cuenta Corriente se espera encontrar?
6.2.- Calcule la varianza y el desvío estándar.
6.3.- Calcule la probabilidad de hallar:
i. exactamente 7 clientes con Cuentas Corriente.
ii. A lo sumo 3 clientes con Cuenta Corriente
iii. Menos de 5 clientes con Cuenta Corriente
iv. Como mínimo 8 clientes con Cuenta Corriente
v. Más de 10 clientes con Cuenta Corriente
vi. Entre 4 y 9 clientes con Cuenta Corriente
vii. Por lo menos un cliente con Cuenta Corriente
viii. Como máximo 6 clientes con Cuenta Corriente.
Rta.: 6.1) 5,1; 6.2) 3,366; 6.3) 1,83 i) 0,1217; ii) 0,1941; iii) 0,3829; iv) 0,0977; v) 0,0021; vi) 0,7960; vii) 0,9980 y viii) 0,7806

7) Una compañía telefónica elige al azar una muestra de 8 abonados. Sabiendo que el 64% de los abonados
tienen un servicio adicional, calcular las siguientes probabilidades acerca de los 8 abonados que han sido
seleccionados:
a) Qué entre 7 y 8 abonados no tengan un servicio adicional
b) Que más de la mitad no tenga un servicio adicional
c) Que entre 2 y 6 tenga un servicio adicional
d) Que la cuarta parte no tenga un servicio adicional.
Rta: a) 0,0042; b) 0,1180; c) 0,8409 y d) 0,2494

8) En una organización escolar se sabe que el 35% de los profesores son mujeres. Se seleccionan al azar 4
profesores para ir de viaje de egresados.
8.1. Se pide calcular:
a) la probabilidad de que en dicho equipo haya ninguna mujer.
b) la probabilidad de que en dicho equipo haya más de dos mujeres.
c) la probabilidad de que en dicho equipo haya a lo sumo 3 hombres.
8.2. Si se extrae una muestra al azar de 90 profesores de esa organización. Determinar la cantidad de
mujeres que se espera encontrar en dicha muestra y con qué desvío.
Rta: 8.1.a) 0,1785; b) 0,1265; c) 0,8215 y 8.2) 31,5

9) El 5% de los engranajes sin fin que produce una máquina automática son defectuosos.
a. ¿Cuál es la probabilidad de que al seleccionar al azar 6 engranajes ninguno sea defectuoso?
b. Cuál es la probabilidad de que haya exactamente
2 engranajes defectuosos - 3 engranajes defectuosos
4 engranajes defectuosos - 5 engranajes defectuosos
6 engranajes defectuosos
c. ¿Qué distribución de probabilidades utiliza y por qué?
Rta: 0,735; 0,031; 0,002; 0; 0; 0

10) Construya en una situación binomial para n=6 las distribuciones de probabilidades y su
representación gráfica considerando:
p= 0,05 p=0,10 p=0,20 p= 0,50 p= 0,70 p= 0,95
¿Qué conclusiones extrae?

11) Construya en una situación binomial para p= 0,10 las distribuciones de probabilidades y su
representación gráfica considerando
n= 6 n=12 n=20 n=40
¿Qué conclusiones extrae y que impedimentos ha encontrado?
60
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

DISTRIBUCIÓN POISSON

EJERCICIOS DE APLICACIÓN de DISTRIBUCIÓN DE POISSON

1) En la intersección de las calles Córdoba y Junín los registros de accidentes dicen que hay 5 accidentes
diarios. El número de accidentes está distribuido de acuerdo a Poisson.
a) Determine la probabilidad puntual de que en el día ocurran 0, 1, 2... accidentes.
b) Determine la probabilidad de que ocurran 0, 1 ó 2 accidentes en el día.
Rta: 0,0067; 0,0337; 0,0842 y 0,1245

2) Un empleado de un call center de una empresa de cable atiende en promedio 1,2 personas cada 10
minutos. Se desea hallar la probabilidad de que dicho empleado atienda:
a) a 2 personas en 10 minutos.
b) a lo sumo 4 personas en 10 minutos.
c) entre 1 y 4 personas inclusive en 10 minutos
d) menos de 4 personas en 10 minutos.
e) 3 personas en 10 minutos, si se sabe que atendió menos de 4.
Rta: a) 0,2169; 0,9922; 0,689; 0,9662 y 0,0897

3) Un programa de computación falla en promedio 4 veces por hora. Se desea determinar:


a) la probabilidad de que falle más de 15 veces en 3 horas
b) las fallas promedio en 3 horas y su varianza.
Rta: 12; 12

4) Una máquina de hilar produce piezas con un promedio de 1 falla cada 200 metros. Determinar la
probabilidad de que una pieza tenga
a) exactamente 3 fallas
b) como mínimo 4 fallas.
Rta: 0,0613; 0,01532

5) La Central de Policía atiende en promedio 5 llamadas por día. ¿Cuál es la probabilidad que en un día
determinado atienda 0, 1, 2 y 10 llamadas?
Rta: 0,0067; 0,0337; 0,0842; 0,0181
1.1) Interpretar el ejercicio planteado y su resolución

61
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

  . 
DISTRIBUCIÓN HIPERGEOMÉTRICA R N R
N = tamaño de la población
r nr
R = número de éxitos en la población
P(r ) 
N – R = número de fracasos en la población
n = tamaño de la muestra
r = número de éxitos en la muestra
  N
n

n – r = número de fracasos en la muestra

EJERCICIOS DE APLICACIÓN de DISTRIBUCIÓN HIPERGEOMÉTRICA

1) Una caja contiene 50 legajos de crédito, siendo 40 legajos de clientes en situación normal y 10 legajos
de clientes con atrasos. Extrayendo 5 legajos al azar.
1.1.) ¿Cuál es la probabilidad de obtener 2 legajos de clientes con atrasos, sabiendo que los legajos se
retiran con reposición?
1.2) ¿Cuál es la probabilidad de que los dos legajos estén con atrasos, ya que es obvio que el auditor
cuando extrae el primer legajo no lo repone a la caja pues no revisará 2 veces el mismo legajo? Luego,
determine su esperanza matemática, varianza y desvío.
Rta: 0,2048; 0,2098

2) Un auditor debe inspeccionar un total de 50 carpetas de cuentas corrientes, de los cuales 35 están en
situación normal y 15 no. Si el auditor selecciona 10 legajos al azar.
¿Cuál es la probabilidad? de que:
- 6 legajos correspondan a carpetas de clientes que no están en situación normal
- Todos los legajos que han sido seleccionados al azar no estén en situación normal.
- 9 o más legajos no cumplan con el requisito de estar en situación normal.
Rta: 0,0255; 0 y 0

3) Un profesor delegó la corrección de los 24 exámenes finales tomados en el cuatrimestre en el jefe de


trabajos prácticos, quien una vez finalizada la corrección le informa que hubo 10 desaprobados. El
profesor, antes de confeccionar el acta decide controlar los exámenes para evaluar el criterio de
calificación. Para ello, selecciona 7 exámenes al azar. Halle:
¿Cuántos exámenes aprobados espera encontrar?
Calcule la varianza y el desvío estándar correspondiente
Calcule la probabilidad de que encuentre entre los 7 exámenes elegidos:
- Exactamente 3 desaprobados ; 1,1214
- Más de 5 aprobados
- Entre 2 y 4 desaprobados
Rta: 4,08; 1,2575; 1,1214; 0,3471; 0,0967 y 0,828

62
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

RESUMEN DE DISTRIBUCIONES

1)Complete la tabla con las características para las distribuciones discretas que se indican
Bernoulli Binomial Hipergeométrica Poisson
DEFINICIÓN

RECORRIDO

FUNCIÓN

F.G.M.

ESPERANZA
MATEMÁTICA

VARIANZA

DESVIO

2) En que Distribución se utiliza el Factor de Corrección por Finitud. 

_____________________________________________________________________.

63
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

DISTRIBUCIÓN NORMAL
D.N.G 

Z Si μ= 0 y σ=1
z 0 z
D.N.S
1)Complete

f(z;0;1)=
Características de la Distribución Normal Estándar
DEFINICIÓN

RECORRIDO

FUNCIÓN

F.G.M.

ESPERANZA
MATEMÁTICA

VARIANZA

DESVIO

Características de la distribución normal:


 ………………..     ………………..     ………………..   
 ………………..   ………………..   ……………….. 
 ………………..   ………………..   ………………

VARIABLE ESTANDARIZADA; PUNTUACIONES ESTÁNDAR: Z



Una distribución normal con cualquier valor μ y σ puede convertirse en una distribución normal estándar,
restando la media - μ - a cada observación X y dividiendo entre la desviación estándar –σ-.

64
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Observemos en la fórmula que tenemos a:


Xi : es una puntuación o el valor a transformar;
Z: es una puntuación transformada en unidades de desviación estándar.

Así surge el valor Z o puntuación “Z” como medida que indica la dirección y el grado en que un valor
individual se aleja de la media, en una escala de desviación estándar. Por ser independiente de las
unidades empleadas se trata de una cantidad adimensional.

Entonces:
Z: Es la variable que mide la desviación respecto a la media en términos de unidades de desviaciones
estándar y también se le dice puntuación Z, Valor Z

Estas puntuaciones Z son distancias que indican áreas bajo la distribución normal (áreas de probabilidad)

Una de las utilidades en estandarizar los valores X, es que permite:


 Comparar puntuaciones de distribuciones diferentes 
 Comparar mediciones de diferentes pruebas utilizadas.  

EJERCICIOS DE APLICACIÓN de UTILIZACIÓN DE TABLA

1) Calcule los siguientes valores, utilizando la tablas de “Función de distribución normal estandarizada”
(Probabilidad acumulada hasta un valor de la variable Z)
 P(x ≤ 0,85)  P (0,21 ≤ x ≤ 0,86)
 P(x ≤ -0,85)  P (-0,21 ≤ x ≤ 0,86)
 P (0 ≤ x ≤ 0,20)  P (- 0,86 ≤ x ≤ -0,20)
 P (-0.21 ≤ x ≤ 0)
Rta: 0,8034; 0,1976; 0,0796; 0,08317; 0,22194; 0,38828 y 0,22585
2) Calcule para una distribución normal general con media 95 y desviación estándar de 10. P( x ≤
105). ¿Cómo soluciona la búsqueda de la probabilidad?

3) Calcule para una distribución normal el valor de k si se conoce la probabilidad


P(x ≤ k) = 0,60 P(x ≤ k) = 0,20 Rta: 0,253 y -0,842

4)Sea Z una variable aleatoria normal estandarizada. Señale si es Verdadera o falsa la


probabilidad en cada enunciado. Para cada caso realice el dibujo de análisis.
 P (0 ≤ z ≤ 1) = 0,3413  P (-1,96 ≤ z ≤ 1,96) = 0,95
 P (-1 ≤ z ≤ 1) =0,6826  P (-1 ≤ z ≤ 1,96) = 0,8163
 P (0 ≤ z ≤ 1,96) = 0,4750  P (-2 ≤ z ≤ 2) = 0,9545
 P (z > 1,96) = 0,0250  P (-3 ≤ z ≤ 3) = 0,9973

5) Los ingresos mensuales por ventas de un determinado producto siguen una distribución normal con
media $ 1860 y desvío estándar de $ 270. Encuentre la probabilidad de que las ventas en un mes
seleccionado al azar sean a) inferior a $ 1500 y b) mayor a $ 2100 Rta: 0,09176 y 0,18943

65
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

6) En la Sucursal del Sur de una importante empresa los ingresos semanales de los operarios siguen
una distribución normal con media $ 1000 y desviación estándar $100. ¿Cuál es la probabilidad de
seleccionar al azar un operario cuyo ingreso?
a) esté entre $790 y $1000 -b) sea inferior de $ 790.
c) sea superior de $ 1.000 -d) esté entre $ 840 y $ 1200 Rta: 0,48214;
0,01786; 0,50 y 0,92245

EJERCICIOS DE APLICACIÓN de APROXIMACIONES DE DISTRIBUCIÓN


APROXIMACIÓN DE LA DISTRIBUCIÓN HIPERGEOMÉTRICA
A LA DISTRIBUCIÓN BINOMIAL

3) En un depósito que contiene 120 cajas de remitos por ventas correspondientes a las dos sucursales,
de las cuales se conoce que 90 cajas corresponde a la sucursal Montes de Oca y las 30 restantes a la
Sucursal Retiro. Las cajas no tienen etiquetas que pueda indicar a cuál sucursal corresponden. Se toman
5 cajas al azar.a) ¿Cuál es la probabilidad de encontrar 3 cajas de remitos que correspondan a la
Sucursal Retiro? Rta: 0,0879

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL


A LA DISTRIBUCIÓN DE POISSON

1) En una empresa que elabora artículos de computación se ha comprobado que el 0,8% de los artículos
son con defectos.
Si pienso exportar una partida de artículos de computación y el envío será rechazado si encuentran 4 o
más artículos con fallas. ¿Cuál es la probabilidad de encontrar exactamente 4 artículos con defectos en
una partida de 1000 unidades? Rta: 0,0573

2) Se conoce que el 1% de los artículos de un gran embarque son defectuosos. Si se selecciona


aleatoriamente una muestra de 30 artículos. ¿Cuál es la probabilidad de que 2 o más de ellos sean
defectuosos? Rta: 0,0368

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL A LA DISTRIBUCIÓN


NORMAL
1) El 39% de los automóviles que circulan por la una zona de San Isidro son 4x4. Se inspeccionará el
paso de 1432 automóviles 4x4 por esa zona. ¿Cuál es la probabilidad de que pasen por lo menos 530
automóviles 4x4? Rta: 0,9418

2) Se conoce que el 20% de los contactados telefónicamente por un representante de ventas de Seguro
Automotor se adherirá también a la compra de un Seguro de Vida. Si un representante contacta a 30
personas. Determine la probabilidad de que 10 o más contactados realicen la compra del Seguro de
Vida. Rta: 0,0548

3) Se conoce que el porcentaje de envases buenos elaborados por una máquina es del 55%. Determine
cuál es la probabilidad de encontrar como máximo 70 envases buenos de una partida de 100 envases.
Rta: 0,99901

4) Se conoce que el 12% de los cheques que una entidad financiera recibe para acreditar en las cuentas
corrientes son rechazados.

66
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

a) Si de la caja de cuentas corrientes se toman al azaar 20 cheques ¿Cuál es la probabilidad de que por
lo menos 7 cheques sean rechazados?
b) Del total de 800 cheques enviados a la Cámara Compensadora ¿Cuál es la probabilidad de que se
rechacen entre 90 y 95 cheques? Rta:0,0071 y 0,24121

5) Se estima en que un 48% de la producción de cierto producto resulta defectuoso. ¿Cuál es la


probabilidad de que un comerciante mayorista que compró 100 unidades de ese producto deba
devolver por lo menos 55 por encontrarlas defectuosas? Rta: 0,0968

APROXIMACIÓN DE LA DISTRIBUCIÓN DE POISSON A LA


DISTRIBUCIÓN NORMAL
1)El número de recepciones telefónicas recibidas por una Compañía de Seguros en el horario habilitado
telefónicamente (8 a 18 hs) es una variable aleatoria discreta. Se pudo comprobar que en ese lapso, en
promedio se recepcionan 8 llamadas por minuto. ¿Cuál es la probabilidad de que en media hora se
reciban a lo sumo 260 llamadas?
Rta: 0,90658

2) El número promedio de reclamos recibidos en una mesa de informes en el turno de 8 hs es de 10.


¿Cuál es la probabilidad de que en un turno de 8 hs se reciban más de 15 llamadas? Rta: 0,04093

CORRECCION POR FINITUD


UTILIZACIÓN DE LA CORRECCION POR FINITUD
, ,

P (X> xi ) P (X ≤ xi )

0,50

xi xi
Se lee: Probabilidad de más de X Se lee: Probabilidad de X o menos

-0,50
P (X ≥ xi ) P ( X < xi )

xi xi
Se lee: Probabilidad de X o màs; o también Se lee: Probabilidad de menos de X
Probabilidad de por lo menos X

67
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO
DE VARIABLES ALEATORIAS
Y
DISTRIBUCIONES DE PROBABILIDAD

Las preguntas 1 A 5 se responden usando la siguiente tabla que presenta la función de Probabilidad
de una variable aleatoria discreta Y
Y P(y)
1 0
2 0,25
4 0,25
6 0,25
8
1
1. Encuentre P (y=8):
a. 0
b. 0,2
c. 0,25
d. Ninguno

2. Encuentre la esperanza de Y:
a. 5
b. 4
c. 6
d. ninguno

3. Encuentre la varianza de Y:
a. 30
b. 5
c. 2,23607
d. Ninguno

4. Cuál es la probabilidad de que y caiga fuera del intervalo μ+/-2σ?


a. 0,75
b. 0,95
c. 1
d. ninguno
5. Cuál es la probabilidad de que Y sea menor que 3?
a. 0,25
b. 0,5
c. 0,75
d. ninguno
6. Cuál de los siguientes ENUNCIADOS es correcto:
a. El número de quiebras en un mes es un ejemplo de una variable aleatoria continua
b. Si una variable aleatoria Y puede tomar un solo valor, digamos y=3 con probabilidad 1, entonces
E(y)=0
c. El número de llamadas telefónicas en un call center es una variable aleatoria discreta
d. Ninguno
7. ¿Para cuál de los siguientes valores de probabilidad la distribución binomial es simétrica?
a. 0,0
68
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

b. 0,1
c. 0,5
d. 1,0
8. Cuál de los siguientes parámetros de esperanza matemática producirá una menor varianza en una
variable aleatoria Poisson:
a. 0,1
b. 5
c. 7
d. 1
9. Una variable aleatoria x tiene una distribución binomial con n=50 y p=0,4. La media y la varianza
para x son:
a. µ=20; 2=12
b. µ=20; 2=3,4641
c. µ=30; 2=12
d. µ=30; 2=3,4641
10. Mencione cuáles son las dos propiedades o condiciones básicas de toda distribución de probabilidad.

MARQUE LA OPCIÓN/ES CORRECTA/S


11. El valor esperado es
a. Un promedio ponderado de los valores que toma la V.A. en donde los pesos son las probabilidades
b. Tiene que ser un valor que pueda tomar la variable aleatoria.

12. La varianza
a. Es El momento centrado de orden 3
b. Es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria respecto de su media,
en donde los pesos son las probabilidades
c. Es El momento absoluto de orden 2 menos el momento absoluto de orden 1
d. Se mide en las mismas unidades que la variable aleatoria

13. Un experimento binominal consiste en


a. n ensayos idénticos con probabilidad de éxito prueba a prueba constante o no
b. n ensayos no necesariamente idénticos pero con probabilidad de éxito constante prueba a prueba
c. n pruebas independientes y mutuamente excluyentes
d. n pruebas no necesariamente independientes pero sí mutuamente excluyentes
e. n ensayos idénticos con probabilidad de éxito constante prueba a prueba
f. n pruebas independientes pero no mutuamente excluyentes

14. Una variable aleatoria con distribución hipergeométrica considera


a. Probabilidad de éxito constante prueba a prueba
b. Probabilidad de éxito variable prueba a prueba
c. La no reposición de elementos
d. El muestreo sin reemplazo

15. La distribución Poisson puede definirse como una aproximación de la distribución binomial cuando
a. la cantidad de pruebas tiende a cero y la probabilidad de éxito es muy pequeña.
b. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es igual a la de fracaso
c. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es muy pequeña.
d. Siendo en estos casos la varianza de la distribución Poisson igual a la esperanza de la distribución binomial

16. En una variable aleatoria con distribución Poisson:


a. La media y el desvío son iguales
69
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

b. La media y la varianza son iguales


c. Se trata de medir la probabilidad de ocurrencia de casos raros
d. El recorrido de la variable es finito
e. El recorrido de la variable es infinito numerable

17. 0,05. 0,95 es la Función Generatriz de Momentos de


a. Una distribución binomial con probabilidad de éxito 0,95
b. Una distribución Binomial con probabilidad de fracaso de 0,05
c. Una distribución Bernoulli con probabilidad de éxito de 0,05
d. Una distribución Bernoulli con probabilidad de éxito de 0,95
e. Una distribución Binomial con probabilidad de éxito de 0,05
f. Una distribución Binomial con probabilidad de fracaso de 0,95

18. La función generatriz de momentos


a. es una función que permite generar, utilizando derivadas sucesivas, momentos centrados.
b. es una función que permite generar, utilizando derivadas sucesivas, momentos absolutos.

19.Cuando la probabilidad de éxito en un proceso de Bernoulli es del 50% p = 0.5, su distribución binomial es
simétrica.

20. Una distribución de frecuencias da una lista de las frecuencias observadas para un experimento que ya se ha
llevado a cabo; una distribución de probabilidad da una lista de aquellos resultados que podrían presentarse si el
experimento se llevara a cabo.

21. El Teorema de Tchebycheff:


a. Permite determinar probabilidades equidistantes a la media
b. Permite determinar probabilidades equidistantes o no a la media
c. Se utiliza cuando se desconoce la distribución de la variable aleatoria pero se conoce su media y su varianza.

22. Una vez que el valor de p ya se ha determinado para un proceso de Bernoulli, el valor de q se calcula como 1 / 2 p.

23. Si el número esperado de llegadas a una oficina se calcula como cinco por hora, uno puede tener una confianza
razonable de que cinco personas llegarán en la siguiente hora.

24. La Distr, binomial no es realmente necesaria, pues sus valores se pueden aproximar siempre por otra Distrib

25. La estatura de los humanos adultos se puede describir mediante una distribución de Poisson.

26. El factor de Corrección de Finitud se utiliza en el cálculo de la varianza de una distribución hipergeométrica

27. Después de 20 ensayos de un experimento, se crea una curva de distribución con su forma definitiva.

28. En una distribución hipergeométrica la esperanza matemática es n.p en donde p= (N-R)/N

29. Una distribución en la que la media y la mediana tienen diferentes valores nunca podrá ser una distribución normal.

30. La media de una distribución binomial está dada por np.

31. Si la ganancia diaria esperada de un puesto de aguas frescas es de $13.45, entonces:


a) la ganancia del día siguiente será de $13.45.
b) la ganancia del día siguiente será menor que $13.45.
c) la ganancia del día siguiente será mayor que $13.45.
d) la pérdida del día siguiente será de $13.45.
e) Ninguno de los anteriores.

32. Para una distribución binomial dada con n fija, si p < 0.5, entonces:

70
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

a) la distribución de Poisson proporcionará una buena aproximación.


b) la distribución de Poisson proporcionará una mala aproximación.
c) la distribución binomial estará sesgada hacia la izquierda.
d) la distribución binomial estará sesgada hacia la derecha.
e) la distribución binomial será simétrica.

33. Suponga que tenemos una distribución de Poisson con Lambda=2.


Entonces la probabilidad de tener exactamente 10 presentaciones

; ; ;
! ! ! !

34. ¿Cuál de las siguientes es una característica de la distribución de probabilidad para cualquier variable aleatoria?
a) Se da una probabilidad para cada valor posible.
b) La suma de todas las probabilidades es uno. c) No se presenta una probabilidad dada más de una vez.
d) Todos los anteriores. e) a) y b), pero no c).

35. ¿Cuál de las variables siguientes nunca podrá ser descrita por una distribución binomial?
a) El número de partes defectuosas producidas en un proceso de ensamblaje.
b) La cantidad de agua utilizada diariamente por una sola ama de casa.
c) El número de personas de su grupo que pueden responder correctamente a esta pregunta.
d) Todos los anteriores pueden ser descritas por una distribución binomial
7! 0,40 3 0,60 4
36. Si p =0.4 para un proceso de Bernoulli, el cálculo de   da la probabilidad de obtener:
3!4!
a) exactamente cuatro éxitos en siete ensayos.
b) exactamente tres éxitos en siete ensayos.
c) tres o más éxitos en siete ensayos.
d) cuatro o más éxitos en siete ensayos.
e) ninguno de los anteriores.

37. Para distribuciones binomiales con p =0.2:


a) Una distribución con n = 2000 se aproxima mejor a la distribución normal que una con n =50.
b) No importa qué valor se tenga de n, la distribución está sesgada hacia la derecha.
c) La gráfica de esta distribución con p = 0.2 y n= 100 sería exactamente la gráfica inversa de la distribución
binomial con n= 100 y p=0.8.
d) Todos los anteriores.
e) a) y b), pero no c).

38. ¿Cuál de las siguientes es una condición necesaria para el uso de una distribución de Poisson?
a) La probabilidad de una llegada por segundo es constante.
b) El número de llegadas en cualquier intervalo de un segundo es independiente de las llegadas en otros intervalos.
c) La probabilidad de tener dos o más llegadas en el mismo segundo es cero.
d) Todos los anteriores.
e) b) y c), pero no a).

39. ¿En qué caso sería la distribución de Poisson una buena aproximación de la binomial?
a) n =40, p= 0.32. b) n = 40, q= 0.79. c) n = 200, q = 0.98. d) n = 10, p = 0.03.
e) a) y c). f) Todos los anteriores.

71
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

MAPA CONCEPTUAL DE DISTRIBUCIONES

72
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

V– LOS INTERVALOS DE CONFIABILIDAD –UNIDAD TEMÀTICA Nro.6 del Programa Nº


3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos para comprender las nociones de muestra aleatoria, parámetro
poblacional, estimador puntual, estimación puntual y por intervalo.

TEOREMA CENTRAL DEL LÍMITE

Complete:
Enunciado del TCL

DISTRIBUCIONES DE MUESTREO

RAZONES QUE JUSTIFICAN TRABAJAR CON UNA MUESTRA

 1. 
 2. 
 3. 
 4. 

TIPOS DE MUESTREO

LOS DIFERENTES TIPOS DE MUESTREO SON:

 A‐ 
 B‐ 

73
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

En las siguientes situaciones de muestreos de grupos, identifique si se usaría el


método estratificado o por conglomerados (o agrupación).

a. estimación de las preferencias de voto de personas de distintas localidades..........


b. estudio de las actitudes de los consumidores con la sospecha de diferencias importantes según
la edad o el sexo. ......
c. deseo conocer el número de computadoras por viviendas en una un área que tiene una gran
variedad de casas, grandes, chicas, de todo tipo de construcción.
d. deseo conocer el número de autos por viviendas en un área que tiene barrios cerrados de
distintas categorías.

Si deseara muestrear el desecho de papel en la basura, tomando una muestra


de 100 viviendas cada día domingo durante 2 meses. ¿Qué opina de usar un muestreo
sistemático?

DISTRIBUCIÓN POBLACIÓNAL Distribución de la totalidad de las medidas individuales de


la Población –N-
DISTRIBUCIÓN DE LA MEDIA MUESTRAL Distribución de los valores incluidos en una
muestra.
DISTRIBUCIÓN DE MEDIAS MUESTRALES  Distribución de los resultados que se
presentan si en realidad se seleccionaran todas las muestras posibles, sea:
- Con reposición: Nn
- Sin reposición –sin importar el orden:
ERROR ESTÁNDAR DEL ESTIMADOR  Desviación típica del estimador

Población en estudio Muestreo repetido Todos los valores posibles


del estadístico
MUESTRA 1
DISTRIBUCIÓN DE
MEDIAS
POBLACIÓN MUESTRALES
MUESTRA 2
( ; ; …)
Parámetro
MUESTRA de1 Gráfico de la Distrib.
interés Muestral
MUESTRA 3
…..
Descripción numérica Gral
TODAS LAS DEMÁS
MUESTRAS

̅ ;
á

74
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CASO DE APLICACIÓN: UN MUESTREO TEÓRICO, PEQUEÑO PROVENIENTE DE


UNA POBLACIÓN PEQUEÑA
1) La empresa tiene 6 empleados (considerados como población). El ingreso en miles de $ de cada
empleado se presenta en la siguiente tabla.

Empleado Salario mensual -miles de $-


A 2
B 6
C 8
D 10
E 10
F 12
PRIMERA PARTE
a) Cuál es la media de la población
b) Grafique la distribución de valores de la población con sus frecuencias
c) Cuál es la distribución de muestreo de medias para una muestra de tamaño 2, considerando
muestreo repetido, -elegir la opción con o sin reposición, resultando más sencillo considerar:
sin importar el orden o sea sin reposición.
d) Cuál es la media de la distribución de muestreo –media o esperanza del estimador media
muestral- Luego: Compare los resultados obtenidos con el punto a) ¿Qué observaciones extrae
de los resultados obtenidos? Grafique la distribución obtenida.
e) Calcule la varianza poblacional y el desvío poblacional
f) Cuál es la varianza de todas las medias muestrales posibles, según el tipo de muestreo
considerado –promedio de los cuadrados de los desvíos entre cada una de las medias
muestrales teóricas referente a su esperanza matemática.
g) Cuál es el desvío estándar de todas las medias muestrales posibles del punto anterior.
h) Último paso: Con los datos del ejercicio calcular la sig. fórmula que permite determinar el x
ERROR ESTÁNDAR y relacione e interprete los valores hallados en este punto y el anterior.

x : ERROR ESTÁNDAR DE LA MEDIA, o bien


x : ERROR ESTÁNDAR
x ERROR ESTÁNDAR DE LA DISTRIBUCIÓN de las
Es la desviación estándar de la
MEDIAS MUESTRALES, o bien distribución muestral de un
x ERROR MUESTRAL DE LA MEDIA. Estadistico

Como criterio: una población es infinita si n/N<0,05 y es Población finita si n/N 0,05.

FÓRMULA DEL ERROR ESTANDAR DE LA MEDIA de la distribución teórica

Para Población Infinita Para Población Finita


  N n
x  x 
n n N 1
En general se lo define como la desviación estándar de la distribución de medias
muestrales.
También como la medida de dispersión de las medias muestrales alrededor de la media
poblacional

SEGUNDA PARTE
75
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

i) Calcule la varianza y el desvío para cada una de las muestras.


j) En una tabla realice la “Distribución de frecuencias de la varianza muestral”
k) Calcule la esperanza de la varianza muestral, es decir el promedio de los valores que el
estadístico toma para las diferentes muestras de 2 elementos que se pueden extraer de una
Población N y luego su desvío Compare los resultados obtenidos con el punto j).
l) ¿Qué comentarios merece? Intente dar solución a las diferencias en el marco de la propiedad
de insesgamiento.

APLICACIONES DE LA DISTRIBUCIÓN DEL MUESTREO


La distribución del muestreo da respuestas a preguntas acerca de Probabilidad con la ayuda de la Distribuciones

DISTRIBUCIONES PARA LA MEDIA MUESTRAL


POBLACIÓN
NORMAL DESCONOCIDA
n cualquier tamaño
DESVIO DESVIO DESVIO DESVIO
CONOCIDO DESCONOCIDO CONOCIDO DESCONOCIDO
; ; ;

Valor Z Valor t(n-1)GL Valor Z Valor Z


“n chica”


Quedando:
√ √ √

√ Si

√ √

√ √
Considerar si se aplica el
Factor de Corrección.
IC para un (1-α) IC para un (1-α) IC para un (1-α) IC para un (1-α)
n <30
√ √ √

√ √ √ √

76
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Recordar que se aplica el Factor de


POBLACIÓN DESCONOCIDA
Corrección por Finitud cuando se tiene que con Si n<30
los elementos, la fracción muestral supere el 5% Se deben usar otros métodos: p.e.
Tchebychev para nuestro curso
IC para un (1-α)

√ √

√ √

La estadística no paramétrica brinda respuesta a


estos casos (Estadistica II o Estadistica para
Administradores)
DISTRIBUCIONES PARA LA VARIANZA MUESTRAL
NORMAL -n cualquier DESCONOCIDA
tamaño-

IC para la varianza poblacional IC para la varianza poblacional


Para un (1-α) Para un (1-α)

; ;

DISTRIBUCIONES PARA LA PROPORCION MUESTRAL



;

∗ ∗
Como p es desconocido entonces usamos

Si buscamos “n” a partir del margen de error máximo admitido tendremos que usar
p=q=0,50

EJERCICIOS DE APLICACIÓN de DISTRIBUCION DEL MUESTREO

1) Una gran población de clientes con deudas vencidas registra un saldo vencido promedio de
$ 1500 con desviación estándar de $ 350.
a. ¿Cuál es la probabilidad de que un cliente con deuda vencida aleatoriamente muestreado tenga saldo
vencido que exceda $ 1600?
b. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 40 clientes con deudas vencidas
registre un saldo que exceda los $ 1600?
Rta: 0,38591 y 0,03515

77
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

2) ¿Cuál es la probabilidad de que la media de una muestra de tamaño 16 esté entre 456 y 461, si
proviene de una población con distribución normal con media 458 y varianza 100?
Rta: 0,673
3) ¿Cuál es la probabilidad de que la media muestral sea superior a 4712 si proviene de una población
con distribución normal de 221 elementos, cuya media es 4650 y desvío típico de 216 y se sacó una
muestra de tamaño 25? Rta: 0,06426

4) ¿Cuál es la probabilidad de que la media muestral de tamaño 100 sea superior a 2314 si proviene de
una población con media de 2302 y desvío típico de 563? Rta: 0,416

5) Se conoce que las ventas realizadas por un comercio sigue una Distribución Normal con media de
$ 168.200 y desvío típico de $ 20.604. De las ventas realizadas en el mes una inspección extrae una
muestra de 9 facturas. ¿Cuál es la probabilidad de que la media de la muestra difiera de la media
poblacional más de $ 12.000? Rta: 0,08

6) La antigüedad media de los títulos de deuda del Estado es de 1750 días con un desvío estándar de
1320 días. La SIGEP toma al azar 90 títulos. ¿Cuál es la probabilidad de que la media de la muestra sea
inferior a 4 años? Rta: 0,0188

7) Los pagos en personal de un Ministerio siguen una Distribución Normal con media de $ 3367 y
varianza de 162409. Si se extrae una muestra de 64 liquidaciones, sabiendo que el total de personas que
trabajan en el Ministerio y reciben sus liquidaciones son 12.800. ¿Cuál es la probabilidad de que el
valor de la media muestral sea superior a $ 3.500? Rta: 0,0042

8) Un auditor toma una muestra aleatoria de 36 cajas de ahorro de una población de 1000 libretas de
cajas de ahorro. El valor medio de los saldos en la libreta de caja de ahorro de toda la población es $ 260,
con desvío estándar de la población de $ 45.
a. ¿Cuál es la probabilidad de que la media muestral sea menor a $250?
b. ¿Cuál es la probabilidad de que la media muestral se encuentre en no más de $ 15 de la media?
Rta: 0,09176y 0,9545

9) En una muestra aleatoria de 64 personas, 48 de ellas se clasifican como exitosas. Si la proporción


poblacional es 0,70.
Determine: a) la proporción muestral de personas exitosas b) el error estándar para la proporción c) la
probabilidad de que la proporción muestral sea mayor al 75%.
Rta: a) 0,75 ; b) 0,057282; c) 0,19215

10) Se seleccionó una muestra aleatoria de 50 usuarios de cable para participar en una encuesta
telefónica. La pregunta clave que se les planteó fue: ¿tiene Usted o algún miembro de su familia canal
de cable Premium adicional al canal básico? De los 50 participantes, 35 contestaron que no y 15 que sí.
Si la proporción de la población que tiene Cable Premium es 0,40.
a) Encuentre la proporción muestral ̅ de familiares con cable Premium
b) Encuentre el error estándar para la proporción.
c) Probabilidad de que la proporción sea superior al 15% y menor al 38%
Rta 0,30; 0,06928; 0,38756

11) El auditor Levin Rubio de una gran entidad financiera sabe que el saldo promedio mensual de
clientes morosos de la cuenta “tarjetas de Crédito” es $ 112 y la desviación estándar de $56. Si éste
audita 50 cuentas seleccionadas al azar ¿cuál es la probabilidad de que el saldo promedio mensual de
la muestra sea: a) menor que $ 100 b) entre $100 y $130 Rta: a) 0,0643 y b) 0,92

78
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

12) A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligen
aleatoriamente 64 artículos: a) cuál es el error estándar de la muestra y b) cuál es la probabilidad de que
la media de la muestra esté entre 107,5 y 109 Rta: a) 1,4904 y b) 0,0428

13) Una investigadora de la empresa Moli Café se encuentra interesada en determinar la tasa de uso de
café por hogar. Ella cree que el consumo mensual por hogar tiene una distribución normal con media
poblacional desconocida y desviación estándar cercana a 1,25 kg.
La investigadora toma una muestra de 36 hogares y registra su consumo de café durante un mes.
a. ¿Cuál es la probabilidad de que la media de la muestra se aleje de la media de la población no
más de ½ kg?
b. Qué tan grande debe ser la muestra que tome para tener el 98% de certidumbre de que la media
de la muestra no se aleje más del medio kilo de la media de la población?
Este punto podrá resolverlo en el capítulo siguiente Rta: a) 0,9819 y b) 34

14) El salario medio por hora del personal de limpieza de laboratorios en la zona de Capital es de $ 68.
¿Cuál es la probabilidad de encontrar un salario medio por hora de $ 70 o más, si se toma una muestra
de 50 personas, sabiendo que la desviación estándar poblacional es de $ 20 por hora.
Rta: 0,23885

APLICACIONES
DE
CONCEPTOS TEÓRICOS DE DISTRIBUCIÓN DEL MUESTREO

En c/ de los enunciados, marque con una cruz si es V (Verdadero) o (Falso).En este último caso,
justifique como transforma en verdadero dicho enunciado.

1. Cuando los elementos incluidos en una muestra se basan en el juicio del individuo que conduce la
muestra, se dice que la muestra es no aleatoria. Rta: V___/F___

2. Una estadística es una característica de una población. Rta: V___/F___

3. Un plan de muestreo que selecciona miembros de una población a intervalos uniformes con
respecto al tiempo, al orden o al espacio se denomina muestreo estratificado. Rta: V___/F___

4 Como regla general, no es necesario incluir un multiplicador de población finita en el cálculo


del error estándar de la media cuando el tamaño de la muestra es mayor que 50.
Rta: V___/F___
5. La distribución de probabilidad de todas las medias posibles de muestras se conoce como la
distribución de muestreo de la media. Rta: V___/F___

6. Los principios de muestreo aleatorio simple son la base teórica de la inferencia


Rta: V___/F___
7. El error estándar de la media es la desviación estándar de la distribución de medias de la
muestra. Rta: V__/F__

8. Con un mayor tamaño de muestra, la distribución de muestreo de la media se aproxima a


la normalidad, sin importar la distribución de la población. Rta: V__/F__
79
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

9. El error estándar de la media disminuye en proporción directa al tamaño de muestra. Rta: V__/F__

10. Para obtener una distribución teórica de muestreo, consideramos todas las muestras de un
tamaño dado. Rta: V__/F__

11. Si la media de una cierta población fuera 15, es probable que la mayor parte de las muestras
que podríamos tomar de esa población tuviera medias de 15. Rta: V__/F__

12. El error estándar de una estadística de muestra es la desviación estándar de su distribución


de muestreo. Rta: V__/F__

13. La fracción de muestreo compara el tamaño de una muestra con el tamaño de la población.
Rta: V__/F__
14. La precisión con la que puede usarse la media de muestra para estimar la media de
población disminuye al incrementarse el error estándar. Rta: V__/F__
15. Elija entre el par de símbolos que se siguen a continuación el que mejor complete el
enunciado: “___________es un parámetro, mientras que _______________es una estadística”
a. N, µ b. ,s c. N,n d. Todos los anteriores e. b) c) ,pero no a)

16. ¿En cuál de las siguientes situaciones es la fórmula correcta para calcular

a) El muestreo es de una población infinita.
b) El muestreo es de una población finita con reemplazo.
c) El muestreo es de una población finita sin reemplazo.
d) Sólo a) y b).
e) Sólo b) y c)

17. Suponga que una población con N = 144 tiene µ = 24. ¿Cuál es la media de la distribución
de muestreo de la media para muestras de tamaño 25?
a) 24 b) 2 c) 4.8. d) No puede determinarse de la información dada.

18. El Teorema Central del Límite nos asegura que la distribución de muestreo de la media:
a) Es siempre normal.
b) Es siempre normal para tamaños grandes de muestra.
c) Se aproxima a la normalidad al tiempo que se incrementa el tamaño de muestra.
d) Parece normal sólo cuando N es mayor que 1,000.

19. En una población normalmente distribuida, la distribución de muestreo de la media:


a) Está normalmente distribuida.
b) Tiene una media igual a la media de la población.
c) Tiene una desviación estándar igual a la desviación estándar de la población dividida entre
la raíz cuadrada de un tamaño de muestra.
d) Todos los anteriores.
e) Tanto a) como b).

Complete los espacios en blanco de forma tal que de sentido a la oración.

80
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

1. Una porción de los elementos de una población elegidos para su examen o medición directa
es una _______________

2. La proporción de la población contenida en una muestra es la ________________.

3. La _______________ _______________ es el proceso mediante el cual se hacen inferencias acerca de


una población a partir de información sobre una muestra.
4. La ____________ ___ _________ _________es la distribución que se obtiene al encontrar la
distribución de muestreo de todas las muestras de un tamaño dado de una población.
5. El muestreo _____________se debe usar cuando cada grupo considerado tiene una pequeña
variación dentro de sí mismo, pero hay una amplia variación entre diferentes grupos.

6. Un método aleatorio en el que los elementos se seleccionan a partir de la población a intervalos


uniformes se denomina muestreo ______________.

7. Dentro de una población, los grupos que son similares entre sí (aunque los grupos mismos tengan
una amplia variación interna) se conocen como _______________.

LA ÉTICA EN LA ESTADÍSTICA 
 
 

Uno de los errores en el diseño de una encuesta es el “ERROR DE COBERTURA” y genera un sesgo de selección constituyéndose en un
problema ético cuando del marco se excluyen unidades de análisis. Lo mismo ocurre si hay ERROR DE NO RESPUESTA, generando el
mismo sesgo, si el investigador deliberadamente no trabaja con las respuestas faltantes o diseña una encuesta sabiendo que se reduce la
posibilidad de que algunos contesten. El ERROR DE MUESTREO puede generar conclusiones distintas si no se informa el tamaño de la
muestra y al margen de error. También, cuando el investigador lleva a que el encuestado de la respuesta que pretende, sea porque la
pregunta es tendenciosa.

81
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

INFERENCIA ESTADÍSTICA

MÉTODO CLÁSICO MÉTODO BAYESIAN0

Utiliza Conocimiento Subjetivo o Previo


sobre la Distrib. De Probabilidad de los
parámetros desconocidos junto con la
ESTIMACIÓN PRUEBA DE HIPÓTESIS información de la muestra

Utilizadas para Toma de Decisiones


Utilizada para Estimar parámetros
en relación con los parámetros de
población especificadas.

PUNTUAL POR INTERVALOS

D
Un solo valor Un conjunto de valores posibles, cerrado y acotado, I
del estimador cuyos límites son funciones del estimador S
T
R
I
B

D
E

P
R
O
B
A
B
I
L

La Inferencia Estadística utiliza un “razonamiento inductivo” porque a partir de los resultados de una
muestra se van a obtener conclusiones sobre la población.

Complete la notación correspondiente

PARÁMETRO ESTIMADOR
a estimar

Estimación Puntual  Valor único


Estimación Por Intervalos  Conjunto de valores cerrado y acotado
82
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

PROPIEDADES DE LOS ESTIMADORES


Defina las propiedades de un buen estimador a partir de la definición de E.C.M

Las propiedades que deben cumplir un buen estimador son:


 ‐ 
 
 ‐ 
 
 
 ‐ 
 
 ‐ 
 
 
 ‐ 
 
 ‐ 

ESTIMACIÓN PUNTUAL

El lanzamiento de una flecha al blanco


El blanco representa el parámetro -θ- que se desea estimar
La flecha representa el estimador
Cada flecha determina una sola estimación muestral

ESTIMACIÓN POR INTERVALOS

El lanzamiento de un aro en un poste.


El poste representa el parámetro -θ- que se desea estimar
El aro representa el intervalo de confianza
83
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Tipo de análisis Datos Categóricos Datos Numéricos


Intervalo de Confianza  Estimación del Intervalo de   Estimación del Intervalo de 
para un Parámetro Confianza para la proporción  Confianza para la media 
Poblacional  Estimación del Intervalo de 
Confianza para la varianza 
 Estimación del Intervalo de 
Confianza para el desvío 

0,025

Grafica: Suponiendo una Población Infinita proveniente de una distribución Normal conociendo el desvío poblacional
Conceptos:

ERROR DE ESTIMACIÓN
Es la distancia entre una estimación y el parámetro θ

SESGO
Es la diferencia entre la esperanza del estimador y el parámetro

Los elementos de la Estimación por Intervalos son los siguientes:


Li - L s INTERVALO DE CONFIANZA: comprendido entre el Límite Inferior y el Límite
Superior. Acota el valor del parametreo entre dos limites con cierto nivel de conf.
(1-α ) NIVEL DE CONFIANZA: De cada 100 intervalos diferentes que se pueden construir
el (1-α)% cubrirá el verdadero valor del parámetro.
z, t, k…. VALOR CRÌTICO: Valor de Z, T, K, u otro necesario para construir un intervalo de
confianza para la distribuciòn.
ERROR ESTANDAR DE LA MEDIA
( para Desvío Poblacional Conocido o no y Población Infinita o Finita)
̅ ERROR ESTANDAR DE LA PROPORCION

=ME=E=z. ERROR MAXIMO DE ESTIMACIÓN PERMITIDO O MARGEN DE ERROR O


SEMIAMPLITUD
Es la diferencia maxima que se está dispuesto a tolerar entre el valor del estimador y
el parámetro.

84
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Interpretación

A largo plazo el (1-α) % de los intervalos obtenidos contienen al parámetro.


Pero, no se sabe si nuestro intervalo construido es uno de los que pertenecen al (1-α) %

Ejemplo:

   
P  x  z.    x  z.  = (1-α)
 n n
La Variable Aleatoria x aparece en los extremos con la constante desconocida: µ en la mitad.

El Intervalo construido  Se considera un INTERVALO ALEATORIO: es un intervalo


especifico que resulta ser la realización de un intervalo aleatorio con base a los datos de una
sola muestra

a) Pues sus dos puntos extremos son una VA


Li____________________________ Ls
 
x  z. x µ x  z.
n n

M.E. M.E.

b) Centrada en la x y se extiende a de c/lado (caso de desvío conocido y población. infinita
n

c) La longitud o ancho es 2 veces Z. y no es aleatoria
n
d) LO ALEATORIO es la Localización del Punto Medio del Intervalo x
 
En consecuencia; IC [ x  z. ; x  z. ]
n n
  
IC  x  z. IC  x  M E 
n 
O más conciso

EJERCICIOS DE APLICACIÓN de ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE
CONFIANZA

Encuentre el valor “z” para construir el intervalo de confianza según el nivel de confianza
especificado:
Nivel de Valor “z” Valor “z”
confianza Del Límite inferior Del Límite superior
80% -1,282 1,282
90%
95%
99%

1) Una asociación de administradores de consorcio desea conocer el promedio de las expensas anuales.
En una muestra aleatoria de 256 administradores, la media es de $ 4542 y la desviación estándar de
$ 205. a) ¿Cuál es la media poblacional?

85
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

b) ¿Cuál es el intervalo razonable de valores para la media poblacional?


c) ¿Qué significan los resultados obtenidos?

2) Necesita estimar la media poblacional, en el caso de estudiar la vida útil de determinada lámpara
de proyectores en donde se conoce la desviación estándar de la vida útil poblacional que es de 500
horas, pero se desconoce la vida útil media. Se toma una muestra de 15 lámparas para proyectores y da
una vida útil de 8900 horas.
Resolver suponiendo:
 2.1) Que la vida útil de las lámparas sigue la distribución normal, sabiendo que quiere construir
el intervalo de confianza del a) del 95% y b) del 90% Rta: (8647;9153) ; (8688, 9112)
 2.2) ) Que la vida útil de las lámparas no se considera normalmente distribuida y por tal razón
la muestra tomada fue de 35 lámparas en lugar de 15 lámparas, sabiendo que quiere construir
el intervalo de confianza para un nivel del 95% Rta: (8734; 9066)
 2.3) Que la población está normalmente distribuida pero no se conoce la desviación estándar de
la población. En la muestra tomada de 35 lámparas dio una desviación estándar de 500 horas
frente a la media de la muestra de 8.900 horas. Resuelva solamente para el 90% de nivel de
confianza. Rta: (8761;9039)
 2.4) Que no puede suponer la forma de la distribución, y más aún, no conoce tampoco el desvío
poblacional. Sigue tomando una muestra de 35 lámparas lo que arrojó una media de 8.900 horas
y 500 horas de desvío y debe estimar la media poblacional para un nivel de confianza del 99%
Rta: ( 8682; 9118)
 2.5) Que el desvío no se conoce, pero el desvío muestral es 500 horas. Construya el intervalo de
confianza con un nivel de confianza del 95% para estimar la media poblacional, sabiendo que
la vida útil sigue una distribución normal. La muestra ha sido de 15 lámparas con una media
muestral de 8.900 horas. Posteriormente, construya el intervalo en donde se encuentra la media
poblacional considerando un nivel de confianza del 90%. Rta: (8623; 9177) ; (8672;9128)
 2.6) Que la muestra de 15 lámparas arrojó una media de 8.900 horas y desvío estándar de 500
horas. Estime la media poblacional construyendo el intervalo con un 90% de nivel de confianza
si se supone que la vida media no está normalmente distribuida. Rta (8492; 9308)

3) En una muestra de 40 restaurantes de comida rápida la venta diaria fue de $ 26.800 y la desviación
estándar de $3.020. a) ¿Cuál es la media estimada de ventas diarias y cómo se llama esta estimación?
b) ¿Cuál es el intervalo de confianza de 99% de nivel de confianza? Interprete sus resultados.
Rta: b) IC [ 25570 28030]

4) El costo variable de construcción de dúplex en una zona del Gran Buenos, por metro cuadrado sigue
una distribución normal. Se tomó una muestra de 16 viviendas con las que se calculó un costo variable
de construcción promedio de $ 2.100 y un desvío estándar de $ 225.
a) Entre qué valores estará el costo variable promedio de construcción si la estimación se hará con un
nivel de confianza del 95%.
b) Estime la varianza poblacional con una confianza del 90%.
c) Luego estime el desvío poblacional con igual confianza
Rta: a) IC [ 1980,13 2219,86] = 0,95; b) IC [30380 104582,7]=0,90; c) IC [174,30 323,4]=0,90
Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía” que es peligroso
hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un intervalo de la
varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media poblacional.”

5) Una empresa con una gran cantidad de empleados están considerando la posibilidad de ofrecer en
conjunto un nuevo servicio de almuerzos para todos. Como integrante en ese estudio de viabilidad del
proyecto se desea conocer el costo diario medio de los almuerzos. En una muestra tomada al azar de
11 empleados se llegó a que los importes consumidos en almuerzo diariamente han sido los siguientes:
$95 $105 $95 $92 $107 $91 $104 $101 $99 $97 $107
86
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

a) Determine un intervalo de confianza de 90% para la media poblacional. Interprete su resultado.


Considere una distribución normal para su resolución
b) Estime la varianza con una confianza del 90%
c) Luego estime el desvío poblacional con igual confianza
d) Comente la situación del problema considerando que no se conoce el tipo de distribución.
Rta: a) IC [ 96,17 102,55] = 0,90; b) IC [18,60 86,42]=0,90; c) IC [4,313 9,296]=0,90

6)El negocio de Nicola dedicado a hacer pasteles los comercializa a 50 pastelerías. Nicola desea
saber el nivel de ausentismo entre sus empleados. A continuación, se da el número de días de
ausencia durante una quincena en una muestra de 10 trabajadores.
4 1 2 2 1 2 2 1 0 3
a) Determine la media y la desviación estándar de la muestra.
b) ¿Cuál es la media poblacional? ¿Cuál es la mejor estimación de ese valor?
c) Proporcione un intervalo de confianza de 95% para la media poblacional
d) Explique por qué usa esa distribución en el ejercicio
e) ¿Puede concluir que el trabajador promedio no faltó ningún día durante una quincena?
Rta: a) 1,8 ; Sn-1 = 1,1353 b) 1,8 -como mejor estimación. c) IC [0,196 3,404] = 0,95

7) En una determinada localidad hay 250 familias. Se realizó una encuesta a 40 familias surgiendo que
la cantidad promedio de consumo anual en turismo es U$s 4.500 con una desviación estándar de U$s
750. Determine un intervalo de confianza de 90% para el consumo anual en turismo.
Rta: a) IC [4320,85 4679,15] = 0,90

8) Se ha reunido la siguiente información en la tabla que se presenta a continuación:


Monto de la deuda Cantidad de clientes
1000-1500 9
1500-2000 17
2000-2500 28
2500-3000 20
3000-3500 6
a) Estime puntualmente el monto promedio de las deudas
b) Estime con una confianza del 98%, el monto promedio de las deudas.
c) Luego estime el desvío poblacional con igual confianza, bajo los supuestos que son necesarios
para su resolución Rta: a) = 2231,25 ; b) IC [2087,25 2375,25] = 0,98; c) IC [466,83 677,79)

9)Un analista de investigación de perfumes obtiene información respecto de una muestra de 100
clientes de los 400 que adquieren una oferta especial determinada. Estas 100 personas gastaron en la
Perfumería un promedio de U$s 24,57 con una desviación estándar de U$s 6,60. Si emplea un intervalo
de confianza considerando el nivel del 95% calcule a) el monto medio de compra para los 400 clientes
y b) el monto total de dinero gastado en compras por los 400 clientes.
Rta: a) b) IC [23,45 25,69] = 0,95 b) IC [9380; 10276] = 0,9

10) Un agente bursátil analiza el rendimiento de un fondo de inversión. Para ello, tomó una muestra
mediante la recopilación de los rendimientos medios generados por ese fondo durante 25 días,
obteniendo un rendimiento medio del 6%. Considerando que el rendimiento de los fondos de inversión
siguen una distribución aproximadamente normal con un desvío del 3,2%.
a) Halle con una confianza del 95% el intervalo para el rendimiento medio del fondo.
b) Halle con una confianza del 90% el intervalo para el rendimiento medio del fondo.
c) Compare e interprete los resultados obtenidos en los puntos anteriores.
d) Calcule la cantidad de días que debería analizar para que el error sea inferior al 0,5% con un nivel
de confianza del 90% Rta: a) IC [0,047456 0,072544] = 0,95; b) IC [0,049472 0,070528] = 0,90 d) n=111
87
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

11) Antes reiterados reclamos el Sector de control de calidad decide calcular la proporción de artículos
que no cumplen con los requisitos de calidad. Dado que resulta dificultoso hacer un relevamiento de
todos los artículos fabricados, se ha decidido estimar dicha proporción a través de una muestra de 64
artículos de los cuales 8 no cumplen con las especificaciones de calidad.
Dada esa evidencia muestral, se solicita:
a) Hallar el intervalo de confianza para la proporción de artículos que no cumplen las especificaciones
en la población, considerando un nivel de confianza del 95%
b) Hallar: b.1) el intervalo de confianza para la proporción de artículos que no cumplen las
especificaciones en la población, considerando un nivel de confianza del 90% y b.2) ¿cómo afectaría la
estimación si la cantidad de artículos fabricados por la empresa han sido 1200?
c) Compare los resultados anteriores e interprételos.
d) Si el error estipulado se quiere reducir en un 25% ¿cuál sería el tamaño de la muestra, considerando
un nivel de confianza del 90%?
Rta: a) IC [0,04397 0,20603] = 0,95; b.1) IC [0,057 0,193] = 0,90; b.2) IC [0,0588 0,19119] = 0,90 d) n=261

12) Un concesionario decide analizar la eficiencia de un vendedor nuevo para estudiar la posibilidad
de incrementarle las comisiones; ventas. Para ello, se analizará además del monto promedio de ventas,
la varianza de las mismas. Del total facturado por ventas realizadas por este vendedor se seleccionaron
al azar las siguientes facturas que arrojan los siguientes valores en miles de pesos
108-136-290-410-72-124-320

Utilizando esta información muestral: Construya el intervalo de confianza para las ventas, que se
distribuyen en forma aproximadamente normal, considerando un nivel del 95% de confianza tanto
para: a) la media; b) la varianza y c) el desvío.
Rta: a) IC [88,69 328,45] = 0,95; b) IC [6976,46 81472,32]=0,95; c) IC [83,52 285,43]=0,95

13) La contabilización de facturas produce una proporción desconocida de comprobantes con datos
diferentes a los reales. Por tal razón, se ha tomado una muestra de 60 comprobantes que arrojaron una
proporción de comprobantes con datos diferentes a los reales del 30%.
a) Hallar los límites de confianza del 95% para la proporción de comprobantes con datos diferentes a
los reales.
b) Determinar la cantidad de comprobantes que debieran someterse a análisis para reducir el error en
un 50%especificando el criterio adoptado para determinar el tamaño muestral.
Rta: a) IC [0,184045 0,415955] = 0,95; b) n= 286

14) Según una encuesta realizada, se pudo establecer utilizando una muestra de 8740 familias que la
proporción de familias que consumen productos light se encuentra entre el 28,74% y el 31,26%. Se pide
hallar el nivel de confianza si se conoce a partir de la muestra que 2622 familias consumen productos
light.
Rta: (1-α)= 0,99

88
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE INFERENCIA ESTADÍSTICA

Conteste Verdadero –V- o Faso en los siguientes enunciados y en el caso de ser Falso,
modifique el texto de forma tal que se haga Verdadero.

1. Una distribución del muestreo es la distribución que enlista algunas de las posibles estadísticas muestrales
obtenidas de muestras de igual tamaño que pueden extraerse aleatoriamente de la misma Población, en donde
se considera tanto el muestreo con reposición como el muestreo sin reposición.

Rta: V__/F__

2. El error estándar de la media es la desviación estándar de la distribución de medias muestrales.


Rta: V__/F__

3. El error estándar de la ………., es el nombre que generalmente se usa para expresar la desviación estándar de
la distribución muestral de la estadística que se mencione en el espacio integrado por punto.
Rta: V__/F__

4.El error estándar de la media aumenta a medida que el tamaño de la muestra aumenta.
Rta: V__/F__

5. La media de la distribución del muestreo de las es igual a la media de la muestra.


Rta: V__/F__

6. Los histogramas para representar todas las distribuciones muestrales son simétricos.
Rta: V__/F__

7. Una muestra aleatoria se obtiene en forma tal que todas las muestras posibles de tamaño n tienen igual
probabilidad de ser seleccionadas. Rta: V__/F__

8. Lo que determina la dispersión de una distribución del muestreo dice Anastasia: “es el número de muestras
empleadas” y Tatiana dice que “es el tamaño de cada muestra empleada.
Rta: V__/F__

9. El intervalo de confianza se construye a partir de la “estimación puntual el error máximo.


Rta: V__/F_

10. El T.C.L. sintéticamente expresa que la distribución del muestreo se asemejará más estrechamente a la
Distribución normal cuando el tamaño muestral aumenta. Rta: V__/F__

11. Un nivel de confianza del 90% significa que la probabilidad de que el intervalo tome esos valores es del 90%
Rta: V__/F__
12. Las Distribuciones “t” de Student tienen una distribución aproximadamente normal, pero están más dispersas
que la distribución normal estándar, por eso son leptocúrticas
Rta: V__/F__

13. Se dice que un estadístico es un estimador eficiente de un parámetro si, al aumentar el tamaño de la muestra,
es casi seguro que el valor del estadístico se acerca mucho al valor del parámetro.
Rta: V__/F__

89
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

14. Una estimación de intervalo es un intervalo de valores utilizado para estimar la forma de la distribución de
una población.
Rta: V__/F__
15. La probabilidad de que un parámetro de población se encuentre dentro de una estimación de intervalo dada
se conoce como nivel de confianza.
Rta: V__/F__

16.Al aumentar el tamaño de la muestra, la distribución t tiende a una forma más plana.
Rta: V__/F__

17. Debemos utilizar siempre la distribución t, y no la distribución normal, cuando se desconoce la desviación
estándar de la población.
Rta: V__/F__

18.Cuando se utiliza la distribución t para hacer estimaciones, se debe suponer que la población es
aproximadamente normal.
Rta: V__/F__
19. No siempre es deseable utilizar niveles de confianza altos, debido a que producen intervalos de confianza
grandes.
Rta: V__/F__

20. Existe una distribución t distinta para cada posible tamaño de muestra. Rta: V__/F__

21. Una estimación puntual a menudo resulta insuficiente, porque sólo puede ser correcta o incorrecta.
Rta: V__/F__

22. Se dice que una media de muestra es un estimador no sesgado o imparcial de una media de población debido
a que ningún otro estimador podría extraer de la muestra información adicional acerca de la media de la población.
Rta: V__/F__

23.El estimador de σ que se utiliza con más frecuencia es s.


Rta: V__/F__

.
22. El error estándar de la población se calcula como
Rta: V__/F__
23. El número de grados de libertad que se utilizan en una estimación de distribución t es igual al tamaño de la
muestra.
Rta: V__/F__

24. Conforme aumenta el tamaño de la muestra, la distribución t se aproxima menos a una distribución normal.

Rta: V__/F__

25.Conforme aumenta el ancho de intervalo de confianza, el nivel de confianza asociado con el intervalo también
se incrementa. Rta: V__/F__

Marque la opción que considera correcta en cada enunciado

1. Cuando escogemos un estimador de un parámetro de población, debe tomarse en cuenta:


a) Suficiencia.
b) Claridad.
c) Eficiencia.
d) Todos los anteriores.
e) a) y c), pero no b)
90
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

2. Suponga que se preguntó a 200 miembros de un grupo si les gusta o no un producto en particular. 50 dicen que
sí y 150 dicen que no. Suponiendo que “sí” significa un éxito, ¿cuál de las siguientes es correcta?
a) ̅ = 0.33.
b) ̅ =0.25.
c) ̅ =0.33.
d) ̅ =0.25.
e) b) y d), solamente.

3. Suponga que está tomando una muestra y calcula es 100. Después calcula el límite superior de un intervalo de
confianza del 90% para m ; su valor es 112. ¿Cuál es el límite inferior de este intervalo de confianza?
a) 88.
b) 92.
c) 100.
d) No se puede determinar a partir de la información proporcionada

4. Después de tomar una muestra y calcular ̅ y s, un especialista en estadística dice: “tengo el 88% de certeza de
que la media de la población está entre 106 y 122”. ¿Qué es lo que quiere decir en realidad?
a) La probabilidad de que µ se encuentre entre 106 y 122 es de 0.88.
b) La probabilidad de que µ = 114, el punto medio del intervalo, µ5.
c) El 88% de los intervalos construidos que fueron calculados a partir de las muestras de tamaño “n” contendrá
el parámetro poblacional µ

5. ¿Cuál de las siguientes es una condición necesaria para utilizar una tabla de distribución t? a) n es pequeño.
b) Se conoce el desvio muestral , pero no el poblacional .
c) La población es infinita.
d) Todos los anteriores. e) a) y b), pero no c).

6.Suponga que intentamos estimar una varianza de población utilizando . No es correcto calcular S2 como ∑(x
– ̅ )2/n debido a que el valor sería:
a) Sesgado.
b) Ineficiente.
c) Inconsistente.
d) Insuficiente.

7. Suponga que, de una población con N 5 50, se toma una muestra de tamaño 15; se sabe que es igual a 36 y
que S 2 para la muestra es 49; la x para la muestra se calcula en 104. ¿Cuál de las siguientes deberá utilizarse para
calcular un intervalo de confianza del 95% para µ?
a) La distribución t de Student.
b) La distribución normal.
c) Multiplicador de población finita.
d) a) y c), pero no b).
e) b) y c), pero no a).

8.. Podemos utilizar la distribución normal para representar la distribución muestral de la población cuando:
a) El tamaño de la muestra es mayor que 10.
b) El tamaño de la muestra es menor que 50.
c) El tamaño de la muestra es mayor que 5.
d) Ninguno de los anteriores.

9. Se sabe que la calificación promedio de los 25 estudiantes del curso de matemáticas de quinto año del colegio
High College es de 66 puntos. Al elaborar un intervalo de confianza del 95% para la calificación promedio de
todos los alumnos del quinto año, deberíamos usar:
a) La distribución normal con 24 grados de libertad.
b) La distribución t con 24 grados de libertad.
c) La distribución t con 65 grados de libertad.
d) La distribución t con 25 grados de libertad.

91
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

10. Cierta población con distribución normal tiene una desviación estándar conocida de 1.0. ¿Cuál es el ancho
total de un intervalo de confianza del 95% para la media de la población?
a) 1.96.
b) 0.98.
c) 3.92.
d) No se puede determinar con la información proporcionada.

Complete los espacios en blanco de forma tal que de sentido a la oración.

1. Un solo número que se utiliza para estimar un parámetro de población desconocido es un(a)
__________________

2. Un intervalo de valores que se utiliza para estimar un parámetro de población desconocido es un(a)
____________________________

3. Una vez que sabemos algo acerca de una muestra, el número de valores de la muestra que podemos
especificar libremente se conoce como _________________

4. La familia de distribuciones de probabilidad que se utiliza cuando no se conoce la desviación estándar de la


población, el tamaño de la muestra es pequeño y los valores se aproximan a la distribución normal es el (la)
_______________________

5. Cuando damos una estimación de intervalo de un parámetro de población, hacemos notar qué tan seguros
estamos de que el intervalo contiene al parámetro real de la población, estableciendo
un________________________________

6. Los límites superior e inferior de confianza están a la misma de la ____________________

7. En ausencia de información adicional, debería utilizarse un valor de ___________para p al determinar el


tamaño de muestra para la estimación de una proporción de población.

92
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

RESUMEN DE CONCEPTOS PARA ESTIMACIÓN POR INTERVALOS

Complete el siguiente mapa conceptual para estimar el parámetro poblacional


mediante un nivel de confianza.

INTERVALOS DE CONFIANZA de la MEDIA POBLACIONAL


considerando

DISTRIBUCIÓN

NORMAL DESCONOCIDA

DESVÍO DESVÍO
DESVÍO DESVÍO
CONOCIDO DESCONOCIDO
CONOCIDO DESCONOCIDO

n 30 n 30 n 30 n 30 n 30 n 30 30
n 30 n

INTERVALOS DE CONFIANZA de la PROPORCIÓN POBLACIONAL


considerando

DISTRIBUCIÓN NORMAL

INTERVALOS DE CONFIANZA de la VARIANZA POBLACIONAL


considerando

DISTRIBUCIÓN NORMAL

93
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

RECORDAR: Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía”
que es peligroso hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un
intervalo de la varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media
poblacional.”

INTERVALOS DE CONFIANZA de la DESVIACION POBLACIONAL


considerando

DISTRIBUCIÓN NORMAL

LA ÉTICA EN LA ESTADÍSTICA 

Cuando se hace inferencia se debe dejar informado el tamaño de la muestra, los límites del intervalo de confianza y la
interpretación de su significado.
Los resultados estadísticos en donde más engañoso se presentan son los relacionados a sondeos políticos, por lo que los resultados
deben estar seguidos del error de muestreo implicado, la metodología utilizada, el tamaño de la muestra, el intervalo de confianza hallado.

94
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

VI – LOS TESTS DE HIPÓTESIS -UNIDAD TEMÀTICA Nro.7 del Programa Nº 3496/13


Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para tomar decisiones en condiciones de
incertidumbre y medir los posibles errores asociados con esta situación.

DISTRIBUCIÓN EN EL MUESTREO

INTERVALOS DE CONFIANZA TEST DE HIPÓTESIS


 Usan los mismos datos
 Razonamiento inductivo porque en la Estadística inferencial se utilizan los resultados de una muestra
para obtener conclusiones acerca de la población
 Se utilizan para estimar un parámetro  Se utilizan para tomar decisiones en relación con
parámetros de población especificado.
 Aporta un análisis diferencial entre los resultados
o Observados en el estadístico de la muestra
o Esperados
Si la hipótesis subyacente es Verdadera.
 Es bilateral  Es bilateral (2 colas Test contradistinto) o Unilateral
de 1 cola –test contra mayor o bien test contra
menor)
 Expresa la incertidumbre de la estimación  Verifica la validez de una suposición acerca del
respecto al verdadero valor del parámetro valor del parámetro θ
θ

“No diga: He hallado la verdad, sino he hallado una verdad” Kahlil Gibran

HIPÓTESIS: enunciado acerca de una característica de la población o de un modelo estadístico.

El test de hipótesis o contrastación de hipótesis o Prueba de hipótesis es un proceso o procedimiento


para establecer la validez de una hipótesis estadística, basado en evidencia muestral y teoría de las
probabilidades.

La prueba de hipótesis comienza con una afirmación o suposición acercad de un parámetro poblacional.

LAS DOS HIPOTESIS EN CONFLICTO


Las dos hipótesis en conflicto son la Ho y la H1 dado que son mutuamente excluyentes.
Para asegurarnos que Ho y la H1 contengan el verdadero valor del θ: es hacer que Ho y H1 sean
complementarias.

 HIPOTESIS NULA - Ho -

El planteo de la hipótesis comienza con la denominada Hipótesis Nula –Ho – cuyo subíndice 0
indica no hay diferencia, no hay cambio y convenimos (por convención general en la mayoría
de la literatura estadística) que tiene que contener el signo igual por lo que se trata de la
afirmación de algo.
Es el punto de partida del investigador. Mantiene el status quo

Se expresa de las siguientes formas:


Ho : u = u o
Ho : u u o
Ho : u u o

95
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

La hipótesis nula siempre tiene el signo igual y NUNCA el igual aparecerá en la hipótesis
alternativa, porque la Ho es la afirmación y cuando se realizan los cálculos se requiere de un
valor específico.

La Ho es una afirmación que no se rechaza a menos que exista evidencia muestral que nos lleve
a rechazarla, es decir a no aceptarla.

Ahora bien, si la evidencia muestral nos lleva a aceptarla, no significa que sea la Ho verdadera,
sino que no encontramos evidencia suficiente para rechazarla. Para probar que sea la Ho
verdadera tendríamos que hacer un censo de la población.
Por ese motivo, cuando se concluye “Aceptar la Ho” en realidad se debe decir “No se rechaza la
“Ho” ya que no se encontró evidencia muestral suficiente que permita rechazarla.
Se concluye expresando: Existe evidencia muestral que indica que la hipótesis nula …….

 HIPOTESIS ALTERNATIVA - H1 - también denotada como Ha

Es la afirmación que se acepta si la evidencia muestral proporciona evidencia suficiente de que


la hipótesis nula es falsa y se rechaza la Ho

TIPOS DE TEST DE HIPOTESIS

o PARAMÉTRICO: Cuando la característica poblacional que sometemos a prueba es un parámetro


o NO PARAMÉTRICO: Cuando la característica poblacional que sometemos a prueba no es un parámetro
sino que puede ser una función de distribución; la independencia de atributos.

REQUISITOS Y SUPUESTOS PARA EL TEST DE HIPOTESIS

PARAMÉTRICO  NO PARAMÉTRICO  
o Requieren  hipótesis  con  respecto  a  parámetros  o La  prueba  no  necesariamente  se  relaciona  con 
poblacionales  parámetros poblacionales 

o El  nivel de medición, debe permitir operaciones  o Los datos no tienen fuerza suficiente como para 
aritméticas  que  tengan  significado  (escala  de  recomendar  operaciones  aritméticas  con 
medición intervalar o de razón)  verdadero  significado  (escala  de  medición 
inferiores a la de intervalos)  

o Supuestos:  o La  prueba  no  depende  de  la  distribución 


a. Que  la  muestra  extraida  provenga  de  probabilística  de  la  población  que  generó  la 
una población Normal   muestra  (según  Gibbons,  se  trata  de  prueba  de 
b. Que  las  observaciones  sean  distribución libre, pero en este curso lo tomamos 
independientes entre sí  como todo lo que no es paramétrico)  
c. Si  intervienen  dos  o  más  muestras,  las 
mismas  deben  ser  extraídas  de 
poblaciones normales con igual varianza. 
De tal forma, con ambos tipos de test tenemos cobertura para analizar datos con todo tipo de escalas de medición, 
algunos test son más rápidos y fáciles de aplicar y más robustas (es decir que tienen insensibilidad relativa a violaciones 
pequeñas de los supuestos)  tales el caso de hipótesis no paramétricas que no es parte de nuestro curso de Estadística I. 
 
Tener en cuenta que si los datos  son numéricos, utilizar pruebas no paramétricas hacen desperdiciar información. 
Lo importante también, es que sirven las no paramétricas para muestras en donde no es posible verificar los supuestos 
de las paramétricas para muestras chicas. 

96
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

RESULTADOS DE UN TEST DE HIPÓTESIS


Complete el cuadro identificando cada error que se generan al tomar una de las
decisiones, en donde no se conoce si el Ho es verdadero o no lo es.

Decisión Situación
Estadística Ho –Verdadera- Ho –Falsa-

No rechazar Ho

Rechazar Ho

Mencione y defina los dos tipos de errores :


1)
2)

Informe sobre la REGLA DE DECISIÓN tomada luego del Test:


Como el valor empírico es   al valor teórico se  la Hipótesis nula que enuncia que 
“ ” 
   
Por lo tanto, existe evidencia muestral suficiente que indica que 
a un nivel de significancia del  por lo que se recomienda

TIPOS DE TEST DE HIPÓTESIS O CONTRASTES DE HIPÓTESIS

DE
CORRIDA

Un ejemplo en la gráfica “Test de hipótesis para la media poblacional”

97
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CONSTRUYENDO LA PRUEBA DE HIPÓTESIS PARA LA TOMA DE DECISIONES

LOS 6 PASOS EN LA
PRUEBA DE HIPÓTESIS

1. Establecer
hipótesis nula H0
hipótesis alternativa H1

2. Elegir
: nivel de significación -máximo riesgo tolerable
de rechazar incorrectamente la H0
n: tamaño de la muestra

3. Determinar
- el estadístico estandarizado de prueba: Z, T, X2
como único número calculado a partir de los datos muestrales
- el valor p: probabilidad calculada usando el estadistico de prueba

4.Hallar
el o los valores críticos, que divide en dos regiones,
rechazo, aceptación de la hipótesis nula

5.Reunir los datos y


calcular el valor del estadístico de la prueba

6.En base al estadístico  TOMAR LA DECISIÓN y,


Escribir las conclusiones del investigador, de acuerdo a que el estadístico caiga en la
región de aceptación, o rechazo de la hipótesis nula H0.
La regla de decisión debe estar fundamentada en base a los datos del problema
Disponer en el contexto del problema una medida correctiva

El “p-valor” es la probabilidad de observar un estadístico de prueba tanto o más extremo que el


observado, si en realidad Ho es verdadero (en bilateral: es tan abajo o tan arriba)
Es el valor más pequeño de α para el cual se puede rechazar la Ho
Es el riesgo real de cometer un error de tipo I y mide la fuerza de la evidencia contra la Ho.
Es el minimo valor de  para el cual, con una muestra dada decido rechazar la Ho

98
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

CONCEPTOS DE APLICACIÓN de TEST DE HIPÓTESIS

1) Exprese en cada caso, si está bien planteada la hipótesis estadística (V ó F) y por qué. Luego, en
cada caso, exprese el tipo de test a utilizar (bilateral, unilateral contra mayor, unilateral contra
menor) con la representación gráfica.
a) Ho : µ > 200 g) H1 : µ = 200
b) Ho: 350 h) Ho: p  0,80
c) Ho : µ = 2
i) H1 : p  1, 80
d) H1 : x  0,80 j) H0 : p  0,80
e) Ho: : x <4320 k) H1: µ ≠200
f) Ho: µ < 350
Rta: V: c); j) y k; Test bilateral –contra distinto-: b) ; c) g) y k); Test
unilateral contra mayor: e); f) h) y j). ; Test unilateral contra menor: a); d); i)

2) En el envase de  las barras de arroz con semillas de amaranto, chia y sésamo de 12 gramos se informa que 
aporta 46 calorías. Responda a las preguntas relacionadas con un test de hipótesis para probar lo expresado 
en el envase sobre las calorías. a) Plantee el Ho y la H1 adecuada  b) En esta situación, interprete  ¿cuál es 
el error de tipo I y las consecuencias que genera cometer este tipo de error?  c) ¿cuál es el error de tipo II y 
las consecuencias de cometer este tipo de error?

3) Se está evaluando implementar un nuevo método de enseñanza si mediante una prueba de hipótesis se 
confirma la conclusión de que el nuevo método de enseñanza reduce la proporción de ausentismo en la 
materias. a) Plantee la hipótesis nula y la alternativa si la proporción de ausentismos actual en la materia 
es del 30% b) En esta situación, interprete  ¿cuál es el error de tipo I y las consecuencias que genera cometer 
este tipo de error?  c) ¿cuál es el error de tipo II y las consecuencias de cometer este tipo de error? 

EJERCICIOS DE APLICACIÓN de TEST DE HIPÓTESIS

1) En una compañía que vende todo a crédito,  se sabe que el valor medio de la totalidad de las cuentas por cobrar 
es de $ 2600 con una desviación estándar de $430. Para ello, el auditor de la misma tomará una muestra de 36 
cuentas y rechazará el supuesto de $ 2600 solo si es claramente contradicho por la media muestral.  
Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test   b) Especifique el nivel 
de significancia        c) Seleccione el estadístico de la prueba   d) Establezca los valores críticos de la estadística de 
prueba  e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $ 2400. ¿Acepta la hipótesis 
con un error de tipo I del 5%? Además, Halle el valor del estadístico de prueba : (en función a los valores observados 
en la muestra):teórico y empírico 
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio diferente a $ 2600. 

2) Con relación a los datos anteriores, al auditor anterior no le interesa el promedio de la totalidad de las cuentas 
por cobrar que excedan los $ 2.600 sino que está preocupado por las cuentas a cobrar menores a $ 2600.  
a) Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test 
b) Especifique el nivel de significancia   c) Seleccione el estadístico de la prueba   d)  Establezca los valores críticos 
de la estadística de prueba   e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $ 
2400.Acepta la hipótesis a un nivel de significancia del 5%  Además, Halle el valor del estadístico de prueba  : 
(en función a los valores observados en la muestra):teórico y empírico 

99
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio menor a los datos anteriores que eran de $
2600. La decisión es informar a la compañía que las ventas a plazo han bajado. 

3)Los ingresos promedio anuales  para determinado cargo son de $ 670 miles para las mujeres. El Sindicato decide 
investigar  si  es  cierto  el  reclamo  presentado  por  un  grupo  de  mujeres  sobre  la  diferencia  de  sexo  para  las 
remuneraciones. Se pregunta ¿los varones tienen ingresos promedio mayor a las mujeres? Si tomada la muestra a 
40 varones dio un promedio de $ 725 miles con un desvío de $ 102 miles.  Considerando un nivel de significancia 
del 1% determine si será cierto lo que el investigador está investigando frente al reclamo presentado.  
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 1%. Luego,
se concluye que las remuneracioes promedio de los varones son mayores que la de las mujeres. La
Probabilidad de que se tome una decision incorrecta es del 1% 

4)El rendimiento diario de la soja ha promediado 880 toneladas en un determinado lugar del Gran Buenos. A la AFIP 
le gustaría conocer si este promedio cambió en los meses recientes. Los inspectores seleccionan al azar de la base 
de contribuyentes sojeros 50 días y surge como rendimiento diario medio de  871 toneladas con desvío muestral 
de 21 toneladas. Contraste la hipótesis con un 5% de nivel de significancia.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el rendimiento diario promedio de soja de los valores informados de 880 toneladas. 

5)En los estuches de las lámparas se especifica que el ciclo medio de vida útil de esas lámparas de bajo consumo es 
de  4200  horas.  Como  estudio  preliminar,  ante  reiterados  reclamos  de  los  consumidores  una  empresa  decide 
investigar la situación planteada a partir de una muestra que le ayuda a determinar si el consumo de las lámparas 
actualmente es menor a las especificaciones del producto. 
Tomada una muestra de 10 lámparas, se extrae que el ciclo medio es de 4000 horas con una desviación estándar 
muestral  de  200  horas.  Dado  que  el  ciclo  de  vida  útil  de  las  lámparas  sigue  una  distribución  normal.  Probar  la 
hipótesis nula a nivel de significancia del 5%.  
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el ciclo medio de vida útil de las lámparas es menor al informado en el producto, razón
por la cual se toma la decision de realizer una reunion con el Sector de Producción y de Calidad, para
tomar las medidas correctivas. 

6)Se quiere determinar si el proceso de llenado de una caja chica de arroz yamaní funciona de manera adecuada, 
es decir que el llenado medio a lo largo de todo el proceso de empaque continúa en 368 gramos especificado en la 
caja  y  no  se  requiere  acción  correctiva.  Para  evaluar  el  requisito  de  368  gramos  conociendo  además  el  desvío 
estándar poblacional de 15 gramos proveniente de una población normal el gerente de empaque selecciona al azar 
una muestra de 25 cajas, pesa cada caja, registra los valores‐ Procesados los mismos, da una media muestral de 
372,5 gramos y debe evaluar la diferencia existente entre el estadístico de la muestra y el parámetro poblacional 
establecido. A un nivel de significancia del 5% ¿cuál es la conclusión?  
Rta: Existe evidencia muestral suficiente para aceptar la Ho al nivel de significancia del 5%. Luego,
se concluye que el proceso de llenado del arroz funciona de manera adecuada, pues en promedio el
contenido es de 368 gramos con un nivel de significancia del 5%

7)Usted como gerente de Kansas quiere determinar si el tiempo de espera al pedir una orden se ha modificado 
durante el último año respecto a su valor de media poblacional de 4,5 minutos. Los tiempos de espera siguen una 
Distribución Normal. A partir de experiencias anteriores, se supone que la desviación estándar poblacional es de 
1,2 minutos. Seleccionada una muestra aleatoria de 25 pedidos u órdenes en el transcurso de una hora, la media 
muestra es de 5,1 minutos. 
Determine si hay evidencia muestral que indique con un nivel de significación del 5% que el tiempo de espera medio 
para servir un pedido se ha modificado. 
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que a un nivel de significancia del 5% los tiempos de espera se han modificado de la media
de 4,5 minutos. Sería conveniente, comprobar si los tiempos se redujeron demostrando una eficiencia  

100
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

8)Un auditor decide probar  el supuesto de que el valor medio de la totalidad de las cuentas por cobrar de clientes 
chicos de una Pyme es de $ 260 con una desviación estándar de los montos de las cuentas por cobrar de $ 43, 
tomando una muestra de 36 cuentas de clientes chicos y calculando la media muestral. El auditor desea rechazar 
el valor supuesto de $260 solo si es claramente contradicho por la media muestral, caso éste en el que el valor 
hipotético recibiría el beneficio de la duda en el procedimiento de prueba. Para ello fija un nivel de significancia del 
5%. a) ¿Cuáles son las conclusiones del auditor si una vez obtenida la muestra de 36 clientes chicos, la misma arroja 
una media de cuentas a cobrar de $240? 
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el valor medio de las cuentas a cobrar es de $260 La probabilidad de que se tome una
decision incorrecta es del 5% y en este caso el auditor puede concluir que los valores informados por
la empresa son razonables y abrir otra auditoria de dicha cuenta.  

9)Recientemente una empresa que realiza ventas de lámparas para proyectores ha recibido numerosos reclamos 
respecto a que  la  duración de  los  repuestos es  inferior  a  1000  días comprometidos  en el  prospecto. Toma  una 
muestra al azar de 9 lámparas y el promedio de vida útil de las lámparas según la muestra de 9 lámparas es de 973 
días y el desvío es de 37,50 días. Se pide: a) Realice la prueba a un nivel de significación del 1%, b) Realice la prueba 
a un nivel de significación del 5% considerando que la duración de los repuestos de lámparas para proyectores sigue 
una  distribución  aproximadamente  normal.  c)  Determinar  la  potencia  del  test  considerando  que  la  verdadera 
duración promedio es de 990 días.  
Rta: a) No se dispone de un test paramétrico por falta de conocimiento de la forma de distribución de
las lámparas. b) Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del
5%. Luego, se concluye que la duración de las repuestas de lámparas para proyectores es menor. La
probabilidad de que se tome una decisión incorrecta es del 5%. La decisión lleva a presentar un informe
a la Gerencia de Control de Calidad para que tome las medidas correctivas. 

10)Usted  está  convencido  de  que  su  instrumento  de  medición  tiene  una  variabilidad  medida  por  la  desviación 
estándar  σ=2.  D.  Normal.  Se  considerará  un  erro  r  de  tipo  I  del  10%  para  probar  la  hipótesis.  Un  experimento 
realizado registró las siguientes medidas: 4,1; 5,2 y 10,2. ¿Qué conclusiones extrae usted a partir de la evidencia de 
esta muestra aleatoria? 
Rta: a) Existe evidencia muestral que indica no rechazar la Ho al nivel de significancia del 10%.
Luego, se concluye que el instrumento de medición no registra variabilidad diferente a la de la hip.nula.  

11)En el restaurante Clo‐Clo el 20% de los clientes al mediodía son mujeres. Para incrementar la proporción de 
mujeres se realiza un menú (2*1). Un mes después de realizada la promoción se realiza un estudio observacional 
para  determinar si  la  proporción de  mujeres  aumento.  Usando  un  nivel de  significancia  del  5% ¿qué  concluye? 
Considere una muestra de 400 clientes en las que 100 son mujeres. 
Rta: a) Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego, se
concluye que la publicidad del 2*1 generó un aumento de clientes mujeres, por lo que le resultaría favorable en
los ingresos del restaurante.

12)En una empresa que arma autopartes piensa  el Supervisor que existe demasiada variabilidad en el tiempo de 
vida útil de los que están armadas durante el turno de los fines de semana. Se sabe que el ciclo de armado funciona 
correctamente  y  deberían  durar  dichas  autopartes    45000  horas    con  una  desviación  estándar  de  4000  hs.  Un 
Supervisor encargado de hacer una prueba para determinar si la variabilidad de las autopartes armadas que se hace 
en el turno de los fines de semana supera al de la variabilidad del resto de los días, por ello,  toma una muestra de 
12 autopartes armadas que arrojaron una  desviación  estándar de 4120 hs. Considerando un nivel de significancia 
del 2,5% ¿qué conclusiones extrae? 
Rta: Como el valor empírico resulta menor al valor teórico, se acepta la hipótesis nula a un nivel de significancia
del 2,5% . Por lo tanto, existe evidencia muestral que indica que la variabilidad de los tiempos de vida útil del
armado de auto-partes no supera 4000 hs, con un nivel de significancia del 2,5%. Por ello, no sería cierta la
sospecha del Supervisión acerca del funcionamiento incorrecto del ciclo de armado durante los fines de semana.

101
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

13)Se  desea  conocer  a  un  nivel  de  significación  del  10%  si  el  desvio  estándar  del  peso  de  las  mermeladas  de 
arándanos para la exportación difieren del límite aceptable de 1,7 kg. por lote. Para ello, se toma una muestra de 
25 lotes  la que arroja una desviación estándar de 2,2 kg.   
Rta: Como el valor empírico se encuentra fuera de los valores críticos o teóricos , se rechaza la hipótesis nula
a un nivel de significancia del 10% . Existe evidencia muestral que indica que el desvío de los pesos de las
mermeladas de arándanos difieren del límite acceptable de 1,7 kg. por lote , con un nivel de significancia del
10%. Consecuentemente, se debe advertir a los responsables de la firma para que generen medidas correctivas.

14)El  Departamento  de  Control  de  Calidad  de  una  fábrica  de  cosméticos  afirma  que  el  porcentaje  de  defectos 
supera el límite tolerable del 1%. Por ende, se hace una prueba seleccionando 100 envases de los cuales resultaron 
con  defectos  5  de  ellos  y  se  considera  un  error  del  tipo  I  del  2,5%.  Determine  si  es  cierta  la  afirmación  del 
Departamento de Calidad que lo lleva a realizar esta investigación.  
Rta: Como el valor empírico resulta mayor al teórico , se rechaza la hipótesis nula a un nivel de significancia
del 2,5% . Existe evidencia muestral que indica que la proporción de defectos en los cosméticos supera el límite
tolerable del 1%, con un nivel de significancia del 2,5%. Consecuentemente, se debe advertir a los responsables
de la firma para que generen medidas correctivas.

15)Sushi Club ofrece un servicio a domicilio en donde le garantiza al cliente una puntualidad en el tiempo medio de 
entrega, por lo que le dice que la entrega es inferior a los 10 minutos. Por otro lado, el Servicio de Personal de Sushi 
Club decide dar un premio a fin de año como estímulo a sus empleados, si es cierto que eso sucede. De los 250 
pedidos del día, se tomó una muestra de 20 pedidos calculándose un tiempo medio de 8,5 minutos y un desvio 
estándar de 1,3 minutos. Admitiéndose que los tiempos se distribuyen normalmente, con un nivel de significación 
del 3% concluya su informe comunicando si es cierta la hipótesis nula y que decisión deberá tomar Personal.  
Rta: Como el valor empírico es menor al valor crítico o teórico, no se rechaza la hipótesis nula a un nivel de
significancia del 1%. Existe evidencia muestral que indica que con un nivel de significancia del 1% que la
publicidad que realiza Sushi Club está en lo cierto y por lo tanto Personal podrá dar un premio a fin de año a
sus empleados.
 
16)En  una  publicidad  de  un  lavarropas  se  expresa  que  a  lo  sumo  el  3%  de  los  lavarropas  de  marca  “GENIUS” 
requieren servicio técnico antes del segundo año de uso. Para comprobar dicha publicidad, dada la cantidad de 
reclamos de consumidores a la Organización de Derechos del Consumidor, ésta sospecha  que los lavarropas de 
maca “Genius” que  requieren servicio técnico antes del segundo año de uso son más que el 3% que lo publicitado 
por esa marca. Por ende, la O.D.C.  realizó encuestas a 150 personas que compraron la marca GENIUS de lavarropas 
solicitándoles    informen  si  “solicitaron  servicio  técnico  dentro  de  los  dos  años  de  la  compra  del  producto”. 
Procesadas las encuestas, se detectó que las respuestas afirmativas ha sido  15. ¿Qué conclusiones puede extraer 
con un nivel de significancia del 1,0%? 
Rta: Como el valor empírico es mayor al valor crítico o teórico , se rechaza la hipótesis nula a un nivel de
significancia del 1% . Existe evidencia muestral que indica que con un nivel de significancia del 1% que el
porcentaje de lavarropas que requieren servicio técnico antes de los dos años es mayor a lo que dice la publicidad

17)Una  empresa  controla  la  calidad  de  sus  productos,  porque  la  exportación  de  los  mismos  se  concreta  si  el 
porcentaje de productos en mal estado es menor al 3%. Para despachar un lote y verificar que está en condiciones 
de exportación se toma una muestra de 500 productos de los 4000 productos que conforman el lote de exportación 
y se detectaron 12 productos en mal estado. ¿Cuál es la decisión que toma el encargado de calidad ¿despacha la 
mercadería porque se ha comprobado que el lote está en buenas condiciones de exportación? Considere un error 
de tipo I del 5%. Realice un test contra menor, por lo que se le pide plantee las hipótesis en función al tipo de test 
solicitado. 
Rta: Como el valor empírico es mayor al valor crítico o teórico,no se rechaza la hipótesis nula a un nivel de
significancia del 5% . Existe evidencia muestral que indica que con un nivel de significancia del 5% que la
proporción de artículos en mal estado es mayor al 3%. Por lo tanto en esas condiciones no se podrá exportar.

102
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO DE
CONCEPTOS DE INFERENCIA ESTADÍSTICA CON TEST DE HIPÓTESIS

Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser Falso, modifique
el texto de forma tal que se haga Verdadero.

1. La estadística de prueba es una variable aleatoria cuyo valor se calcula a partir de los datos muestrales y al ser
nuestro valor empírico se usa para tomar la decisión de rechazo o no rechazo de la hipótesis nula. Rta: V_/F_

2. El nivel de significación es la probabilidad de cometer el error tipo II Rta: V_/F_

3. Cuando se plantea la hipótesis y se concluye siempre se lo hace sobre la hipótesis alternativa. Rta: V_/F_

4. La Distribución es una distribución sesgada cuya forma depende exclusivamente de los grados de libertad.
Rta: V_/F_

5. La estadística de prueba sigue una Distrib. “t” con n-1 grados de libertad y se usa para una muestra en donde
los datos son tomados de manera independiente y representan una muestra aleatoria de tamaño chico, de una
distribución poblacional está distribuida normalmente cuyo desvío poblacional se desconoce. Rta: V_/F

6. La Distribución se utiliza en el caso de la inferencia estadística de la media Rta: V_/F_

7. (1-α) se conoce como nivel de significación de un test de hipótesis. Rta: V_/F_

8. El error estándar de la media es la desviación estándar de la muestra seleccionada. Rta: V_/F_

9. Alfa es la medida del área bajo la curva del puntaje estándar que se encuentra en la región de rechazo para la
hipótesis nula. Rta: V_/F_

10. El riesgo de cometer un error tipo I está directamente controlado en una prueba de hipótesis en donde el
investigador establece un nivel para α. Rta: V_/F_

11. Si la estadística de prueba cae en la región crítica, la hipótesis nula ha sido probada verdadera. Rta: V_/F_

12. Cuando la estadística de prueba t y el número de grados de libertad se hacen muy grandes, el valor crítico de t
es muy cercano al de la Z normal estándar. Rta: V_/F_

13. El error estándar de la proporción es . . Rta: V_/F_

14. La distribución muestral de la proporción está distribuida aproximadamente como una distribución t de Student.
Rta: V_/F_
15. En la prueba de hipótesis, suponemos que algún parámetro de población toma un valor particular antes de
muestrear. Esta suposición que se va a probar se denomina hipótesis alternativa. Rta: V_/F_

16. Suponiendo que una hipótesis dada acerca de la media de una población es correcta, el porcentaje de medias
muestrales que pudieran caer fuera de ciertos límites de esta media hipotética se denomina nivel de significancia.
Rta: V_/F_
17. En la prueba de hipótesis, la distribución de probabilidad apropiada es siempre la distribución normal.
Rta: V_/F_

18. Si cometiéramos un error tipo I, rechazaríamos una hipótesis nula cuando realmente es verdadera. Rta: V_/F_
103
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

19. Una prueba en la escala sin procesar o en la escala estandarizada nos lleva a la misma conclusión. Rta: V_/F_

20. Sí 1.96 es el valor crítico de z, entonces el nivel de significancia de la prueba es 0.05. Rta: V_/F_

21. Si nuestras hipótesis nula y alternativa son H0: µ≥80 y H1: µ <80, es apropiado utilizar una prueba de cola
izquierda. Rta: V_/F_

22. Si la media de muestra estandarizada está entre cero y el valor crítico, entonces no se rechaza H0. Rta: V_/F_

23. El valor ( 1 – β ) se conoce como la potencia de la prueba y significa la probabilidad de aceptar la hipótesis nula,
dado que ésta es verdadera. Rta: V_/F_

24. Después de realizar una prueba de una cola y rechazar H0, se da cuenta de que debió haber hecho una prueba
de dos colas, al mismo nivel de significancia. También rechazará H0 para esa prueba. Rta: V_/F_

25. Elegir el nivel de significancia apropiado es más fácil que elegir la prueba correcta que se debe utilizar.

Rta: V_/F_

26. Existen métodos matemáticos que garantizan que el nivel de significancia seleccionado siempre será el adecuado.
Rta: V_/F_

27. La prueba de hipótesis nos ayuda a sacar conclusiones sobre parámetros estimados por la muestra Rta: V_/F_

28. Una prueba de hipótesis será útil para determinar si una media de población es 45 o 60 (es decir, H0: µ=45; H1:
µ=60). Rta: V_/F_

29. Es apropiado utilizar la potencia de una prueba de hipótesis sólo con pruebas de una cola. Rta: V_/F_

30. La hipótesis nula siempre tiene el signo igual porque se trata de la afirmación a probar y cuando se realizan los
cálculos se requiere de un valor específico. Rta: V_/F

31. Un test paramétrico debe realizarse con datos cuyos niveles de medición sean por intervalos o bien de razón.
Rta: V_/F

32. El supuesto para un test de hipótesis en el caso de una muestra chica es que las observaciones que componen la
muestra sean independientes entre sí y que esa muestra tomada provenga de una población normal o
aproximadamente normal. Rta: V_/F

Marque la opción que considera correcta en cada enunciado

1. Un fabricante de automóviles importante ha tenido que retirar varios modelos de su línea 1993 debido a problemas
de control de calidad que no fueron descubiertos con los procedimientos finales de inspección aleatoria. Éste es un
ejemplo de:
a) Error tipo I.
b) Error tipo II.
c) Error tipo I y error tipo II.
d) Ningún tipo de error.

104
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

2. Si n = 24 y α = 0, 05, entonces el valor crítico de t para probar las hipótesis H0: µ≥ 38 y H1: µ < 38 es:
a) 2.069
b) 1.714.
c) -1.714.
d) 22.069.

3. Suponga que deseamos probar si la media es significativamente mayor o menor que 10.
Tomamos una muestra aleatoria que revela un valor de ̅ = 8. ¿Cuál debe ser nuestra hipótesis alternativa?
a) µ < 10.
b) µ≠ 10.
c) µ > 10.
d) No puede determinarse de la información dada.

5. Suponga que se realiza una prueba de hipótesis para un proceso en el que un error de tipo I puede ser muy
costoso, pero un error tipo II puede resultar relativamente barato y sin importancia. ¿Cuál de los siguientes sería la
mejor elección para α en esta prueba?
a) 0.01.
b) 0.10.
c) 0.25.
d) 0.50.
e) Ninguno de los anteriores.

6. Cuando usamos la proporción de la muestra para probar las hipótesis enunciada H0: p = 0,30 y H1: p ≠ 0,30, el
error estándar es:
.
a)
.
b)
.
c)

d)
e) e) Ninguno de los anteriores.

7. Para una prueba de hipótesis de dos colas, con α = 0,10, la región de aceptación es toda la región:
a) A la derecha del valor crítico negativo.
b) Entre los dos valores críticos.
c) Fuera de los dos valores críticos.
d) A la izquierda del valor crítico positivo.

8. La distribución normal es la distribución apropiada para usar al probar hipótesis respecto a:


a) Una proporción, cuando n.p > 5 y nq > 5.
b) Una media, cuando s es conocida y la población es normal.
c) Una media, cuando s es desconocida, pero n es grande.
d) Todos los anteriores.

9. Cuando se acepta una hipótesis nula, es posible que:


a) Se haya tomado una decisión correcta.
b) Se haya cometido un error tipo I.
c) Haya ocurrido tanto a) como b).
d) No haya ocurrido a) ni b).
e) Ninguno de los anteriores.

105
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

10. Cuando la hipótesis nula es H0: µ = 67, la hipótesis alternativa puede ser:
a) H1: µ ≥ 67.
b) H1: µ < 67.
c) H1: µ ≠ 67
d) H1: µ ≠ 40.
e) Ninguno de los anteriores.

11. Con un nivel de significancia más bajo, la probabilidad de rechazar una hipótesis nula que de hecho es cierta:
a) Disminuye.
b) Permanece igual.
c) Se incrementa.
d) Todos los anteriores.

Complete los espacios en blanco de forma tal que de sentido a la oración.


1) Los valores observados x y los valores críticos z no se pueden comparar de manera directa porque están dados
en dos _____________diferentes.

2)Con el fin de usar la distribución t para probar hipótesis acerca de la media de una población, utilizando una
muestra chica debe suponerse que la población tiene una distribución______________ y que su desviación
estándar es ______________.

3) Para estar seguros de que la prueba de hipótesis trabaja correctamente, es mejor que el valor de (1-β) esté
tan cerca de ______________como sea posible.

4) La potencia de una prueba se refiere a la habilidad de la prueba para ______________la hipótesis


______________ cuando en realidad es ______________.

5) Una suposición acerca del valor de un parámetro es una ______________.

6) Aceptar una hipótesis nula cuando es falsa constituye un error tipo ______________ y su probabilidad se
identifica con ______________.

7) La suposición acerca de un parámetro que deseamos probar es la hipótesis ______________

8) Una prueba de hipótesis que involucra dos regiones de rechazo se conoce como una prueba de dos
______________.

9) Si la hipótesis nula es µ ≤ 10 y la hipótesis alternativa es µ > 10, la prueba apropiada para este caso sería una
prueba ______________.

LA ÉTICA EN LA ESTADÍSTICA 

Un investigador tiene que considerar en su labor:


 El planteo correcto de la hipótesis traduciendo el objetivo de la encuesta, del experimento o del estudio que está por realizar.
 La aleatorización de los datos provenientes de una muestra seleccionada al azar ( es decir evitando que los participantes potenciales se
autoseleccionen para el estudio, o que el investigador los seleccione a propósito). Caso contrario, genera problemas de cobertura o sesgos de
selección

106
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

 Consentimiento informado de los participantes humanos en “tratamiento”, lo que significa que debe ser advertidos del proyecto de investigación
y de todos los efectos colaterales. El sujeto participante debe proporcionar el consentimiento.
 Tipo de prueba: unilateral y en qué sentido o bilateral, en función a lo que se trata investigar. Nunca deben modificarse la dirección de la prueba
después de recolectados los datos.
 Selección del nivel de significancia antes de emprender la recopilación de los datos, reportando también el p-value.
 No entrometerse en los datos, para modificar conclusiones y seleccionar luego el nivel de significancia, o el tipo de prueba., como tampoco
modificar, o eliminar los datos inusuales o atípicos.
 Reportar los resultados de la investigación, tantos los que son buenos como los malos.
 
En resumen hemos visto TEST DE HIPOTESIS PARA un solo parámetro 
 
  Tipo de datos
Tipo de análisis 
Cuantitativos Categóricos

Prueba de   Prueba Z de hipótesis para la media   Prueba  Z  de  hipótesis  para  la 


hipótesis   Prueba t de hipótesis para la media  proporción 
relativa   Prueba χ  de hipótesis para la 
a un solo  varianza 
parámetro   Prueba χ  de hipótesis para el desvío 
 

Recomendación: Como en esta guía hemos visto prueba de hipótesis para una sola muestra. Se recomienda a partir de la
bibliografía del Programa trabajar con dos muestras para Probar hipótesis de diferencias de medias, de varianzas, de
proporciones.

107
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

VII – LOS NÚMEROS INDICE DE PRECIOS Y CANTIDADES – UNIDAD TEMÁTICA Nro. 9


del Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para la construcción, el análisis y la utilización de
números índices de precios y cantidades

¿QUÉ ES UN NÚMERO INDICE?

 Es un número que expresa la variación relativa del precio, la cantidad o el valor, en comparación con un
período base (Lind,)
 Es un indicador que sirve para comparar, para poner se relieva cambios en una variable –indice simple- o
cambios en un grupo de variables relacionadas con respecto al tiempo.

PROPIEDADES
 IDENTIDAD  Si coinciden el Índice del periodo base I(o) y el de comparación I(p); es decir
Igual a 100 cuando el índice está expresado en porcentajes. En consecuencia 1.
Ej. Si el Índice de precios a una fecha 2014 de un determinado producto es 123,40
,
La identidad se comprueba porque: I2014/2014= 1
,

 INVERSIÓN Si en un Índice se invierten el períodos base y el de comparación, el índice


toma el valor recíproco al anterior. Ej. Si el I(p)2013 = 112,5 y el I(p)2014 = 114,75
,
Entonces: I2014/2013= 1,02
,
.
Invertimos el índice y tenemos I2013/2014= 0,980392156 .
,
Comprobamos que el índice 0,980382156 es reciproco de 1,02
La condición de reversibilidad en el tiempo expresa que un índice correspondiente
al periodo “t”con base 0, debe ser la inversa del indice para el periodo 0 con base “t”

 CIRCULAR Dado un índice de precios I(p)2013 = 110 y el I(p)2015 = 118,97 cumple la

propiedad cíclica. Si Incorporamos un período –en este caso: año- intermedio, 2014
I(p)2014 =115,5
, ,
Es decir: I2015/2013= ∗ ∗ 1,08155
, ,

EXISTENCIA El índice debe tomar valores reales y finitos para


cualquier valor de la variable observada

 PROPORCIONALIDAD Si se aumenta la magnitud correspond. al año base o corriente del índice en


una proporción “p” el propio número índice aumentará en igual proporc.
 INALTERABILIDAD
 HOMOGENEIDAD Si el índice no se encuentra afectado por cambios en la/s unidad/es de la
Variable o de la Medida de las magnitudes que en él intervienen.
Ej. Los datos para la construcción del índice en pesos se convierten a dólares.Ej. Los
datos para la construcción del índice de cantidad en kilogramos son convertidos a
gramos.

108
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

TIPOS DE NÚMERO INDICE


 INDICE SIMPLE
 INDICE NO PONDERADO
o INDICE RELATIVO SIMPLE
o INDICE PROMEDIO ARITMÉTICO DE RELATIVOS SIMPLES
o ÍNDICE PROMEDIO GEOMÉTRICO DE RELATIVOS SIMPLES
o ÍNDICE MEDIANA DE RELATIVOS SIMPLES
o ÍNDICE AGREGATIVO SIMPLE
 INDICE PONDERADOS
o INDICE DE PRECIOS DE LASPEYRES
o INDICE DE PRECIOS DE PAASCHE
o INDICE DE FISHER
o OTROS

EJERCICIOS DE APLICACIÓN de NÚMEROS INDICES

A- INDICES SIN PONDERAR


1) Dados los siguientes precios o bien cantidades que cada empresa tiene en distintas unidades de
comercialización para el cierre de ejercicio económico del período anterior y del actual. (Kurincic)
Año Unidad de Unidad de Unidad de Unidad de Unidad de
Comercializ N° Comercializ Comercializ Comercializ Comercializ
N° N° N° N°
0 1200 1300 1150 1800 920
1 1350 1100 1050 1650 1050
Determine los sig. Índices de precios o cantidades (según se refiera) para el año 1 con base en el año 0.
a) Indice de precios relativos simples b) Índice promedio aritmético de relativos simples
c) Índice promedio geométrico de relativos simples d) Índice Mediana de relativos simples
d) Índice agregativo simple 

2) Dados los siguientes valores -


Item Año 2008 Año 2009 Hallar:
p p a) IP promedio aritmetico de relativos
A 10 12 b) IP promedio geométrico de relativos
B 9 8 c) IP agregativo aritmético simple
C 15 17 d) IP mediana de relativos
D 300 350
E 4 3
F 80 90

Ítem Año 2008 Año 2009


Q q
I 1200 1350 Hallar:
II 1300 1100 a) IQ promedio aritmetico de relativos
III 1150 1050 b) IQ promedio geométrico de relativos
IV 1800 1650 c) IQ agregativo aritmético simple
V 920 1050 d) IQ mediana de relativos

109
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

3) Considerando los valores siguientes Calcule


B C D E F
Item Año Año Año Año INDICES DE PRECIOS Y DE CANT.SIN POND.
2008 2008 2009 2009 a) I promedio aritmético de relativos
p q p q b) I promedio geométrico de relativos
Carne 50 10 55 10 c) I agregativo aritmético simple
Verdura 30 12 32 15 d) I mediana de relativos
Fruta 45 8 50 5 INDICES PRECIOS PONDERADOS
Dulces 38 7 35 10 a) I.P. Laspeyres
b) IP Pasche
c) IP Fisher
d) IP Edgeworth-MaRSCHALL
e)IP Drovisch – Bowley

110
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

A B C D E INDICES SIN PONDERAR G H I J K L


2 Item Año 2008 Año 2009 Hallar:
p p a) IP promedio aritmetico de relativos 104,400
3 =(+E4/C4+E5/C5+E6/C6+E7/C7+E8/C8+E9/C9)/6*100
4 A 10 12 b) IP promedio geométrico de relativos 102,942 =(+E4/C4*E5/C5*E6/C6*E7/C7*E8/C8*E9/C9)^(1/6)*100
5 B 9 8 c) IP agregativo aritmético simple 114,833 =(SUMA(E4:E9)/SUMA(C4:C9))*100
6 C 15 17 d) IP mediana de relativos 112,917 1°) Determinamos los relativ2°) Ordenamos
7 D 300 350 Item I 1,2 V 0,75
8 E 4 3 II 0,88888889 II 0,88888889
9 F 80 90 III 1,13333333 VI 1,125
10 IV 1,16666667 III 1,13333333
11 V 0,75 IV 1,16666667
12 Item Año 2008 Año 2009 VI 1,125 Item I 1,2
13 q q Indice de la Mediana 112,916667
14 I 1200 1350 Hallar: Posición en (n+1)/2
15 II 1300 1100 a) IQ promedio aritmetico de relativos 98,843 =(+E14/C14+E15/C15+E16/C16+E17/C17+E18/C18)/5*100
16 III 1150 1050 b) IQ promedio geométrico de relativos 98,116 =(+E14/C14*E15/C15*E16/C16*E17/C17*E18/C18)^(1/5)*100
17 IV 1800 1650 c) IQ agregativo aritmético simple 97,331 =(SUMA(E14:E18)/SUMA(C14:C18))*100
18 V 920 1050 d) IQ mediana de relativos 91,670 1°) Determinamos los relativos
19 Item I 1,125
20 II 0,84615385
21 III 0,91304348
22 IV 0,91666667
23 V 1,14130435
24 2° Ordenamos
25 II 0,84615385
26 III 0,91304348
27 IV 0,91666667 Mediana
28 Item I 1,125
29 V 1,14130435
30 3°) Indice mediana
31 91,6666667

111
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro

A B C D E F INDICES PRECIOS SIN PONDERAR G H I J K L


2 Item Año 2008 Año 2009 Año 2009 a) IP promedio aritmetico de relativos 104,97 =+($E$4/$C$4+$E$5/$C$5+$E$6/$C$6+$E$7/$C$7)/4*100
3 p q p q b) IP promedio geométrico de relativos 104,68 =(+$E$4/$C$4*$E$5/$C$5*$E$6/$C$6*$E$7/$C$7)^(1/4)*100
4 Carne 50 10 55 10 c) IP agregativo aritmético simple 105,52 =(SUMA(E4:E7)/SUMA(C4:C7))*100
5 Verdura 30 12 32 15 d) IP mediana de relativos 108,33 1°) Determinamos los relativo2°) Ordenamos
6 Fruta 45 8 50 5 Carne 1,1 Dulces 0,92105263
7 Dulces 38 7 35 10 Verdura 1,06666667 Verdura 1,06666667
8 Fruta 1,11111111 Carne 1,1
9 Determine: Dulces 0,92105263 Fruta 1,11111111
10 a) IP relativ simples tanto de precios Indice de la Mediana 108,33 =(+l7+l8)/2*100
11 b) IP promedio geométrico de relativos como INDICES CANTIDADES SIN PONDERAR G H I J K L
12 c) IP agregativo aritmético simple de a) IQpromedio aritmetico de relativos 107,59 =+($F$4/$D$4+$F$5/$D$5+$F$6/$D$6+$F$7/$D$7)/4*100
13 d) IP mediana de relativos cantidad b) IQ promedio geométrico de relativos 102,78 =(+$F$4/$D$4*$F$5/$D$5*$F$6/$D$6*$F$7/$D$7)^(1/4)*100
14 c) IQ agregativo aritmético simple 108,11 =+(SUMA(F4:F7)/SUMA(D4:D7))*100
15 e) IP Laspayres d) IQ mediana de relativos 112,50 1°) Determinamos los relativo2°) Ordenamos
16 f) IP Pasche Carne 1 Fruta 0,625
17 105,538342 Verdura 1,25 Verdura 1
18 Fruta 0,625 Carne 1,25
19 Cálculos auxiliares Dulces 1,42857143 Dulces 1,42857143
20 Ʃpo . Qo = 1486,000 Indice de la Mediana 112,50 =(+l7+l8)/2*100
21 INDICES PRECIOS PONDERADOS
22 Ʃpt . Qo = 1579 a) I.P. Laspeyres 106,26
23 b) IP Pasche 104,82
24 Ʃpt . Qt = 1630 c) IP Fisher 105,54
25 d) IP Edgeworth-MaRSCHALL
26 Ʃpo . Qt = 1555 e) IP Drovisch - Bowley
27

112
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

B- INDICES PONDERADOS Fuente Prof. Kurincic – Garnica Hervás.

Los resultados son: 1) a. 103,39 b= 102,15 2) Base junio 1995. Mayo: 100,06; junio: 100;
JULIO 99,46 Y AGOSTO 99,37 - B) BASE AGOSTO 1995. Mayo: 100,68, julio: 100,62, julio
100,08 y agosto: 100. c) La reversión cronológica es una prueba en donde el índice del periodo t con base
0 multiplicado el índice del periodo 0 con base t debe dar 1. Por ej. Índice de agosto (base junio) da 99,37

113
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

y el índice de junio (base agosto) da 100,62. El producto de ambos es 1. 3) Ind. Passche: 103,98 - Ind.
Laspeyres 103,69 - Cantidad Laspayeres 108,51 y Cantidad Fisher 108,8’0

C – INDICE DE VALOR
En función a los datos del ejercicio 3 del punto C. Calcule los Indices de Valor Base 2008-
D - EMPALME DE INDICES
4) Dado los siguientes indices efectuar el empalme de las series, llevando los índices a
la base 1990=100
Años Indice Base Nuevo Indice
1982=100 Base 1990=100
1986 100
1987 104
1988 106
1989 110
1990 115 100
1991 102

5) Llevar los diferentes indices a la base 2005=100

Años Indice Base Indice Base Indice Base Indice Base


1997 2000 2002 2005
1997 100
19i98 110
1999 98
2000 96 100
2001 104
2002 103 100
2003 110
2004 115
2005 118 100
2006 112
2007 108

TRABAJO SOBRE NUMEROS INDICES


CONSIGNA:
1. Qué es un número índice 
2. Construya en un cuadro comparativo de  los diferentes tipos de índices 
3. Defina que es el I.N.D.E.C. y de que se ocupa  
4. ¿Qué elementos intervienen en la construcción del I.P.C.?  
5. ¿Es lo mismo el I.P.C. y el Índice de Costo de Vida? Justifique 
6. ¿Cuáles son los usos que se le puede dar al I.P.C? 
7. ¿Cuál es la metodología que aplica actualmente el I.N.D.E.C.  para la determinación del 
I.P.C.?  Consultar en  Sitios disponibles para su consulta 
http://www.indec.gov.ar/ftp/cuadros/economia/ipc_que_es_06_16.pdf 
http://www.indec.mecon.ar/ftp/cuadros/economia/ipc_metodologia_17_07_16.pdf 
http://www.indec.mecon.ar/ftp/cuadros/economia/ipc_metodologia_abril2016.pdf 

114
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO DE
CONCEPTOS TEÓRICOS DE NÚMEROS ÍNDICES

Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos
corregir para transformarlo en verdadero

1. El número índice para un año base siempre es cero. V:__F:__

2. El método de promedio de relativos suma porcentajes, no cantidades. V:__F:__

3. Un índice de valores mide los efectos combinados de los cambios en precios y cantidades.
V:__F:__

4. Siempre se encuentra un número índice al obtener el cociente entre un valor actual y un valor
base y multiplicar por 100. V:__F:__

4. La selección de una base no apropiada no distorsiona los números índice. V:__F:__


5. Los números índice son inherentemente confusos y, en consecuencia, se utilizan muy poco
en el mundo real. V:__F:__

7.No ponderado se refiere a que todos los valores que son utilizados para calcular el índice
tienen igual importancia. V:__F:__
8. La desventaja del índice de Laspeyres es que no considera los cambios que se producen en los
patrones de consumo V:__F:__
9. El índice de Fisher es la media aritmética de los índices de Laspeyres y de Paasche.
V:__F:__
Seleccione la opción que considera Verdadera

1. Las mercancías sujetas a variaciones considerables de precio se pueden medir mejor mediante:
a) El índice de precios. b) El índice de cantidad. c) El índice de valor d) Ninguno de los anteriores.
RTA: _____

2. Los pesos utilizados en un índice de cantidad son: a) Porcentajes de la cantidad total. b) Precios.
c) Un promedio de cantidades. d) Ninguno de los anteriores. RTA : ______

Integre los espacios en blanco

1. Si todos los valores considerados al calcular un índice tienen igual importancia, el índice es
_____________________
2. El método de índice ponderado en el cual las cantidades consumidas durante el periodo base
se usan como pesos es el método _____________________.
3. El método que utiliza las cantidades consumidas en el periodo actual en cuestión cuando se
calcula un índice ponderado es el de _____________________.
4. Los tres tipos principales de índices son el índice_____________________ , el índice
_____________________y el índice_____________________.

115
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

VIII – LA CORRELACIÓN Y LOS MODELOS DE REGRESIÓN LINEAL–


UNIDAD TEMÀTICA Nro.10 del Programa Nº 3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos para analizar el grado de relación entre
variables observables y. explicar el comportamiento de una variable a partir de dicha relación con otras
variables de su entorno económico.

“Los modelos son medios


y no objetos de fe”
Henri Theil

En la primera parte del curso en Estadística Descriptiva hemos trabajado con datos bivariados
incorporando los conceptos de COVARIANZA primero y CORRELACIÓN después, dado que la
esta primera medida no permitía comparar diferentes covarianzas.

El Análisis de Correlación aporta mayor información que la Covarianza pues permite medir la
intensidad de la asociación entre variables numéricas, pues arroja un valor numérico que sirve
para interpretar la fuerza de esa asociación lineal entre dos variables.
Entonces:

COEFICIENTE DE CORRELACIÓN
Es el grado de interconexión entre variables que intenta determinar con qué precisión describe o
explica la relación entre variables la ecuación lineal o de cualquier otro tipo.

Ej. de correlación: las variables tales como peso y altura.


Correlación Simple y Regresión Simple: cuando están en juego dos variables.
Correlación Múltiple y Regresión Múltiple: están en juego más de dos variables.

CORRELACIÓN LINEAL
Si X e Y son las dos variables para analizar, un “DIAGRAMA DE DISPERSIÓN” muestra la
localización de los puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersión parecen estar en una recta, la correlación se llama lineal. Cuando más
cercanos estén en la recta será el valor de la correlación más cercano a 1 (en el caso de correlación
lineal positiva) o bien más cercano a -1 (en el caso de correlación lineal negativa).

Como segunda parte, apoyados ya en los conocimientos anteriores, se tratará el Análisis de


Regresión  utilizado fundamentalmente con fines de predicción -estimación- siendo el objetivo
el desarrollo de un modelo estadístico que pueda ser utilizado para predecir los valores de la
variable dependiente o variable respuesta basándonos en al menos una variable independiente o
explicativa que se utiliza como la variable de predicción potencial.

Gráficos que permiten visualizar el tipo de correlación lineal entre dos variables

Correlación lineal positiva Correlación lineal negativa Sin Correlación

Relación directa Relación inversa Sin Relación


La variable dependiente aumenta La variable dependiente disminuye No hay
conforme conforme relación entre
aumenta la variable independiente. aumenta la variable independiente. las variables

116
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

DIFERENCIAS ENTRE CORRELACIÓN Y REGRESIÓN


(Fuente: Kurincic; G. – Bibliografía)

CORRELACIÓN REGRESIÓN
Objetivo Medir la fuerza de relación lineal Predecir o estimar el valor poblacional
entre dos variables medio de una variable dependiente en
términos de valores conocidos (muestrales)
de la variable explicativa.

El análisis correlacional permite El análisis regresional permite conocer


conocer acerca de : acerca de :
 La existencia de la  La naturaleza y la forma de la
asociación asociación a través de la función
 La dirección de la matemática y la forma que
asociación represente con mejor exactitud la
 El grado de la asociación relación.

Variable Es estocástica y tiene asociada una


Dependiente Ambas son variables aleatorias o distribución
también denominadas variables
Variable estocásticas Toma valores fijos
Independiente (son no estocásticas)

Especificación Por ser de naturaleza simétrica, se No es de naturaleza simétrica. Exige definir


de X – Y pueden representar indistintamente cuál variable es X – explicativa- y cuál es Y –
ambas variables en cualquiera de explicada-
los dos ejes.
Medida de asociación lineal Puede estimarse una regresión no lineal.
Con un rango de variación [-1;1] .
Signo del Su signo que refleja la asociación Positiva o Negativa) DEBE ser el mismo de la
Coeficiente de pendiente de la función de regresión y también al signo de la covarianza.
correlación
CAUSA El término relación causal es cuando la variable independiente –X-“causa” cambios
– EFECTO en la variable dependiente-Y-
Se debe tener cuidado, en ello, pues no se da en la mayoría de los casos.
La causalidad la explica otras disciplinas.
La medición que se realiza en estadística permite brindar solamente una relación
estadística.
En Estadística se encuentra relaciones de asociación, pero no necesariamente de
causa y efecto.
A menos que existan razones suficientes para creer que los valores de la variable
dependiente se originan por valores de las variables independientes, no debemos
inferir causalidad en las relaciones que encontremos por la regresión. :
Expresa Gujarati, citando a Kendal :”Una relación estadística, sin importar que tan
fuerte y sugestiva sea, NUNCA podrá establecer conexión causal: nuestras ideas de
causalidad deben venir de estadísticas externas y en último término de una teoría”

Se debe tener en cuenta que dos variables pueden variar conjuntamente o covariar, en el mismo sentido
cuando al aumentar los valores de una aumentan los valores de la otra; o bien variar conjuntamente o
covariar en sentido contrario, si al aumentar los variables de una, disminuyen los de la otra.
Observar la relación entre dos variables en un diagrama de dispersión, se podrá diferenciar si se trata de
una dependencia funcional cuando Y = f(X) en forma perfecta, si se trata de una dependencia estocástica,
cuando Y = bo + b1 . X + e; o por el contrario ambas variables X e Y son independientes, en lugar de
dependientes.

117
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

REGRESIÒN LINEAL SIMPLE - RLS o MODELO DE REGRESIÓN LINEAL SIMPLE -MRLS-

La medición de la incertidumbre asociada a un determinado fenómeno que resulta de interés investigarlo


constituye un problema a resolver. A partir del planteo del problema, deberán especificarse las variables a
medir identificándose la variable independiente de la dependiente.

Ésta última –Y - constituye la variable a medir denominada variable explicada o variable respuesta, entre
sus diferentes acepciones-
La primer variable X que puede influenciar en la variabilidad de la respuesta es la variable explicativa, o
la variable de predicción potencial, entre una de sus distintas denominaciones.

El conjunto de datos que surge de la medición de las variables permitirá examinar la asociación cuantitativa
entre las mismas con la finalidad de obtener una fórmula matemática empírica de predicción que mejor
ajuste el conjunto de datos observados a ese modelo teórico que se construye.

Se logrará establecer la relación de asociación entre las variables, sin que eso signifique una relación causa-
efecto, no pudiendo establecer que esa variable X es causa y la variable Y es el efecto que produce X. Como
ejemplo de ello, la relación entre la mortalidad humana y el consumo de carbón en el siglo XX, no son una
relación causa-efecto; dado que tanto el consumo de carbón como las muertes se producían en el invierno
duro, no siendo el carbón la causa de las muertes.

El principio de parsimonia científica lleva al investigador a utilizar modelos sencillos considerando para
este curso el M.R.L.S. –siglas que significa Modelo de Regresión Lineal Simple.

CONDICION: Se podrá hacer el análisis de la regresión lineal simple siempre y cuando dicha
relación representada en un diagrama permita que pueda ser expresada mediante una recta.

El nombre de Regresión se le debe a un antropólogo y meteorólogo inglés que lo adjudicó en su estudio


realizado en la rama de la biología, inspirado en los resultados de Darwin, revelando que la altura de los
individuos a pesar de que pueden ser extremas, es decir muy altos o bien muy bajos, regresan hacia la
altura media normal de la población.

Conceptos de comprensión en el Análisis de la Regresión

La REGRESIÓN
Técnica que permite establecer relaciones funcionales entre variables de tipo cuantitativas.

1) ¿Qué es el análisis de regresión?


- Estimación o predicción de una variable (variable dependiente) de una o más variables
relacionadas (variables independientes)
- Proceso general de predecir una variable que constituye la variable respuesta a partir de otra, que
será la variable de predicción potencial.

2) En el análisis de regresión ¿Qué es una ecuación de estimación o de predicción?


Es una fórmula matemática que relaciona las variables conocidas con las variables desconocidas.
Es una fórmula matemática que describe la relación entre la variable dependiente y una o más variables
independientes.
El propósito de este tema tal como dice Canavos, es obtener una ecuación empírica de predicción
razonablemente precisa y que proporcione un modelo teórico que no está disponible

Después de conocer el patrón de esta relación, podremos aplicar el “análisis de correlación” para
determinar el grado en que las variables se relacionan. Entonces, el análisis de correlación indicará que
tan bien la ecuación de estimación describe realmente la relación.

118
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

3) Terminología y ejemplos de análisis de regresión

Variable Variable dependiente Variable independiente


Símbolo Y X1 X2 ...Xk
Definición Es la variable cuantitativa cuyo Es la variable relacionada con la
comportamiento se desea explicar a variable dependiente que se utilizará
partir del comportamiento de: para explicar su comportamiento.
- otras variables, si es REGRESIÓN El modelo puede tener varias
LINEAL MÚLTIPLE -RLM variables independientes en el caso
-una variable, si es REGRESION de RLM.
LINEAL SIMPLE –RLS- Esta última
objeto de estudio para nuestro curso
Otras Explicada Explicativa
denominaciones Regresada Regresor
Respuesta Estímulo/Control
Endógena Exógena
Predicha Predictora
De Predicción potencial
Ejemplos Y=Consumo X1 Ingreso de los agentes de la
economía
Y=Costo total X1: Unidades producidas
Y= Ingresos por Ventas X= Gastos por publicidad
Y= Comportamiento del Mercado de X= Índices claves en el Mercado de
Acciones acciones

4) PASOS para determinar si existe una relación entre dos variables

El objetivo es ajustar un modelo matemático (veremos que se trabajará con el modelo lineal simple) a un
conjunto de datos, para realizar un análisis de regresión, es decir que con el modelo matemático obtener
la estimación y predicción.

Qué diferencia hay entre el análisis de regresión simple y múltiple?


En el proceso que determina la relación entre una variable dependiente y una variable independiente
conlleva al análisis de regresión simple y en el caso de ser dos o más variables independientes conlleva a
la regresión múltiple.

1. Recolección de datos 

Resultan los datos apareados de un conjunto de “n” observaciones que muestran los valores
correspondientes de las variables cuantitativas X e Y.

2. Gráfica de datos: Diagrama de Dispersión

También denominado Diagrama de puntos. Se trata de una representación gráfica en un sistema de


coordenadas rectangulares del conjunto de puntos resultantes que son pares ordenados de los valores de
las variables. Esta gráfica se llama “diagrama de dispersión”

Cada pareja de datos se representa en el gráfico con un solo punto y visualizando los puntos se puede
Trazar una curva aproximante, o sea una curva suave que aproxima los datos.

¿Qué es entonces un Diagrama de puntos o diagrama de dispersión?


Es la representación gráfica de los pares ordenados de los valores de las variables que intervienen en el
análisis de regresión, representando los valores de X como Variable explicativa o predictoria sobre el eje X
y los valores correspondientes a la variable explicada sobre el eje Y como variable respuesta.

119
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

ESTADISTICA EN EXCEL

Para el análisis del tema “Regresión” verifique que en el Excel esté habilitada la función “Análisis de datos”
dentro de la solapa “Datos” Si no lo estuviese,deberá habilitarla mediante los siguientes pasos:
1° Abrir el Programa Excel
2° Hacer click en “Archivo”
3° Hacer click en “Opciones”
4° Hacer Click en “Complementos”
5° Hacer Click en “Ir” que está al lado de “Administrar: Complementos de Excel”
6° Tildar “Herramientas para análisis” y “Aceptar

Suponga que Ud. ha ingresado los siguientes datos observados en total 10 datos apareados en ese orden,
primero el de la variable explicativa y luego la variable respuesta. Para visualizar si hay algún tipo de
relación lineal entre las variables se procederá a representar los datos a través del diagrama de dispersión
En Excel:
1°) Sombrear los datos de X e Y
2°) En la solapa “Insertar” seleccionar Gráfico “Diagrama de Dispersión”
Permitirá ver si los puntos representados en el gráfico presentan una relación lineal para poder trazar una
recta que mejor los represente.
En conclusión queda:
Usando excel
1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
las celdas que contienen los datos marcadas.

2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear

300

250

200

150 Series1

100

50

0
0 10 20 30 40 50 60

3°) Se pueden ir completando los datos en las abscisa y ordenada


haciendo click con el botón derecho dentro del gráfico.
Cada par de datos es un punto.

3.Tipo de Regresión

Una vez representado el diagrama de dispersión, posicionándose con el puntero o mousse en cualquiera
de los puntos haciendo click se ingresa a un menú en el que se debe clickear “Agregar línea de tendencia”
Las distintas curvas que pueden formarse son la que vemos en el gráfico del Excel que se acompaña en este
punto.

120
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Observamos que las opciones de línea de tendencia que devuelve el Excel responden a:
- Modelos Lineales en los parámetros βo, β1, β2 ,…, βn

El Modelo es lineal en los parámetros, porque ningún parámetro en el modelo aparece como
exponente o multiplicado o dividido entre otro parámetro.
o Lineal Simple: Y = βo + β1. X + e
o Lineal Logarítmico: Y = βo + β1 .ln ( X) + e
o Lineal Parabólico: Y = βo + β1 .X + β2 .X2 +e
(Curva cuadrática o Parábola, denominada en Excel
Polinómica de orden 2). Los otros polinomios de otro orden,
serán:
o Curva cubica: Y = βo + β1 .X + β2 .X2 + β3 .X3 +e
o Curva cuartica: Y=βo + β1 .X + β2 .X2 + β3 .X3 + β4 .X4 +e
o Curva de grado “n”: Y = βo + β1 .X + … + βn .Xn +e

Hay otras, no en Excel, tal como Hipérbola:

- Modelos no Lineales en los parámetros βo , β1 , β2 ,…


o Exponencial: Y= βo. e β1.X + e
o Potencial o Curva Geométrica: Y= βo. X β1 + e

Qué diferencia hay entre relaciones lineales y curvilíneas?


*Relaciones lineales: la variable dependiente cambia una cantidad constante por cada incremento igual en
la variable independiente.

*Relaciones curvilíneas: la variable dependiente no cambia con una tasa constante con incremento igual en
la variable independiente.

Graficamente las primeras dos representaciones y la última que se ven en las seis figuras responden a
una relación lineal simple, que son las que se estudiará en esta unidad.

Mediante esta exploración visual se


buscan patrones que indican que las
variables están relacionados y por ende,
el tipo de línea o ecuación de estimación
que describa dicha relación.
El problema que consiste en encontrar
curvas aproximantes que se ajusten al
conjunto de datos se llama “ajuste de
curvas”.

4. Ajuste de curvas en el M.R.L.S. 

Cuando a prima facie se realiza, recurriendo a la intuición personal, un dibujo de una curva que ajuste el
conjunto de datos se denomina “Método de ajuste de curvas a mano”. Este método es el movimiento de
una regla sobre el conjunto de puntos hasta que parezca que pase por la mitad entre los puntos. Ésta sería
el mejor ajuste.

121
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

El ajustar una línea matemáticamente si ninguno de los puntos caen sobre ella, significa trazarla de forma
tal, que podamos minimizar el error entre los puntos estimados en la línea y los observados. Es sensato
pensar que actualmente hay un método mejor que el manual a través de un trazado a mano alzada. Si el
tipo de ecuación que describe la curva es conocido, ejemplo una recta, sólo se necesitan dos puntos, si es
una parábola son precisos tres puntos.

Desventaja: que distintos observadores podrán obtener curvas y ecuaciones distintas.


Para evitar este juicio individual en la construcción de una recta se buscará una mejor recta de ajuste y será
aquella en que la sumatoria de los errores cuadráticos sea mínima y por ello se hallará la recta de mínimos
cuadrados.

Si el objetivo es estimar los parámetros del modelo lineal, tenemos entonces que dado los datos observados
“apareados” para estimar los parámetros de la ecuación elegida, una técnica es el M.M.C. -Método de
Mínimos Cuadrados- a través de la minimización de la suma de los cuadrados de las diferencias entre los
valores observados de la variable respuesta y los valores de la ecuación de predicción que en nuestro caso
será la ecuación lineal.

Supuestos del método de MCL -Método de Mínimo Cuadrado Lineales:


- Se ha seleccionado la forma correcta de la ecuación de regresión, por lo que cualquier variabilidad
en la variable respuesta “Y” que no puede explicarse mediante la ecuación de regresión es un “error
aleatorio”
- Los datos apareados constituyen una muestra representativa que permite su generalización
- Los valores observados de la variable respuesta “Y” no están estadísticamente correlacionados. Por
lo tanto, tampoco están correlacionados los errores aleatorios.
- Para toda i= 1,2,…,n , E(ei) = 0 y la VAR(ei) = σ2
- El modelo es lineal en los parámetros θ = βo -intercepto- y las pendientes: β1, β2 ,…, βn en el caso
de varias variables explicativas.

Recolectados los datos en el caso del M.R.L.S. tenemos para Y= variable respuesta y X= variable explicativa
o de predicción potencial, cada uno de los “n” datos apareados:
(x1, y1); (x2, y2); (x3, y3)… (xn, yn)

Se utilizará el modelo lineal simple quedando así : Yi = βo + β1. Xi + ei para i=1,2,…n


Es lineal en los parámetros, pues éstos no están como exponentes ni tampoco multiplicando o dividiendo
otro parámetro y es simple por considerar solo una variable explicativa o variable de predicción.
Ahora bien, cada valor de Yi es una V.A. que es la suma de dos componentes el no aleatorio representado
por βo + β1. Xi y el aleatorio representado por ei. Si ei = 0, entonces el valor observado Yi estaría localizado
sobre la línea de regresión βo + β1. Xi . Por eso, ei es la distancia vertical de la observación a la línea de
regresión.
Supuestos del modelo:
E(ei) = 0
VAR(ei) = σ2 i= 1,2,…n
COV(ei;eJ) = 0 i ≠ j
Entonces:
E (Yi )= E( βo + β1. Xi + ei ) = βo + β1. Xi
COV(Yi;YJ) = 0 i ≠ j
VAR(Yi) = VAR( βo + β1. Xi + ei ) = VAR(ei ) = σ2
Si ei = Yi – ( βo + β1. Xi )
e2i = ( Yi – βo - β1. Xi )2
∑ ∑

122
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Recordemos que la recta de regresión hallada nos queda de la forma: Y = βo + β1. Xi .


En donde los valores Y son los estimadores para las medias de distribuciones de probabilidad de la
variable Y correspondientes a la variable Xi promedio.

Por lo comentado , el principio de mínimos cuadrados es el criterio de bondad que establece “escoger como
recta de mejor ajusta aquella que minimiza la suma de los cuadrados de las desviaciones de los valores
observados respecto de los pronosticados. Es una técnica empleada para obtener la ecuación de regresión
y se consigue: Minimizando la suma de los cuadrados de los diferentes verticales entre los valores Y
verdaderos y los valores Ŷ pronosticados. Es un procedimiento estadístico que se utiliza para encontrar la
recta de “mejor ajuste” para un conjunto de puntos. Porque como se observará la recta de regresión tiene
carácter de línea media
Recordando que la ecuación de regresión es una expresión matemática que define la relación lineal entre 2
variables X e Y, cuyo modelo es Y = bo + b1 .X : es un modelo matemático determinista porque al sustituir
un valor de X en la ecuación, el valor de Y queda determinado y no se considera margen alguno de error.
Se aplica para la predicción solo cuando los errores de predicción son pequeños

Se aclara que cuando los errores de predicción son grandes, que se daría en el caso general de los
pronósticos en la administración de negocios se debe considerar el error de predicción, en donde se debe
agregar al modelo matemático determinista una o más componentes aleatorias para tomar en cuenta el
error aleatorio e inexplicado de la predicción y se transforma el modelo matemático determinista al modelo
matemático probabilístico

Los estimadores de mínimos cuadrados de βo y β1 se obtienen mediante la diferenciación de la fórmula


∑ ∑ con respecto a de βo y β1 y luego igualar cada derivada parcial a cero de
esa fórmula. Veamos:

∑ ∑
2 2

∑ ∑ ∑ ∑ . . ∑ . ∑ .

∑ . .∑ ∑ . . ∑ . ∑

Se llega a las denominadas ecuaciones normales de los mínimos cuadrados (ecuaciones normales de Gauss)

∑ . .∑ (1)

∑ ∑ .∑ (2)

En cada una de estas ecuaciones normales para encontrar en el modelo de regresión que se forma cuando
la función de regresión es una función afín o sea una recta de aproximación por mínimos cuadrados del
conjunto de puntos (X1 , Y1) ;(X2 , Y2) ; (X3 , Y3) ;… (Xn , Yn) ; en donde las constantes y se determina
mediante el sistema de ecuaciones.
A partir de (1) se divide ambos miembros por n y queda:
∑ ∑
(3)
Despejando de (3) queda: Despejando de (3) queda:

∑ ∑
4 5

Otra forma: βo = β1 . (6)

A partir de (2) se divide ambos miembros por n y queda:


∑ ∑ ∑
. . 7

123
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Para encontrar el estimador β1 -pendiente- Para encontrar el estimador βo -intercercepto-


Se reemplaza en 7 el valor de 4 βo Se reemplaza en 7 el valor de 5 β1


∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
1
. . . ∑ .
Aplicando propiedad distributiva: Aplicando propiedad distributiva:


∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
1
. . ∑ . . ∑

∑ ∑ ∑ ∑ 2 ∑ ∑ ∑ ∑ ∑ .∑
2 1 2
. . ∑
. ∑

∑ ∑ ∑ ∑ ∑ 2 ∑ ∑ .∑ ∑ ∑
2 . .
2 ∑ ∑

.∑ ∑ ∑ ∑ ∑ 2 ∑ ∑ ∑ .∑ ∑ ∑
2 . .
2 .∑ .∑

.∑ ∑ ∑ ∑ ∑ ∑ .∑
2 .∑
2
∑ ∑ ∑ .∑
. .∑
2

.∑ ∑ ∑ ∑ ∑ ∑ .∑
∑ ∑
………………………… ∑
.∑
∑ ∑

O dividiendo por n

Otra forma que se puede expresar B1 Para tener igual denominador se multiplica numerador
Si dividimos nuevamente por n. y denominador por (-1) y queda:
, ∑ .∑ ∑ ∑
∑ ∑

Con varios pasos matemáticos se obtuvieron los valores constantes del Intercepto: b o también βo y de la
pendiente: m o también β1 que representa el cambio medio en Y por unidad de cambio en X.
Siendo: Ŷ : la ecuación de estimación o de predicción y representa la ecuación que mejor ajusta a los datos.

Afirmar que Y no aumenta ni disminuye linealmente cuando X aumenta o disminuye equivale a decir que
m o β1=0

Se reitera que no se puede hablar de relación causal entre X e Y, solamente podemos decir que hay una
asociación en donde si Y cambia cuando X varía y que puede ser posible lograr una mejor predicción para
Y al utilizar X y la recta de predicción, que simplemente utilizar Y ignorando a X.

Para comprobar que la ecuación de estimación sea la correcta, podemos determinar los errores o
perturbaciones estocásticas o residuos individuales y sumarlos, dado que la suma de los errores positivos
y negativos debe dar cero.
Una recta de regresión lograda por el método de mínimos cuadrados permite obtener ciertas propiedades,
una de ellas la mencionada anteriormente:
Propiedades :
∑ 0

. 0

124
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Interpretación de la interceptación “βo” y la pendiente “m o bien β1 ”


Dado el siguiente ejemplo en el que se supone que un economista desea utilizar la tasa anual de crecimiento
de la productividad X para predecir el porcentaje de cambio de un índice. Supongamos que el modelo
regresional fue ajustado en base a datos anuales de 30 años.

Yi = - 5.0 + 7Xi siendo: Y = cambio del índice y X = Tasa anual de crecimiento de la productividad .
La intercepción de Y, β0 = -5.0 se interpreta: “cuando la tasa anual de crecimiento de la productividad es 0, el
cambio esperado en el índice es -5.0, e indica que el índice se predice que decrezca un 5% durante el año”.
Por otro lado, la pendiente β1 = 7 nos dice que “por cada incremento en la tasa anual de productividad predice
un cambio esperado en el índice de 7.0, o sea que nos indica que el índice predice un incremento del 7% por cada 1%
de incremento en la productividad.

5. Interpolación Versus Extrapolación

Cuando se utiliza un modelo de regresión con motivo de predicción, es importante que consideremos solo
el rango relevante de la variable independiente en nuestra predicción. Con este rango relevante, todos los
valores desde el X más pequeño al mayor han sido utilizados para desarrollar el modelo. Nosotros
podemos interpolar SOLAMENTE en ese rango relevante de los valores de X pero NO PODEMOS
EXTRAPOLAR fuera del rango de X.

SUPUESTOS DE LA REGRESIÓN
Las cuatro suposiciones básicas de regresión (acrónimo LINE) son
 Linealidad: la relación entre las variables es lineal
 Independencia de errores: cuando se recolectan los datos, los errores deben ser independientes.
Es decir, hay situaciones en que los errores para un período específico a menudo están
correlacionados con aquellos del período anterior.
 Normalidad: los errores se distribuyen normalmente en cada valor de X.
 Equality =Igual Varianza (HOMOCEDASTICIDAD): la varianza de los errores es constante para
todos los valores de X.

6. Determinación de las Varianzas o Cuadrados Medios – Tabla Anova

Y *
Como figura de análisis:
Grafique las variaciones en el diagrama de dispersión * *

*
* *
*
0 X
Notación:
S.C.: Suma de los Cuadrados C.M.: Cuadrados Medios (Varianza)
S.C.E. : Suma de los Cuadrados Explicados por la Recta de Regresión
S.C.R.: Suma de los Cuadrados de los Residuos o Errores o perturbaciones estocásticas.

125
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Interprete los valores de la tabla siguiente


DATOS PARA COMPLETAR LA TABLA ANOVA 

Fuente de las   S.C.  G.L  C.M.  Fe  Valor “p” 


Variaciones   Varianza 
REGRESION S.C.E=  1  C.M.E=   

Residuos o S.C.R=  n‐2  C.M.R= 


Errores

TOTAL S.C.T.=  n‐1  C.M.T.=     


   
 

7. Medidasestadísticas
MEDIDAS Estadísticasenenlala Regresión
Regresión

S.C.T

. . .

S.C.R= ∑ S.C.E.=∑

Se divide por Se divide por Se divide por


GL= (n-2) GL=1 S.C.T.

Varianza de los errores Varianza de la Regresión


∑ Coeficiente
C.M.R.= C.M.E.=∑ De Determinación
. . . . . .
R2=
. . . . . .

Error Estandar de Estimación



e.e.e.=
Coeficiente
De Correlación
. .
/ √ = / . . .

Error estándar de Estimación

El error estándar de estimación denotado como e.e.e , o bien se mide la variabilidad o dispersión de los
valores observados alrededor de la recta de regresión. A medida que sea menor la variación de los valores
de Y respecto a la recta de regresión, tanto más cerca se encontrará la recta de mínimos cuadrados de la
recta de la regresión.
Indica la confiabilidad de la ecuación de estimación.

126
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

El numerador de la raíz está formado por la suma de los cuadrados residuales debe ser lo más bajo posible.
En cuanto al denominador es en el caso de un M.R.L.S. igual a (n-2) . Se resta 2 porque significa la érdida
de 2 grados de libertad (para los valores de la pendiente y del intercepto) al estimar la recta de regresión.

Cuanto más grande es el e.e.e., entonces mayor será la dispersión de los puntos alrededor de la recta de
regresión. El caso particular es que el e.e.e. de cero, en donde no hay dispersión de los puntos, por ende,
todos los puntos se encuentran sobre la línea de regresión.

Una aplicación intuitiva del e.e.e. – Una aproximación en la estimación de un intervalo de predicción

Podríamos interpretar que, si los puntos observados se distribuyen normalmente alrededor de la línea de
regresión, entonces podemos esperar que el 68% de los puntos caerían dentro de 1 ; el 95,5% de los
puntos caerían dentro de 2 y el 99,7% de los puntos caerían dentro de 3 .

Y *
* *

*
* *
*
0 X

El e.e.e. también sirve para estimar un intervalo de predicción aproximada. Es decir si tenemos que estimar
un determinado valor de Y dado un valor (dentro del rango de la variable explicativa de nuestra muestra)
de X, lo consideramos ese valor estimado como una estimación puntual y entonces, para calcular los limites
inferior y superior de un intervalo de confianza, a ese valor puntual le sumamos y restamos 1 e.e.e.; 2 e.e.e. ,
3 e.e.e. según, querramos informar que aproximadamente el 68%, o el 95,5% o el 99,7% del valor de Y estará
dentro de 1, 2 o 3, respectivamente errores estándar de estimación. Pero, para ello necesitamos, dado que
utilizamos la distribución normal que la muestra sea mayor a 30; caso contrario si la muestra es chica,
utilizamos la distribución t.
Sin embargo, utilizaremos otras fórmulas específicas para la construcción de los intervalos de confianza y
de predicción.

Coeficiente de determinación

Mide solo la fuerza de una relación lineal entre las variables. Denotado como R2 o bien r2
Es la cantidad de variación en Y que es explicada por la línea de regresión. Es decir mide que tan bien X
explica Y. Constituye la parte determinística del modelo.

Si el modelo lineal tiene un bajo coeficiente de determinación, deberá probarse otro modelo. Aunque la
decisión final del modelo de regresión, se sostiene, es atributo del predictor

Coeficiente de Correlación
Es tan solo la raíz cuadrada del coeficiente de determinación, cuyo signo tendrá el de la pendiente de la
línea de regresión. Denotado como r -si es muestral- y ρ -si es poblacional-
En el caso de calcular el coeficiente de correlación a partir de la Covarianza, en este caso es el signo de la
covarianza el que da el signo del coeficiente de correlación. Porque calculado por esta vía, el coeficiente de
correlación es el cociente entre la Covarianza y el producto de los desvíos de las variables, denominador
que siempre es positivo
El coeficiente de correlación superior al 0,75 para el caso de variables micro y macroeconómicas se
interpreta en general la existencia de asociación entre las variables.

127
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Estas dos últimas: coeficiente de determinación y de correlación constituyen medidas que deben ser
interpretadas en conjunto. Pues si el grado de asociación entre dos variables fuese del 70%, relación
bastante fuerte, mientras que por ejemplo, el coeficiente de determinación sería del 49%, significa que X
explica solo el 49% de la variación en Y.

8. Test
Test de hipótesis
de hipótesis paraelelcoeficiente
para coeficiente de
de correlación
correlación

1
Ho : ρ=0 No existe relación lineal entre las variables X e Y
H1 : ρ≠0 Existe relación lineal entre las variables X e Y

2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)

3
Estadístico de Prueba tn-2 = . . .

Tomada la muestra de “n” datos apareados reemplazamos los valores en el Estadístico de


Prueba
4
V.E = te = tn-2 =

5
V.T.= tt (n-2 gl)

6
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables

9. Test de hipótesis para la pendiente

Existen dos caminos (El Método de la Prueba de significancia “t” y el de “F” de Snedecor, para
concluir si existe significatividad estadística en la relación entre X e Y.

Comencemos con la prueba “t”

128
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Método 1: “Prueba de significancia “t” de Student” : A iguales valores de nivel de significancia


da el mismo valor de “p-value” . Además, da el mismo valor empírico que el test anterior.

1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y

2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)

3
Estadístico de Prueba tn-2 = . . .

Tomada la muestra de “n” datos apareados reemplazamos los valores en el Estadístico de


Prueba y obtenemos el Valor Empírico
4
V.E = te =

Luego, buscamos el Valor Teórico que resulta de las Tablas Estadísticas.


5
V.T.= tt (n-2 gl)

6
Comparado ambos Valores obtenemos las conclusiones a través de la :
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables.

NOTA ACLARATORIA: Ambos test de hipótesis para la pendiente y para el coeficiente de correlacion en
el que se utilizan para la prueba de significancia estadística que indica la relación lineal entre X e Y y que
contrastaron los valores empíricos con un valor “t” arrojan el mismo valor empírico.

Método 2: “Prueba de significancia “F” de Snedecor :


Tanto el método 1 como éste método 2 cuando se trata de regresión lineal simple, conducen a las mismas
conclusiones.

1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y

2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)

3
Estadístico de Prueba tn-2 = . . .

129
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Tomada la muestra de “n” datos apareados reemplazamos los valores en el Estadístico de


Prueba y obtenemos el Valor Empírico
4
V.E = te =

Luego, buscamos el Valor Teórico que resulta de las Tablas Estadísticas.


5
V.T.= tt (n-2 gl)

6
Comparado ambos Valores obtenemos las conclusiones a través de la :
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables.

10. Intervalo de Confianza para la media de Y condicional

Sea un determinado Xf : valor fijo, un valor particular para el cual se desea estimar la media de la
variable respuesta Y . En consecuencia, el estimador es Y
Por tratarse de una muestra la cantidad de observaciones con sus valores observados, ésta cambia
de muestra en muestra, por lo que de acuerdo a la muestra seleccionada se determinó la recta
de regresión, pero el estimador Y cambiaría entonces construimos un intervalo de confianza.

Si la VAR(Y

En donde la desviación estándar del estimador Y será :e . . .


1
. . . . . 1

11. Intervalo para la Predicción de Y para un determinado valor fijo

A diferencia de la fórmula que resulta para construir el intervalo de confianza para la media de
Yf ; es decir si en lugar de estimar la media de Yf en xf , se desea predecir un valor particular de xf
que se observaría si se impusiera un valor xf para la variable de predicción, se deberá aumentar
la varianza, ya que ésta varianza denota dos variaciones:
- Las variaciones muestra a muestra de
- Las variaciones inherentes de la distribución de probabilidades de Yf

Entonces: VAR(Y Y

VAR(Y

VAR(Y 1

Recordando que (Y es la predicción particular para Yf en xf

130
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

1
. . . . . 1 1

12. Intervalo de Confianza para la pendiente β1


Por tratarse de una muestra la que determinó la recta de regresión, con su ordenada y pendiente
b1 ; entonces construimos el intervalo de confianza.
. . .
. . 1

Como ya hemos visto, la interpretación del I.C. es la siguiente: Si se toman muestras repetidas de “n”
observaciones de la variable respuesta Y para algunos de los valores de x, producen una recta estimada de
Y , construyéndose para cada muestra de tamaño “n” un intervalo de confianza; en donde
el (1-α).100%de los intervalos contendrán al parámetro

EJERCICIOS DE APLICACIÓN de REGRESIÓN LINEAL SIMLE

Un investigador en comercialización recolecta datos tomando una muestra de 10 confiterías tipo


restaurantes ubicadas alrededor de las diferentes Facultades de la Universidad de Buenos Aires y otros
centros educativos en la zona de Córdoba y Junín y aledaños. Considerando, que para cada confitería tipo
restaurante se recolectó como información la población estudiantil que asiste y las ventas trimestrales
que se realiza –todas cifras de miles de $-
Se pide a través de un análisis de datos bivariados pueda:
 Representar gráficamente la relación entre ventas y población de estudiantes.
 De acuerdo a la gráfica representada ¿qué conclusión extrae de dicha relación?
 Obtenga la ecuación de mejor ajuste utilizando el criterio de mínimos cuadrados.
 Cuál es el valor del error estándar de estimación
 Calcule el coeficiente de determinación
 Calcule el coeficiente de correlación
 Pruebe los valores hallados del coeficiente de correlación con la calculadora y de la forma
en que se resolvió en la primera parte del curso.
 Complete el siguiente cuadro

TABLA ANOVA para la REGRESIÓN LINEAL SIMPLE

Fuente de Suma de Grados de Cuadrado Fe Valor


Variación Cuadrados Libertad Medio p
REGRESIÓN S.C.E 1 C.M.E. Fe = C.M.E /C.M.R.
ERRORES S.C.R n-2 C.M.R.
S.C.T. n-1

131
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

TRABAJO SOBRE FUNCIÓN DE REGRESIÓN

OBJETIVO DEL TRABAJO DE REGRESIÓN:

a) Predecir el valor de la variable a partir de una variable explicativa mediante un modelo matemático
que represente la función de regresión muestral
b) Relacionar las medidas estadísticas ya estudiadas en la primera parte del curso (Covarianza y
Correlación muestral) con la REGRESION.
c) Reconocer si resulta viable construir un modelo de regresión lineal en función a los datos
observados
d) Construir una tabla ANOVA que de información sobre las variaciones en los errores y las
variaciones que resultan explicadas por la regresión.
TAREA:

SE RECUERDA LA PRIMERA PARTE

1- ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una determinada
posición, o marco teórico sobre el tema que trata esas variables.

2 - ETAPA DE RECOLECCIÓN DE DATOS..


La muestra debe estar conformada de por lo menos seis unidades de análisis y deberá identificar
cual es la variable explicativa (X) y cuál será la variable explicada (Y) informando la fuente y fecha
de la misma.

3- TRATAMIENTO CUANTITATIVO DE LOS DATOS BIVARIADOS


Comenzar con el gráfico del diagrama de dispersión, para ver si presentan algún tipo de asociación
a simple vista
Luego, seguir con la construcción de una tabla que permita hallar la COVARIANZA, Luego los
desvíos para calcular el COEFICIENTE DE CORRELACIÓN. Hacer los cálculos manualmente
en la hoja paso a paso, cruzar con los cálculos realizados en la calculadora y también es aconsejable
utilizar una planilla de cálculo tipo Excel (ver guía del curso sobre REGRESION)
Interpretar ambas medidas estadísticas de covarianza y correlación.

 SEGUNDA PARTE

4- LOS PASOS DE LA FUNCIÓN DE REGRESIÓN

Se continúa con la función de regresión, determinando previamente el intercepto y la pendiente de


la función de regresión muestral F.R.M.

Volver a graficar el diagrama de dispersión y ahora sí , la recta que resulta de mejor ajuste

Hacer una tabla con la S.C.T desagregados en S.C.R y S.C.E por la recta de regresión. Construir la
tabla resumen ANOVA.
A partir de la suma de los cuadrados, calcular el coeficiente de determinación y luego el coeficiente
de correlación. Comprobar los valores del coeficiente de correlación con el calculado en el punto
ya hecho en covarianza y correlación.
Determinar el error estándar de estimación.

132
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

En cada medida estadística deberá ser interpretado su resultado

Por último pronosticar para un determinado valor de la variable explicativa . Es decir si X tuviese
determinado valor cuál sería el de Y.

Luego, construya el Intervalo de confianza para un determinado valor fijo y el intervalo de


predicción de Y para un valor fijo.

También, deberá construir un intervalo de confianza para la pendiente.

Construya un test de hipótesis para probar la relación entre las variables si existe o no, a través de
los valores del coeficiente de correlación y también de la pendiente obtenida en la función de
regresión. Compruebe los resultados hallados.

Construya un test de hipótesis a través de los resultados de las varianzas, es decir las variaciones
explicadas por la recta de regresión y las variaciones de los errores.

EJERCICIOS DE APLICACIÓN de REGRESIÓN LINEAL SIMPLE

1)
Los gastos anuales en reparación de motores son los que logró informarse la directora del Departamento de Salu-
bridad quien está interesada en la relación que existe entre la antigüedad de un motor y los gastos anuales.
Con el fin de determinar dicha relación , la directora reunió información de cuatro motores
La información es la siguiente

Gs. Anuales en miles de Dolares 7 7 6 4


antigüedad de los .Motores en años 5 3 3 1

a) Desarrolle una ecuación de regresión que describe la relac. Entre la antig. Y sus gs. Anuales de reparación.
b) Pronostique los gastos anuales de reparacion en miles de dólares si la antigüedad del motor fuese de 4 años
c) Calcule el error estandard de la estimación
y = 0,75x + 3,75 El gráfico queda representado así
R² = 0,75 Ser…

2) En la empresa "Tecnobuenosaires" en el Sector Contable "Contabilidad de Costos" se encuentran abocados a la estimación de los gs.gs
con base en el nivel de producción. Por ello, el Supervisor logró reunir información acerca de los gastos generales y de las unidades producid.
en diferentes plantas, y ahora desean estimar una ecuación de regresión para predecir los gastos generales futuros.
La información es la siguiente

Gastos Ge 191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40

a) Desarrolle una ecuación de regresión para contabilidad de costos


b) Pronostique los gastos generales cuando se producen 50 unidades

133
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

3) Determine la ecuación de regresión de minimos cuadrados para el siguiente problema-


Un analista toma una muestra aleatoria de 10 embarques recientes por camión realizados por una compañía y
registra la distancia en km y el tiempo de entrega al medio día más cercano a partir del momento en que el
embarque estuvo listo para su carga. Elabore el diagrama de dispersión de datos y considere si el análisis de
regresión lineal parece apropiado

Embarque 1 2 3 4 5 6 7 8 9 10
Distancia ( 825 215 1070 550 480 920 1350 325 670 1215
Tiempo de 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0

4) Dados los sig. valores de xi e yi, definiendo Y: ventas y X: gastos de publicidad.


Gastos  a) Especifique  cuál  es  la  variable  de  predicción  y  la  variable 
Publicidad  Ventas  explicativa 
miles $  10.000  $ 
b) Representar los puntos observados mediante un diagrama 
1 42,5 66,3
de dispersión 
2 49 67,3
3 50,5 69,1 c) Hallar la ecuación de regresión que permita estimar las Vtas
4 53,2 71,2 d) Hallar e interpretar el coeficiente de correlación.  
5 52,1 72,1 e) Si  la  compañía  acepta  afrontar  un  gasto  de  publicidad  de 
6 54,5 72,3 $50 miles ¿cuál será la ventas estimada?  
7 51,5 73,4 f) Y  si  la  compañía  acepta  gastar  $80  miles  ¿cuál  serían  las 
8 54,3 73,3 ventas  estimadas?  Comente  esta  decisión  para  la  medida 
9 53,5 74,6 estadística.  
10 52,6 75,1 g) ¿Cuál es el error estándar de estimación y que significa? 
h) Construya un intervalo de confianza para el valor de la pendiente de la recta 
i) Construya un test de significancia para probar la relación estadística entre las ventas y los 
gastos de publicidad. 
Rta:

x y xy x2 y2 Los resultados del cuadro:


1 42,5 66,3 2817,8 1806,25 4395,69 N 10
2 49 67,3 3297,7 2401 4529,29 ∑x= 513,7
3 50,5 69,1 3489,6 2550,25 4774,81 ∑y= 714,7
4 53,2 71,2 3787,8 2830,24 5069,44 ∑ x 2= 26502,15
5 52,1 72,1 3756,4 2714,41 5198,41 ∑ y 2= 51160,55
6 54,5 72,3 3940,4 2970,25 5227,29 ∑x.y= 36791,25
7 51,5 73,4 3780,1 2652,25 5387,56
x
 x 0,00194666
8 54,3 73,3 3980,2 2948,49 5372,89 N
9 53,5 74,6 3991,1 2862,25 5565,16 (∑ x)2= 263887,69
10 52,6 75,1 3950,3 2766,76 5640,01
------------- ------------ ----------- ------------- ---------------
y
 y 71,47
∑ 513,7 714,7 36791 26502,2 51160,6 N
m 51,37 71,47
Cálculo de los valores de la pendiente m y de la ordenada al origen b de la ecuación lineal de regresión.

5) Determine la recta de regresión en los ejercicios de estadística descriptiva  consignados en  el punto 
de correlación.

134
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

2 2
Restaurante xi yi XiYi xi yi xi - m(xi) yi - m(yi) [x i-m(x i )][yi-m(yi )] Los resultados del cuadro:
Pobl est Ventas
1 2 58 116 4 3364 -12 -72 864 N 10 Usando excel
2 6 105 630 36 11025 -8 -25 200 ∑x= 140 1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
3 8 88 704 64 7744 -6 -42 252 ∑y= 1300 las celdas que contienen los datos marcadas.
4 8 118 944 64 13924 -6 -12 72 ∑ x 2= 2528
5 12 117 1404 144 13689 -2 -13 26 ∑ y 2= 184730 250
6 16 137 2192 256 18769 2 7 14 ∑x.y= 21040
7 20 157 3140 400 24649 6 27 162
x
x 14
200
8 20 169 3380 400 28561 6 39 234 N
9 22 149 3278 484 22201 8 19 152 (∑ x)2= 19600
10 26 202 5252 676 40804 12 72 864 150
-------------- --------------- --------------- --------------- --------------- --------------- --------------- --------------- y
y 130
N Series1
∑ 140 1300 21040 2528 184730 0 0 2840 100
m 14 130
Cálculo de los valores de la pendiente m y de la ordenada al origen b de la ecuación lineal de regresión.
50

( y ).( x )  ( x. y ).( x )
2
b= 340800 0
b 5680 0 10 20 30
N .( x )  ( x )
2 2
b= 60
2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear
3°) Se pueden ir completando los datos en las abscisa y ordenada
haciendo click con el botón derecho dentro del gráfico.
N .( x. y )  ( x ).( y ) m= 28400 4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
m 5680
N .( x )  ( x ) 2
2 que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
m= 5 hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
La recta de regresión será
b m x y  60  5  x
Presentar valor de R cuadrado en el gráfico.

250
c) Verificación de la ecuación de estimación
Residual ó
Cálculo de la suma de los errores individuales de la tabla Valor ajustado Error Individ 200 y = 5x + 60

 y  y
2
 

2
   2 R² = 0,9027

 
 e2   y  y  y  y

y ey y  

 
Y   150
1 58 60 + 5* 2 70,00 -12,00 144,00 3600 5184 Series1
2 105 60 + 5* 6 90,00 15,00 225,00 1600 625 100 Lineal (Series1)
3 88 60 + 5* 8 100,00 -12,00 144,00 900 1764
4 118 60 + 5* 8 100,00 18,00 324,00 900 144
50
5 117 60 + 5* 12 120,00 -3,00 9,00 100 169
6 137 60 + 5* 16 140,00 -3,00 9,00 100 49
7 157 60 + 5* 20 160,00 -3,00 9,00 900 729 0
8 169 60 + 5* 20 160,00 9,00 81,00 900 1521 0 10 20 30
9 149 60 + 5* 22 170,00 -21,00 441,00 1600 361
10 202 60 + 5* 26 190,00 12,00 144,00 3600 5184
------------------- ------------------- ------------------- ------------------- ------------------- 5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
1300 ERROR TOTAL =====> 1300,00 0,00 1530,00 14200,00 15730,00 podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales
130
d) Error Estándar de la estimación 6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
Mirando la linea de tendencia si R2 =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
 si R2 es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac

SY , X 
 ( y  y) 2

  e2 1530 si R2 es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
SY , X   191, 25  13,8293 nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
n2 n2 10  2
ajuste.

135
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

136
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Test de hipótesis para el coeficiente de correlación


θ
Recordamos los estimadores de los parámetros θ vistos hasta ahora. µ
Ahora, tenemos a r -el coeficiente de correlación muestral, como S2
estimador de ρ -el coeficiente de correlación poblacional. S σ
p
Construcción del Test de hipótesis
r ρ
para el coeficiente de correlación

1
Ho : ρ=0 No existe relación lineal entre las variables X e Y
H1 : ρ≠0 Existe relación lineal entre las variables X e Y

2
α=0,01 (en general, un valor que oscila entre el 0,01 y 0,10)
n= 10 (cantidad de datos apareados)

3
Estadístico de Prueba tn-2 =

Tomada la muestra de “n” datos apareados reemplazamos los valores en el Estadístico de


Prueba
4 ,
V.E = te = = 8,616749
,

V.T.= t0,005 (8 gl) = ± 3,355


5

Regla de Decisión: Como el te está fuera de la zona de aceptación de la hipótesis nula,


6
dado que es mayor al tt ; entonces se rechaza la hipótesis nula con ese nivel de
significancia α= 0,01
Se concluye que existe evidencia muestral que indica que hay relación lineal entre
las variables

Construcción del test de hipótesis para la pendiente.


Método de la prueba de significancia “t”

1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y

2
α= 0,01 (en general, un valor que oscila entre el 0,01 y 0,10)
n= 10 (cantidad de datos apareados)

137
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Estadístico de Prueba 10-2 = tn-2 = . . .

3 ∑

Tomada la muestra de “n” datos apareados reemplazamos los valores en el Estadístico de


Prueba
V.E = te = 10-2 = , . = 8,616747
4 √

V.T.= tt (10-2 gl) = ±3,355


5

Regla de Decisión: Como el te está fuera de la zona de aceptación de la hipótesis nula,


6
entonces se rechaza la hipótesis nula con ese nivel de significancia del 0,01 y se
concluye que existe evidencia muestral que indica que hay relación lineal entre las
variables

138
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

139
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO
DE CONCEPTOS TEÓRICOS DE REGRESIÓN LINEAL SIMPLE
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero.
1) Una de las razones para encontrar una ecuación de regresión es para hacer predicciones fuera o dentro
del dominio muestral de la variable explicativa, para cualquier periodo y población. V:__F:__

2) En el análisis de regresión se mide la fuerza de la relación lineal entre las variables. V:__F:__

3)Un coeficiente de correlación fuerte significa que la variable X es causa de la variable Y que es su efecto.

4) El análisis de correlación es un método de obtener la ecuación que representa la relación entre dos
variables. V:__F:__

5) Un coeficiente de correlación de cero significa que las dos variables están perfectamente correlacionadas.
V:__F:__
6)Cuando el coeficiente de correlación r es positivo, la pendiente de la recta será siempre negativa.
V:__F:__

7)Cuando el valor calculado del coeficiente de correlación es negativo, el valor calculado de la pendiente
de la recta será negativo. V:__F:__

8) La pendiente de la recta de regresión representa la cantidad de cambio que se espera tenga lugar en la
variable explicada, cuando la variable explicativa aumenta en una unidad. V:__F:__

9) Los coeficientes de correlación están entre 0 y 1. V:__F:__

10) El valor que se predice se denomina variable predictora. V:__F:__

11) La recta de mejor ajuste se emplea para predecir el valor promedio de Y que se puede esperar, ocurra a
un valor determinado de X, dentro del rango de los valores de X, para esa población y periodo en que se
obtuvo las observaciones V:__F:__

12) Dado que la ecuación para una recta es Y = 26 – 24 X, podemos decir que la relación de Y con X es
directa y lineal. V:__F:__

13) Un valor r2 cercano a cero indica una fuerte correlación entre X y Y. V:__F:__

14) Los análisis de regresión y correlación se usan para determinar relaciones de causa y efecto. V:__F:__

15) El coeficiente de correlación de la muestra, r, es simplemente √ w, y no podemos interpretar su


significado directamente como un porcentaje de algún tipo. V:__F:__

16) El error estándar de la estimación mide la variabilidad de los valores observados alrededor de la
ecuación de regresión. V:__F:__

17) La recta de regresión se deriva de una muestra y no de toda la población. V:__F:__

18) Podemos interpretar el coeficiente de determinación de la muestra como la cantidad de la variación en


Y que explica la recta de regresión.
V:__F:__
19) La ecuación de estimación es válida sólo en el mismo intervalo que el dado por los datos originales de
la muestra para los cuales se desarrolló. V:__F:__

140
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

20) Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos cuadrados, los errores
individuales positivos y negativos respecto a la línea suman cero. V:__F:__

21) Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el valor de r debe
ser la raíz cuadrada positiva de r2. V:__F:__

22) Si r = 0.8, entonces la ecuación de regresión explica el 80% de la variación total en la variable
dependiente. V:__F:__

23) El coeficiente de correlación es el porcentaje de la variación total de la variable dependiente explicada


por la regresión. V:__F:__

24) Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de la muestra de la
variable independiente. V:__F:__

Marque la opción que considera correcta en cada enunciado

1) Suponga que conocemos la estatura de una estudiante, pero no su peso. Usamos una ecuación de
estimación para determinar una estimación de su peso, basándonos en su estatura. Por tanto, podemos
concluir que:
a) El peso es la variable independiente.
b) La altura es la variable dependiente.
c) La relación entre peso y altura es inversa.
d) Ninguno de los anteriores.
e) b) y c), pero no a).

2) Suponga que le dicen que existe una relación directa entre el precio de los tomates cherry y la cantidad
de lluvia que cayó durante la época de cultivo. Puede concluirse que:
a) Los precios tienden a ser altos cuando la lluvia es alta.
b) Los precios tienden a ser bajos cuando la lluvia es alta.
c) Una gran cantidad de lluvia ocasiona que los precios suban.
d) La falta de lluvia ocasiona que los precios suban.

3) Suponga que se calcula que a es 4 y b es 2 para una línea de estimación particular con una variable
independiente. Si la variable independiente tiene un valor de 2, ¿qué valor debe esperarse para la variable
dependiente?
a) 8.
b) 10.
c) 21.
d) 0.

4). Suponga que se calculó la ecuación de estimación 5 2. , para un conjunto de datos. ¿Qué es cierto
de lo siguiente para esta situación?
a) La ordenada Y de la recta es 2.
b) La pendiente de la recta es negativa.
c) La recta representa una relación inversa.
d) Todos los anteriores.
e) b) y c), pero no a).

5)27. La variación de los valores de Y alrededor de la recta de regresión se expresa mejor como:
a) ∑
b) ∑
c) ∑
d) ∑

141
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

6) El valor de r2 para una situación particular es 0.49. ¿Cuál es el coeficiente de correlación?


a) 0.49.
b) 0.7.
c) 0.07.
d) No puede determinarse de la información dada.

7) En la ecuación Y= A + BX + e, la e representa:
a) La ordenada X de los datos observados.
b) El valor de Y con el cual se comparan otros para determinar el “mejor ajuste”.
c) Variaciones aleatorias respecto a la recta de regresión de la población.
d) Ninguno de los anteriores.

8) Si la variable dependiente aumenta cuando la variable independiente aumenta en una ecuación de


estimación, el coeficiente de correlación estará en el intervalo de:
a) 0 a 21.
b) 0 a 20.05.
c) 0 a 22.
d) Ninguno de los anteriores.

Complete los espacios en blanco

1) Si la variable dependiente en una relación disminuye al aumentar la variable independiente, la relación


es _______________.

2) Una asociación entre dos variables descrita por una línea curva es una _______________.

3) Toda línea recta tiene una _______________.que representa cuánto cambia la variable dependiente con
cada cambio unitario de la variable independiente.

4) El grado en el que los valores observados difieren de sus valores pronosticados sobre la línea de regresión
se mide por _______________.

5) _______________.es una medida de la proporción de variación en la variable dependiente que explica la


recta de regresión.

6) Si el 75% de la variación en la variable dependiente es explicada por la recta de regresión, entonces el


valor de r será de alrededor de _______________. .

7) El signo de r indica la_______________.de la relación entre las dos variables X y Y.

8) El método de mínimos cuadrados encuentra la línea de “mejor ajuste” a través de un conjunto de puntos,
esto es, la recta que _______________. el error entre los puntos observados y los puntos estimados sobre esa
recta.

LA ÉTICA EN LA ESTADÍSTICA 

Se debe tener especial cuidado en análisis regresional en los siguientes aspectos:


 Si no se conoce sobre modelos de regresión 
 Si se extrapola fuera del rango 
 Concluir sobre una relación causa‐efecto como resultado de una relación significativa 
 Falta de conocimiento sobre los supuestos de la regresión 

142
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

ESTADÍSTICA CON EXCEL.

Luego que vimos anteriormente como Se traza el diagrama de dispersión. Seguimos

4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
Presentar valor de R cuadrado en el gráfico.

Ecuación de regresión lineal


y = 6,4915x - 80,443
2
R = 0,9673
300
250
Gastos generales

200
150 Serie1
Lineal (Serie1)
100
50
0
0 10 20 30 40 50 60
Unidades

5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales

6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
2
Mirando la linea de tendencia si R =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
2
si R es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac
2
si R es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
ajuste.

Aca vemos el coeficiente de correlación que tenemos una diferencia con el realizado en el ejercicio (problemas de
aproximación en los decimales).Pues si pasamos a otro ejemplo: El ejercicio que busca el modelo de regresión entre
los gastos anuales en reparación de motores y su antigüedad, llegamos a iguales resultados también en correlación con
el desarrollo nuestro.
-
8 y = 0,75x + 3,75
7 R2 = 0,75

6
5
Serie1
4
Lineal (Serie1)
3
2
1
0
0 2 4 6

143
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

IX – LAS SERIES CRONOLÓGICAS –UNIDAD TEMÀTICA Nro.8 del Programa Nº


3496/13
Objetivos del Aprendizaje: Proporcionar los conocimientos necesarios para el análisis temporal clásico fundado en la
descomposición de los fenómenos económicos dinámicos en los factores tendencia-ciclo y estacionalidad.

SERIE CRONOLÓGICA – SERIE TEMPORAL –SERIE DE TIEMPO


Se trata de una secuencia o conjunto de mediciones de una determinada variable registradas
secuencialmente en una sucesión de tiempos. Define Anderson como el conjunto de observaciones de una
variable media en puntos sucesivos en el tiempo o en periodos de tiempo sucesivos. La serie de tiempo
puede ser continua (observaciones tomadas instantáneamente en el tiempo) o discreta (tomadas en
momentos específicos)

A diferencia de Regresión, en este caso estudiar la serie nos permitirá PRONOSTICAR o predecir datos a
futuro suponiendo que los patrones de comportamiento pasados se mantienen en el futuro.

La suposición básica que subyace en el tratamiento de las series temporales es que “los factores
que han provocado patrones de comportamiento en el pasado y en el presente continuarán
haciéndolo en el futuro”
Por ello, expresa Berenson Levine que los principales objetivos del análisis de series consiste en identificar
y aislar tales factores de influencia con propósito de hacer predicciones (pronósticos), así como para
efectuar una planeación y un control administrativo

La sugerencia que se hace es que ante el hecho de explicar variaciones en serie de tiempo con datos
históricos en donde no se sabe si el patrón de comportamiento continuará en el futuro, es que se deben
combinar con un análisis que se extiende a buscar respuestas de tipo. ¿Qué pasaría si…? Ya que forman
parte de la planeación estratégica de lo que estoy sometiendo a análisis el marco de referencia de los datos
que se desenvuelvennen diferentes entornos económico, político, sociológico y hasta sicológico.

COMPONENTES DE UNA SERIE

La Serie Y(t) se descompone si seguimos el modelo multiplicativo clásico (uno de los tantos):
Y(t ) = T(t) * C(t) * E(t) * I(t)

Patrón de movimiento a LP persistente, Razón de la influencia: Duración:


T(t) ascendente o descendente Cambios en la tecnología, Varios años
TENDENCIA Razones para analizar la tendencia: población, valores, riqueza
SECULAR -Descubrir el patrón histórico
- Proyectar patrones o tendencias pasadas al
futuro
- Eliminar el componente tendencia para
analizar otro: ejemplo la estacionalidad.
Componente sistemático
C(t) Ondas u oscilaciones o movimientos Razón de la influencia: Duración:
CÍCLICO repetitivo en 4 etapas: pico (prosperidad), Factores que influyen en la 2 a 10 años con
contracción (recesión), fondo (depresión) y economía diferente intensidad
expansión (recuperación)
Componente sistemático
Patrones de cambio de una serie de tiempo Razón de la influencia: Duración:
E(t) que ocurren dentro de un año, y que tienden a Condiciones climáticas, Dentro del periodo
ESTACIONAL repetirse cada año costumbres sociales, anual (con los datos
Componente sistemático religiosas, fechas festivas subperiódicos)
I(t) Condición de una serie de tiempo en la que el Razón de la influencia: Duración:
IRREGULAR valor de una variable es completamente Corta

144
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

impredecible. Son las fluctuaciones erráticas o Variaciones aleatorias en Sin repetición


residuales que queda luego de considerar el los datos o debido a
componente sistemático. eventos no previstos:
Componente No Sistemático huelgas, huracanas,
inundaciones,….
Proceso estadístico usado para eliminar Se observa cuando la serie de datos no es anual,
DESESTACIO efectos de la estacionalidad en una serie temp. sino subperiódica...
NALIZACION
MEDIA Método estadístico utilizado en el análisis de Se la trabaja en la desestacionalización de la serie
MODIFICADA serie de tiempo y descarta los valores
extremos Se usa la mediana para descartar
más aún los valores extremos.
CODIFICACIÓ Método para convertir medidas tradicionales Se codifica el tiempo pues si tenemos ej.
N de tiempo en forma más simplificada para sus 2001,2002, es tedioso elevar al cuadrado
cálculos. números grandes. Se simplifica además, si la
media de X es cero. Entonces, para eso, se debe
traducir el tiempo considerando si se trata de:
- Número impar de elementos: …ej. 5 elem.
Los valores de x= -2; -1; 0; 1; 2
- Número par.: ej. 4 elem.: X= -3; -1; 1; 3
Así me queda media 0

PROMEDIO MOVIL
El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil.
La media móvil se basa en la idea que cualquier componente irregular en cualquier mom.ento del tiempo
ejercerá un efecto menor si se promedia el punto con sus vecinos inmediatos (Newbold). El objetivo de usar
medias móviles será la eliminación del componente irregular subyacente en la serie temporal

Una aplicación muy importante para el tratamiento de series que tienen componente estacional es usar las
medias móviles para extraer ese componente. Así, cuando graficamos la serie de medias móviles centradas
–PMC- junto con la serie original hemos eliminado el componente estacional y por otro lado, también se
ha suavizado el componente irregular. El grafico que se pueda representar nos permite juzgar las
regularidades no estacionales de los datos y comenzar a interpretar gráficamente que tipo de tendencia y
ciclo domina en esa serie representada ya suavizada.

Entonces, la serie de PMC de “p” puntos –en donde p representa la cantidad de subperiodos que en el año
están informados los datos observados o relevados- pueden resultar útil para comprender la estructura de
una serie temporal.

Así, usamos los PMC para desestacionalizar la serie

Actividad: Aplicación Teórica de series de tiempo

1) Enumere y defina los componentes de una serie cronológica 
2) Cuáles de los componentes de una serie de tiempo puede esperarse que estén presentes en cada 
una de las siguientes series: 
a. Ventas mensuales de piletas de natación 
b. El índice de precios al consumidor para los meses comprendidos entre diciembre 2009 a 
diciembre 2014. 
c. La tasa de desempleo en los últimos 10 años 
d. El número de turistas que visitan el Complejo Las Leñas en Mendoza entre los meses de 
enero 2009 a diciembre 2014. 

145
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

e. Las tasas de interés pasivas  en el periodo comprendido entre diciembre 2001 a diciembre 
2014. 
3) Marque en los  ejemplos que se citan a continuación , aquellos  en donde Ud. considere que no son 
series cronológicas. 
a. Series Económicas sobre Tasas de desempleo, Tasas de Inflación, Indicadores Economicos 
que informan Índices de Precios, Precios de determinados  productos. 
b. Series Demográficas: sobre tasas de crecimiento, mortalidad, natalidad 
c. Series Físicas sobre Evolución de Precipitaciones, temperaturas. 
d. Series Geofísicas sobre Evolución de  Movimientos Sísmicos en el área de Mendoza  
e. Series de tráfico, series de turismo…. 
4)
EJERCICIO DE APLICACIÓN DE SERIE DE TIEMPO:
Dado los siguientes valores originales observados en las ventas en miles de $ en esos periodos.
a) Identifique el componente estacional y desestacionalice la serie de observaciones.

Año I trimestre II trimestre III trimestre IV trimestre


I (ej. 1991) 16 21 9 18
II (EJ. 1992) 15 20 10 18
III 17 24 13 22
IV 17 25 11 21
V 18 26 14 25

Resolución:
Estos valores se pueden representar en la siguiente tabla como una serie de tiempo y luego
graficarlos
Valores .Originales 
año  TRIM   De Ventas en ‐Miles de $‐ 
1  1  16  ETAPA PREVIA
   2  21 
  3  9 
     4  18 
 2  1  15 
  2  20  Ventas históricas en Valores originales 
  3  10  30
  4  18 
3  1  17  20
2  24  10 V.O.
 
  3  13 
0
  4  22  0 5 10 15 20
4  1  17 
  2  25 
  3  11 
  4  21 
5  1  18 
  2  26 
  3  14 
  4  25 

146
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

ETAPA DE TRABAJO
Para el caso de series informadas por periodos menores al año, hallaremos el componente estacional para
desestacionalizar la serie. Por eso, comenzamos con

1.- Desestacionalizar la serie de tiempo.

2.- Encontrar la línea de tendencia.

3.-Hallar la variación alrededor de la línea de tendencia

4.- Encontrar el ciclo relativo.

5- Identificar la variación irregular en lo que queda.

El descomponer la serie en sus elementos, permite con un enfoque mecánico del análisis de serie
de tiempos “Pronosticar”. A diferencia de lo visto en regresión, que podíamos interpolar dentro del rango
de la variable explicativa, en el caso de Series Cronológicas podemos proyectar la tendencia histórica y
variación cíclica en el futuro, cuidando de ver si los patrones están cambiando, pues de nada nos serviría
la proyección en ese caso, como tampoco serviría si no son regulares y duraderas las tendencias pasadas.

SUPUESTO FUERTE: “El patrón de comportamiento histórico se considera válido para el futuro.”

El análisis de la Serie de tiempo también requiere de ver cuán precisos son los datos históricos, ello
incluye considerar en el caso de Series de precios, a diferencia de cantidad, que pueden estar registradas
contablemente a valores corrientes. Por ende, interpretar una tendencia positiva en el comportamiento de
los precios de una determinada serie, sería errónea si se tratase tan solo de la inflación que acompañan
dichos precios. Para dicho análisis, debieran primeramente deflacionarse dichos valores, nos estamos
refiriendo a trabajar en valores homogéneos, lo que equivaldría decir, trabajemos a valores constantes. Allí
necesitamos del manejo de NÚMEROS INDICES.

I – LA DESESTACIONALIZACIÓN DE LA SERIE DE TIEMPO

El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una
imagen más clara a través de la media móvil

El cuadro nos permite integrar los valores que resultan de:


1) Cálcular el total móvil de cada uno de los subperíodos trimestrales que comprenden cada período
anual. El total móvil es el dato que ocupa el lugar medio. Para el período siguiente tomo
nuevamente el promedio de los cuatro trimestres excluyendo el primero e incorporando uno más;
es decir: se incorpora el primero del año siguiente y se excluye el primero del año anterior) y así
sucesivamente .

2) Puede ocurrir que el número de subperiodos en el año es un número impar, por lo que cada
promedio movil se dice que queda ubicado en el centro de aquellos que formaron parte del cálculo.
(Recordemos el cálculo de la mediana que para datos sueltos queda posicionada en el orden
[n+1]/2) . En el caso de que el número de subperiodos en el año sea par, tal como este caso 4
trimestres, nos queda el PM –Promedio Móvil- ubicado en la posición 2,5, es decir entre dos valores
y así queda posicionado.

147
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

3) Si los PM hallados son de orden par debemos centrarlos y entonces para calcular el PMC –
Promedio Móvil Centrado- se procede a centrar el promedio móvil y así poder asociarlo con los
datos reales de cada período , en este caso periodo trimestrAL. Enel caso de datos impares (ej. 5
bimestres) no necesitamos este paso pues, el 1° PM quedaría centrado en el subperíodo 3. Centrar
significa hallar la semisuma de dos PM que en su posición quedarán nuevamente alineados con un
valor original.

4) Graficamos los PMC del cuadro


Interpretación: Observemos el gráfico con los valores reales u originales de los datos y cómo se
suavizan a través de los Promedios móviles centrados. Ya que los PMC suavizan los picos y valles
de los datos originales, representando entonces la T(t) y C(t)
El PMC lo que hace es promediar tanto las fluctuaciones estacionales como las irregulares pues está
basado en datos mensuales, trimestrales… (subperíodicos), lo que no hace es promediar las
influencias de tendencia ni cíclicas pues son a L.P.

Y t  T  C  E  I
  EI
P.M.C T C

30
25
20
15 V.O.

10 PMC

5
0
0 5 10 15 20 25

Para cada período calculamos el porcentaje de valor original o valor real respecto del valor
promedio móvil centrado para cada uno de los períodos de la serie de tiempo. Con este PMC
observamos que se han eliminado el componente irregular asi como el componente estacional.
La siguiente relación permite recuperar el componente Estacional y la podemos denominar “Valor
Estacional”
Y t 
Valor Estacional  .100
. .C
PM

Veamos como quedan los resultados, hasta ahora:

148
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Valor Origina PASO 1 PASO 2 PASO 3


Valor Estacional
Año Trim t Y(t) PM PMC Z(t) 100
I 1 1 16

2 2 21
16,000
3 3 9 15,875 56,69
15,750
4 4 18 15,625 115,20
15,500
II 1 5 15 15,625 96,00
15,750
2 6 20 15,750 126,98
15,750 62,50
3 7 10 16,000
16,250 197,46
4 8 18 16,750
17,250 96,45
III 1 9 17 17,625
18,000 129,73
2 10 24 18,500
19,000 68,42
3 11 13 19,000
19,000 115,03
4 12 22 19,125
19,250 89,47
IV 1 13 17 19,000
18,750 134,23
2 14 25 18,625
18,500 59,06
3 15 11 18,625
18,750 111,26
4 16 21 18,875
19,000 92,90
V 1 17 18 19,375
19,750 128,40
2 18 26 20,250
20,750
3 19 14

4 20 25

Forma parte del proceso de promediar el componente irregular que se realiza enlistando los
diversos cocientes aplicables al mismo trimestre, eliminando los valores más alto y más bajo y
calculando la media de los cocientes restantes. Esta medida se denomina media modificada, a causa
de la eliminación de los dos valores extremos.La media modificada será el índice de componente
estacional. Esta media modificada es un índice desajustado

5) ajustamos la media modificada (cocientes medios modificados) a través de una constante de


ajuste o factor de corrección, tal que la suma de los 4 cocientes sea 400.
Sum a .deseada .de .los .indices
F actor .de .C orrección .ó .C onst .de .ajuste 
Sum a .real .de .los .indices
400
Const.de.ajuste.   100  1,0064
397,44

Índice Estacional = Índice Desajustado (Media modificada)*Constante de Ajuste

Observaremos que El índice estacional se puede utilizar para eliminar los efectos de estacionalidad en una
serie de tiempos haciendo la desestacionalización.

Veremos que las medias modificadas al multiplicarse por un factor de ajuste permiten que la suma del
índice en este caso sea 100 para cada trimestre y 400 en los cuatro trimestres que comprenden el año.

Veamos:

CUADRO PARA DETERMINAR EL INDICE DE ESTACIONALIDAD

149
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

TRIM I II III IV
AÑO 1 - - 56,69 115,20
AÑO 2 96,00 126,98 62,50 107,46
AÑO 3 96,45 129,73 68,42 115,03
AÑO 4 89,47 134,23 59,06 111,26
AÑO 5 92,90 128,40 - -
Sumas 374,83 519,34 246,67 448,95
mediana 94,45 129,06 60,78 113,15 397,440
Sumas 100 100 100 100 400,000
I.E 95,1 129,9 61,2 113,9 400,000

Cálculo del FACTOR DE AJUSTE Y SU


APLICACIÓN
Mediana
o media
modificada 94,45 129,06 60,78 113,15 1,00644122
Fact.de aj. 1,0064 1,0064 1,0064 1,0064 400/397,44= 1,0064
IE 95,1 129,9 61,2 113,9 400

Interpretación del IE .
El trimestre con mayor efecto estacional positivo es el Segundo Trimestre, cuyas ventas son superiores
en alrededor del 29,9% a las del trimestre normal. Por el contrario, las ventas del Tercer Trimestre son
apenas el 61,2% de las ventas del trimestre normal.

Una empresa puede tomar las variaciones en consideración para planificar su programa de trabajo y
realizar el pronóstico de ventas.

6)Estamos en condiciones de calcular los VALORES DESESTACIONALIZADOS DE LA SERIE DE


TIEMPO, que denominaremos Z(t)

Determinación de la Serie de Tiempo Desestacionalizada

Utilidad: Los datos desestacionalizados o denominados datos con ajuste estacional son pertinentes cuando:
Se desea comparar datos de diferentes subperiodos para determinar si ha tenido lugar un
incremento o decremento en relación con las expectativas estacionales.

Calculamos el Valor Desestacionalizado, que denominamos Z(t) aplicando el Indice de estacionalidad


hallado a los valores originales de la serie. ¿de qué forma?

. 100

Ej.
16
. 100 16,8
95,10

150
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Y(t) I.E. Y(t)


Valores Índice de Valores
Originales Estacionalidad Desestacionalizados
16 95,1 16,8
21 129,9 16,2
9 61,2 14,7
18 113,9 15,8
15 95,1 15,8
20 129,9 15,4
10 61,2 16,3
18 113,9 15,8
17 95,1 17,9
24 129,9 18,5
13 61,2 21,3
22 113,9 19,3
17 95,1 17,9
25 129,9 19,2
11 61,2 18,0
21 113,9 18,4
18 95,1 18,9
26 129,9 20,0
14 61,2 22,9
25 113,9 22,0

II – DESARROLLO DE LA LÍNEA DE TENDENCIA


Para ello usamos el método de mínimos cuadrados y codificamos la variable temporal para abreviar el
tiempo traducido asignando la media de 0 al valor en la mitad de los datos.
Si la serie puede ser representada por una tendencia lineal, las ecuaciones para las líneas de tendencia son
las siguientes ecuaciones normales: ∑ . .∑
. .
En donde: los valores del intercepto –b- y de la pendiente de la recta –m- serán

( y ).( x )  ( x. y ).( x)
2 N .( x. y )  ( x).( y )
b (o )  b(1) 
N .( x )  ( x) 2
2
N .( x )  ( x) 2
2

La línea de tendencia, en términos estadísticos parece similar a la línea de regresión. PERO, no lo es.
 La variable dependiente Y no es una V.A.==> Es Una serie de valores históricos.
 Sólo puede haber un valor histórico (no una distribución de valores) para un periodo dado
 Es probable que los valores asociados con periodos contiguos sean dependientes y no
independientes.
 De todas formas el método de mínimos cuadrados es una base adecuada para la determinación de
la T(t)

151
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Tendencia
x V.O.DESEST xy x2 y2 X Y desestacionalizada
1 -19 16,8 -319,8 361 283,30 -19 16,831462 15,04138
2 -17 16,2 -274,8 289 261,37 -17 16,167051 15,35874
3 -15 14,7 -220,7 225 216,46 -15 14,712674 15,6761
4 -13 15,8 -205,5 169 249,86 -13 15,806894 15,99346
5 -11 15,8 -173,6 121 248,99 -11 15,779496 16,31082
6 -9 15,4 -138,6 81 237,07 -9 15,397192 16,62818
7 -7 16,3 -114,4 49 267,24 -7 16,347416 16,94554
8 -5 15,8 -79,0 25 249,86 -5 15,806894 17,2629
9 -3 17,9 -53,7 9 319,82 -3 17,883429 17,58026
10 -1 18,5 -18,5 1 341,39 -1 18,47663 17,89762
11 1 21,3 21,3 1 451,63 1 21,251641 18,21498
12 3 19,3 58,0 9 373,24
3 19,319537 18,53233
13 5 17,9 89,4 25 319,82
5 17,883429 18,84969
14 7 19,2 134,7 49 370,43
7 19,24649 19,16705
15 9 18,0 161,8 81 323,36
16 11 18,4 202,9 121 340,08 9 17,982157 19,48441
17 13 18,9 246,2 169 358,55 11 18,441376 19,80177
18 15 20,0 300,2 225 400,65 13 18,935395 20,11913
19 17 22,9 389,1 289 523,79 15 20,016349 20,43649
20 19 22,0 417,1 361 481,98 17 22,886382 20,75385
-------------- -------------- -------------- 19 21,95402 21,07121
- --------------- - - ---------------
∑ 0 361,12591 422,0878 2660 6618,88948 La ecuación estimada de tendencia
m 0 18,056296 21,10439 133 330,944474 
y  18,0563  0,1587. X
Luego, armamos la Tendencia desestacionalizada haciendo el cociente entre los valores de las ventas
desestacionalizadas y los valores de la ecuación estimada de tendencia.
Podemos determinar también, el Porcentaje de Tendencia desestacionalizada si multiplicamos por 100 el
cociente entre los valores de las ventas desestacionalizadas y los valores de la ecuación estimada de
tendencia.

30 Observemos que
representamos los valores
25 V.O. hallados en cada uno de los
pasos:
20 - Y(t) : Valores Originales
PMC
- PMC: Promedios Móviles
15
Centrados
Val. Desestac
10 - Z(t): Valores
Desestacionalizados
5 b(o)+b(1).x - Tendencia: b(o)+ b(1) . X

0
0 5 10 15 20 25

Por último el cálculo del Residuo restando 100 al valor de la tendencia desestacionalizada. Ver cuadro
siguiente. Posteriormente, el gráfico nos queda así.

Es lo mismo que calcular el Residuo Cíclico Relativo haciendo La diferencia entre el valor
desestacionalizado de la serie y la tendencia desestacionalizada. Luego esa diferencia la dividimos por la
tendencia desestacionalizada y multiplicamos por 100.

152
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro


∗ 100
, ,
Ej. ∗ 100
,

Veamos:
=T(t)
Y(t) Tendencia Residuo
X desestacionalizada desestacionalizada cíclico relativo
-19 16,8315 15,0414 11,9010
-17 16,1671 15,3587 5,2629
-15 14,7127 15,6761 -6,1458
-13 15,8069 15,9935 -1,1665
-11 15,7795 16,3108 -3,2575
-9 15,3972 16,6282 -7,4030
-7 16,3474 16,9455 -3,5297
-5 15,8069 17,2629 -8,4343
-3 17,8834 17,5803 1,7245
-1 18,4766 17,8976 3,2351
1 21,2516 18,2150 16,6713
3 19,3195 18,5323 4,2477
5 17,8834 18,8497 -5,1262
7 19,2465 19,1671 0,4144
9 17,9822 19,4844 -7,7100
11 18,4414 19,8018 -6,8701
13 18,9354 20,1191 -5,8836
15 20,0163 20,4365 -2,0558
17 22,8864 20,7538 10,2754
19 21,9540 21,0712 4,1897

CONCLUSION: Expresa Levin, Rubin en su texto “SUGERENCIA: La manera correcta de proceder al analizar
todas las componentes de una serie de tiempo es:
 1° Desestacionalizar
 2° Encontrar la línea de tendencia
 3° Calcular la variación alrededor de la línea de tendencia
 4° Identificar la variación irregular en lo que queda.

RESOLVER: Que comentarios le merece la interpretación del siguiente gráfico.

153
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

1)EJERCICIO DE APLICACIÓN DE SERIES DE TIEMPO 
 
 
Dada la siguiente serie “SALIDA DE TURISTAS” extraido de un Cuadro titulado  “Turismo emisivo. Salida de turistas, 
 estadía promedio y gasto gasto diario diario promedio por tipo de alojamiento utilizado    
Aeropuerto Internacional de Ezeiza y Aeroparque Jorge Newbery. Años 2010‐2015, por trimestre” 
  Que fuera extraido de http://www.indec.mecon.ar/nivel4_default.asp?id_tema_1=3&id_tema_2=13&id_tema_3=55  
Se pide:
a) Grafique la serie de tiempo original.
b) Identifique los componentes que ve presentes en la serie de tiempo.
Desagreguelos en la serie.
c) ¿Hay una tendencia creciente o decreciente en el turismo?
d) Pronostique para el primer trimestre 2015 la tendencia y compárela con
los datos reales. Observe si es necesario corregir el dato real para su
comparación.

154
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE SERIES CRONOLOGICAS

Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero
1. El análisis de series de tiempo se utiliza para detectar patrones de cambio en información estadística
durante intervalos regulares de tiempo.
V:__F:__
2. Las tendencias seculares representan la dirección a largo plazo de una serie de tiempo.
V:__F:__

3. El residuo cíclico relativo puede calcularse para un elemento de una serie de tiempo restando 10 al
porcentaje de tendencia de ese elemento.
V:__F:__
4. Una vez calculados los índices estacionales de una serie de tiempo, la serie puede ser desestacionalizada
de modo que solamente quede la componente de tendencia.
V:__F:__
5. El porcentaje de tendencia no debe utilizarse para pronosticar variaciones cíclicas futuras.
V:__F:__
6. De los cuatro tipos de variación, la cíclica es la más difícil de pronosticar.
V:__F:__
7. La variación estacional es una variación repetitiva y predecible alrededor de la línea de tendencia que se
da en un periodo de un año.
V:__F:__
8. Los índices estacionales ajustados deben sumar siempre 400. V:__F:__
9. Una serie de tiempo puede ser desestacionalizada si los valores originales se lo multiplican por los PMC
y el valor 100 V:__F:__
10. Una serie de tiempo de datos anuales puede contener los siguientes componentes: a) Tendencia secular.
b) Fluctuación cíclica y c) Variación estacional. V:__F:__
11. El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil V:__F:__

Integre los espacios en blanco

1 . Al dividir cada valor real de una serie de tiempo por el valor de tendencia correspondiente y multiplicar
el resultado por 100, obtenemos el _______________.
2. El movimiento repetitivo y predecible alrededor de la línea de tendencia que se da en un año o menos es
la variación_______________ .
3. La variación _________________de una serie de tiempo está caracterizada por un movimiento
impredecible y aleatorio que por lo general ocurre durante intervalos cortos.
4. La variación __________________es la componente de una serie de tiempo que oscila alrededor de la
línea de tendencia en periodos mayores que un año.
5. El uso de índices estacionales para eliminar los efectos de la estacionalidad de una serie de tiempo se
conoce como _________ la serie de tiempo.
6. El primer paso para calcular los índices estacionales de los datos de una serie de tiempo consiste en
calcular el ______________________.
7. El resultado de descartar los valores más alto y más bajo antes de promediar se conoce como
___________________.

155
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

ETICA, ESTADÍSTICA Y TECNOLOGÍA


Fuente de la información extractada de la pag. www.econ.ub.ar . Act. Juan Ramón Garnica Hervás
disponible en http://www.econ.uba.ar/www/departamentos/matematica/plan97/est_adminis/garnica/index.html
El papel de los estadísticos
Aunque  a  menudo  se  consideran  un  tema  árido,  las  estadísticas  son  ni  más  ni  menos  que  la  fuente  de  información  cifrada 
necesaria para los análisis, estudios e incluso el ensayo de las teorías económicas. Por curiosidad o por necesidad, las estadísticas 
están a menudo en el centro mismo de los debates y las consiguientes decisiones. Así, el estadístico cumple una misión a la vez 
ambiciosa y apasionante: hacer el censo de poblaciones y evaluar las condiciones de vida, calcular el número de empresas y medir 
sus actividades, observar y cuantificar los flujos monetario, de bienes y servicios, etc. 
  
Su tarea consiste también en explicar y desmistificar las cifras, completándolas con lo que los especialistas denominan metadatos 
con la finalidad de garantizar una utilización correcta de los datos y evitar interpretaciones erróneas de las estadísticas. 
  
Las  estadísticas  son  fiables  y  se  convierten  en  un  verdadero  instrumento  de  la  democracia  cuando  son  elaboradas  por 
profesionales que utilizan métodos científicos reconocidos sin ninguna presión. En consecuencia, es de primordial importancia 
que  el  marco  jurídico  que  rige  las  actividades  estadísticas  dentro  de un país  sea  favorable  a  la  aplicación  de  los  Principios 
fundamentales de  las estadísticas oficiales que la Comisión de Estadística de las Naciones Unidas adoptó durante el período de 
sesiones extraordinario especial que se celebró del 11 al 15 de abril de 1994. 
  
Los objetivos de desarrollo y las estadísticas 
  
Los  ocho  objetivos  de  desarrollo  del  Milenio  fijados  en la Declaración del  Milenio de  septiembre  de  2000  por  la  comunidad 
internacional abarcan desde la reducción de la pobreza extrema a la mitad  hasta el logro de la enseñanza primaria universal, 
pasando por la detención de la propagación del VIH/SIDA para el año 2015. 
  
Se han fijado también 48 indicadores que permitirán medir los progresos realizados. Tras cada indicador hay estadísticos que a 
nivel  local,  nacional  e  internacional,  se  ocupan  de  obtener  todos  los  datos  necesarios  para  realizar  el  cálculo.  Cada  uno 
desempeña  su  papel,  desde  la  definición  de  conceptos  e  instrumentos  de  medición  del  desarrollo,  la  programación  de  las 
aplicaciones informáticas de cálculo y la difusión de los indicadores, hasta la compilación y armonización de las estadísticas. La 
UNCTAD, por ejemplo, se ocupa de los indicadores de la pobreza y el acceso a los mercados. 
  
Se admite en general que las políticas económicas, demográficas y sociales se elaboran sobre la base de estadísticas fiables y que 
el  seguimiento  de  su  aplicación  implica  el  cálculo  de  indicadores.  Estos  datos  e  indicadores  se  usan  para  diversos  fines.  Por 
ejemplo, en el marco de la contabilidad nacional y de la balanza de pagos, los estadísticos se esfuerzan para presentar los datos 
de  manera  coherente,  aunque  a menudo  , el  lector  sólo  retiene  la  parte  visible  que  se  limita  a  cifras  tales  como  el  Producto 
Nacional Bruto (PNB). Por el contrario, también se calculan indicadores claves sobre los flujos financieros, la deuda, o la relación 
de intercambio con el fin de evaluar de manera transparente los resultados de los países. 
  
El papel de la comunidad internacional 
  
Las  organizaciones  internacionales  retoman  las  actividades  nacionales  al  reunir  en  sus  bases  de  datos  las  estadísticas 
proporcionadas por los países. Ofrecen a menudo el espacio de concertación necesario para la armonización de los conceptos y 
métodos sin el cual carecen de sentido la comparación y agregación de datos. 
  
Su papel consiste también en estimar los datos que faltan y calcular los indicadores derivados. El resultado de este trabajo se 
comunica a las administraciones públicas nacionales, los encargados de formular políticas, los universitarios y los investigadores 
gracias a las publicaciones y anuarios tradicionales que, cada vez con mayor frecuencia permiten difundir por vía electrónica las 
estadísticas en CD‐ROM o en Internet. 
  
Como la armonización de datos es un objetivo de los estadísticos en las organizaciones internacionales, la coordinación de sus 
actividades es ineludible. En efecto, permite evitar que los países comuniquen estadísticas similares a diferentes agencias, pero 
es también la clave del éxito de las actividades del sistema estadístico internacional destinadas a crear y reforzar las capacidades 
estadísticas de los países en desarrollo o en transición. 
  
En particular, es primordial que la oferta de cooperación técnica sirva en primer lugar para cumplir con los objetivos prioritarios 
de las estrategias nacionales elaboradas con mucha atención. 
  
La UNCTAD interviene en reuniones de formación organizadas por la División de Estadística de las Naciones Unidas en los países 
en desarrollo para mejorar las estadísticas sobre el comercio internacional. En ellas los estadísticos se reúnen con agentes de 
aduanas  y  pueden  conocer  mejor  las  repercusiones  estadísticas  que  puede  tener  SYDONIA,  aplicación  informática  concebida 
inicialmente por la UNCTAD para automatizar las operaciones aduaneras. 
 La comunidad de los estadísticos que trabajan en las organizaciones internacionales cuenta con medios de coordinación como 
el Comité de Coordinación de las Actividades Estadísticas, que adoptó , en septiembre de 2005, una serie de principios que rigen 

156
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

las  actividades  estadísticas  internacionales. La  UNCTAD,  al  igual  que  la  mayoría  de  los  organismos,  se  ha  comprometido  a 
aplicarlos. 
                                                                                Declaración de Ética Profesional          del Instituto Internacional de Estadística. 
 
 
 
 
ÉTICA EN ESTADÍSTICA:
RESPONSABILIDAD DE LAS UNIVERSIDADES EN LA FORMACIÓN DEL PROFESIONAL
María Teresa Blaconá *Facultad de Ciencias Económicas y Estadística de Rosario ‐ Universidad Nacional de Rosario 
Extraido de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99. Consulta 20 de mayo de 2014 
 
 ETICA: 
Expresa  Blaconá  …”Se  puede  definir  la  noción  de  ética  como  un  conjunto  de  reglas  compiladas  en  una  guía  o  estándares 
profesionales que pueden ser importantes en la educación y entrenamiento de los estadísticos.  Por ejemplo, el objetivo de la Guía 
Ética  de  la American  Statistical  Association  (1999) expresa:  el  propósito  de  la  guía  ética  de  la  ASA  es  asegurar  que  el  trabajo 
estadístico sea ético y efectivo cuando se realizan trabajos del medio ambiente y asistir a los estudiantes a aprender a desarrollar 
el  trabajo  estadístico  razonablemente.  Pero  por  otro  lado,  el  desempeño  ético  de  un  profesional  estadístico  no  puede  estar 
solamente restringido a conocer dichas guías o estándares. 
Es importante tener en cuenta lo enunciado por la Comisión de Estadística de la Asamblea General de las Naciones Unidas, cuando 
decidió celebrar el Día Mundial de la Estadística (World Statistics Day, WSD), el día 20 de octubre de 2010, en reconocimiento de 
los servicios prestados por el sistema estadístico global a nivel nacional e internacional. Al respecto definieron como palabras 
claves: Servicio – Profesionalismo – Integridad. 
En  una  democracia  es  altamente  reconocido  que  el  libre  acceso  a  la  información  estadística  es  un  derecho  que  tienen  los 
ciudadanos para obtener información correcta. Para que esto se pueda cumplir los organismos de Estadísticas Oficiales, enfrentan 
desafíos  éticos  los  cuales  se  pueden  enunciar  brevemente  como:  a)  utilizar  una  metodología  adecuada;  b)  proteger  la 
confidencialidad y c) mantener la integridad de las Agencias Estadísticas en el Sistema Estadístico Nacional. 
No obstante, que los estudiantes en la Universidad reciban una buena formación en metodología estadística, ¿alcanzará para 
permitirles que puedan resolver desafíos éticos que surgen en el desempeño de la profesión?. 
En este artículo en la sección 2 se desarrollan algunas premisas sobre las condiciones necesarias para desempañarse éticamente 
en  estadística,  en  la  sección  3  se  enuncian  otros  aspectos  que  se  deben  considerar  para  desarrollar  una  actividad  ética  en 
estadística y en la sección 4 se presentan las consideraciones finales. 
 
2. Condiciones necesarias para desempañarse éticamente en estadística 
En  primer  lugar  se  puede  considerar  lo  expresado  por Seltzer  (2005) sobre  los  desafíos  éticos  que  surgen  en  las  Estadística 
Oficiales, las cuales se pueden expresar como: a) utilizar una metodología adecuada; b) proteger la confidencialidad y c) defender 
la integridad de las Agencias Estadísticas en el Sistema Estadístico Nacional. 
Sin duda estas premisas son necesarias para el desempeño ético de los profesionales estadísticos. Las preguntas que caben son: 
1) ¿estas premisas son suficientes? y 2) ¿cómo contribuye la Universidad para que los profesionales posean el mayor número de 
herramientas  para  enfrentar  dicho  desafío?.  Se  enunciaran  brevemente  algunas  respuestas  a  estas  preguntas,  para  ello  se 
comienza con las condiciones necesarias expresadas anteriormente. 
a.‐ Utilizar una metodología adecuada. Si bien como dice Seltzer (2005), la ciencia correcta no es necesariamente ciencia ética, 
el no utilizar la metodología adecuada presenta serios problemas éticos. Por ello para el cumplimiento de este ítems es primordial 
la responsabilidad de la formación profesional universitaria. 
Por  un  lado,  desde  la  función  docente  se  deben  impartir  conocimientos  sobre  metodologías  correctas,  actualizadas  y 
especialmente  brindar  herramientas  para  adaptar  las  metodologías  a  nuevos  problemas  que  surjan.  Desde  la  función  de 
investigación,  los  docentes  deben  estar  abiertos  y  alertas  para  encarar  estudios  que  puedan  contribuir  a  nuevos  desarrollos 
metodológicos que ayuden a resolver problemas que se presentan en las agencias estadísticas u otras áreas del conocimiento. 
Por último, desde la función de transferencia se deben dar a conocer los resultados encontrados en sus investigaciones, sean estos 
positivos o negativos e interactuar con los directivos y personal de las agencias estadísticas, como así también con profesionales 
de otras áreas. 
Se puede agregar, que no necesariamente un procedimiento errado es un indicador de falta de ética, pero el profesional Estadístico 
debe tener la capacidad para corregirlo cuando se advierte un error. La educación debe asegurar las ventajas e integridad de los 
métodos a utilizar. 
b.‐ Protección de la confidencialidad. Generalmente se hace mucho hincapié en la confidencialidad a nivel del micro dato, que es 
además lo que protege la ley, no es tan claro cómo se maneja la confidencialidad de datos agregados (tabulados para pequeñas 
unidades geográficas, grupos étnicos, etc.). Se puede mencionar el ejemplo dado por varios autores sobre la reubicación en 1942 
de la población estadounidense de origen japonés, en base a información surgida de la Oficina de Censos de EEUU. Se violó la 
confianza pública, porque se permitió que los datos fueran usados en detrimento de la comunidad japonesa, es decir se violó la 
promesa de que los registros no se utilizarían contra los individuos. Si bien la ley protege los datos individuales, esto no implica 
que  los  datos  se  puedan  utilizar  con  perjuicio  a  pequeños  grupos.Todavía  no  se  ha  delimitado  claramente  en  los  estándares 
profesionales  y  éticos  de  las  agencias  estadísticas,  ni  en  la  comunidad  estadística,  las  responsabilidades  u  obligaciones  de 
perjuicios anticipados. De esto surge el dilema, si en estadística a todas las acciones legales se las puede considerar éticas.  Una 

157
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

pregunta para los Estadísticos, es si la sociedad y la comunidad estadística entiende la ley y las responsabilidades que de ella 
surgen,  así  como  los  estándares  profesionales  y  éticos  que  de  ella  se  desprenden  y  en  el  mismo  contexto   si  la  comunidad 
estadística tiene alguna responsabilidad u obligación de “anticipar los perjuicios”. Este es un debate abierto, que las Universidades 
deberían instalar en su ámbito 
c.‐  Integridad  de  las  agencias  estadísticas  en  el  sistema  estadístico  nacional.Como  menciona Seltzer  (2005),  un  importante 
tópico del Fundamental Principles of Oficial Statistics, es el mantener e incrementar la integridad del sistema estadístico nacional, 
debido  a  que  pueden  surgir  amenazas  a  la  integridad  de  muchas  formas,  incluyendo  entre  otras,  conceptos  de  manipulación 
política arbitraria, definiciones e información de los datos muy atrasada, informando los datos reales manipulados, usando la 
agencia para  análisis políticos y politizando el personal técnico de la agencia. 
Por otro lado, como expresa Habermann (2005), en un sentido amplio, puede existir tensión entre la agencia estadística y el uso 
del dato estadístico (especialmente en el contexto de la aplicación de la ley y otras actividades de defensa o inteligencia) y también 
con respecto a la autonomía de la agencia estadística y el contexto de la agencia dentro del gobierno. De acuerdo al mismo autor 
es importante saber que esta tensión puede no resolverse. Las agencias del gobierno, como pequeñas organizaciones dentro de 
una estructura de gobierno mucho más amplia, no están bien equipadas para ejercitar autoridad moral. 
En este sentido la Universidad debería colaborar cuando se plantea alguna tensión, especialmente brindando una opinión externa, 
basada en el conocimiento académico e incluyendo el tópico ético. 
3. Otros aspectos que se deben considerar para desarrollar una actividad ética en estadística 
Hasta aquí se han enunciado las condiciones necesarias para el desarrollo ético de un trabajo estadístico, pero en algunos casos 
dichas condiciones no resultan ser suficientes. 
Para las Naciones Unidas el primero de los principios fundamentales de las estadísticas oficiales es proporcionar un elemento 
indispensable en el sistema de información de una sociedad democrática, al servicio del gobierno, la economía y el público con 
datos sobre la situación económica, demográfica, social y ambiental. Con este fin, las estadísticas oficiales que encuentran las 
pruebas  de  la  utilidad  práctica  deben  ser  compiladas  y  puestas  a  disposición  de  manera  imparcial,  por  agencias  estadísticas 
oficiales, para honrar el derecho de los ciudadanos a la información pública (United Nations Statistical Commission, 1994). 
Por otro lado, Habermann (2005) agrega al respecto que, por supuesto, para que el debate tenga lugar, la sociedad debe estar 
informada y señala que la agencia Estadística debería abrirse y ser transparente acerca de la solicitud de los datos que se solicitan 
y que los datos requeridos sean informados oportunamente para que las respuestas sean ser información pública. 
No es fácil resolver tensiones que afectan a las agencias estadísticas. Entre las estrategias de prevención para reducir probables 
problemas  éticos, Seltzer  (2001) menciona:  Incluir  educación  y  tratamientos  sobre  ética  en  la  universidad  y  programas  de 
entrenamiento de las agencias y desarrollar planes de la agencia específica para discusiones externas a la agencia sobre temas 
éticos y mecanismos específicos de la agencia para responder a lo que se refiere a la ética. Es decir, considera la mirada académica 
externa uno de los pilares para resolver problemas éticos en las agencias estadísticas. 
La mayoría de lo que se ha expuesto con respecto a ética en  Estadística en las agencias oficiales, tiene vigencia para trabajos 
profesionales y/o académicos de cualquier área, como por ejemplo, biología, medio ambiente, economía, epidemiología, etc. 
En este tópico las Universidades pueden contribuir a que la sociedad esté informada y tenga una mirada externa de especialistas 
en el tema, a través de tareas de extensión y divulgación de opiniones. 
 
4. Consideraciones finales 
Por lo expresado se podría concluir que las Universidades deben realizar esfuerzos para formar profesionales estadísticos que 
puedan enfrentar nuevos temas en nuevos contextos. 
Como dice Ostapski et al. (2001), los estadísticos establecen estándares profesionales por su educación continua para asegurar 
las  ventajas  e  integridad  de  su metier.  El  título  significa  prometer  valores  profesionales  para  cultivar  un  gran  sentido  de 
responsabilidad (Imrey,  1994) y  generalmente  acrecienta  el  profesionalismo  para  distinguir  al  estadístico  bien  entrenado  de 
aquellos que poseen menos calificación o habilidades. El título no resuelve,  por si mismo, cómo cualquier individuo responderá 
cuando se enfrente a presiones conflictivas, para arribar a una de las diferentes determinaciones críticas. El título por si mismo no 
garantiza que el individuo reflejará las implicaciones éticas de una tarea estadística, cuando realice una acción. 
No es fácil resolver tensiones que afectan el comportamiento ético en  Estadística. Entre las estrategias de prevención para reducir 
probables problemas éticos, se pueden mencionar: incluir educación y tratamientos sobre ética en la Universidad y programas de 
entrenamiento específicos para discusiones sobre temas éticos y mecanismos para responder a los mismos. 
Una pregunta relacionada es de qué manera se puede investigar la mala conducta ética. Existen algunas profesiones, como por 
ejemplo: abogados, médicos, contadores, etc. que tienen desarrollados mecanismos para investigar violaciones éticas. Mientras, 
por  contraste,  muchas  organizaciones  profesionales  y  científicas  en  las  ciencias  sociales,  cuando  se  estudia  una  alegación 
específica  de  mala  conducta  ética,  tiene  procedimientos  de  investigación  mínima.  Por  otro  lado,  tampoco  se  controla  que  el 
trabajo estadístico sea realmente realizado por profesionales estadísticos. 
Una  buena  preparación  universitaria  colaborará  a  que  el  profesional  estadístico  tenga  herramientas  necesarias  con  el  fin  de 
decidir de acuerdo a sus principios, el camino más acertado para resolver conflictos éticos. En su formación se debe enfatizar la 
responsabilidad de que deben actuar éticamente, especialmente porque son profesionales que manejan información sensible y 
que diseñan métodos y experimentos donde se involucran seres humanos, animales, medio ambiente, etc.” 
 
Material extraido de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99. Consulta 20 de mayo de 
2014. María Teresa Blaconá , “ÉTICA EN ESTADÍSTICA: RESPONSABILIDAD DE LAS UNIVERSIDADES EN LA FORMACIÓN DEL 
PROFESIONAL” *Facultad de Ciencias Económicas y Estadística de Rosario ‐ Universidad Nacional de Rosario 

158
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

REFERENCIAS BIBLIOGRÁFICAS

LOS EJERCICIOS ESCOGIDOS DE LA BIBLIOGRAFÍA CITADA HAN SIDO


REPRODUCIDOS EN LA PRESENTE GUÍA

 Anderson, Sweeney&Williams (2008). “Estadística para Administración y Economía”10ª Ed.


CENGAGE. México.
 Berenson, M.L y Levine D. (1996) Estadística Básica en Administración, conceptos y aplicaciones.
Sexta Edición. Pearson. Prentice Hall. México.
 Canavos, G. (1987)”Probabilidad y Estadística aplicada y métodos” McGraw Hill. México.
 Capriglione, Cayetano (2003) “Estadística” Tomo I y II. 3C Editores y Crauss “Tablas Estadisticas”
 Fernandez Loureiro de Pérez, Emma (2011) “Estadística no paramétrica” a modo de introducción.
2da. Edición. Colección el Número de Oro.EC. Buenos Aires.
 Freund, J; Miller, I & Miller, M (2000): Estadística matemática con aplicaciones. 6° Ed. Pearson
Educación. Prentice Hall.
 Johnson, Kubby “Estadistica Elemental”
 Harnett D, D y Murphy (1987) “Introducción al análisis estadístico”. Addison Wesley
Iberoamericana.
 Hildebrand, D y Ott, L (1997): “Estadística aplicada a la administración y a la economía”. Addison-
Wesley Iberoamericana.
 Johnson Kuby (2008): “Estadística elemental: lo esencial” 10° Ed.
 Kazmier, Leonard J. (1998) “Estadística aplicada a la Administración y a la Economía”. Mc. Graw
Hill.
 Kurincic, G (2001) “Estadística. Probabilidades y Distribuciones”. EC. Buenos Aires.
 Kurincic, G “Estadística. Herramientas de Inferencia” (2001) “. EC. Buenos Aires.
 Kurincic, G “Notas de Cátedra del curso de Estadística para Administradores” Cátedra Junior.
Buenos Aires.
 Landro, A. (1999): “Acerca de la probabilidad”. Editorial Economizarte. Buenos Aires.
 Levine, D; Krehbiel, T & Berenson, M (2006): Estadística para administración. 4°Edic. Pearson
Educación. Cap. 4 “Probabilidad básica”
 Levin, Rubin, Balderas, Del Valle & Gómez: (2004) “Estadística para Administración y
Economía”. Pearson Educación. México – utilizado para los AUTODIAGNÓSTICOS
 Lind, Marchal, Mason (2004). Estadística para Administración y Economía. Alfaomega.Colombia.
Cap.5 “Revisión de algunos conceptos de probabilidad”
 Mendenhall, W, Beaver, R & Beaver, B (2009): “Introducción a la Probabilidad y Estadística” 12°
Ed. CENGAGE. México. Cap. 4 “Probabilidad y Distribuciones de Probabilidad”
 Mendenhall, W; Reinmuth, J. (1996): Estadística para Administración y Economía. Newbold, P,
Carlson W & Thorne B (2008) “Estadística para Administración y Economía” 6°Ed. Pearson.
Prentice Hall.
 Pindyck, R & Rubinfeld (2001) “Econometría. Modelos y pronósticos” 4° Ed. Mc. Graw Hill.
México.
 Sampieri, Collado y Lucio Metodologia de la investigación. Mc. Graw Hill
 Toranzos, Fausto I “Teoría Estadística y Aplicaciones”.
 Walpole, R & Myers, R (1998) “Probabilidad y Estadística. McGraw-Hill.México.
 Wonnacott, T y Wonnacott, R (1979) “Introducción a la estadística. LIMUSA.México.

159
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

ALFABETO GRIEGO
letra Nombre Sonido AFI Valor HTML (1)
Α α Alfa [a] [aː] 1 &alpha;
Β β Beta [b] 2 &beta;
Γγ Gamma [g] siempre 3 &gamma;
Δδ Delta [d] 4 &delta;
Εε Épsilon [e] 5 &epsilon;
Ζζ Dseta [zd] o [dz] o [z] 7 &zeta;
Η η Eta [ɛː] 8 &eta;
Θ θ Zeta o Theta [tʰ] 9 &theta;
Ιι Iota [i] [iː] 10 &iota;
Κ κ Kappa, Cappa [k] 20 &kappa;
Λ λ Lambda [l] 30 &lambda;
Μ μ Mi [m] 40 &mu;
Ν ν Ni [n] 50 &nu;
Ξξ Xi [ks] 60 &xi;
Ο ο Ómicron [o] 70
Π π Pi [p] 80 &pi;
Ρρ Ro [ɾ] [r]; [ɾʰ], [rʰ] 100 &rho;
Σσ Sigma [s] 200 &sigma;
Ττ Tau [t] 300 &tau;
Υ υ Ípsilon [u] [uː] > [y] [yː] 400 &upsilon;
Φ φ Fi [pʰ] 500 &phi;

Χ χ Ji [kʰ] 600 &chi;


Ψ ψ Psi [ps] 700 &psi;
Ω ω Omega [ɔː] 800 &omega;

160
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Esquema A1 de norma IRAM 34 552 26 de Octubre de 1982

TERMINOLOGÍA ESTADÍSTICA 
 
Conceptos generales 
 
O. NORMAS POR CONSULTAR 
 
 
      IRAM              TEMA 
 
  14 Y 15          Definiciones referentes a  control de la calidad 
 
 
1. OBJETO 
 
1.1  Establecer las definiciones de los términos de uso más frecuente que se utilizan en estadística. Se excluyen de esta norma los 
términos referentes al control estadístico de calidad, por hallarse definidos en las normas IRAM 14 e IRAM 15. 
 
2. DEFINICIONES 
2.1  CONCEPTOS INICIALES 
 
2.1.1  elemento Objeto real, convencional o ideal de carácter singular, sobre el cual pueden efectuarse observaciones. 
NOTA: Denominado también “unidad” o “unidad estadística”. 
 
2.1.2  población Conjunto de elementos que satisfacen una definición común. 
NOTA: Denominada también “universo” 
 
2.1.3  Tamaño de la población Cantidad de elementos que la componen. 
 
2.1.4    Datos  o  datos  estadísticos  Conjunto  de  valores  observados  que  pueden  ser  comparados,  analizados,  interpretados  o 
relacionados. 
NOTA: Denominado también “información estadística”. 
 
2.1.5  Característica Propiedad que permite diferenciar los elementos de una población. 
 
2.1.6  Variable Característica cuantitativa. 
 
2.1.7  Variable contínua Característica cuantitativa que puede tomar cualquier valor dentro de su dominio. 
 
2.1.8  Variable discreta Característica cuantitativa que solamente puede tomar determinados valores de su dominio. 
 
2.1.9  Atributo Característica cualitativa. 
 
2.1.10  Valor observado Cantidad o calidad que tiene una característica de un elemento determinado, en el momento que es sujeto 
de observación. 
NOTA: Denominado también “observación”. 
 
2.2  CENSOS Y ENCUESTAS 
 
2.2.1   Empadronamiento Operativo  para  identificar  y listar  todos  y  cada  uno  de los  elementos de  una  población  // Entrevista 
mediante la cual se obtiene y se registra información sobre cada uno de los elementos de la población. 
2.2.2  Encuesta Método para recolectar información estadística de una población, contactando cada uno de los elementos de la 
misma o a una parte de ella, con el objetivo de deducir características de conjunto relativas a esta población, en un momento dada 
o relativas a su evolución en el transcurso del tiempo. 
 

161
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

2.2.3  Censo Encuesta exhaustiva de una población realizada en un momento determinado y con respecto a característica especí‐
ficas. 
 
2.2.4  Encuesta por muestreo Encuesta realizada a una muestra de la población. 
 
2.2.5  Encuesta piloto Encuesta, generalmente de tamaño pequeño, llevada a cabo con anterioridad a la encuesta principal, para 
lograr información tendiente a aumentar la eficiencia de la encuesta principal. 
 
2.2.6  Censo por muestreo Operativo censal en el que a todos los elementos  de la población se los interroga respecto de las 
características básicas y a solo una muestra de ellos, sobre características no básicas. 
 
2.2.7 Cuestionario Documento que contiene una sucesión de preguntas a las que deberá responder el encuestado y que ha sido 
planeado para obtener y registrar información sobre una o varias características. 
NOTA: Denominado también “cédula” o “formulario”. 
 
2.2.8  Tabla Forma de presentación de datos estadísticos arreglados sistemáticamente en columna o filas. 
NOTA: También denominada “cuadro” o “tabulado”. 
 
2.2.9    Plan  de  tabulación    Conjunto  de  tablas  por  medio  del  cual  se  prevé  ordenar  la  información  estadística  y  presentar  los 
resultados provenientes de un operativo de recolección de información. 
 
2.3.  DISTRIBUCIÓN DE FRECUENCIAS 
2.3.1  Clase  Cada una de las subdivisiones e intervalos en que se ha dividido el dominio de una variable. 
NOTA: Denomina también “intervalo de clase”. 
 
2.3.2  Limites de clase Valores que define los extremos de una clase. 
 
2.3.3  Marca de clase Punto medio o centro de una clase. 
 
2.3.4  Frecuencia absoluta Cantidad de veces que se presentan un determinado valor observado o cantidad de valores observados 
incluidos en una clase. 
NOTA: Denominada también “frecuencia”. 
 
2.3.5  Frecuencia relativa Cociente entre la frecuencia absoluta y la cantidad total de valores observados. 
 
2.3.6    Frecuencia  acumulada  Suma  de  las  frecuencias  (absoluta  o  relativas)  para  todos  los  valores  inferiores  o  iguales  a  un 
determinado valor de una característica o al límite superior de una clase. 
 
2.3.7  Distinción de frecuencias Cuadros que presenta en forma ordenada a las clases o a los distintos valores de una variable 
(derivados de valores observados) y sus correspondientes frecuencias. 
 
2.3.8    Histograma  Representación  de  la  distribución  de  frecuencia  absolutas  o  relativas,  de  una  variable  agrupada  en  clases 
mediante un gráfico de superficies en un sistema de coordenadas cartesianas ortogonales. Sobre el eje de abscisas se presentan 
las clases y se levantan sobre cada una de ellas un rectángulo cuya área es igual a la respectiva frecuencia. 
 
2.3.9  Polígono de frecuencias Línea poligonal obtenida en un histograma, uniendo los puntos medios de los lados superiores de 
los  rectángulos.  Los  dos  extremos  del  polígono  pueden  o  no  ser  conectados  con  el  eje  de  la  variable.  Cuando  ello  ocurre,  se 
emplean dos clases hipotéticas con frecuencia cero, colocada cada una de ellas en ambos extremos del histograma. 
 
2.3.10  Gráfico de bastones Representación gráfica de las frecuencias acumuladas de una variable discreta mediante un gráfico de 
puntos, en un sistema de coordenadas cartesianas ortogonales cuya abscisas son valores de una variable y cuyas ordenadas son 
las frecuencias absolutas o relativas. 
NOTA: Denominado también “diagrama breve”. 
 
2.3.11  Polígono de frecuencia acumuladas Representación gráfica de las frecuencias acumuladas de una variable agrupada en 
clases, mediante una línea poligonal obtenida uniendo los puntos que tienen por abscisa los límites superiores de clases y por 
ordenadas las respectivas frecuencias acumuladas. 

162
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

 
2.3.12    Gráfico  acumulativo  de  frecuencias  Representación  gráfica  de  las  frecuencias  acumuladas  de  una  variable  discreta 
mediante segmentos paralelos al eje de abscisas. Cada segmento se extiende entre dos valores consecutivos de la variable, siendo 
las respectivas ordenadas las frecuencias acumuladas correspondientes al valor de variable que es abscisa del punto inicial del 
segmento. 
NOTA: Denominado también “gráfico escalonado”. 
 
2.3.13  Tabla de contingencia simple Cuadro que representa en forma ordenada las categorías de un atributo y sus correspon‐
dientes frecuencias. 
 
2.4  MEDIDAS DE POSICIÓN Y VARIABILIDAD 
 
2.4.1  Media aritmética Suma de los valores disponibles de una variable, dividida por la cantidad de los mismos. 
NOTA: Denominada también “medida” o “promedio aritmético”. 
 
2.4.2  Ponderación Coeficiente numérica que expresa la importancia relativa de cada valor. 
 
 
2.4.3  Media aritmética ponderada Suma de los productos de cada valor disponible de una variable por su ponderación, dividida 
por la suma de las ponderaciones. 
 
2.4.4  Modo Valor o valores de la variable que se repiten la máxima cantidad de veces. 
NOTA: Denominado también “moda”, “valor tipo” o “valor típico” 
 
2.4.5  Mediana Valor que en un conjunto de valores de una variable, ordenadas de acuerdo con su magnitud, supera a no más de 
la mitad de los mismos y es simultáneamente superado por no más de la otra mitad. 
 
2.4.6  Media geométrica Raíz enésima del producto de los n valores disponibles de una variable. 
 
2.4.7  Media armónica Inversa de la medida aritmética de las inversas de los valores disponibles de una variable. 
 
2.4.8  Amplitud Diferencia entre el mayor y el menor de los valores disponibles. 
 
NOTA: Denominada también “rango”, “recorrido” o “intervalo”. 
 
 
2.4.9  Desvío Diferencia entre un valor disponible de una variable y un valor constante. 
 
2.4.10  Desvío con respecto a la media aritmética Desvío cuyo valor constante es la media aritmética de los valores disponibles de 
la variable considerada. 
NOTA: Denominada también “desviación”. 
 
2.4.11  Desvío medio aritmético Promedio aritmético de los módulos de los desvíos con respecto a la media aritmética. 
 
2.4.12  Variancia Promedio aritmético de los módulos de los cuadrados de los desvíos con respecto a la media aritmética. 
NOTA: Denominada también “varianza”. 
2.4.13  Desvío estándar Raíz cuadrada positiva de la variancia 
NOTA: Denominado también “desviación típica”, “desviación normal” o “desviación estándar”. 
 
2.4.14  Coeficiente de variación Cociente entre el desvío estándar y la media aritmética de los valores disponibles de una misma 
variable. 
NOTA: Denominada también “coeficiente de variabilidad” 
   
2.5 SERIES CRONOLÓGICAS 
 
2.5.1  Serie cronológica Conjunto de valores ordenados cronológicamente, provenientes de sucesivas observaciones de un mismo 
fenómeno  que  se  refieren  a  diferentes  períodos  de  tiempo.  En  general  los  intervalos  entre  las  sucesivas  observaciones  son 

163
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

constantes.  Sus  factores  de  variación  o  componentes  se  denominan:  “tendencia”,  “variación  estacional”,  “variación  clínica”  y 
“variación residual”. 
NOTA: Denominada también “serie de tiempo” o “serie temporal”. 
 
2.5.2  Serie económica Serie cronológica en la que se analiza el comportamiento de variables económicas. 
 
2.5.3  Tendencia Componente sistemático o regular, no periódica, de una serie cronológica, que describe la evolución básica del 
movimiento de la serie en un período extenso. Se representa generalmente por medio de alguna función matemática cuya ecua‐
ción describe un movimiento suave a lo largo del tiempo. 
NOTA: Denominada también “tendencia secular”. 
 
2.5.4  Variación estacionales Componentes periódicas de una serie cronológica, cuyas fluctuaciones se repiten en forma regular, 
inscriptas en el marco de cada año y que se reproducen de manera más o menos permanente de un año a otro. 
NOTA: Denominadas también “fluctuaciones estacionales” o “movimientos estacionales”. 
 
2.5.5  Índice de variación estacional Valor relativo que cuantifica la incidencia de la variación estacional en el comportamiento 
periódico de una serie cronológica. 
 
2.5.6  Variaciones cíclicas Componentes periódicas de una serie cronológicas cuyas fluctuaciones se repiten en forma regular con 
períodos mayores a un año y que se reproducen de manera más o menos permanente cada cierta cantidad de años, según el 
período. 
 
2.5.7   Variaciones  residuales  Componentes  no  periódicas  de una  serie  cronológica  cuyas  fluctuaciones se  presentan en  forma 
irregular e imprevisible. Son debidas a factores perturbadores no permanentes. 
NOTA: Denominadas también “variaciones irregulares”. 
 
 
2.6  PROBABILIDAD Y VARIABLES ALEATORIAS 
 
 
2.6.1  Suceso aleatorio Acontecimiento con relación al cual existe incertidumbre acerca de su ocurrencia; es decir que antes de 
realizar el experimento no se lo puede predecir con seguridad completa. 
NOTA: Denominado también “evento aleatorio” o “estocástico”. 
 
2.6.2    Probabilidad  de  un  suceso  aleatorio  Medida  del  grado  de  incertidumbre.  Se  puede  calcular  según  la  ascripción  a  una 
determinada teoría del cálculo de probabilidades, como: 
 
a)  Cociente  entre  en  número  de  casos  favorables  que  corresponden  al  suceso  aleatorio  y  el  número  de  casos  posibles  res‐
pectivos, siempre que estos sean igualmente probables, equiprobables o simétricos (definición clásica de probabilidad); 
 
b)  Límite hacia el cual tiene la frecuencia relativa del suceso aleatorio cuando el número de experimentos crece indefinidamente 
(definición frecuencial, experimental o empirista); 
 
c)  En forma axiomática objetiva o subjetiva. 
 
2.6.3    Sucesos  aleatorio  combinado  Combinación  de  dos  o  más  acontecimientos  aleatorios,  de  los  cuales  interesa  calcular  la 
probabilidad. Las combinaciones más habituales, son las que se establecen con el uso de las conjunciones disyuntiva o y copulativa 
y, cuando se dice la probabilidad de un suceso aleatorio u otro y la probabilidad de un suceso aleatorio y otro. Tales combinaciones 
corresponden el Lógica a dos Clases de operaciones: la suma lógica y el producto o intersección. 
 
2.6.4  Probabilidad total Probabilidad de un suceso aleatorio combinado, cuando la combinación se 0establece usando la con‐
junción disyuntiva o. En el caso de dos sucesos es la suma de las probabilidades simples correspondientes a cada uno de ellos 
menos la probabilidad conjunta de ambos. 
 
2.6.5  Sucesos aleatorios incompatibles Aquellos que no pueden verificarse juntos al realizarse un experimento, es decir aquellos 
cuya  probabilidad  conjunta  vale  cero.  En  consecuencia  la  probabilidad  total  correspondiente  a  ellos  es  la  suma  de  las 
probabilidades simples respectivas. 

164
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

2.7.12  Límites inferiores y superiores del intervalo de confianza (1 ‐ “) Son los respectivos extremos, t1, t2 del intervalo que tiene 
probabilidad (1 ‐ “) de contener al verdadero desconocido del parámetro. Dichos extremos son aleatorios porque se calculan en 
función de un estimador. 
 
2.7.13  Nivel de confianza (1 ‐ “) Es la probabilidad (1 ‐ “) definida previamente, de que el intervalo (t1, t2) cubra el verdadero valor 
desconocido del parámetro. 
NOTA: Denominado también “coeficiente de confianza”. 
 
2.7.14  Nivel de riesgo (“) Es la probabilidad “ de que el intervalo (t1, t2) no contenga el verdadero valor desconocido del parámetro. 
NOTA: Denominado también “coeficiente de riesgo”. 
 
 
2.8 REGRESIÓN, CORRELACIÓN Y ASOCIACIÓN 
 
2.8.1  Regresión Método estadístico utilizado para establecer y estimar la función que relaciona una variable aleatoria dependiente 
con una o más variables independientes, que pueden o no ser aleatorias. En algunos casos a las variables independientes se las 
denomina explicativas o descriptivas y a la variable dependiente explicada. 
 
2.8.2  Función de regresión Función matemática que liga los valores de la o las variaciones independientes con la media aritmética 
o con la esperanza matemática de las distribuciones de la variable dependiente. 
NOTA: Denominada también “ecuación de regresión”. 
 
2.8.3  Recta de regresión Función de regresión lineal. 
 
2.8.4  Coeficiente de regresión Cada uno de los parámetros que determinan o identifican una función de regresión. 
 
2.8.5  Correlación Método estadístico utilizado para medir la interdependencia o ligazón aparente dos o más variables aleatorias. 
 
2.8.6  Coeficiente de correlación Medida de la relación o interdependencia existente entre dos o más variables aleatorias. 
 
2.8.7  Asociación Métodos estadísticos utilizado para medir la interdependencia o ligazón aparente entre dos o más características. 
 
2.8.8  Coeficiente de asociación Medida de la asociación existente entre dos o más características. 
 
2.9 NÚMERO ÍNDICE 
2.9.1. número índice. Coeficiente estadístico que refleja las variaciones, en el tiempo o en el espacio, de una magnitud o de un 
subconjunto  de  magnitudes,  considerado  como  representativo  de  un  conjunto  mayor.  Se  calcula  respecto  de  un  punto  de 
referencia  denominado  base  del  número  índice  y  generalmente  se  expresa  como  porcentaje.  Los  números  índices  más  
frecuentemente utilizados son los de precio, de cantidades y de valores. 
NOTA: Denominado también índice. 
 
2.9.2. base de un número índice. Momento, período o punto con respecto al cual se establece la comparación. Generalmente al 
índice en la base se le asigna valor 100. 
 
2.9.3.  número  índice  de  precios.  Aquel  que  refleja  la  variación  de  los  precios  de  un  conjunto  de  bienes  o  servicios,  entre  dos 
momentos en el tiempo o dos puntos en el espacio.  
 
2.9.4. número índice de cantidades. Aquel que refleja la variación de las cantidades de un conjunto de bienes o servicios, entre 
dos momentos en el tiempo o dos puntos en el espacio. 
 
2.9.5. número índice de valor. Aquel que refleja la variación en el valor total (precio multiplicado por cantidad) de un conjunto de 
bienes o servicios, entre dos momentos en el tiempo o dos puntos en el espacio. 
 
2.9.6. relativo de precio. Razón del precio de un bien o servicio, en un período  o punto dado, respecto al precio del mismo bien o 
servicio, en el período o punto base. Estos relativos integran los números índices entre los cuales las fórmulas más frecuentemente 
usadas son las de Laspeyres o Paasche. 
 

166
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

NOTA: Denominados también “sucesos aleatorios excluyentes” o “mutuamente excluyentes”. 
 
2.6.6 Sucesos aleatorios independientes Dos o más sucesos aleatorios son independientes cuando el hecho de saber que se ha 
verificado o no uno de los acontecimiento, no modificada la probabilidad de ocurrencia del otro u otros sucesos compatibles con 
el anterior. 
 
2.6.7    Sucesos  aleatorios  dependientes  Dos  o  más  sucesos  aleatorios  son  dependientes  cuando  el  hecho  de  saber  que  se  ha 
verificado o no uno de los acontecimientos modifica la probabilidad de ocurrencia del otro u otros sucesos compatibles con el 
anterior. 
 
2.6.8  Probabilidad condicional Probabilidad de un acontecimiento aleatorio dependiente cuando se ha verificado previamente 
otro u otros sucesos compatibles con el anterior. 
 
2.6.9   Probabilidad  compuesta  Probabilidad  de  un suceso  aleatorio  combinado  cuando  la combinación  se  establece usando  la 
conjunción  copulativa  y. En el  caso  de  dos  sucesos  es  el producto  de  la  propiedad  simple  de  uno  de  ellos  por  la  probabilidad 
condicional del otro. Si los sucesos aleatorios son independientes, la probabilidad compuesta es igual al producto de las respectivas 
probabilidades simples de cada uno de los acontecimientos. 
 
2.6.10  Variable aleatoria Aquella que puede tomar uno cualquiera de los valores posibles de un conjunto finito o infinito (dominio), 
cada uno de los cuales tiene asociada una probabilidad si la variable es discreta o una densidad de probabilidad si la misma es 
contínua. La suma de estas probabilidades es igual a uno. 
NOTA: Denominada también “variable estocástica”. 
 
2.7  INFERENCIA 
 
2.7.1  Parámetro Valor fijo o constante que caracteriza a una población. 
 
2.7.2  Muestra Conjunto de elementos tomados de una población dad, destinado a suministrar información sobre ésta. 
 
2.7.3  Muestra probabilística Muestra seleccionada mediante la aplicación de algún método información en el Cálculo de Proba‐
bilidades. 
 
2.7.4  Tamaño de muestra Cantidad de elementos que la componen. 
 
2.7.5  Estadístico Relación matemática que vincula los valores de una o más características, los cuales proceden de una o varias 
muestras. 
NOTA: Denominado también “estadígrafo”. 
 
2.7.6  Coeficiente estadístico Denominación que se emplea generalmente para llamar a los estadísticos sin dimensión, es decir 
número puro. 
2.7.7  Estimación Conjunto de métodos de la Estadística Inductiva que, basado en el Cálculo de probabilidades, permite a partir de 
muestras probabilísticas, inferir las leyes de distribución de las características consideradas en la población de la cual provienen, 
o juzgar la validez de ciertas hipótesis // Resultado obtenido por la aplicación  del método de estimación utilizado. 
 
2.7.8    Estimador  Estadístico  aplicado  a  una  o  varias  muestras  probabilísticas  para  estimar  un  parámetro  desconocido  de  la 
población. Es una variable aleatoria. 
 
2.7.9  Estimación puntual Método que permite a partir de los valores muestrales y de un estimador, calcular un único valor como 
estimación de un parámetro desconocido. Se utiliza como estimación un sólo punto del dominio de dicho estimador. 
 
2.7.10  Estimación por intervención Método que permite obtener un intervalo aleatorio que tiene una probabilidad (1 ‐ “) definida 
previamente, de contener al verdadero valor desconocido de un parámetro. Es un método de estimación que, si se aplicara una 
gran cantidad de veces, cubriría al verdadero valor del parámetro en 100 (1 ‐ “) % de los casos. 
 
2.7.11  Intervalo de confianza (1 ‐ “) Es el intervalo (t1, t2) que tiene probabilidad (1 ‐ “) de contener el verdadero valor desconocido 
del parámetro que desea estimar. 
 

165
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

2.9.7. relativo de cantidad. Razón del precio de un bien o servicio, en un período  o punto dado, respecto a la cantidad del mismo 
bien o servicio en el período o punto base. 
 
2.9.8. canasta. Conjunto seleccionado de los bienes y servicios sobre el que se basa el cálculo de un determinado número índice. 
La selección se realiza generalmente a partir de la lista exhaustiva de bienes y servicios vinculados con el fenómeno que se desea 
reflejar, y debe cumplir la condición de respetar la representatividad o participación de las distintas categorías o capítulos en el 
conjunto total. 
 
2.9.9. número índice de precios de Laspeyres. Aquel que se calcula como un conjunto cuyo numerador es la suma de los precios 
de un período o punto dado, ponderados por las cantidades del período o punto base. Ambas sumas involucran todos los bienes 
y servicios de la canasta respectiva. 
 
2.9.10  número  índice  de  cantidad  de  Laspeyres.  Aquel  que  se  calcula  como  un  cociente  cuyo  numerador  es  la  suma  de  las 
cantidades de un período o punto dado, ponderados por los precios del período o punto base, y cuyo denominador es la suma de 
las cantidades, por los precios del período o punto base. 
 
2.9.11 número índice de precios de Paasche. Aquel que se calcula como un cociente cuyo nominador es la suma de los precios por 
las cantidades de un período o punto dado y cuyo denominador es la suma de los precios del período o punto base, ponderados 
por las cantidades del período dado. 
 
2.9.12  número  índice  de cantidades  de Paasche.  Aquel  que  se  calcula como  un  cociente  cuyo  denominador  es  la  suma  de  las 
cantidades por los precios de un período o punto dado y cuyo denominadores es la suma de las cantidades del período o punto 
base, ponderadas por los precios del período dado. 
APROBADO SU ENVÍO A DISCUSIÓN PUBLICA POR EL SUBCOMITÉ DE ESTADÍSTICA EN SU SESIÓN DE 14 DE DICIEMBRE DE 1982 
(Acta 5‐82) 
      (Firmado)              (Firmado) 
      Lic. J. Ibáñez      Lic. S. B. Esrequis 
        IRAM      Secretario del Subcomité 
  (Firmado) 
             Dr. E.V. Pineda 
   Vº Bº Equipo A 

167
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro

Prof. Aída Beatriz Castegnaro

ESTADÍSTICA

TABLAS ESTADISTICAS BÁSICAS


DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN DE POISSON
TABLAS DE DIGITOS AL AZAR o NÚMEROS ALEATORIOS
TABLA DE COMBINACIONES O NÚMEROS COMBINATORIOS
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN NORMAL ESTANDARIZADA (TABLA DE CRAUSS)
 FUNCION DE DISTRIBUCIÓN 
 FRACTILES DE LA DISTRIBUCIÓN 
DISTRIBUCIÓN “t” DE STUDENT
DISTRIBUCIÓN “t” DE STUDENT (TABLA DE CRAUSS)
DISTRIBUCIÓN JI-CUADRADO
DISTRIBUCIÓN JI-CUADRADO (TABLA DE CRAUSS)
DISTRIBUCIÓN F DE SNEDECOR

p(r ) 
 R
r   nr 
. N R

 
N p ( x )   nx  . p x .q n  x
n

e  x
p( x) 
x!

z 1  12 z 2
F ( z)  
  xm
z
 .e dz

2

168

You might also like