Professional Documents
Culture Documents
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
3. ETICA EN LA ESTADISTICA
5. ALFABETO GRIEGO
6. NORMAS IRAM
9. BIBLIOGRAFIA UTILIZADA
2. RECUPERATORIO:
3. FINAL:
0
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2 Mi. 27/03/19 PROBABILIDAD
Ju. 28/03/19 PROBABILIDAD
Lu. 01/04/19 PROBABILIDAD
3 Mi. 03/04/19 PROBABILIDAD
Ju. 04/04/19 TEOREMA DE BAYES ‐ APLICACIONES
Lu. 08/04/19 VARIABLES ALEATORIAS
4 Mi. 10/04/19 DISTRIBUCIONES DE PROBABILIDAD DISCRETA: BERNOULLI ‐BINOMIAL
Ju. 11/04/19
Lu. 15/04/19 HIPERGEOMÉTRICA – POISSON.
5 Mi. 17/04/19 VARIABLE ALEATORIA CONTINUA
Ju. 18/04/19 FERIADO
Lu. 22/04/19 DISTRIBUCION NORMAL.
6
Mi. 24/04/19 APROXIMACIONES DE LAS DISTRIBUCIONES DE PROBABILIDAD
Ju. 25/04/19 AUTODIAGNOSTICO
Lu. 29/04/19 DISTRIBUCIÓN DEL MUESTREO. PROPIEDADES DE LOS ESTIMADORES
7 Mi. 01/05/19 FERIADO
Ju. 02/05/19 PRIMER PARCIAL DE ESTADISTICA
Lu. 06/05/19 DISTRIBUCIÓN DEL MUESTREO. TEOREMA CENTRAL DEL LÍMITE
8 Mi. 08/05/19 ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA
ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA DE LA MEDIA , DE LA
Ju. 09/05/19
PROPORCIÓN, DE LA VARIANZA Y DEL DESVIO POBLACIONAL
Lu. 13/05/19 ESTIMACIÓN PUNTUAL Y POR INTERVALOS de CONFIANZA
9 Mi. 15/05/19 AUTODIAGNOSTICO
Ju. 16/05/19 TEST DE HIPOTESIS
10 Lu. 20/05/19 TEST DE HIPOTESIS
1
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Mi. 22/05/19 TEST DE HIPOTESIS
Ju. 23/05/19 TEST DE HIPÓTESIS PARA DOS POBLACIONES
Lu. 27/05/19 NUMEROS INDICES
11 Mi. 29/05/19
NUMEROS ÍNDICES
EL MODELO DE LA REGRESIÓN LINEAL. DFERENCIAS CON CORRELACION.
Ju. 30/05/19
SUPUESTOS DE LA REGRESIÓN.
Lu. 03/06/19 TABLA ANOVA
12 Mi. 05/06/19 REGRESIÓN LINEAL – INTERVALO de CONFIANZA Y DE PREDICCIÓN
Ju. 06/06/19 REGRESIÓN LINEAL – PRUEBA DE SIGNIFICANCIA “t” y “F”
Lu. 10/06/19 2° PARCIAL
13 Mi. 12/06/19 SIN CLASES
Ju. 13/06/19 NOTAS Y REVISIÓN DEL 2° PARCIAL
Lu. 17/06/19 FERIADO
14 Mi.19/06/19 RECUPERATORIO
Ju. 20/06/19 FERIADO
NOTAS Y REVISIÓN DEL RECUPERATORIO.
Lu. 24/06/19
SERIES CRONOLÓGICAS
15
Mi. 26/06/19 SERIES CRONOLOGICAS
Ju. 27/06/19 FINAL
Lu. 01/07/19 NOTAS Y REVISION DE EXAMENES FINALES
Mi.03/07/19 NOTA FINAL DEL CURSO: LECTURA
16
Ju. 04/07/19 NO HAY CLASES
FECHAS DE REMANENTES 2019
TURNOS FECHAS DE INSCRIPCIÓN FECHA EN QUE
EN EL SISTEMA INTERACTIVO SE RINDE
MARZO 6 y 7 de febrero 2019 18 al 22 de marzo de 2019
MAYO 8 y 9 de mayo de 2019 27 al 31 de mayo de 2019
AGOSTO 6 y7 de agosto de 2019 26 al 30 de agosto de 2019
OCTUBRE 2 y 3 de octubre de 2019 21 al 25 de octubre de 2019
DICIEMBRE 20 y 21 de noviembre de 2019 9 al 13 de diciembre de 2019
2
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Contenido Teórico
Actividad: Autodiagnóstico
Excel en Estadística
NOTA IMPORTANTE
Ciertos contenidos y los ejercicios escogidos de la bibliografía citada en esta guía (ver referencias bibliograficas)
han sido reproducidos en la presente guía. Asimismo, algunos conceptos teóricos han sido extractados de su
libro origen (Kurincic, Gabriela; Loureiro de Pérez, Emma; Levin Balderas, del Valle y otros.)
MI RECONOCIMIENTO
Se agradece toda la colaboración al PROF. ACTUARIO FÉLIX FRANCO quien fuera mi Profesor en
mi época de estudios en la carrera de Ciencias Económicas y quien me brindara colaboración a
posteriori y muchísimo material de lectura y de apoyo didáctico para el curso junto a largas charlas, lo
que me ha dado un crecimiento en la materia, como así también se agradece al Prof. Actuario Juan
Ramón Garnica Hervas por todo su apoyo, confianza, recomendaciones y material brindado.
A todos los alumnos con quienes compartiendo cursos e inquietudes seguimos mejorando esta guía
para beneficios de la comunidad educativa.
Para los profesionales de Ciencias Económicas, La matemática aislada, carece de sentido. Necesitamos
experimentarla en la realidad, justificarla como una necesidad para analizar e interpretar los hechos.
Como matemática aplicada a problemáticas especiales, para comprender la realidad, le damos sentido
a lo que enseñamos y por qué lo enseñamos.
3
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
4
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
5
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Los datos y la información
Los datos son valores correspondientes a los atributos o propiedades que identifican y describen a cada
unidad de análisis, unidad experimental
Pueden ser de dos tipos: cualitativos y cuantitativos cuando además permiten establecer las diferencias
entre los valores en cantidad y grado.
Este conjunto de datos ya procesados se transforma en información para la toma de decisiones.
La Estadística, en principio permite recolectar los datos de las unidades de análisis, los que a través de un
proceso se transforman en información y se pueden tomar para decisiones en condic. de incertidumbre.
¿Por qué se recolectan datos?
Los datos se recolectan por alguna inquietud, o para probar alguna conjetura, o para investigar.
En general, se dice: que las razones básicas para recolectar los datos pueden ser:
satisfacer una curiosidad
medir el desempeño de un proceso de producción, relacionado con la evaluación, control de calidad
cursos de acción alternativas para ampliar la toma de decisiones
satisfacer una curiosidad
decisiones sobre causas‐efectos
Los datos primero se recogen y luego se requiere compilarlos.
Ej. El INDEC es un organismo que recolecta los datos y constituye una FUENTE PRIMARIA. Por otro lado,
una FUENTE SECUNDARIA es quien compila dichos datos, que puede estar en cabeza de quien es fuente
primaria o puede ser otro.
Aplicaciones
Las aplicaciones concretas de los conocimientos de estadística a las siguientes áreas:
Contabilidad y Auditoría: en la selección de muestras para evaluar la razonabilidad de EECC
con menor coste, tiempo y esfuerzo y por otro lado, la identificación y valoración de riesgos
y su probabilidad de ocurrencia a los que está sometido la empresa que le pueden generar
La Estadística que se aplica se denomina “Contabilidad Administrativa” de uso interno y no
regulado por normas externas, por tratarse de un sistema de información que genera
reportes para la toma de decisiones económicas que cubre las necesidades de la
administración cuyas funciones son planificación, control y la toma de decisiones. Permite
comparar resultados presentes y pasados para planificar y prever los futuros.
También se ocupa de la Contabilidad financiera
6
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Administración: descripción y características de la población
Producción: control de calidad. El corregir a tiempo los contratiempos
Economía: en los pronósticos de inflación, tasas de interés y desempleo
Finanzas: en los pronósticos, evaluación de proyectos y volatilidad de los mercados
Gubernamental: Censos
Mercado: Investigación de mercado. Búsqueda de liderazgo en el mercado en cuanto a
ventajas competitivas ‐en los costos, en su calidad. Análisis decisorio sobre una expansión
geográfica
La investigación. Enfoques. Técnicas y Tipos de Estudios.
Enfoques de
Investigación
Es el investigador el que está en contacto con esos datos como fuente de su investigación. La
palabra investigación proviene del latín Investigare, en inglés “Research” y refiere a un conjunto de pasos,
por eso remite a un proceso cuidadoso, sistemático y empírico para conocimiento.
Como sostiene Sampieri en su libro Metodología de la Investigación han surgido distintas corrientes
de pensamiento para la búsqueda del conocimiento, polarizándose en dos muy diferenciados enfoques,
el cualitativo y el cuantitativo. Según el tipo de formación de quien lleva a cabo la investigación utiliza uno
u otro enfoque, considerando que la investigación constituye un proceso cuidadoso, sistemático y
empírico en el esfuerzo de generar conocimiento, en el que cada uno de los enfoques tienen sus propias
características que conduce a un tipo de observaciones, de recolección de datos con distintas técnicas,
compilación y evaluación del fenómeno objeto de estudio. Aunque, entre los enfoques emergió un tercer
tipo: el enfoque mixto como combinación de ambos. En detalle exponemos que:
‐ El enfoque cualitativo: es aquel conjunto de prácticas interpretativas, que utiliza los datos
recolectados sin la necesidad de la medición numérica para descubrir o afinar preguntas de
investigación en un proceso de interpretación. Se basa en un proceso inductivo –al ir de lo
particular a lo general de explorar y describir‐.
La realidad se define a través de las interpretaciones de los participantes en la investigación
respecto de sus propias realidades.
En este enfoque la reflexión es el puente que vincula la investigación con los participantes. Es
holista y sin pretensión de generalizar pues la recolección de datos es no estandarizada –subjetiva‐
- El enfoque cuantitativo: es aquel que utiliza los datos recolectados para probar hipótesis, con base
en la medición numérica y el análisis estadístico para establecer patrones de comportamiento y
probar teorías. Pretende generalizar los resultados.
Esos datos del mundo real se miden (Sampieri & Otros, 2006, pp. 5‐6) y le cabe dos tipos de análisis
estadístico a través de:la estadística descriptiva que permite obtener información sobre las
características de los datos y,
o la estadística inferencial que permite poner a prueba las hipótesis del investigador.
7
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
- El enfoque mixto: combinan ambos enfoques. También denominado enfoque integrado
multimodal.
Las técnicas en la investigación transitan desde la perspectiva cualitativa a la cuantitativa
Datos
Estudio Datos Textos.
secundarios Trabajo de
Censo Experimento Observaciona secundarios Diarios.Histor Ensayos
de campo
l estadísticos ias de vida
documentos
INVESTIGACIÓN CUANTITATIVA INVESTIGACIÓN CUALITATIVA
Supuestos en cada uno de los paradigmas de los enfoques cuantitativo y cualitativo
Enfoque Cuantitativo Enfoque Cualitativo
Supuestos: Paradigma Positivista – Paradigma constructivista
Post positivista
Ontológico La realidad es objetiva La realidad es subjetiva y múltiple
‐naturaleza de la realidad‐
Epistemológico Hay distancia No hay distancia. El investigador está
‐relación entre el investigador inmerso en el contexto de interacción
y aquello que se investiga‐
Axiológico El investigador se despoja de El investigador asume que sus valores
‐el papel de los valores en la sus propios valores, de lo que forman parte del proceso de investigación
investigación‐ es justo o injusto
Metodológico Aplica la lógica deductiva (de lo Aplica la lógica inductiva (de lo particular
‐procedimientos utilizados general a particular, es decir de a lo general‐ de los datos a las
para la construcción de las leyes y teoría a los datos) generalizaciones y la teoría)
evidencia empírica‐
Es un proceso empírico Es un proceso empírico en espiral o
secuencial y probatorio circular, sin secuencia.
Usa técnicas estadísticas Análisis en profundidad y en detalle.
Observación naturista.
Operacionalización de Conceptos y categorías a lo largo de todo
conceptos teóricos. el proceso
Confianza, autenticidad
Confiabilidad de resultado por Parsimonia científica (usa menos
validación interna categorías o dimensiones de análisis
Estructurado, Abierto, flexible, construido durante el
Diseño de la investigación predeterminado. trabajo de campo o realización del estudio
Naturaleza de los datos Es cuantitativa y se analizan Es cualitativa, en forma de textos,
estadísticamente los datos narraciones, significados, imágenes,
piezas audiovisuales, objetos personales,
documentos.
Aplicativos SPSS; Excel; Minitab… Atlas.ti
Nos interesa conocer las etapas de investigación cuantitativa que hace uso de la estadística.
8
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
En este curso de Estadística observamos que los saberes y técnicas que nos suministra, permitirán abordar
el tipo de enfoque cuantitativo, utilizando las técnicas que le son propias para la recolección de datos.
Las fases en el proceso de investigación son las siguientes.
• Idea de investigación
Fase 1
• Planteo del problema de investigacion
Fase 2
• Revision de la literatura (Estado del arte)
Fase 3 • Desarrollo del marco teórico
• Alcance de estudio
Fase 4
• Planto de la hipótesis de investigacion
Fase 5 • Definicion de las variables
• Desarrollo del diseño de innvesigación. Marco Metodológico
Fase 6
• Definción y selección de la muestra
Fase 7
• Recolección de los datos
Fase 8
• Analisis de los datos
Fase 9
• Elaboráción del reporte de resultados
Fase 10
Los diferentes tipos de estudios aplicando la estadística que se pueden realizar son:
- Estudio exploratorio: investiga un problema poco estudiado, del que se sabe poco; indagan en forma
innovadora, ayuda a identificar conceptos o preparan para oros estudios, describen.
- Estudio descriptivo: busca identificar propiedades, características, perfiles de personas, grupos, objetos,
procesos o cualquier otro fenómeno que se somete a análisis. Por lo que miden concepto, describen
tendencias de un grupo o población.
- Estudio correlacional: asocia variables con el propósito de conocer la relación que existe entre dos o más
conceptos, categorías o variables en un contexto en particular, midiendo el grado e asociaciones entre las
mismas. Tiene un valor explicativo, aunque parcial. El investigador debe tener cuidado en esa relación
encontrada pues puede tratarse de una aparente asociación de las variables, llevando a correlaciones
espurias. Este tipo de estudio ofrece predicciones, explican la relación entre variables y cuantifican
relaciones entre variables.
- Estudio explicativo: pretende establecer las causas de los eventos, sucesos o fenómenos que se estudian,
por lo que van más allá de la descripción.
- Estudio de diferencias entre grupos.
La utilización del enfoque cuantitativo para estos tipos de estudios el investigador es neutral, pues deja
de lado sus propios valores, creencias y con procedimientos rigurosos y objetivos hace el estudio
distanciado físicamente y también distanciado psicológicamente del fenómeno de investigación.
Si nos preguntamos ¿QUE ES LA ESTADÍSTICA? Comenzaríamos diciendo que:
Es aquella rama de la matemática que resulta útil para la investigación de corte cuantitativa. Pero, la
respuesta a esa pregunta, además de constituir una herramienta para investigar
La Estadística como disciplina científica
es el conjunto de métodos sistemáticos que se aplican a la
9
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
a. Recopilación
b. Presentación
c. Análisis e
d. Interpretación
de los datos para la toma de decisiones
La Estadística se divide en dos ramas:
- Estadística Descriptiva ‐ Estadística Inferencial
Para poder abordar ambas ramas pasa por la
Probabilidad.
En el campo curricular, la estadística como asignatura brindada en los cursos de las carreras de Ciencias
Económicas responde a necesidades concretas, destinado a resolver situaciones específicas, cuyo objetivo
es brindar una estadística aplicada, a diferencia de la estadística matemática más propia de estadística II,
en una sola materia que concentra diferentes contenidos en amplitud dada la riqueza de conocimientos
que contiene el programa de la asignatura. Por eso, de ciencia abstracta ser estudiada como ciencia fáctica
o empírica que toma los conocimientos de origen matemático para ser usados en forma instrumental a la
resolución de determinados problemas en determinados contextos.
Estadística: ciencia de los grandes números
La irregularidad que presentan los resultados aislados y su impredecibilidad son superadas por la
regularidad y predictibilidad que muestran los resultados medios, cuando se repiten muchas veces las
observaciones o experimentos aleatorios. Por ello, se denomina a la estadística la ciencia de los grandes
números. (Act.Garnica Hervas, Juan R. exProf. Titular de Estadística Actuarial, Estadística, Estad. para Adm.)
Para esclarecer la forma en que se tratará veremos un esquema (Berenson, Krehbiel y Levine).
DIAGRAMA DE LA PRESENTACIÓN DE LOS CONTENIDOS
OBTENCIÓN DE FENÓMENOS DINAMICOS
PRESENTACIÓN Y CONCLUSIONES ACERCA DE ELABORACIÓN DE
TEORÍA DE LAS
DESCRIPCIÓN DE LA POBLACIONES BASADAS SÓLO PRONÓSTICOS
PROBABILIDADES
INFORMACIÓN EN INFORMACIÓN DE UNA CONFIABLES DE LAS
MUESTRA VARIABLES DE INTERÉS
Probabilidad: Tipos
Distribucione de
Recolección de Datos
muestreo
Variables Aleatorias Regresión Lineal
Simple
Presentación de Datos Distribuciones de Estimación de
en Tablas y Gráficos Probabilidad Discretas Intervalo de Confianza Números Indices
Distribución Normal Series Cronológicas
Medidas Descriptivas
Cuantitativas o
Numéricas Otras Distribuciones
Continuas Prueba de Hipótesis
10
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Análisis de la relación Regresión múltiple
entre dos o más
variables
11
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
ESTADISTICA DESCRIPTIVA
ETAPAS DE LA ESTADISTICA DESCRIPTIVA
ETAPA 3
ETAPA 2
DE PRESENTACIÓN DE DATOS
DATOS DE ANÁLISIS E
INTERPRETACIÓN
•ENCUESTAS DATOS
•OBSERVACIÓN •TABLAS
•EXPERIMENTACIÓN •GRAFIC0S
Fuentes Secundarias
PRECISAS Y
¿Le gusta a Ud. el deporte? Le gusta usted el deporte verlo en TV,
COMPRENSIBLES VAGUEDAD escucharlo en radio o prácticarlo? y de
DE los términos qué deporte se trata?
¿Votará usted en las próximas, elecciones? En las próximas elecciones para elegir
Presidente…del día ….¿piensa ir a votar?
¿Es estable su empleo? Múltiples ¿Es estable en su empleo, considerando
significados: que tiene 1 año o más en el mismo?
caract. De la
-Ha asistido recientemente al cine? temporalidad
(que es reciente: 1 semana, 1 mes, ) ¿qué es estable? Durante las últimas 2 semanas ha ido Ud.
¿qué es reciente al cine?
¿qué edad es
-Ha trabajado desde joven? joven? -A partir de que edad empezó a trabajar?
12
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2 BREVES (CONCISAS) Como Ud. sabe el próximo …. serán las DEMASIADAS En las próximas inscripciones del
inscripciones a las materias virtuales, nueva PALABRAS 2°Cuatrimestre a cursos virtuales ¿piensa
modalidad de distancia en nuestra FCE ¿piensa inscribirse?
Ud. acudir a la inscripción de materias virtuales
para el segundo cuatrimestre de este año?
VOCABULARIO DIRECTO, ¿ pernocta Ud. cerca de la Facultad? Vocabulario ¿Vive cerca de la Facultad a menos de 10
SIMPLE Y FAMILIAR PARA no familiar cuadras?
LOS PARTICIPANTES
3 NO DEBEN INDUCIR A ¿Acostumbra a ingerir algún tipo de bebida? Incomoda la Algunos de sus amigos acostumbran
RESPUESTAS verdad de la consumir algún tipo de bebida
(PREGUNTAS INCÓMODAS) respuesta alcohólica?
Y luego, preguntar
¿Cuál es su tipo de bebida favorita?
4 . NO DEBEN INDUCIR A una ¿Son los trabajadores argentinos poco Tendenciosa ¿Qué tan productivos son los trabajadores
determinada RESPUESTA productivos? argentinos? Sumamente productivos- Más
(PREG. TENDENCIOSAS) bien productivos-Más bien
improductivos- Sumamente
improductivos.
¿Suele tener tiempo para leer el diario? Y
¿Acostumbra a leer el diario? luego: ¿Con qué frecuencia?
5 NO PUEDEN APOYARSE EN El Gobierno Nacional entregó planes conectar Tendenciosa. ¿Considera beneficioso la entrega de
INSTITUCIONES porque considera que beneficia a una mejor computadoras para la educación en un
educación ¿Considera Ud. que es beneficioso? plan de ayuda?
6 Preguntas con Considera que la mayoría de las mujeres que NEGACION Considera que la mayoría de las mujeres
NEGACIONES:EVITARLAS están casadas preferiría no trabajar? prefieren estar en sus casas?
Objetivo: Identificar la fuente de Datos, para ello indique Cuáles de los siguientes procedimientos
será considerado “Experimento” “Encuesta” o “Estudio Observacional u Observación Directa”
Un sondeo político de intenciones de voto individuales en las próximas elecciones
Clientes de un centro comercial que serán entrevistados acerca del motivo por el cual compran allí en Unicentro.
Comparación de dos métodos para comercializar una póliza anual de seguro mediante la aplicación de cada
método en áreas geográficas comparables.
Evaluación de dos conjuntos diferentes de instrucciones de armado de un juguete haciendo que 2 grupos
comparables de niños lo armen siguiendo las instrucciones.
13
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Envío a los suscriptores de una revista de evaluación de productos de un cuestionario para la calificación de los
productos que han adquirido recientemente
Comparación de los resultados de un nuevo método de capacitación para comercialización de pasajes aéreos por
venta telefónica con el método tradicional.
Niveles de los datos
ESCALAS DE MEDICIÓN
Características:
Características: Características: Características:
Tenga en cuenta que para diferenciar entre NIVEL DE INTERVALOS O NIVEL DE RAZÓN:
RECUERDESi una magnitud se la puede clasificar en
1. EXTENSIVA O ADITIVA: si tiene sentido la operación aritmética de adición.
2. INTENSIVA cuando la magnitud no es extensiva
Entonces
p.1) clasifique en magnitud intensiva o extensiva
- El Volumen de las piletas de natación……………….
- El Peso de las cajas de cereal…………………………
- El perímetro en cada parcela vendida………………..
- La superficie de cada lote construido………………..
- La temperatura en la ciudad de Mar del Plata……….
p.2) Complete en función a la clasificación realizada del punto p.1) lo siguiente:
Son el tipo de datos que responden a preguntas del tipo ¿Dónde vivis? ¿cuál es tu sexo? cuyas variables si
se le asignasen una denominación podría ser del estilo “Zona de Residencia” para la primera pregunta y
“Sexo” ó “Genero” para la segunda pregunta.
Las respuestas son los datos que respectivamente se registran en categorías y luego se pueden presentar su
frecuencia en una tabla y también en un gráfico.
ETAPA 3
ESTADISTICA DESCRIPTIVA
–DATOS CUANTITATIVOS: DISCRETOS-
ORGANIZACIÓN, PRESENTACIÓN y DESCRIPCIÓN DE LOS DATOS SIN AGRUPAR
TRATAMIENTO CUANTITATIVO
MEDIDAS DESCRIPTIVAS O MEDIDAS ESTADISTICAS
Una descripción informativa de cualquier conjunto de datos está dada por la frecuencia de repetición
u arreglo distribucional de las observaciones en el conjunto.
15
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
El número de observaciones en una clase recibe el nombre de frecuencia absoluta de esa clase. También resulta
interesante y funcional para determinadas medidas estadísticas trabajar con frecuencia acumulada u ojiva.
A partir de una organización por tablas y una presentación por gráficos se puede descubrir patrones de distribución
ocultos en el conjunto de datos. Además, se pueden caracterizar a través de las medidas numéricas que describen
la población en estudio.
Por ende, las medidas numéricas descriptivas se pueden clasificar en
Medidas de Posición no toman en cuenta los valores de la variable de estudio sino su posición
Medidas Promedio toman en cuenta todos los valores de la variable de estudio a los que se les aplica
operadores algebraicos.
Existen medidas numéricas de interés para cualquier conjunto de datos: la localización de su centro y su
variabilidad, luego tenemos las denominadas medidas de orden superior, que también son de forma o de
deformación.
MEDIDAS DE TENDENCIA CENTRAL: son los valores de variable que se ubican en la zona de la escala donde
se encuentra la mayor concentración de frecuencias. Es decir habla de la disposición del conjunto de datos
para agruparse ya sea alrededor del centro o de ciertos valores numéricos
MEDIDAS DE VARIABILIDAD: es la dispersión de las observaciones en el conjunto de datos
MEDIDAS DE DEFORMACIÓN: comparan una serie de frecuencias con una distribución normal estándar.
1)El gerente de personal determinó que los 19 empleados de la Planta de Ezeiza han faltado en el término
de un año el siguiente número de días.
5,10,10,8,10,17,12,8,16,6,15,6,5,7,10,6,16,5 y 8
1.1. Defina la Variable de interés para el estudio. ¿Qué puede concluir o interpretar con estos datos?
1.2. Grafique los resultados de las Frecuencias absolutas simples en un gráfico de bastones.
1.3. Grafique los resultados de las Frecuencias absolutas acumuladas en un gráfico escalonado.
1.4. En una tabla complete la distribución de frecuencias relativas de la variable
1.5. Determine el porcentaje de
personas que han faltado
a. exactamente 10 días
b. a lo sumo 10 días
c. al menos 10 días
1.6 Calcule la media aritmética, la
moda y la mediana
1.7 Calcule la amplitud de la
variación, la desviación media
1.8. Calcule la varianza, el
Media 9,47368421
desvío estándar y el coeficiente de variabilidad
Error típico 0,9188361
1.9. Comente los resultados devueltos por Excel y sus cálculos.
Rta: devolución de los valores En Excel Mediana 8
Moda 10
Rta: devolución de los valores En SPSS Desviación estándar 4,00511369
Varianza de la muestra 16,0409357
Rango 12
Mínimo 5
Máximo 17
16
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2) Cuando el gerente de personal decide hacer el relevamiento completo de la empresa, le falta incluir a la
Planta de Ezeiza las ausencias de la Planta Matriz ubicada en San Isidro conformada por 31 empleados. Por
lo tanto, recogido los datos, en esta Planta Matriz las ausencias han sido:
1,1,5,8,9,11,12,16,14,15,11,12,5,8,4,9,23,12,20,21,21,22,23,24,2,1,9,6,20,31,15
MEDIDAS
PROMEDIO Y DE POSICIÓN
SUBCLASIFICADAS en las MEDIDAS ESTAD.
Media
Mediana Primer Cuartil Asimetría
Varianza Rango
Deciles
Aritmética Geométrica Desvío estándar
ó Desvío medio
Desvío típico Percentiles
ó
Dispersión
Modo Coeficiente de
Variabilidad
PROMEDIO: Para calcular un promedio se debe utilizar todos los valores de una serie de datos
MEDIDAS DE POSICIÓN: No utiliza todos los valores de una serie de datos. Su resultado
depende de la posición que ocupa dentro de la distribución de datos.
17
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Identifique con una cruz y justifique si las siguientes medidas son promedios o posición?
Algunos Cuantiles
Es el valor tal que por lo menos “el …%” de los datos son menores o iguales que ese valor y el resto
son mayores o iguales que ese valor
Denominación Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
El conj.de datos se divide (en partes iguales)en
Para encontrar el valor del cuantil, con los
DATOS SIN AGRUPAR: me° = Q k° = Dk ° = Pk° =
Paso 1) Se ORDENAN en forma creciente
Paso 2) Se halla el Orden o posición que dentro de
la serie ocupa ese cuantil)
Paso 3) En esa posición se encuentra el valor del
cuantil:
-en forma directa si la serie es impar
-interpolando los 2 valores centrales si es par
18
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Cuadro de Propiedades
MEDIA VARIANZA
Notación Notación
Características Características
m© VAR©
m (c + X) VAR (c + X)
m (c - X) VAR (c - X)
m (c . X) VAR (c . X)
X X
m VAR
c c
m(X + Y) VAR(X + Y)
*
*
El AE.D. permite detectar obervaciones atípicas que son datos inconsistentes con el resto de los
otros datos. Son los datos extremos, pero para considerarse inusuales debe verificarse que estén
fuera de los límites Inferior y Superior.
Se identifica un dato extremo como:
Aquel valor < que : Q1 - 1,5 veces la amplitud intercuartílica
Aquel valor > que: Q3 +1,5 veces la amplitud intercuartílica
19
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
RESUMEN DE LOS
CINCO NÚMEROS
Q1 Me Q3 XM
Xm
menor valor
Primer Cuartil Mediana Tercer Cuartil Mayor valor
R.I.C.
Rango Intercuartílico
Amplitud Intercuartilica
Dispersión media
Complete en el cuadro Comparativo del resumen de los cinco números que describe el tipo de
distribución de datos, cuáles de los signos corresponde y tachar los signos que no correspondan
La distancia de
Xm a Q 1 Xm a Q 1 X m a Q1 Xm a Q 1
Contra
la distancia de >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
Q3 a X M correspondan) correspondan) correspondan)
Q3 a X M Q 3 a XM Q3 a X M
La distancia de
Q1 a me Q1 a me Q1 a me Q1 a me
Contra
la distancia de >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
me a Q3 correspondan) correspondan) correspondan)
me a Q3 me a Q3 me a Q3
1) Deberá seleccionar, cual corresponde Si ¿ >, <? tachando aquellos que no correspondan:
Cuánto más esparcidos están los datos Son > = < Rango
R.I.C
Varianza
Cuánto más concentrados u homogéneos están los datos Son > = < Desvío
Si todos los Xi son = (no hay variación de los datos)
RECUERDE que:
NINGUNA MEDIDA DE VARIACIÓN (Rango, RIC, VAR, DESVIO) ES MENOR A CERO
20
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1) Las tasas de rentabilidad de los inmuebles han sido del 4%, 6%, 8%, 10% y 11% en los últimos cinco meses.
Determine: a) la media aritmética y b) el factor de expansión o crecimiento acumulado. c) el factor de expansión
o crecimiento medio y d) la media geométrica.
Rta: 0,078 –en tanto por uno- ó 7,8% b. 1,4537 c. 1,0777 d. 0,0777 -en tanto por uno- ó 7,32%
2) El número de habitantes en una localidad ha registrado la siguiente evolución demográfica: 10.000 a fines de
2015; 10500 a fines de 2016; 12600 a fines del 2017 y 18900 a fines del 2018. Halle:
a. la tasa de crecimiento anual (para cada uno de los años) b.el factor de expansión demográfico acumulado
c. el factor de expansión demográfico medio d. la tasa de crecimiento promedio anual
Rta: a) 0,05; 020 y 0,50 ‐ en tanto por uno‐ b) 1,89 c) 1,23638559 d) 0,23638559
3) De los 80 operarios de la empresa “Cable sur” 60 cobran $ 140 la hora y el resto $ 260 la hora. ¿Cuánto cobran
en promedio por hora? Justifique el resultado
Rta: $170
Recuerde que: “las ponderaciones son valores que permiten asignar a cada variable en
estudio una determinada importancia”
4) Calcule la tasa media resultante de una inversión de $ 100.000 que al cabo de un año genera un valor final de
$ 50.000 y al cabo de 2 años se transforma en un monto o valor final igual a la inversión inicial de $ 100.000.
Rta.: 0
5) Un depósito por $ 10.000 en una cuenta devengó las siguientes. tasas de interés: 7% el 1°año, 8% el 2°año, 10%
el 3°año, 12% el 4°año y 18% el 5°año, generando un valor final de $ 16.800. Halle el factor medio de crecimiento
anual y la tasa de crecimiento anual –en %‐ Rta: 1,109 y la tasa de crecimiento anual del 10,9%
6) La tasa de crecimiento en un determinado cultivo de una localidad ha sido la siguiente:
Calcule cuál fue el crecimiento
2008 2009 2010 2011 2012 2013 2014
promedio anual. 11%
9% 7,5% 8% 9,5% 10,8% 12%
21
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1) La cuantía de las cuotas que cobra mensualmente una compañía en concepto de Préstamos
línea Personales a reintegrar en 24 mensualidades, iguales y consecutivas han sido las siguientes:
CUANTÍAS MENSUALES en concepto de cuota cobrada por préstamos personales.
900 500 450 1900 1200 1250 2500 550 1650 1200
1000 550 950 600 750 1300 850 350 1400 700
300 1100 300 1600 1500 1000 1800 900 500 650
2000 1000 2000 450 750 850 600 3000 350 1500
1.1) ¿Cómo puede organizar los datos? y ¿Cuál es la cantidad de intervalos de clase que tomaría?
1.2) Calcule las medidas con los datos de la distribución de frecuencias e interprételas: a) rango;
b) mediana; c) modo; d) media;e) desvío medio; f) varianza; g) desvío estándar h) coeficiente
de variación o dispersión relativa; i) coeficiente de asimetría y j) coeficiente de kurtosis
I - Cálculo manual de las medidas
Importe de Fronteras de Marca de clase fi F
cuotas en $ Clase [ ; ) -Punto medio- i=1,2…h a
Intervalo de clase Inclusión Izq. Xi
SUMAS
II- Otro camino: “Reduciendo los cálculos”Cálculo con Variable modificada. Considerando c= ; w=
X*i fi
SUMAS
variableXi: Varianza
Desvío
358351,30
598,62
Varianza
Desvío
320865,08
566,45
Varianza
Desvío
357497,28
597,91
Varianza
Desvío
372435,44
610,27
Desvío codif.
1,224375
1,106515
Varianza codi
Desvío codif.
1,577500
1,255986
Varianza codi
Desvío codif.
2,399375
1,548992
Varianza codi
Desvío codif.
3,260000
1,805547
Coef. de Asim 1,05784457 Coef. de Asim 1,07844912 Coef. de Asim 0,98242203 Coef. de Asim 1,03872129
Coef.de Kurto 0,52018758 Coef.de Kurto 0,65861297 Coef.de Kurto 0,27659763 Coef.de Kurto 0,43513117
22
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
El procedimiento para la utilización de una hoja de cálculo tipo Excel se detalla a continuación:
EXCEL EN ESTADÍSTICA
Los estadísticos descriptivos se pueden calcular a través de planillas
de cálculo como Excel. Para ello, primero es necesario habilitar
el menú de Estadística.
23
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
∗ ∗
∗
∗ ∗
; 0
∗ ∗
,
∗
∗ .
∗ despejo
∗ .
/___________/___________/___________/___________/
Xi enValores Originales
/____________/___________/___________/___________/___________/___________/
Xi - C
CAMBIO DE ORIGEN
/_/_/_/_/_/_/_/_/
∗
4- 3-2 -1 0 1 2 3 4
CAMBIO DE ESCALA
MOMENTOS EMPÍRICOS
Los momentos se definen a través de medias aritméticas. Los que usaremos son:
MOMENTOS NATURALES a los que se les denomina también ABSOLUTOS
MOMENTOS CENTRADOS
Algunas aplicaciones:
Definición de la varianza por diferencia de momentos
Determinación de las medidas de asimetría y curtosis de la distribución a partir de los momentos
24
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
CUADRO RESUMEN
MOMENTOS
EMPÍRICOS
son
Operadores matemáticos
obtenidos a partir
de los
Valores observados de la variable
se calculan como
MOMENTO
El promedio aritmético MOMENTO
EMPIRICO
de la potencia k-ésima EMPÍRICO
ABSOLUTO
de los CENTRADO
DE
DE
ORDEN k
ORDEN k
mak = mck =
La notación convencional:
mk : momento absoluto de orden k µk momento centrado de orden k
1) Complete:
ma1 = mc1 =
ma2 = mc2 =
ma3 = mc3 =
ma4 = mc4 =
2) Exprese los momentos centrados de orden 2,3 y 4 en función a los momentos absolutos
Deducir la fórmula sin omitir pasos intermedios
Complete el cuadro con las medidas y relaciónelas con las resultantes para DATOS DISCRETOS.
Conviene realizar la ojiva como representación gráfica y comparar la búsqueda del valor con la
tabla de frecuencias.
Algunos Cuantiles
Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
Si el conjunto de datos se
divide (en partes iguales) en
DATOS AGRUPADOS
Valor del cuantil mek = Q k= Dk = P k=
En donde:
N=
Li =
k=
fi =
Fa =
MEDIDAS
CLASIFICADAS
EN
DE
DE OTRAS
TENDENCIA MEDIDAS
VARIABILIDAD
CENTRAL
CUANTILES ó FORMA
Varianza Rango FRACTILES
Media Mediana
Primer Cuartil
Quintiles
Desvio Medio
Coeficiente de
Variabilidad Deciles CURTOSIS
Percentiles
26
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
3)Dada la siguiente información sobre Salarios Semanales en miles de pesos de 42 operarios de la rama
“Construcción”. Se pide, paso previo a las mediciones la organización de
datos y su representación gráfica (Fte.Brufman, J)
3.1) Construir una serie de frecuencias de amplitud w=1 (1° intervalo de
clase 5,0 – 6,0)
3.2) Represente gráficamente el histograma y el polígono de frecuencias
3.3) Represente gráficamente las frecuencias acumuladas
3.4) Halle e interprete la media, la mediana, el modo ,el primer cuartil, el
segundo cuartil, el tercer cuartil y el rango intercuartílico. Comente la
asimetría
3.5) Ingrese en un Excel los datos y analice los resultados que devuelve el Excel
3.6) Ingrese los datos en una calculadora científica e interprete los valores que le devuelve.
Li - Ls xi fi Fa
i=1,2…h
SUMAS
4)Dada la siguiente información sobre distancia recorrida medida en km –en valores originales-
Distancia en km xi fi Fi
Fronteras de clase i=1,2…h
0 - 1,99 2
2 - 3,99 5
4 - 5,99 4
6 - 7,99 8
8 - 9,99 1
SUMAS 20
27
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Se pide: 4.1) histograma 4.2) Gráfico del polígono de frecuencias 4.3) Gráfico de la frecuencias
acumuladas 4.4) media, el modo y la mediana 4.5) ¿Cuántas personas recorren menos de 5,5 km 4.6)
los cuartiles de 1° y 3° orden 4.7) la varianza, el desvío estándar y el coefic de Para
media
h= 5 ; w =2
5,10
Para h= 5
media codif
; w =2
0,050
variabilidad 4.8) la forma de la distribución de los valores de la variable: Varianza 4,99 Varianza cod 1,248
Asimetría y la curtosis 4.9)Realice la distribución de frecuencias utilizando Desvío 2,234 Desvío codif. 1,12
0 - 1,99 2
2 - 3,99 5
4 - 6,99 4
6 - 7,99 8
8 - 9,99 1
Totales 20
28
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
El valor que deja por debajo, es decir que supera al 25% de los datos –Q1-
el segundo cuartil y
el valor que es superado por el 25% de los datos –Q3-
El percentil 75
Realice los cálculos por valores codificados en el caso de la varianza, el desvio , la media, el coeficiente
de asimetría y el de curtosis.
4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2
Determine:
a)Tiempo medio de fabricación; b) Tiempo modal ; c) Tiempo mediano; d) Varianza; e)Desvío Standard
f) Coeficiente de simetría; g) coeficiente de curtosis ;
h) Complete con los valores codificados y calcule las medidas estadísticas
Tiempo xi X*i fi
4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2
29
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
3) Un auditor detecta que las cuentas a cobrar de la empresa tiene una media de $ 2.950 y desviación típica de $
630. A) Halle el intervalo en el que pueda garantizarse que se encuentra l 60% de estos valores. B) Halle un
intervalo en que pueda garantizarse que se encuentre el 80% de estos valores.
Rta.: a) 1954 y 3946 b)1541 y 4359
4) La cantidad ingresada a la AFIP por Impuesto a las Ganancias año 2015 –en miles‐en los integrantes de toda una
empresa son las siguientes
Cantidad Ahorrada N° empleados
$ 30 a $ 35 3
$35 a $ 40 7
$40 a $ 45 11
$ 45 a $ 50 22
$ 50 a $ 55 40
$55 a $ 60 24
$ 60 a $ 65 9
$65 a $ 70 4
Total
Calcule usando variable codificada: a) La varianza poblacional ; b) desviación estándar poblacional
c) Al menos que porcentaje de la cantidad ingresada se encuentra entre: c.1) más y menos 3 desviaciones
estándar respecto de la media si no se conoce la distribución de datos c.2) más y menos de 1 desviaciones
estándar respecto de la media si no se conoce la distribución de datos c.3) más 1,5 desviaciones estándar
y menos de 1,5 desviaciones estándar respecto de la media si no se conoce la distribución de datos d)
Aproximadamente entre que cantidades está el 92% de los ahorros ;e) Aproximadamente entre que
cantidades está el 68% de los ahorros ; f) Suponiendo que sigue una distribución normal
. ¿Entre qué cantidades está el 68% de la cantidad ingresada?
. ¿Entre qué cantidades está el 92% de la cantidad ingresada?
. ¿Entre qué cantidades está el 95% de la cantidad ingresada?
. ¿Entre qué cantidades está casi la mayoría de los datos de la cantidad ingresada?
Rta: a) Varianza Poblacional=55,96 $2; Desvío Poblac.= 7,48 c.1) 88,89% c.2) Se debe calcular para un valor k>1;
c.3) 55,55% entre $ 40,32 y$62,76 d)El 91,84% de los datos está a más o menos 3,5 desvíos de la media, es decir
entre $25,36 y $77,72 e) Entre 1,76 desvíos en más o menos de la media de $ 51,54 –entre$ 38,38 y $ 64,70‐ , f.1)
a un desvío , f.2) a 1,76 desvíos y f.3) a 3 desvíos. F.4) el 99,99% de los datos está a 4 desvíos de la media.
5) De acuerdo con el teorema de Tchebyshev ¿al menos que porcentaje de cualquier conjunto de observaciones se
encontrará a no más de 1,8 desviaciones estándar desde la media? Rta: 69%
31
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DATOS CUANTITATIVOS BIVARIADOS
MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES: COVARIANZA Y CORRELACION
Objetivo: Temas a comprender Diferencias entre Covarianza y Correlación y su interpretación para
luego, transferir los conocimientos a la unidad temática de Análisis de Regresión.
COVARIANZA: medida de asociación lineal o de la relación lineal entre 2 variables llamadas variables
bivariantes o bivariados.
COVARIANZA:
Medida de relación lineal entre 2 variables.
Mide la variabilidad conjunta entre dos variables
Es una medida descriptiva de asociación lineal entre 2 variables (X e Y)
∑ . ∑ .
, COV. MUESTRAL
∑ .
, COV. POBLACIONAL
La COV. puede tomar cualquier valor No informa sobre la fortaleza de esa relación
Indica el sentido de la relación lineal, si existe entre dos variables. Es decir si:
COV>0 Relación lineal directa o creciente
COV=0 No existe Relación lineal (X e Y son independientes)
COV<0 Relación lineal inversa o decreciente
COEFICIENTE DE CORRELACIÓN: mide la intensidad de esa relación lineal. Es decir, indica el sentido, pero
también el grado de la relación lineal entre 2 variables.
COEFICIENTE DE CORRELACIÓN:
Medida de relación lineal CORRELACIÓN
entre 2 variables que indica la
fortaleza relativa de la asociación lineal entre 2 variables.
Indica sentido y grado de la relación lineal entre 2 variables
, ,
,. , ,. ,
Sus valores oscilan entre
1 1
Grado de correlación (según el valor hallado)
-1 … 0 … 1
Perfecta Fuerte Moderada Débil SIN CORREL. Débil Moderada Fuerte Perfecta
Antes de precipitarse a una respuesta, podría comprobar los resultados y luego pensar que ocurre. Observe
que en la fórmula del coeficiente de correlación se presenta el cociente entre dos valores que tendrán divisor
común, dado que en el numerador y denominador aparece cantidad de datos “n” o “n-1” pues se refiere a
promedios aritméticos de las medidas covarianza y de los desvíos.Si el coeficiente de correlación da cero
significa que ambas variables X e Y no están asociadas linealmente. Según sean los valores hallados de
correlación lineal entre dos variables la representación gráfica es similar a la siguiente.
32
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
REGLA PRÁCTICA: Existe una relación si | |
√
Recordar que Excel calcula siempre automáticamente la Covarianza Poblacional.
Por lo tanto, si trabajo con una muestra puedo hacer COV. POBL . COV. MUESTRAL
¿CAUSALIDAD o SIMPLE CORRELACIÓN?
Las relaciones entre las variables se describen como tendencias, pero no como causa‐efecto.
La sola correlación no prueba la exigencia de un efecto de causalidad, es decir, que el cambio en el valor de una
variable causó el cambio de la otra variable.
Debemos recordar que una Correlación Fuerte puede producirse también por:
a) Simple coincidencia: casualidad
b) Por el efecto de una tercer variable que no se tomó en cuenta en el cálculo
c) Por una relación causa-efecto
CORRELACIONES FALSAS O ESPURIAS son aquellos casos en que la correlación es fuerte, es decir que la medida
estadística presenta una relación fuerte entre dos variables pero que es casual. (Ej. Una correlación fuerte entre
la variable: consumo de aspirinetas y la otra variable: consumo de maníes.
Se debe afirmar que la CAUSALIDAD implica CORRELACIÓN, pero la sola Correlación no implica Causalidad.
EJERCICIOS DE APLICACIÓN de
COVARIANZA Y CORRELACIÓN del Producto – Momento de Pearson
1) Halle las siguientes medidas estadísticas: a) la covarianza, b) el desvío estándar de la variable X y
c) el desvío estándar de la variable Y en la siguiente información
edad estatura en cm
x y
0 56
1 74
2 92
4 104
6 116
10 140
14 159
2) Considerando la siguiente tabla de valores, calcule las medidas estadísticas halladas en el punto
anterior
33
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
edad estat en pulg
x y
0 22
1 29
2 36
4 41
6 46
10 55
14 63
3)Compare los resultados obtenidos con la tabla anterior y Complete la línea punteada)¿ Qué conclusiones
extrae?................................. ……………………………………………………………..Otra utilidad que se encuentra en utilizar el
Coeficiente de Correlación es ………………………………………………………………………………………………………………………………
Johnson Kubby también encuentra una forma práctica para determinar el coeficiente de correlación a
través del trazado de un rectángulo que abarca todos los puntos del diagrama de dispersión y encuentra
1
que r 1
k
¿Qué opinión le merece dicha fórmula en el marco de algún ejercicio?
4) Los siguientes datos representan las calorías y la grasa total que contienen las raciones de una
delicatesen para el café o té que se vende en la dietética.
Producto Calorías Grasa total
1 Barra Nature Crops barra Premium (quinoa, frutillas y yogurt) 170 3,0 gramos
1 Barra de Arroz con Semillas (Amaranto, Chia y Sesamo) dulce leche 59 2,7 gramos
1 Galleta de arroz bañada Lulemu tipo alfajor sabor chocolate 45 2,4 gramos
1 Chocolate sin azúcar agregada con leche Georgalos como barra 142 10 gramos
1 Barrita de arroz yamani integral cubierta con chocolate genuino 66 3,1 gramos
1 Nestlé Pop pochoclo acaramelado recubierto con baño repostería 97 4,3 gramos
1 Choco arroz original de dulce leche Gallo 119 6,1 gramos
a) Calcule la covarianza de la muestra
b) Calcule el coeficiente de correlación.
c) ¿Qué le parece de mayor utilidad para expresar la relación que existe entre calorías y grasa: la covarianza
o el coeficiente de correlación? Explique el porque
d) ¿Qué conclusiones deduce acerca de la relación entre calorías y grasa?
5)Busque información relacionado al relevamiento de datos que representen el valor de exportaciones e
importaciones de varios países en el año……. Posteriormente, calcule la covarianza, el coeficiente de correlación e
interprete ambos resultados.
CONSIGNA:
1-ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
34
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una determinada posición
y construir un marco teórico sobre el tema que trata esas variables, tal como...” La cantidad de personas que
viajan al exterior están influenciadas por el tipo de cambio...”
2 -ETAPA DE RECOLECCIÓN DE DATOS. En esta parte del proceso deberán ponerse en contacto con
la fuente de datos. Para ello, podrán buscar algún cuadro del Instituto de Estadística y Censos que informe
acerca de salida de turistas del aeropuerto internacional de Ezeiza y Aeroparque. También debería
confirmarse que no exista otro aeropuerto internacional para no sesgar los datos, pues se estaría omitiendo
parte de la información. Siguiendo este ejemplo, debería conseguir los datos referidos al tipo de cambio en
igual momento.
La muestra deberá estar conformada de por lo menos seis unidades de análisis y se deberán identificar cual
es la variable explicativa (X) y cuál será la variable explicada (Y)
3.4Cruzar los resultados del punto 3.3. con los valores informados en su calculadora y tildarlos en la tabla
dejando constancia de la forma: o.k. con calculadora
3.5Realizar la tabla del punto 3.3. en una planilla de cálculo tipo Excel (ver guía del curso sobre REGRESION)
y hallar tanto las medidas estadísticas como la representación del diagrama de dispersión.
3.6Interpretar las medidas estadísticas de covarianza y correlación en el marco del problema planteado.
3.7Expresar cuáles de las medidas suministran más información y qué consideraciones deberán tener en la
interpretación de los datos.
4.PRESENTACIÓN DE UN INFORME DE INVESTIGACIÓN. Que de cuenta de los siguientes puntos
obligatorios: (Para ello se ha tomado la Guía de Presentación de informes confeccionada por la Dra. Adriana
Fassio – F.C.E. – Escuela de Estudios de Posgrado, la que ha sido adaptada al curso )
Título: Informe de Investigación: La covarianza y correlación entre ……….. y ……….(especificar las dos
variables en estudio)
a. Presentación: en pocas palabras es una aproximación al trabajo que Ud. está presentando.
b. Planteo del Problema: se trata de describir brevemente el tema que Ud. trata en este trabajo que puede ser
presentado como la pregunta problematizante que pretende resolver con este estudio.
c. Justificación: motivos que determinaron la elección del tema tratado.
d. Objetivos: general y específicos
Objetivo general: Da cuenta de los alcances de la investigación. Los objetivos se redactan a partir de un verbo
en infinitivo, ya que expresan una acción a realizar (describir, explorar, analizar, determinar, etc.).
35
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
e. Objetivos específicos: Se desarrollan a partir de la operacionalización del objetivo general. Describen con
mayor precisión los productos logrados y las variables/aspectos relevantes estudiados para dar respuesta al
tema/problema formulado.
f. Hipótesis: son anticipos de respuesta al problema planteado. Las hipótesis se plantean como guía del trabajo
de investigación y/o para su verificación. Deben estar en concordancia con los objetivos y tipo de estudio.
g. Marco teórico: es un pequeño resumen de lo que Ud. ha leído, se ha informado del tema del trabajo. Es el
resultado del proceso de revisión de la literatura sobre el tema (estado del arte) y la identificación de los
aspectos relevantes a tomar en cuenta para abordarlo con sus definiciones de las variables en estudios. Esta
definición operacional de cada variable es importantísima para cualquier investigación futura, para quien
retoma este trabajo y puede continuarlo o ampliarlo. En el marco teórico, es cuando el investigador toma
postura personal a partir de la revisión del estado del arte. Este punto del trabajo supone la referencia en el
cuerpo del texto de los autores analizados para su construcción. Cuantas más referencias, más rico es el trabajo.
Deberá evitarse los párrafos sin referencias o que no estén debidamente documentados. Se trata en la realidad
de referencias científicas, avaladas por comités académicos. Se utilizan las normas APA en su edición más
reciente para las referencias
h. Metodología: se menciona el Tipo de estudio correlacional dentro de la perspectiva cuantitativa.
i. Fuentes de datos/herramientas de recolección utilizadas/ herramientas de procesamiento de los datos.
Se especifica la procedencia de los mismos y fechas de recolección o presentación con los sitios webs
correspondientes.
j. Universo, muestra y unidad de análisis: especificar
k. Resultados del trabajo de investigación: Es la presentación de todos las tablas y gráficos que debió haber
realizado en la consigna. Da cuenta de tanto del desarrollo del tratamiento cuantitativo de los datos como de
los hallazgos. Conclusiones/reflexiones finales: Como supone el broche del trabajo de investigación y es el
resultado final del desarrollo, en las conclusiones, no pueden incorporarse ejes de discusión no planteados en
los puntos correspondientes a los hallazgos. También se incluyen en la reflexión sobre las limitaciones de la
investigación / consecuencias (si corresponde); sugerencias para investigaciones futuras y cualquier limitación
encontrada en el proceso de investigación.
l. Transferencia: aporte/utilidad del trabajo al desarrollo disciplinar/conocimiento de la temática/ejercicio
profesional según corresponda.
m. Referencias bibliográficas: Deberán listarse por orden alfabético según apellido del primer autor de la
referencia a listar todas las referencias bibliográficas que han sido citadas en todo el trabajo. Se seguirán las
normas APA en su edición más reciente.
Anexos: Podrán incorporarse como Anexos documentos, gráficos, cuadros, etc. que se consideren
complementarios y relevantes para el análisis del trabajo.
EXCEL EN ESTADÍSTICA
Ya habilitado el menú de Estadística
Ingresar los datos en la caja de
dialogo y luego mediante la
elección dentro de la SOLAPA
“DATOS” seleccionar lafunción
“COVARIANZA”
Es donde aparece el siguiente
cuadro de diálogo
36
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
En rango de entrada se sombre la columna con los valores
asignados a la variable X e Y
En rango de salida se sombrea el espacio en donde se
espera obtener los valores de la función
Si se quiere que aparezca el nombre de cada variable se
sombrea ,pero se tilda la opción “Rótulo en la primera fila”
para que no lo considere variable
o bien
se ingresa en la Opción “CORRELACIÓN”
LA ÉTICA EN LA ESTADÍSTICA
Por ser matemática aplicada, cuando se resuelve un determinado problema a partir de datos, se
cubren dos etapas que aluden a dos tipos de tareas con relación al objeto de estudio,
PROCESAMIENTO DE LOS DATOS Tarea que comprende un ANÁLISIS OBJETIVO. La objetividad apunta a
realizar un tratamiento cuantitativo de los datos con aquellas medidas numéricas descriptivas más
apropiadas para lo que se está estudiando.
Ej.: Si los datos presentan asimetría, ¿debería usted reportar solo la media, cuando la mediana es útil?
INTERPRETACIÓN SUBJETIVA Dado que la interpretación la realizan las personas, depende desde la
perspectiva de cómo ve el mundo, por tal razón: debería ser claro y neutral en sus conclusiones.
ÉTICA DEL DISCURSO en la ESTADISTICA Cuando deba exponer resultados de trabajos realizados,
deberá documentar tanto los resultados buenos como los malos y comunicar los mismos de forma
imparcial, objetiva y neutral.
37
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
AUTODIAGNÒSTICO DE ESTADISTICA DESCRIPTIVA.
Marcar con una cruz la/s respuestas correctas a las siguientes expresiones:
1) El modo es
- El valor de la variable con máxima probabilidad de ocurrencia
- El valor de la variable que divide a la distribución en dos grupos con igual cantidad de observaciones cada uno
- El valor de la variable que se repite con mayor frecuencia
- Una medida de posición y frecuencia
- Se grafica en el histograma de áreas.
2) La desviación estándar para el conjunto de valores de salarios de 3000, 3000,3000, 3000, 3000 y 3000 es
-3000
-0
-Ninguno de los valores anteriores
8) Para cualquier distribución de datos, la suma de todas las desviaciones con respecto a su media
-es distinto de cero
-es el desvío medio
-es la varianza
-es igual a cero
38
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
9) La suma de los cuadrados de las desviaciones de los valores observados con respecto a la media
-a veces será negativa.
-Es la varianza
-Es una medida de forma
-Siempre es positiva
-La media es muy representativa de los valores que puede tomar la variable
-Los valores que toma la variable son homogéneos
-Los valores que toma la variable son heterogéneos
-El desvío es significativo con respecto a la media.
16) La varianza es el
-Momento centrado de orden 1
-Momento absoluto de orden 2
-La diferencia entre el momento centrado de orden 2 y el cuadrado del momento centrado de orden 1
-La diferencia entre el momento absoluto de orden 2 y el cuadrado del momento absoluto de orden 1
39
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
40
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Recordemos que Lind, Marchal, Mason consideran como razones para el estudio de Estadística, la presencia de los
datos en todas partes, en donde las técnicas estadísticas se usan para la toma de decisiones y dado que siempre un
ser humano está tomando decisiones lo hace con los datos que cuenta y esa decisión repercute en la vida.
Al respecto, si definimos “decisión” podemos decir que es la resolución que el individuo toma como respuesta a un
problema que debe ser resuelto. Resulta ser el resultado de un proceso mental‐cognitivo del ser humano o de un
conjunto de seres humanos que conduce a la selección y ejecución de una acción.
Un cartel en un escritorio de un importante editor de periódicos decía “No me traiga un problema si no trae una
solución”
Para tomar una decisión, no hay duda que es necesario conocer el problema, comprenderlo lo mejor posible y en
función a la información con la que se cuenta poder dar una solución a ese problema.
Por lo tanto, las decisiones pueden ser consideradas bajo certeza, incertidumbre y riesgo.
Pavesi, Pedro y otros, 2004, La decisión, Buenos Aires: Grupo Editorial Norma parte de un concepto general
definiendo Incertidumbre – en sentido amplio‐ de la siguiente manera: Existe incertidumbre si el decisor cree que
una variable puede adoptar uno de entre, por lo menos, dos niveles posibles, pero no puede asegurar cuál será
dicho nivel. Pero, esta ignorancia puede darse en la propensión a suceder de los niveles de una variable, sino
también de la identificación de los niveles posibles y también de las variables en juego.
Sin embargo, considerando un enfoque estadístico, una decisión bajo incertidumbre significa “el desconocimiento
absoluto de la propensión a suceder, es decir de la probabilidad de un estado determinado de los mundos inciertos.”
Así, en este caso se conocen los estados posibles –sus variables y niveles y otros factores‐ pero no se conoce la
probabilidad de tales estados.
La resolución a problemas de decisión en tales casos lleva a considerar diferentes métodos, entre los cuales será el
decisor quien adoptará el que en forma subjetiva considere más conveniente. El problema es que cada método
puede arribar a resultados distintos.
Uno de los métodos
- Criterio de Laplace de razón insuficiente:
Si una variable puede adoptar cuatro niveles cuya probabilidad se desconoce, entonces los cuatro niveles son
equiprobables: no hay razón suficiente para atribuir una probabilidad mayor o menor a cualquiera de ellos.
Dado, que si esa razón existiera para preferir uno u otro, entonces no se estaría en condiciones de
incertidumbre.
- Criterio de Wald:
Pensando en el criterio de la teoría de los juegos, empleado en la guerra, en tonde el enemigo no perdona y
tratará de provocar el mayor daño. Entonces, adoptando una posición de prudencia máxima, denominada
conservadora se elige la alternativa cuyo peor resultado sea mejor que los peores resultados. Sigue diciendo
Pavesi, es como considerar que el fin de la Bolsa es arruinar al inversor. Son los métodos maximin, minimix o
criterio pesimista. El decisor desconoce la propensión a suceder, desconoce la probabilidad de los estados del
mundo incierto, si bien conoce cuáles y cuantos son esos estados.
41
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
- Criterio maximax o criterio optimista
Es el extremo del criterio anterior, identificando el mejor resultado posible para cada alternativa y seleccionado
el de mayor resultado posible.
- Criterio de Hurwicks:
Adopta una combinación lineal entre el criterio pesimista y el optimista.
- Criterio de Savage:
Considerando el pesimismo del maximín, aplicado al costo de oportunidad de la elección en vez de aplicarlo a
los resultados
Riesgo:
Una decisión bajo riesgo es aquella en la cual conocemos las probabilidades de ocurrencia de los estados posibles
del mundo incierto. Se conoce cuántos estados son posibles y se le puede asignar una probabilidad mayor que cero
a cada uno de ellos.
Se utilizan medidas estadísticas, y se selecciona una vez calculada la esperanza matemática como promedio
ponderado por las probabilidades de los resultados de cada alternativa, la alternativa que tenga mayor esperanza
matemática y otras medidas aún más importantes.
En las decisiones financieras se pueden utilizar modelos determinísticos o modelos probabilísticos.
Un modelo es determinístico cuando los resultados están determinados por las condiciones en que se da.
En cambio un modelo probabilístico también denominado estocástico es cuando se conocen todos los resultados
posibles, hay replica, pero se desconoce cuál será el resultado.
La probabilidad es el concepto que ingresa en la consideración de las decisiones en condiciones de riesgo y es el
aporte que nosotros haremos para materias posteriores.
Definiciones e Interpretación del resultado de probabilidad
La Estadística es un método de Toma de Decisiones ante la incertidumbre basada en la Teoría de las
Probabilidad.
La Probabilidad es el lenguaje y es la medida de la incertidumbre y los riesgos asociados a ella.
Podemos decir que la PROBABILIDAD es la expresión cuantitativa del sentimiento de incertidumbre respecto del
resultado de un fenómeno. Se basa en que en muchos fenómenos inciertos existen patrones a largo plazo.
El valor numérico hallado NUNCA ASEGURA de lo que ocurrirá en la próxima observación, ensayo.
Pues el resultado da información de lo que ocurrirá si se repite una y otra vez
ese ensayo en igual de condiciones y por lo tanto el resultado
hallado es el resultado a largo plazo, es el valor esperado a
largo plazo.
42
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
ENFOQUES DE PROBABILIDAD:
g) Si sabe que en una población de 50200 personas considera‐
das económicamente activas, se detectó según la última
encuesta de Empleo y desempleo que 12.820 personas
estaban desocupadas y desea conocer si selecciona una per‐
zona al azar de dicha población, cuál es la probabilidad de
que se encuentre desocupada Prob.Clásica Prob. Subj. Prob.Frecuenc.
h) En una reunión empresarial, se realiza una encuesta con el
Objeto de conocer la opinión de los empresarios presentes
Acerca de ¿cómo va a evolucionar la economía argentina en
El año 2016? Y ¿qué probabilidad cree usted que tiene el país
de ingresar las marcas de celulares Iphone al país para que
compitan en el mercado argentino? Prob.Clásica Prob. Subj. Prob.Frecuenc.
U=
{0; 1} El espacio muestral es un conjunto finito
b. Experimento 2: Lanzar un dado
c. Experimento 3: Se selecciona al azar un alumno del curso y se registra el peso y la altura
44
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Otro caso: Si repetimos el experimento de lanzar al aire una moneda “n” veces. Cada uno de los resultados
posibles se denomina suceso. El espacio muestral también es un suceso ya que representa la suma de
sucesos simples y el conjunto vacío también es un suceso. Entonces denominamos al suceso A: cara y al
suceso B: ceca. ; n(1): son las veces que sale el suceso A y n(2): las veces que sale el suceso B.
La frecuencia relativa del suceso A denotada como ; mientras que la frecuencia relativa del
suceso B denotada como fB
Las propiedades de la frecuencia relativa:
1) 0 1
2) 1, si solo ocurre el suceso A en las “n” repeticiones
3) 0, si no ocurre el suceso A en las “n” repeticiones
4) Si A y B son sucesos excluyentes + =1
5) Cuando n ∞ la converge en probabilidad P(A) =
n ∞
La probabilidad clásica se define como el cociente entre casos favorables y casos igualmente posibles.
Veamos:
Las propiedades de la probabilidad
1 0 0 1
2) Si S= U n = N y P(S)=1
3) Si = Φ n= 0 y P(S)=0
̅
4) Si es complemento de S (N‐n) : cantidad de resultados del suceso ̅
̅ 1 = 1 – P(S) ; es decir: ̅ 1 – P(S), despejando: ̅ P(S) = 1
El conteo nos permite determinar la cantidad de eventos o sucesos posibles del espacio muestral.
Ej. 1) Una inmobiliaria ofrece la posibilidad de seleccionar el estilo de Viviendas tipo: Casa, Dùplex,
Departamentos, con una sola planta, dos plantas. ¿De cuántas maneras posibles puede un comprador
ordenar una de estas viviendas?
Soluciòn: Dado que N1 = (3) y N2 = (2) Entonces, un comprador puede elegir entre N1 N2 = (3). (2) = 6
viviendas posibles
45
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Entonces el número de formas diferentes en que un cliente puede ordenar un teléfono celular es N1 N2 N3 =
(5). (4). (2) = 40
Ej.3) Halle cuántos puntos muestrales hay en un espacio muestral cuando se lanza 3 dados una sola
vez , es lo mismo que decir un dado que se lanza 3 veces.
Soluciòn: El 1er. Dado puede caer en cualquiera n1 =6 maneras, al igual que el 2do. dado y el 3er. Dado.
Por lo tanto la cantidad de puntos muestrales es N1 N2 N3 = (6). (6). (6) = 216
Nn
cantidad de formas de
combinar “n” objetos
con ”N” opciones c/u.
cantidad de formas o grupos en
que se ordenan “n” objetos de N
n≤N
Si
Dos grupos son diferentes si Dos grupos son diferentes si
Difieren en algún elemento o únicamente cuando tienen
En el orden de los mismos algún elemento diferente
INTERESA LA POSICIÓN INTERESA LA PRESENCIA
IMPORTA EL ORDEN- - NO IMPORTA EL ORDEN-
VARIACIONES COMBINACIONES
! !
N Vn = . … NCn =
! ! !
Si
n=N
PERMUTACIONES
PN = N!
Es la variación de N elementos tomados de a n.
46
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1) En una carrera de 8 ciclistas ¿Cuántos resultados distintos (ordenamientos) pueden darse?
n1 n2 n3 n4 n5 n6 n7 n8 = (8) . (7) . (6). (5) . (4) . (3) . (2) . (1)
8 7 6 5 4 3 2 1
Es el número de formas de ordenar “n” objetos seleccionados de “N” objetos, sin interesar el orden. Es
decir, existe un conjunto general denominado “N” del cual extraemos una muestra “n” de forma ordenada.
Entonces, se denomina Variaciones de N elementos tomados de a n, a la cantidad de grupos de “n”
elementos que se pueden formar con N elementos, considerando que dos grupos son distintos, si difieren
en algún elemento o en el orden. Por eso, se dice que “importa el orden”
Condición: N≥n
!
!
2) Deloitte busca estudiantes de la carrera de actuario para ocupar 4 cargos distintos. Si de los avisos que
reciben los alumnos, se presentan 20 solicitudes de empleo. ¿Cuántas posibilidades diferentes se dan,
suponiendo que todos pueden ser elegidos?
3) ¿Cuál es el número de maneras distintas que se pueden presentar las letras ABC tomadas de a 2, importando
el orden de presentación? Rta: 6
AB
AC -IMPORTA EL ORDEN-
BA
!
BC n Vr 6
!
CA
. . … . !
CB n Vr =
!
. 1 . 2 … 1
Se trata de Variaciones Simples: Número de formas o maneras de ordenar “r” objetos seleccionados de n
objetos en donde importa el orden. Son permutaciones de n objetos tomados de r en r.
4) ¿Cuántas permutaciones posibles con 5 letras ABCDE se pueden hacer si se las coloca en orden de a 2?
Rta: 20
5) ¿De cuántas maneras pueden quedar asignados los títulos de campeón y subcampeón? Si son cuatro
competidores Rta: 12
AB ‐ BA ‐ CA ‐ DA
AC ‐ BC ‐ CB ‐ DB
AD ‐ BD ‐ CD ‐ DC
! . .
n Vr =12
!
47
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
! !
Si sustituimos NPn por el valor nos queda NCn =
! ! !
6) ¿Cuál es el número de combinaciones que se pueden hacer con las letras ABC tomadas de a 2 si no interesa
el orden? Rta: 3
AB
AC -NO IMPORTA EL ORDEN-
BA
3
BC NCn 3
2
CA
CB
Se trata de Combinación: Número de formas o maneras de ordenar “r” objetos seleccionados de n objetos en
donde NO importa el orden.
Aplicación: Número de muestras posibles en un muestreo aleatorio sin reposición de sus elementos.
1) Un comercio cuenta con 180 clientes de los cuales 54 son incobrables. Si por cada cliente se cuenta con
un resumen de situación y se extrae al azar un resumen.
a) ¿Cuál es la probabilidad de que pertenezca a un cliente incobrable?
b) ¿Cuál es la probabilidad de que pertenezca a un cliente no incobrable?
Rta: a) 0,30; b) 0,70
2) Una organización vende 1000 billetes de lotería. Hay 10 premios grandes y 100 premios chicos y todos
deben repartirse. El proceso de selección de los ganadores es tal que al principio todos los billetes tienen
las mismas probabilidades de ganar un premio grande y todos tienen las mismas probabilidades de ganar
un premio chico. Ninguno puede ganar más de un premio.
a) ¿Cuál es la probabilidad de ganar un premio grande con un único billete?
b) ¿cuál es la probabilidad de ganar un premio chico?
c) ¿Cuál es la probabilidad de ganar algún Premio?
Rta: a) 0,01 b) 0,10 c) 0,11
3) ¿Cuál es la probabilidad de acertar un pleno (acertar justo al número que sale) en la ruleta? Rta. 1/37
4) YPF observó que el 75% de los clientes compran nafta INFINIA, el 80% nafta SUPER y el 65%
consume las dos. ¿cuál es la probabilidad de que un cliente consuma al menos una de las dos?
Rta: 0,90
5) En una tirada de ruleta ¿Cuál es la probabilidad de:
a. Que salga el número cero.
b. Que salga el número par
c. Que salga el número par, mayor
Rta: a) 1/37; b) 18/37; c) 9/37
49
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
7) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos, si se pueden
diferenciar los dados? Presente el espacio muestral.
Rta: ¼
8) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos si no se pueden
diferenciar los dados? Presente el espacio muestral
Rta: 1/6
9) Se lanza una moneda equilibrada dos veces. a) ¿Cuál es la probabilidad de que ambos lanzamientos de
cara?
b) Responda, si la probabilidad hallada se interpreta como que si el ensayo se repite: la probabilidad
de que suceda es ese valor hallado
Rta: ¼.
10) Se lanzan 3 monedas. ¿Cuál es la probabilidad de obtener: a) ninguna cara; b) dos caras; c) menos de
dos caras d) una o tres caras, d) 4 caras? Rta: a) 1/8; b) 3/8 ; c) ½; d) ½ ; e) 0
11) De un mazo de 52 cartas de póker, compuesto por 13 cartas de trébol, 13 de corazones, 13 de diamantes
y 13 de picas, se extrae al azar una carta. Calcular la probabilidad de:
a. Extraer un trébol
b. Extraer un trébol o un corazón
c. Extraer un trébol o un corazón o un diamante
d. No extraer trébol. Rta. a) ¼ ; b) ½; c) ¾; d) ¾
12) ¿Cuál es la probabilidad de sacar en un mazo de cartas de 52 naipes, un as o un rey? Rta.: 2/13
13) ¿Cuál es la probabilidad de sacar un 1 o una espada o ambos en un mazo de 48 naipes que no tienen
comodines? Rta = 15/48
14) ¿Cuál es la probabilidad de extraer 2 bolas rojas consecutivas sin devolver a la urna que tiene 3 rojas y
dos bolas verdes? Rta: 3/10
15) ¿Cuál es la probabilidad de obtener un as (A), un rey ® o un dos (D) al extraer un naipe de mazo
debidamente barajado de 52 naipes? Rta: 3/13
16) Una carpeta de “Ajustes Manuales para dar de alta en la Cartera Pasiva de Clientes” contiene 12
cuentas de clientes, de las cuales se detectó que 4 de ellas contienen un error de procedimiento en sus
cuantías.
a) Si un auditor selecciona aleatoriamente una cuenta. ¿Cuál es la probabilidad de que ésta contenga el
error?
b) Si un auditor selecciona aleatoriamente dos de estas cuentas (sin reemplazo): b.1) ¿Cuál es la
probabilidad de que las dos contenga un error de procedimiento? b.2) ¿de que ninguna de ellas tenga
error?
c) Si el auditor selecciona aleatoriamente tres cuentas ¿Cuál es la probabilidad de que ninguna de ellas
contenga un error de procedimiento? Rta: 0,33; 0,09; 0,42 y 0,25
17) De una caja que contiene 3 biromes negras y 4 biromes verdes, se extraen 4 sin reposición. Calcule la
probabilidad de que sean:
a. 1 verde y 3 negras (en ese orden)
b. 2 verdes y 2 negras (en ese orden)
Rta: a) 1/35; b) 3/35
18) En una administración de cartera existen 300 clientes, de los cuales 100 son clientes grandes y los
restantes son chicos por su envergadura. De los clientes grandes el 20% son de Azul y el resto de otros
50
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
lugares del Gran Buenos Aires. Además, el 10% de la cartera total son clientes chicos y de Azul. Asimismo,
para corroborar los datos también se sabe que en la administración hay 250 clientes de los otros lugares
del Gran Bs.As. Determine la probabilidad de que:
a. Un cliente sea de la zona de Azul Rta 1/6
b. Si se eligió un cliente de Azul que este sea chico. Rta 3/5
c. Un cliente sea de Azul o grande Rta: 13/30
d. Un cliente sea de Azul y grande Rta: 1/15
e. Para ello, construya una tabla de asociación y la correspondiente tabla de contingencias,
expresando cada una de los valores que directamente surgen de la tabla y definiéndolos.
19) En el Aeropuerto de Trelew se registraron 500 pasajes de mujeres y 800 de varones, de los cuales el 3%
de las mujeres son turistas y el 5% de los varones son varones turistas. Determine la probabilidad de que
seleccionado al azar un pasajero sea:
a. turista
b. no sea turista
c. varón y no turista
d. mujer y turista
e. mujer y no turista
f. mujer o turista
g. Luego, determine la probabilidad de que sabiendo que es turista, sea varón.
h. Probabilidad de que sea mujer, si se sabe que no es turista.
Rta: a) 0,0423; b) 0,9577; c) 0,5846; d) 0,0115; e) 0,3731 f) 0,4154 g) 0,73 y h) 0,3896
20) En el bar de la Facultad se consume café y té. Se conoce que el 30% consume café, el 60% consume té
y el 5% consume ambos. ¿Cuál es la probabilidad de que elegida una persona al azar, consuma algún tipo
de bebida? Rta: 0,85
21) En un curso conformado por 100 estudiantes, se selecciona al azar un estudiante y se quiere hallar la
probabilidad de que sea un estudiante varón o sea un estudiante menor o igual a 20 años. Se conoce que el
60% son mujeres y el 48% son mujeres mayores de 20 años y el 80% de la población son mayores de 20
años.
Rta: 0,52
B
A P A . P
A
P
B
∑ P A . P
A
22) En una fábrica hay 3 máquinas A1, A2 y A3, que producen el 20%, el 30% y el 50% respectivamente,
de la producción total. La máquina A1 genera 5% de defectos La máquina A2 genera 10% de defectos
La máquina A3 genera 15% de defectos. Si se extrae de la producción un artefacto defectuoso, se desea
saber la probabilidad de haber sido fabricada por la máquina A1.
P (A1/B)=0,08695
23) Frente a denuncias de recipientes con menos contenidos de lo indicado, el gerente comercial no sabe
de qué planta puede provenir, por tal razón se comunica con el gerente de control de procesos de producción
y obtiene la siguiente información
Planta A1 55% total de la producción 3% de recipientes defectuosos
Planta A2 45% total de la producción 4% de recipientes defectuosos
Cuál es la probabilidad de que las botellas defectuosas (B) hayan sido llenadas por la Planta “A”
P (A1/B)=0,4782
51
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
24) En una entidad financiera hay un sistema de alarma. En una noche cualquiera la probabilidad de que:
Suene la alarma cuando hay robo es 0,99
Suene la alarma si no hay robo es 0,01
Ocurra un robo es 0,002
Calcular la probabilidad de que si suena la alarma (B) haya robo (A1)
P (A1/ B)= 0,16555
25) Tres bibliógrafos idénticos contienen facturas en dos colores, las blancas son a cobrar dentro de los 30
días y las rosas a cobrar en plazos más extensos. A continuación se indica los colores de las facturas en
cada bibliógrafo:
Bibliógrafo 1 Bibliógrafo 2 Bibliógrafo 3
6 blancas 3 blancas 8 blancas
2 rosas 5 rosas 10 rosas
Si un empleado recibe una factura que otro extrajo de alguno de esos bibliográfos, la que resulta ser blanca.
Calcule la probabilidad de que esta factura blanca provenga del segundo bibliógrafo.
P (A2/B)= 27/113= 0,2389
26) Dos impresoras láser de diferentes marcas Marca Epson y Marca HP imprimen diariamente 700 y 1000
hojas respectivamente. La experiencia nos indica que la impresora Epson imprime hojas con error en la
proporción del 3% mientras que la impresora HP imprime con error en la proporción del 5%. De la
impresión diaria, se elige una hoja al azar y de ella resulta que tiene error de impresión.
¿Cuál es la probabilidad de que la hoja elegida provenga de la impresora HP? P (A2/B)= 50/71
27)En una entidad financiera que tiene cien mil cuentas de ahorro activas se procedió a realizar una auditoría
de la que resultó gran cantidad de cuentas con diferencias las que se informan seguidamente juntamente
con el oficial de inversiones responsable de esas cuentas
Cartera de cuentas de ahorro Cantidad de cuentas Cuentas con diferencias Oficial de Inversiones
Grupo 1 900 40 Díaz, Horacio
Grupo 2 600 50 Benítez, Marcela
Grupo 3 1.700 60 Martínez, Isidoro
Grupo 4 800 100 Opico, Germán
Si se seleccionó una cuenta de uno de los grupos al azar y resulta ser con diferencias. Determine la
probabilidad de que dicha cuenta provenga del oficial de inversiones Martínez, Isidoro que atiende ese
grupo 3.
28) Del total de piezas de una fábrica que ensambla auto- partes, el 65% provienen del proveedor del Sur y
el 35% del proveedor del Norte. Un estudio reveló que el 98% de las piezas compradas al proveedor del
Sur son piezas de buena calidad mientras que el 95% de las piezas compradas al proveedor del Norte son
de buena calidad.
Si una máquina se descompone por ensamblar una pieza mala: a) ¿Cuál es la probabilidad de que sea del
proveedor del Sur? B) ¿Cuál será la probabilidad de que sea del proveedor del Norte?
P (A1/B)= 0,4262 P (A2/B)= 0,5738
29) Un concesionario de auto sabe que el 10% de las personas que ingresan al local y preguntan, compran
un auto. Por ello, la concesionaria decide ofrecer una cena gratis con un vendedor a todas aquellas personas
que están dispuestas a escuchar la presentación completa del vendedor, así aumentaría la probabilidad de
éxito en las ventas. También se sabe que algunas personas hacen cualquier cosa por una cena gratis y
también que otras personas no quieren cenar con un vendedor, aunque tenga ganas de comprar un auto.
52
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Por ese motivo, se pretende comprobar la eficacia del incentivo. El proyecto se hizo durante 6 meses y el
40% de las personas que compraron un auto cenó gratis. También cenó gratis el 10% de las personas que
no compraron un auto.
a) ¿tienen las personas que aceptan la cena una probabilidad mayor de comprar un auto?
b) ¿qué probabilidad hay de que una persona que no acepta una cena gratis compre un auto?
P (A1/B)= 0,308 y P (A1/B)= 0,069
Conteste V (Verdadero) o F (Falso) o de corresponder, integre las líneas que requiere completar
53
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
20. Si un evento no se ve afectado por el resultado de otro evento, se dice que ambos eventos son: a)
Dependientes. b) Independientes c) Mutuamente excluyentes d) Todos los anteriores e) Tanto b)
como c).
21. ¿Por qué los eventos resultantes de lanzar una moneda al aire son mutuamente excluyentes?
a) Porque el resultado de cualquier lanzamiento no se ve afectado por los resultados de los lanzamientos
que le anteceden. b) Porque no se pueden presentar cara y cruz en el mismo lanzamiento. c) Porque la
probabilidad de obtener cara y la probabilidad de obtener cruz son las mismas. d) Por todas las
anteriores.e) a) y b), pero no c).
22. Si Ay B son eventos mutuamente excluyentes, entonces P (A o B) =P(A) +P (B). ¿De qué manera
cambia el cálculo de P(A o B) si A y B no son mutuamente excluyentes?
a)P (AB) debe restarse de P(A) b) P (AB) debe sumarse a P(A) c) Ninguno de los anteriores.
24. La probabilidad de que un valor escogido al azar de una determinada población sea mayor que la
mediana de la población es: a) 0,25 b) 0,50 c) 1 d) 0,67
LA ÉTICA EN LA ESTADÍSTICA
Al manejar conceptos de probabilidad debiera explicarse el significado de la probabilidad de ganar la lotería si compra un billete
en el que debe contener 6 números ganadores de la lista de 54 números.
Ej. “un aviso en donde se afirma…Seguiremos hasta que hagamos de cada concursante un millonario”
54
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1) Las tres tablas muestran variables aleatorias asociadas a sus probabilidades. Sólo una de ellas es
realmente una distribución de probabilidad. a) ¿Cuál es?, b) Utilizando la distribución de probabilidad
correcta encuentre la probabilidad que X sea: b.1) exactamente 15 ; b.2) no más de 10 y b.3) más de 5.
c) Halle la varianza, desvío, coeficiente de variación
x 0 1 2 3 4 5
P(x) 2/15 1/3 0 1/5 1/15 4/15
a) Grafique la función de probabilidades.
b) Grafique la función de distribución de las probabilidades acumuladas.
c) Halle
P(X>2) Rta: 8/15
P(X 2) Rta: 8/15
P(X 1) Rta: 7/15
P(X <1) Rta: 2/15
F (1) Rta: 7/15
F (6) Rta: 1
P (3 X<5) Rta: 4/15
P (x<1 ó x>4) Rta: 6/15
55
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
3) Describir el espacio muestral y hallar las funciones de probabilidad y de distribución para el tiro
de un dado. Grafique la función de probabilidad.
4) El Gerente de Ventas de una sucursal está analizando el número de ventas que por día se realizó
en un determinado artículo y para ello compiló información de los últimos 50 días. El resultado
fue el siguiente:
a. 1 día con 38 ventas.
b. 2 días con 34 ventas
c. 3 días con 33 ventas
d. 6 días con 32 ventas
e. 13 días con 31 ventas
f. 25 días con 30 ventas
Calcular: a) Probabilidad de que en un día se efectúen a lo sumo 32 ventas
b) Probabilidad de que en un día se efectúen más de 30 ventas
c) Cantidad esperada de ventas diarias, su varianza y su desvío estándar.
X P(x)
0 0,20
1 0,40
2 0,30
3 0,10
6) Un agente colocador de fondos tiene que optar entre tres carteras de inversión alternativas. En base
a información reunida, estima que las condiciones económicas futuras del país pueden seguir tres
escenarios: a) escenario en que desmejoren: probabilidad del 30%; escenario en que sigan sin
cambio: probabilidad del 50% y de que haya un crecimiento en la economía: probabilidad del 20%.
Considerando cada una de las condiciones económicas citadas, los beneficios que obtendría serían
los siguientes
Escenario de la economía Beneficio de la cartera en miles de $
A B C
-Negativo 500 -2000 -7000
- Neutro 1000 2000 -1000
- Positivo 2000 5000 20000
a) Calcule el beneficio esperado para cada cartera. Justifique cuál cartera elegiría.
b) Calcule la desviación estándar para cada cartera y la variabilidad relativa. Justifique utilizando
esta medida qué cartera elegiría.
7) Se define una variable aleatoria como la cantidad de caras que pueden resultar al lanzar una
moneda tres veces. Defina el espacio muestral. Halle la función de probabilidad y la función de
distribución.
56
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Analice para cada una de las situaciones siguientes, si una serie de ensayos Bernoulli
proporciona un modelo razonable y justifique su respuesta.
Situación B: Al finalizar el año, los empleados de una firma son calificados mediante la siguiente
escala de valoración: excelente, aceptable o insatisfactorio. Un ensayo consiste en determinar la calificación
para un empleado de la firma.
Situación D: Una caja tiene 6 gomas de tinta-lápiz y 14 gomas de lápiz o bien de tinta. Se extrae
una goma al azar, se mira y se devuelve a la caja. Cuál es la probabilidad de sacar una goma de tinta-lápiz.
Respuestas:
Situación A: La hipótesis de independencia es dudosa, pues en cualquier período de tiempo hay una
tendencia fuerte de los precios de estos activos a modificar sus precios en forma conjunta, a causa del
cambio en la tasa de interés, noticias políticas…Es decir, que para las acciones de la lista el resultado
depende del cambio en el precio de otras.
Situación B: Los ensayos Bernoulli son buen modeloSi definimos “éxito” tener una calificación
excelente y “fracaso” al complemento (aceptable o insatisfactorio). Pero, si hay restricciones en el número
de calificaciones excelentes no se cumple la hipótesis de independencia.
Situación D: Este experimento tiene dos resultados posibles si definimos: la goma de tinta lápiz es éxito
y el resto es fracaso. Definiendo la V.A.D. como el número de gomas de tinta-lápiz. La probabilidad de
éxito permanece constante, pues existe reposición de elementos.
P(x=1) = p = 6/20 = 3/ 10 = 0,3
La probabilidad de fracaso será P(x=0) = (1-p) = 1 – 0,30 = 0,70
57
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Una distribución de Probabilidad: indica toda la gama de valores que pueden presentarse como resultado
de un experimento. La diferencia con una distribución de frecuencias relativas, es que esta última describe el pasado.
En cambio la distribución de probabilidad describe que tan probable es un evento futuro.
Calcularemos las medidas : media que se denomina esperanza matemática, valor esperado, varianza, desviación
estándar , describiremos sus características y calcularemos probabilidades usando una distribución.
Las medidas estadísticas también serán halladas a partir de la F.G.M, siglas que significan Función Generatriz de
Momentos. Determinaremos la F.G.M. para algunas de las distribuciones.
F.G.M. –Función Generatriz de Momentos- es una Función que permite deducir a través de las derivadas sucesivas,
los momentos absolutos de distinto orden.
Algo de la demostración matemática.: Una F.G.M. para X existe, si existe una constante positiva “b” tal que la FM
es finita para | | .
. . . .
La serie 1 . +….
! ! !
= ∑ p(x) + . ∑ . ∑ . ∑ . ∑ .
! ! !
Recordemos que la derivada de una suma finita siempre es igual a la suma de las derivadas (suponiendo que todas
las derivadas existen).
En consecuencia, E(ext) es una función de todos los momentos alrededor el origen para k= 1,2,3,4…
¬
t=0
58
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN BINOMIAL
!
1
! !
Siendo:
P(x)=Probabilidad de x éxitos en “n” pruebas con probabilidad de éxito “p” constante para cada prueba.
X= número de sucesos en la muestra (X= 0, 1,2, ….,n)
n= tamaño de la muestra –número de observaciones de las pruebas.
p = probabilidad de “Suceso éxito”
q= (1-p) = probabilidad de “Suceso fracaso”
2) En un examen final de estadística con 20 preguntas, cada una con 4 respuestas alternativas. Suponiendo
que todas las preguntas son independientes y que las respuestas serán calificadas como “Bien” o “Mal”.
Calcule la probabilidad de obtener:
a) exactamente 7 respuestas correctas. b) 7 o más respuestas correctas
c) ninguna respuesta correcta d) todas las respuestas correctas
Rta: a) 0,1124; b) 0,2143 c) 0,0032 y d) 0
3) El Sector “Control de Calidad” va a inspeccionar los ítems defectuosos. Se conoce que la producción
total de un cierto proceso es perfecta en un 80%. Para detectar los ítems defectuosos es necesario
destruirlos una vez hecha la inspección. Si se extrae una muestra aleatoria de 17 ítems de un cierto día de
producción en donde se completó 20.000 unidades. ¿Cuál es la probabilidad de contar con 3 o menos
unidades defectuosas? Rta: 0,5489
5) En un estudio reciente se encontró que el 5% de los usuarios de telefonía celular tienen equipo Iphone.
En una muestra de 20 usuarios.
a)¿Cuál es la probabilidad de que por lo menos la cuarta parte tenga Iphone?
b) ¿Cuál es la probabilidad de que menos de 5 tengan Iphone?
c) Exprese y represente la forma de este tipo de distribución.
Rta: a) 0,002 Y b) 0,998
59
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
6) El 34% de los clientes de una Sucursal Bancaria tienen Cuenta Corrientes. Se toma una muestra al azar
de 15 clientes.
6.1.- ¿Cuántos clientes con Cuenta Corriente se espera encontrar?
6.2.- Calcule la varianza y el desvío estándar.
6.3.- Calcule la probabilidad de hallar:
i. exactamente 7 clientes con Cuentas Corriente.
ii. A lo sumo 3 clientes con Cuenta Corriente
iii. Menos de 5 clientes con Cuenta Corriente
iv. Como mínimo 8 clientes con Cuenta Corriente
v. Más de 10 clientes con Cuenta Corriente
vi. Entre 4 y 9 clientes con Cuenta Corriente
vii. Por lo menos un cliente con Cuenta Corriente
viii. Como máximo 6 clientes con Cuenta Corriente.
Rta.: 6.1) 5,1; 6.2) 3,366; 6.3) 1,83 i) 0,1217; ii) 0,1941; iii) 0,3829; iv) 0,0977; v) 0,0021; vi) 0,7960; vii) 0,9980 y viii) 0,7806
7) Una compañía telefónica elige al azar una muestra de 8 abonados. Sabiendo que el 64% de los abonados
tienen un servicio adicional, calcular las siguientes probabilidades acerca de los 8 abonados que han sido
seleccionados:
a) Qué entre 7 y 8 abonados no tengan un servicio adicional
b) Que más de la mitad no tenga un servicio adicional
c) Que entre 2 y 6 tenga un servicio adicional
d) Que la cuarta parte no tenga un servicio adicional.
Rta: a) 0,0042; b) 0,1180; c) 0,8409 y d) 0,2494
8) En una organización escolar se sabe que el 35% de los profesores son mujeres. Se seleccionan al azar 4
profesores para ir de viaje de egresados.
8.1. Se pide calcular:
a) la probabilidad de que en dicho equipo haya ninguna mujer.
b) la probabilidad de que en dicho equipo haya más de dos mujeres.
c) la probabilidad de que en dicho equipo haya a lo sumo 3 hombres.
8.2. Si se extrae una muestra al azar de 90 profesores de esa organización. Determinar la cantidad de
mujeres que se espera encontrar en dicha muestra y con qué desvío.
Rta: 8.1.a) 0,1785; b) 0,1265; c) 0,8215 y 8.2) 31,5
9) El 5% de los engranajes sin fin que produce una máquina automática son defectuosos.
a. ¿Cuál es la probabilidad de que al seleccionar al azar 6 engranajes ninguno sea defectuoso?
b. Cuál es la probabilidad de que haya exactamente
2 engranajes defectuosos - 3 engranajes defectuosos
4 engranajes defectuosos - 5 engranajes defectuosos
6 engranajes defectuosos
c. ¿Qué distribución de probabilidades utiliza y por qué?
Rta: 0,735; 0,031; 0,002; 0; 0; 0
10) Construya en una situación binomial para n=6 las distribuciones de probabilidades y su
representación gráfica considerando:
p= 0,05 p=0,10 p=0,20 p= 0,50 p= 0,70 p= 0,95
¿Qué conclusiones extrae?
11) Construya en una situación binomial para p= 0,10 las distribuciones de probabilidades y su
representación gráfica considerando
n= 6 n=12 n=20 n=40
¿Qué conclusiones extrae y que impedimentos ha encontrado?
60
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN POISSON
1) En la intersección de las calles Córdoba y Junín los registros de accidentes dicen que hay 5 accidentes
diarios. El número de accidentes está distribuido de acuerdo a Poisson.
a) Determine la probabilidad puntual de que en el día ocurran 0, 1, 2... accidentes.
b) Determine la probabilidad de que ocurran 0, 1 ó 2 accidentes en el día.
Rta: 0,0067; 0,0337; 0,0842 y 0,1245
2) Un empleado de un call center de una empresa de cable atiende en promedio 1,2 personas cada 10
minutos. Se desea hallar la probabilidad de que dicho empleado atienda:
a) a 2 personas en 10 minutos.
b) a lo sumo 4 personas en 10 minutos.
c) entre 1 y 4 personas inclusive en 10 minutos
d) menos de 4 personas en 10 minutos.
e) 3 personas en 10 minutos, si se sabe que atendió menos de 4.
Rta: a) 0,2169; 0,9922; 0,689; 0,9662 y 0,0897
4) Una máquina de hilar produce piezas con un promedio de 1 falla cada 200 metros. Determinar la
probabilidad de que una pieza tenga
a) exactamente 3 fallas
b) como mínimo 4 fallas.
Rta: 0,0613; 0,01532
5) La Central de Policía atiende en promedio 5 llamadas por día. ¿Cuál es la probabilidad que en un día
determinado atienda 0, 1, 2 y 10 llamadas?
Rta: 0,0067; 0,0337; 0,0842; 0,0181
1.1) Interpretar el ejercicio planteado y su resolución
61
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
.
DISTRIBUCIÓN HIPERGEOMÉTRICA R N R
N = tamaño de la población
r nr
R = número de éxitos en la población
P(r )
N – R = número de fracasos en la población
n = tamaño de la muestra
r = número de éxitos en la muestra
N
n
1) Una caja contiene 50 legajos de crédito, siendo 40 legajos de clientes en situación normal y 10 legajos
de clientes con atrasos. Extrayendo 5 legajos al azar.
1.1.) ¿Cuál es la probabilidad de obtener 2 legajos de clientes con atrasos, sabiendo que los legajos se
retiran con reposición?
1.2) ¿Cuál es la probabilidad de que los dos legajos estén con atrasos, ya que es obvio que el auditor
cuando extrae el primer legajo no lo repone a la caja pues no revisará 2 veces el mismo legajo? Luego,
determine su esperanza matemática, varianza y desvío.
Rta: 0,2048; 0,2098
2) Un auditor debe inspeccionar un total de 50 carpetas de cuentas corrientes, de los cuales 35 están en
situación normal y 15 no. Si el auditor selecciona 10 legajos al azar.
¿Cuál es la probabilidad? de que:
- 6 legajos correspondan a carpetas de clientes que no están en situación normal
- Todos los legajos que han sido seleccionados al azar no estén en situación normal.
- 9 o más legajos no cumplan con el requisito de estar en situación normal.
Rta: 0,0255; 0 y 0
62
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
RESUMEN DE DISTRIBUCIONES
1)Complete la tabla con las características para las distribuciones discretas que se indican
Bernoulli Binomial Hipergeométrica Poisson
DEFINICIÓN
RECORRIDO
FUNCIÓN
F.G.M.
ESPERANZA
MATEMÁTICA
VARIANZA
DESVIO
2) En que Distribución se utiliza el Factor de Corrección por Finitud.
_____________________________________________________________________.
63
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN NORMAL
D.N.G
Z Si μ= 0 y σ=1
z 0 z
D.N.S
1)Complete
f(z;0;1)=
Características de la Distribución Normal Estándar
DEFINICIÓN
RECORRIDO
FUNCIÓN
F.G.M.
ESPERANZA
MATEMÁTICA
VARIANZA
DESVIO
Una distribución normal con cualquier valor μ y σ puede convertirse en una distribución normal estándar,
restando la media - μ - a cada observación X y dividiendo entre la desviación estándar –σ-.
64
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Así surge el valor Z o puntuación “Z” como medida que indica la dirección y el grado en que un valor
individual se aleja de la media, en una escala de desviación estándar. Por ser independiente de las
unidades empleadas se trata de una cantidad adimensional.
Entonces:
Z: Es la variable que mide la desviación respecto a la media en términos de unidades de desviaciones
estándar y también se le dice puntuación Z, Valor Z
Estas puntuaciones Z son distancias que indican áreas bajo la distribución normal (áreas de probabilidad)
1) Calcule los siguientes valores, utilizando la tablas de “Función de distribución normal estandarizada”
(Probabilidad acumulada hasta un valor de la variable Z)
P(x ≤ 0,85) P (0,21 ≤ x ≤ 0,86)
P(x ≤ -0,85) P (-0,21 ≤ x ≤ 0,86)
P (0 ≤ x ≤ 0,20) P (- 0,86 ≤ x ≤ -0,20)
P (-0.21 ≤ x ≤ 0)
Rta: 0,8034; 0,1976; 0,0796; 0,08317; 0,22194; 0,38828 y 0,22585
2) Calcule para una distribución normal general con media 95 y desviación estándar de 10. P( x ≤
105). ¿Cómo soluciona la búsqueda de la probabilidad?
5) Los ingresos mensuales por ventas de un determinado producto siguen una distribución normal con
media $ 1860 y desvío estándar de $ 270. Encuentre la probabilidad de que las ventas en un mes
seleccionado al azar sean a) inferior a $ 1500 y b) mayor a $ 2100 Rta: 0,09176 y 0,18943
65
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
6) En la Sucursal del Sur de una importante empresa los ingresos semanales de los operarios siguen
una distribución normal con media $ 1000 y desviación estándar $100. ¿Cuál es la probabilidad de
seleccionar al azar un operario cuyo ingreso?
a) esté entre $790 y $1000 -b) sea inferior de $ 790.
c) sea superior de $ 1.000 -d) esté entre $ 840 y $ 1200 Rta: 0,48214;
0,01786; 0,50 y 0,92245
3) En un depósito que contiene 120 cajas de remitos por ventas correspondientes a las dos sucursales,
de las cuales se conoce que 90 cajas corresponde a la sucursal Montes de Oca y las 30 restantes a la
Sucursal Retiro. Las cajas no tienen etiquetas que pueda indicar a cuál sucursal corresponden. Se toman
5 cajas al azar.a) ¿Cuál es la probabilidad de encontrar 3 cajas de remitos que correspondan a la
Sucursal Retiro? Rta: 0,0879
1) En una empresa que elabora artículos de computación se ha comprobado que el 0,8% de los artículos
son con defectos.
Si pienso exportar una partida de artículos de computación y el envío será rechazado si encuentran 4 o
más artículos con fallas. ¿Cuál es la probabilidad de encontrar exactamente 4 artículos con defectos en
una partida de 1000 unidades? Rta: 0,0573
2) Se conoce que el 20% de los contactados telefónicamente por un representante de ventas de Seguro
Automotor se adherirá también a la compra de un Seguro de Vida. Si un representante contacta a 30
personas. Determine la probabilidad de que 10 o más contactados realicen la compra del Seguro de
Vida. Rta: 0,0548
3) Se conoce que el porcentaje de envases buenos elaborados por una máquina es del 55%. Determine
cuál es la probabilidad de encontrar como máximo 70 envases buenos de una partida de 100 envases.
Rta: 0,99901
4) Se conoce que el 12% de los cheques que una entidad financiera recibe para acreditar en las cuentas
corrientes son rechazados.
66
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
a) Si de la caja de cuentas corrientes se toman al azaar 20 cheques ¿Cuál es la probabilidad de que por
lo menos 7 cheques sean rechazados?
b) Del total de 800 cheques enviados a la Cámara Compensadora ¿Cuál es la probabilidad de que se
rechacen entre 90 y 95 cheques? Rta:0,0071 y 0,24121
P (X> xi ) P (X ≤ xi )
0,50
xi xi
Se lee: Probabilidad de más de X Se lee: Probabilidad de X o menos
-0,50
P (X ≥ xi ) P ( X < xi )
xi xi
Se lee: Probabilidad de X o màs; o también Se lee: Probabilidad de menos de X
Probabilidad de por lo menos X
67
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE VARIABLES ALEATORIAS
Y
DISTRIBUCIONES DE PROBABILIDAD
Las preguntas 1 A 5 se responden usando la siguiente tabla que presenta la función de Probabilidad
de una variable aleatoria discreta Y
Y P(y)
1 0
2 0,25
4 0,25
6 0,25
8
1
1. Encuentre P (y=8):
a. 0
b. 0,2
c. 0,25
d. Ninguno
2. Encuentre la esperanza de Y:
a. 5
b. 4
c. 6
d. ninguno
3. Encuentre la varianza de Y:
a. 30
b. 5
c. 2,23607
d. Ninguno
b. 0,1
c. 0,5
d. 1,0
8. Cuál de los siguientes parámetros de esperanza matemática producirá una menor varianza en una
variable aleatoria Poisson:
a. 0,1
b. 5
c. 7
d. 1
9. Una variable aleatoria x tiene una distribución binomial con n=50 y p=0,4. La media y la varianza
para x son:
a. µ=20; 2=12
b. µ=20; 2=3,4641
c. µ=30; 2=12
d. µ=30; 2=3,4641
10. Mencione cuáles son las dos propiedades o condiciones básicas de toda distribución de probabilidad.
12. La varianza
a. Es El momento centrado de orden 3
b. Es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria respecto de su media,
en donde los pesos son las probabilidades
c. Es El momento absoluto de orden 2 menos el momento absoluto de orden 1
d. Se mide en las mismas unidades que la variable aleatoria
15. La distribución Poisson puede definirse como una aproximación de la distribución binomial cuando
a. la cantidad de pruebas tiende a cero y la probabilidad de éxito es muy pequeña.
b. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es igual a la de fracaso
c. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es muy pequeña.
d. Siendo en estos casos la varianza de la distribución Poisson igual a la esperanza de la distribución binomial
19.Cuando la probabilidad de éxito en un proceso de Bernoulli es del 50% p = 0.5, su distribución binomial es
simétrica.
20. Una distribución de frecuencias da una lista de las frecuencias observadas para un experimento que ya se ha
llevado a cabo; una distribución de probabilidad da una lista de aquellos resultados que podrían presentarse si el
experimento se llevara a cabo.
22. Una vez que el valor de p ya se ha determinado para un proceso de Bernoulli, el valor de q se calcula como 1 / 2 p.
23. Si el número esperado de llegadas a una oficina se calcula como cinco por hora, uno puede tener una confianza
razonable de que cinco personas llegarán en la siguiente hora.
24. La Distr, binomial no es realmente necesaria, pues sus valores se pueden aproximar siempre por otra Distrib
25. La estatura de los humanos adultos se puede describir mediante una distribución de Poisson.
26. El factor de Corrección de Finitud se utiliza en el cálculo de la varianza de una distribución hipergeométrica
27. Después de 20 ensayos de un experimento, se crea una curva de distribución con su forma definitiva.
29. Una distribución en la que la media y la mediana tienen diferentes valores nunca podrá ser una distribución normal.
32. Para una distribución binomial dada con n fija, si p < 0.5, entonces:
70
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
34. ¿Cuál de las siguientes es una característica de la distribución de probabilidad para cualquier variable aleatoria?
a) Se da una probabilidad para cada valor posible.
b) La suma de todas las probabilidades es uno. c) No se presenta una probabilidad dada más de una vez.
d) Todos los anteriores. e) a) y b), pero no c).
35. ¿Cuál de las variables siguientes nunca podrá ser descrita por una distribución binomial?
a) El número de partes defectuosas producidas en un proceso de ensamblaje.
b) La cantidad de agua utilizada diariamente por una sola ama de casa.
c) El número de personas de su grupo que pueden responder correctamente a esta pregunta.
d) Todos los anteriores pueden ser descritas por una distribución binomial
7! 0,40 3 0,60 4
36. Si p =0.4 para un proceso de Bernoulli, el cálculo de da la probabilidad de obtener:
3!4!
a) exactamente cuatro éxitos en siete ensayos.
b) exactamente tres éxitos en siete ensayos.
c) tres o más éxitos en siete ensayos.
d) cuatro o más éxitos en siete ensayos.
e) ninguno de los anteriores.
38. ¿Cuál de las siguientes es una condición necesaria para el uso de una distribución de Poisson?
a) La probabilidad de una llegada por segundo es constante.
b) El número de llegadas en cualquier intervalo de un segundo es independiente de las llegadas en otros intervalos.
c) La probabilidad de tener dos o más llegadas en el mismo segundo es cero.
d) Todos los anteriores.
e) b) y c), pero no a).
39. ¿En qué caso sería la distribución de Poisson una buena aproximación de la binomial?
a) n =40, p= 0.32. b) n = 40, q= 0.79. c) n = 200, q = 0.98. d) n = 10, p = 0.03.
e) a) y c). f) Todos los anteriores.
71
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
72
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Complete:
Enunciado del TCL
DISTRIBUCIONES DE MUESTREO
1.
2.
3.
4.
TIPOS DE MUESTREO
A‐
B‐
73
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
74
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Como criterio: una población es infinita si n/N<0,05 y es Población finita si n/N 0,05.
SEGUNDA PARTE
75
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
√ √ √ √
76
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
√ √
√ √
; ;
∗ ∗
Como p es desconocido entonces usamos
Si buscamos “n” a partir del margen de error máximo admitido tendremos que usar
p=q=0,50
1) Una gran población de clientes con deudas vencidas registra un saldo vencido promedio de
$ 1500 con desviación estándar de $ 350.
a. ¿Cuál es la probabilidad de que un cliente con deuda vencida aleatoriamente muestreado tenga saldo
vencido que exceda $ 1600?
b. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 40 clientes con deudas vencidas
registre un saldo que exceda los $ 1600?
Rta: 0,38591 y 0,03515
77
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2) ¿Cuál es la probabilidad de que la media de una muestra de tamaño 16 esté entre 456 y 461, si
proviene de una población con distribución normal con media 458 y varianza 100?
Rta: 0,673
3) ¿Cuál es la probabilidad de que la media muestral sea superior a 4712 si proviene de una población
con distribución normal de 221 elementos, cuya media es 4650 y desvío típico de 216 y se sacó una
muestra de tamaño 25? Rta: 0,06426
4) ¿Cuál es la probabilidad de que la media muestral de tamaño 100 sea superior a 2314 si proviene de
una población con media de 2302 y desvío típico de 563? Rta: 0,416
5) Se conoce que las ventas realizadas por un comercio sigue una Distribución Normal con media de
$ 168.200 y desvío típico de $ 20.604. De las ventas realizadas en el mes una inspección extrae una
muestra de 9 facturas. ¿Cuál es la probabilidad de que la media de la muestra difiera de la media
poblacional más de $ 12.000? Rta: 0,08
6) La antigüedad media de los títulos de deuda del Estado es de 1750 días con un desvío estándar de
1320 días. La SIGEP toma al azar 90 títulos. ¿Cuál es la probabilidad de que la media de la muestra sea
inferior a 4 años? Rta: 0,0188
7) Los pagos en personal de un Ministerio siguen una Distribución Normal con media de $ 3367 y
varianza de 162409. Si se extrae una muestra de 64 liquidaciones, sabiendo que el total de personas que
trabajan en el Ministerio y reciben sus liquidaciones son 12.800. ¿Cuál es la probabilidad de que el
valor de la media muestral sea superior a $ 3.500? Rta: 0,0042
8) Un auditor toma una muestra aleatoria de 36 cajas de ahorro de una población de 1000 libretas de
cajas de ahorro. El valor medio de los saldos en la libreta de caja de ahorro de toda la población es $ 260,
con desvío estándar de la población de $ 45.
a. ¿Cuál es la probabilidad de que la media muestral sea menor a $250?
b. ¿Cuál es la probabilidad de que la media muestral se encuentre en no más de $ 15 de la media?
Rta: 0,09176y 0,9545
10) Se seleccionó una muestra aleatoria de 50 usuarios de cable para participar en una encuesta
telefónica. La pregunta clave que se les planteó fue: ¿tiene Usted o algún miembro de su familia canal
de cable Premium adicional al canal básico? De los 50 participantes, 35 contestaron que no y 15 que sí.
Si la proporción de la población que tiene Cable Premium es 0,40.
a) Encuentre la proporción muestral ̅ de familiares con cable Premium
b) Encuentre el error estándar para la proporción.
c) Probabilidad de que la proporción sea superior al 15% y menor al 38%
Rta 0,30; 0,06928; 0,38756
11) El auditor Levin Rubio de una gran entidad financiera sabe que el saldo promedio mensual de
clientes morosos de la cuenta “tarjetas de Crédito” es $ 112 y la desviación estándar de $56. Si éste
audita 50 cuentas seleccionadas al azar ¿cuál es la probabilidad de que el saldo promedio mensual de
la muestra sea: a) menor que $ 100 b) entre $100 y $130 Rta: a) 0,0643 y b) 0,92
78
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
12) A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligen
aleatoriamente 64 artículos: a) cuál es el error estándar de la muestra y b) cuál es la probabilidad de que
la media de la muestra esté entre 107,5 y 109 Rta: a) 1,4904 y b) 0,0428
13) Una investigadora de la empresa Moli Café se encuentra interesada en determinar la tasa de uso de
café por hogar. Ella cree que el consumo mensual por hogar tiene una distribución normal con media
poblacional desconocida y desviación estándar cercana a 1,25 kg.
La investigadora toma una muestra de 36 hogares y registra su consumo de café durante un mes.
a. ¿Cuál es la probabilidad de que la media de la muestra se aleje de la media de la población no
más de ½ kg?
b. Qué tan grande debe ser la muestra que tome para tener el 98% de certidumbre de que la media
de la muestra no se aleje más del medio kilo de la media de la población?
Este punto podrá resolverlo en el capítulo siguiente Rta: a) 0,9819 y b) 34
14) El salario medio por hora del personal de limpieza de laboratorios en la zona de Capital es de $ 68.
¿Cuál es la probabilidad de encontrar un salario medio por hora de $ 70 o más, si se toma una muestra
de 50 personas, sabiendo que la desviación estándar poblacional es de $ 20 por hora.
Rta: 0,23885
APLICACIONES
DE
CONCEPTOS TEÓRICOS DE DISTRIBUCIÓN DEL MUESTREO
En c/ de los enunciados, marque con una cruz si es V (Verdadero) o (Falso).En este último caso,
justifique como transforma en verdadero dicho enunciado.
1. Cuando los elementos incluidos en una muestra se basan en el juicio del individuo que conduce la
muestra, se dice que la muestra es no aleatoria. Rta: V___/F___
3. Un plan de muestreo que selecciona miembros de una población a intervalos uniformes con
respecto al tiempo, al orden o al espacio se denomina muestreo estratificado. Rta: V___/F___
9. El error estándar de la media disminuye en proporción directa al tamaño de muestra. Rta: V__/F__
10. Para obtener una distribución teórica de muestreo, consideramos todas las muestras de un
tamaño dado. Rta: V__/F__
11. Si la media de una cierta población fuera 15, es probable que la mayor parte de las muestras
que podríamos tomar de esa población tuviera medias de 15. Rta: V__/F__
13. La fracción de muestreo compara el tamaño de una muestra con el tamaño de la población.
Rta: V__/F__
14. La precisión con la que puede usarse la media de muestra para estimar la media de
población disminuye al incrementarse el error estándar. Rta: V__/F__
15. Elija entre el par de símbolos que se siguen a continuación el que mejor complete el
enunciado: “___________es un parámetro, mientras que _______________es una estadística”
a. N, µ b. ,s c. N,n d. Todos los anteriores e. b) c) ,pero no a)
16. ¿En cuál de las siguientes situaciones es la fórmula correcta para calcular
√
a) El muestreo es de una población infinita.
b) El muestreo es de una población finita con reemplazo.
c) El muestreo es de una población finita sin reemplazo.
d) Sólo a) y b).
e) Sólo b) y c)
17. Suponga que una población con N = 144 tiene µ = 24. ¿Cuál es la media de la distribución
de muestreo de la media para muestras de tamaño 25?
a) 24 b) 2 c) 4.8. d) No puede determinarse de la información dada.
18. El Teorema Central del Límite nos asegura que la distribución de muestreo de la media:
a) Es siempre normal.
b) Es siempre normal para tamaños grandes de muestra.
c) Se aproxima a la normalidad al tiempo que se incrementa el tamaño de muestra.
d) Parece normal sólo cuando N es mayor que 1,000.
80
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1. Una porción de los elementos de una población elegidos para su examen o medición directa
es una _______________
7. Dentro de una población, los grupos que son similares entre sí (aunque los grupos mismos tengan
una amplia variación interna) se conocen como _______________.
LA ÉTICA EN LA ESTADÍSTICA
Uno de los errores en el diseño de una encuesta es el “ERROR DE COBERTURA” y genera un sesgo de selección constituyéndose en un
problema ético cuando del marco se excluyen unidades de análisis. Lo mismo ocurre si hay ERROR DE NO RESPUESTA, generando el
mismo sesgo, si el investigador deliberadamente no trabaja con las respuestas faltantes o diseña una encuesta sabiendo que se reduce la
posibilidad de que algunos contesten. El ERROR DE MUESTREO puede generar conclusiones distintas si no se informa el tamaño de la
muestra y al margen de error. También, cuando el investigador lleva a que el encuestado de la respuesta que pretende, sea porque la
pregunta es tendenciosa.
81
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
INFERENCIA ESTADÍSTICA
D
Un solo valor Un conjunto de valores posibles, cerrado y acotado, I
del estimador cuyos límites son funciones del estimador S
T
R
I
B
D
E
P
R
O
B
A
B
I
L
La Inferencia Estadística utiliza un “razonamiento inductivo” porque a partir de los resultados de una
muestra se van a obtener conclusiones sobre la población.
PARÁMETRO ESTIMADOR
a estimar
ESTIMACIÓN PUNTUAL
0,025
Grafica: Suponiendo una Población Infinita proveniente de una distribución Normal conociendo el desvío poblacional
Conceptos:
ERROR DE ESTIMACIÓN
Es la distancia entre una estimación y el parámetro θ
SESGO
Es la diferencia entre la esperanza del estimador y el parámetro
84
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Interpretación
Ejemplo:
P x z. x z. = (1-α)
n n
La Variable Aleatoria x aparece en los extremos con la constante desconocida: µ en la mitad.
M.E. M.E.
b) Centrada en la x y se extiende a de c/lado (caso de desvío conocido y población. infinita
n
c) La longitud o ancho es 2 veces Z. y no es aleatoria
n
d) LO ALEATORIO es la Localización del Punto Medio del Intervalo x
En consecuencia; IC [ x z. ; x z. ]
n n
IC x z. IC x M E
n
O más conciso
EJERCICIOS DE APLICACIÓN de ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE
CONFIANZA
Encuentre el valor “z” para construir el intervalo de confianza según el nivel de confianza
especificado:
Nivel de Valor “z” Valor “z”
confianza Del Límite inferior Del Límite superior
80% -1,282 1,282
90%
95%
99%
1) Una asociación de administradores de consorcio desea conocer el promedio de las expensas anuales.
En una muestra aleatoria de 256 administradores, la media es de $ 4542 y la desviación estándar de
$ 205. a) ¿Cuál es la media poblacional?
85
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2) Necesita estimar la media poblacional, en el caso de estudiar la vida útil de determinada lámpara
de proyectores en donde se conoce la desviación estándar de la vida útil poblacional que es de 500
horas, pero se desconoce la vida útil media. Se toma una muestra de 15 lámparas para proyectores y da
una vida útil de 8900 horas.
Resolver suponiendo:
2.1) Que la vida útil de las lámparas sigue la distribución normal, sabiendo que quiere construir
el intervalo de confianza del a) del 95% y b) del 90% Rta: (8647;9153) ; (8688, 9112)
2.2) ) Que la vida útil de las lámparas no se considera normalmente distribuida y por tal razón
la muestra tomada fue de 35 lámparas en lugar de 15 lámparas, sabiendo que quiere construir
el intervalo de confianza para un nivel del 95% Rta: (8734; 9066)
2.3) Que la población está normalmente distribuida pero no se conoce la desviación estándar de
la población. En la muestra tomada de 35 lámparas dio una desviación estándar de 500 horas
frente a la media de la muestra de 8.900 horas. Resuelva solamente para el 90% de nivel de
confianza. Rta: (8761;9039)
2.4) Que no puede suponer la forma de la distribución, y más aún, no conoce tampoco el desvío
poblacional. Sigue tomando una muestra de 35 lámparas lo que arrojó una media de 8.900 horas
y 500 horas de desvío y debe estimar la media poblacional para un nivel de confianza del 99%
Rta: ( 8682; 9118)
2.5) Que el desvío no se conoce, pero el desvío muestral es 500 horas. Construya el intervalo de
confianza con un nivel de confianza del 95% para estimar la media poblacional, sabiendo que
la vida útil sigue una distribución normal. La muestra ha sido de 15 lámparas con una media
muestral de 8.900 horas. Posteriormente, construya el intervalo en donde se encuentra la media
poblacional considerando un nivel de confianza del 90%. Rta: (8623; 9177) ; (8672;9128)
2.6) Que la muestra de 15 lámparas arrojó una media de 8.900 horas y desvío estándar de 500
horas. Estime la media poblacional construyendo el intervalo con un 90% de nivel de confianza
si se supone que la vida media no está normalmente distribuida. Rta (8492; 9308)
3) En una muestra de 40 restaurantes de comida rápida la venta diaria fue de $ 26.800 y la desviación
estándar de $3.020. a) ¿Cuál es la media estimada de ventas diarias y cómo se llama esta estimación?
b) ¿Cuál es el intervalo de confianza de 99% de nivel de confianza? Interprete sus resultados.
Rta: b) IC [ 25570 28030]
4) El costo variable de construcción de dúplex en una zona del Gran Buenos, por metro cuadrado sigue
una distribución normal. Se tomó una muestra de 16 viviendas con las que se calculó un costo variable
de construcción promedio de $ 2.100 y un desvío estándar de $ 225.
a) Entre qué valores estará el costo variable promedio de construcción si la estimación se hará con un
nivel de confianza del 95%.
b) Estime la varianza poblacional con una confianza del 90%.
c) Luego estime el desvío poblacional con igual confianza
Rta: a) IC [ 1980,13 2219,86] = 0,95; b) IC [30380 104582,7]=0,90; c) IC [174,30 323,4]=0,90
Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía” que es peligroso
hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un intervalo de la
varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media poblacional.”
5) Una empresa con una gran cantidad de empleados están considerando la posibilidad de ofrecer en
conjunto un nuevo servicio de almuerzos para todos. Como integrante en ese estudio de viabilidad del
proyecto se desea conocer el costo diario medio de los almuerzos. En una muestra tomada al azar de
11 empleados se llegó a que los importes consumidos en almuerzo diariamente han sido los siguientes:
$95 $105 $95 $92 $107 $91 $104 $101 $99 $97 $107
86
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
6)El negocio de Nicola dedicado a hacer pasteles los comercializa a 50 pastelerías. Nicola desea
saber el nivel de ausentismo entre sus empleados. A continuación, se da el número de días de
ausencia durante una quincena en una muestra de 10 trabajadores.
4 1 2 2 1 2 2 1 0 3
a) Determine la media y la desviación estándar de la muestra.
b) ¿Cuál es la media poblacional? ¿Cuál es la mejor estimación de ese valor?
c) Proporcione un intervalo de confianza de 95% para la media poblacional
d) Explique por qué usa esa distribución en el ejercicio
e) ¿Puede concluir que el trabajador promedio no faltó ningún día durante una quincena?
Rta: a) 1,8 ; Sn-1 = 1,1353 b) 1,8 -como mejor estimación. c) IC [0,196 3,404] = 0,95
7) En una determinada localidad hay 250 familias. Se realizó una encuesta a 40 familias surgiendo que
la cantidad promedio de consumo anual en turismo es U$s 4.500 con una desviación estándar de U$s
750. Determine un intervalo de confianza de 90% para el consumo anual en turismo.
Rta: a) IC [4320,85 4679,15] = 0,90
9)Un analista de investigación de perfumes obtiene información respecto de una muestra de 100
clientes de los 400 que adquieren una oferta especial determinada. Estas 100 personas gastaron en la
Perfumería un promedio de U$s 24,57 con una desviación estándar de U$s 6,60. Si emplea un intervalo
de confianza considerando el nivel del 95% calcule a) el monto medio de compra para los 400 clientes
y b) el monto total de dinero gastado en compras por los 400 clientes.
Rta: a) b) IC [23,45 25,69] = 0,95 b) IC [9380; 10276] = 0,9
10) Un agente bursátil analiza el rendimiento de un fondo de inversión. Para ello, tomó una muestra
mediante la recopilación de los rendimientos medios generados por ese fondo durante 25 días,
obteniendo un rendimiento medio del 6%. Considerando que el rendimiento de los fondos de inversión
siguen una distribución aproximadamente normal con un desvío del 3,2%.
a) Halle con una confianza del 95% el intervalo para el rendimiento medio del fondo.
b) Halle con una confianza del 90% el intervalo para el rendimiento medio del fondo.
c) Compare e interprete los resultados obtenidos en los puntos anteriores.
d) Calcule la cantidad de días que debería analizar para que el error sea inferior al 0,5% con un nivel
de confianza del 90% Rta: a) IC [0,047456 0,072544] = 0,95; b) IC [0,049472 0,070528] = 0,90 d) n=111
87
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
11) Antes reiterados reclamos el Sector de control de calidad decide calcular la proporción de artículos
que no cumplen con los requisitos de calidad. Dado que resulta dificultoso hacer un relevamiento de
todos los artículos fabricados, se ha decidido estimar dicha proporción a través de una muestra de 64
artículos de los cuales 8 no cumplen con las especificaciones de calidad.
Dada esa evidencia muestral, se solicita:
a) Hallar el intervalo de confianza para la proporción de artículos que no cumplen las especificaciones
en la población, considerando un nivel de confianza del 95%
b) Hallar: b.1) el intervalo de confianza para la proporción de artículos que no cumplen las
especificaciones en la población, considerando un nivel de confianza del 90% y b.2) ¿cómo afectaría la
estimación si la cantidad de artículos fabricados por la empresa han sido 1200?
c) Compare los resultados anteriores e interprételos.
d) Si el error estipulado se quiere reducir en un 25% ¿cuál sería el tamaño de la muestra, considerando
un nivel de confianza del 90%?
Rta: a) IC [0,04397 0,20603] = 0,95; b.1) IC [0,057 0,193] = 0,90; b.2) IC [0,0588 0,19119] = 0,90 d) n=261
12) Un concesionario decide analizar la eficiencia de un vendedor nuevo para estudiar la posibilidad
de incrementarle las comisiones; ventas. Para ello, se analizará además del monto promedio de ventas,
la varianza de las mismas. Del total facturado por ventas realizadas por este vendedor se seleccionaron
al azar las siguientes facturas que arrojan los siguientes valores en miles de pesos
108-136-290-410-72-124-320
Utilizando esta información muestral: Construya el intervalo de confianza para las ventas, que se
distribuyen en forma aproximadamente normal, considerando un nivel del 95% de confianza tanto
para: a) la media; b) la varianza y c) el desvío.
Rta: a) IC [88,69 328,45] = 0,95; b) IC [6976,46 81472,32]=0,95; c) IC [83,52 285,43]=0,95
13) La contabilización de facturas produce una proporción desconocida de comprobantes con datos
diferentes a los reales. Por tal razón, se ha tomado una muestra de 60 comprobantes que arrojaron una
proporción de comprobantes con datos diferentes a los reales del 30%.
a) Hallar los límites de confianza del 95% para la proporción de comprobantes con datos diferentes a
los reales.
b) Determinar la cantidad de comprobantes que debieran someterse a análisis para reducir el error en
un 50%especificando el criterio adoptado para determinar el tamaño muestral.
Rta: a) IC [0,184045 0,415955] = 0,95; b) n= 286
14) Según una encuesta realizada, se pudo establecer utilizando una muestra de 8740 familias que la
proporción de familias que consumen productos light se encuentra entre el 28,74% y el 31,26%. Se pide
hallar el nivel de confianza si se conoce a partir de la muestra que 2622 familias consumen productos
light.
Rta: (1-α)= 0,99
88
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE INFERENCIA ESTADÍSTICA
Conteste Verdadero –V- o Faso en los siguientes enunciados y en el caso de ser Falso,
modifique el texto de forma tal que se haga Verdadero.
1. Una distribución del muestreo es la distribución que enlista algunas de las posibles estadísticas muestrales
obtenidas de muestras de igual tamaño que pueden extraerse aleatoriamente de la misma Población, en donde
se considera tanto el muestreo con reposición como el muestreo sin reposición.
Rta: V__/F__
3. El error estándar de la ………., es el nombre que generalmente se usa para expresar la desviación estándar de
la distribución muestral de la estadística que se mencione en el espacio integrado por punto.
Rta: V__/F__
4.El error estándar de la media aumenta a medida que el tamaño de la muestra aumenta.
Rta: V__/F__
6. Los histogramas para representar todas las distribuciones muestrales son simétricos.
Rta: V__/F__
7. Una muestra aleatoria se obtiene en forma tal que todas las muestras posibles de tamaño n tienen igual
probabilidad de ser seleccionadas. Rta: V__/F__
8. Lo que determina la dispersión de una distribución del muestreo dice Anastasia: “es el número de muestras
empleadas” y Tatiana dice que “es el tamaño de cada muestra empleada.
Rta: V__/F__
10. El T.C.L. sintéticamente expresa que la distribución del muestreo se asemejará más estrechamente a la
Distribución normal cuando el tamaño muestral aumenta. Rta: V__/F__
11. Un nivel de confianza del 90% significa que la probabilidad de que el intervalo tome esos valores es del 90%
Rta: V__/F__
12. Las Distribuciones “t” de Student tienen una distribución aproximadamente normal, pero están más dispersas
que la distribución normal estándar, por eso son leptocúrticas
Rta: V__/F__
13. Se dice que un estadístico es un estimador eficiente de un parámetro si, al aumentar el tamaño de la muestra,
es casi seguro que el valor del estadístico se acerca mucho al valor del parámetro.
Rta: V__/F__
89
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
14. Una estimación de intervalo es un intervalo de valores utilizado para estimar la forma de la distribución de
una población.
Rta: V__/F__
15. La probabilidad de que un parámetro de población se encuentre dentro de una estimación de intervalo dada
se conoce como nivel de confianza.
Rta: V__/F__
16.Al aumentar el tamaño de la muestra, la distribución t tiende a una forma más plana.
Rta: V__/F__
17. Debemos utilizar siempre la distribución t, y no la distribución normal, cuando se desconoce la desviación
estándar de la población.
Rta: V__/F__
18.Cuando se utiliza la distribución t para hacer estimaciones, se debe suponer que la población es
aproximadamente normal.
Rta: V__/F__
19. No siempre es deseable utilizar niveles de confianza altos, debido a que producen intervalos de confianza
grandes.
Rta: V__/F__
20. Existe una distribución t distinta para cada posible tamaño de muestra. Rta: V__/F__
21. Una estimación puntual a menudo resulta insuficiente, porque sólo puede ser correcta o incorrecta.
Rta: V__/F__
22. Se dice que una media de muestra es un estimador no sesgado o imparcial de una media de población debido
a que ningún otro estimador podría extraer de la muestra información adicional acerca de la media de la población.
Rta: V__/F__
.
22. El error estándar de la población se calcula como
Rta: V__/F__
23. El número de grados de libertad que se utilizan en una estimación de distribución t es igual al tamaño de la
muestra.
Rta: V__/F__
24. Conforme aumenta el tamaño de la muestra, la distribución t se aproxima menos a una distribución normal.
Rta: V__/F__
25.Conforme aumenta el ancho de intervalo de confianza, el nivel de confianza asociado con el intervalo también
se incrementa. Rta: V__/F__
2. Suponga que se preguntó a 200 miembros de un grupo si les gusta o no un producto en particular. 50 dicen que
sí y 150 dicen que no. Suponiendo que “sí” significa un éxito, ¿cuál de las siguientes es correcta?
a) ̅ = 0.33.
b) ̅ =0.25.
c) ̅ =0.33.
d) ̅ =0.25.
e) b) y d), solamente.
3. Suponga que está tomando una muestra y calcula es 100. Después calcula el límite superior de un intervalo de
confianza del 90% para m ; su valor es 112. ¿Cuál es el límite inferior de este intervalo de confianza?
a) 88.
b) 92.
c) 100.
d) No se puede determinar a partir de la información proporcionada
4. Después de tomar una muestra y calcular ̅ y s, un especialista en estadística dice: “tengo el 88% de certeza de
que la media de la población está entre 106 y 122”. ¿Qué es lo que quiere decir en realidad?
a) La probabilidad de que µ se encuentre entre 106 y 122 es de 0.88.
b) La probabilidad de que µ = 114, el punto medio del intervalo, µ5.
c) El 88% de los intervalos construidos que fueron calculados a partir de las muestras de tamaño “n” contendrá
el parámetro poblacional µ
5. ¿Cuál de las siguientes es una condición necesaria para utilizar una tabla de distribución t? a) n es pequeño.
b) Se conoce el desvio muestral , pero no el poblacional .
c) La población es infinita.
d) Todos los anteriores. e) a) y b), pero no c).
6.Suponga que intentamos estimar una varianza de población utilizando . No es correcto calcular S2 como ∑(x
– ̅ )2/n debido a que el valor sería:
a) Sesgado.
b) Ineficiente.
c) Inconsistente.
d) Insuficiente.
7. Suponga que, de una población con N 5 50, se toma una muestra de tamaño 15; se sabe que es igual a 36 y
que S 2 para la muestra es 49; la x para la muestra se calcula en 104. ¿Cuál de las siguientes deberá utilizarse para
calcular un intervalo de confianza del 95% para µ?
a) La distribución t de Student.
b) La distribución normal.
c) Multiplicador de población finita.
d) a) y c), pero no b).
e) b) y c), pero no a).
8.. Podemos utilizar la distribución normal para representar la distribución muestral de la población cuando:
a) El tamaño de la muestra es mayor que 10.
b) El tamaño de la muestra es menor que 50.
c) El tamaño de la muestra es mayor que 5.
d) Ninguno de los anteriores.
9. Se sabe que la calificación promedio de los 25 estudiantes del curso de matemáticas de quinto año del colegio
High College es de 66 puntos. Al elaborar un intervalo de confianza del 95% para la calificación promedio de
todos los alumnos del quinto año, deberíamos usar:
a) La distribución normal con 24 grados de libertad.
b) La distribución t con 24 grados de libertad.
c) La distribución t con 65 grados de libertad.
d) La distribución t con 25 grados de libertad.
91
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
10. Cierta población con distribución normal tiene una desviación estándar conocida de 1.0. ¿Cuál es el ancho
total de un intervalo de confianza del 95% para la media de la población?
a) 1.96.
b) 0.98.
c) 3.92.
d) No se puede determinar con la información proporcionada.
1. Un solo número que se utiliza para estimar un parámetro de población desconocido es un(a)
__________________
2. Un intervalo de valores que se utiliza para estimar un parámetro de población desconocido es un(a)
____________________________
3. Una vez que sabemos algo acerca de una muestra, el número de valores de la muestra que podemos
especificar libremente se conoce como _________________
5. Cuando damos una estimación de intervalo de un parámetro de población, hacemos notar qué tan seguros
estamos de que el intervalo contiene al parámetro real de la población, estableciendo
un________________________________
92
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN
NORMAL DESCONOCIDA
DESVÍO DESVÍO
DESVÍO DESVÍO
CONOCIDO DESCONOCIDO
CONOCIDO DESCONOCIDO
n 30 n 30 n 30 n 30 n 30 n 30 30
n 30 n
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN NORMAL
93
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
RECORDAR: Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía”
que es peligroso hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un
intervalo de la varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media
poblacional.”
DISTRIBUCIÓN NORMAL
LA ÉTICA EN LA ESTADÍSTICA
Cuando se hace inferencia se debe dejar informado el tamaño de la muestra, los límites del intervalo de confianza y la
interpretación de su significado.
Los resultados estadísticos en donde más engañoso se presentan son los relacionados a sondeos políticos, por lo que los resultados
deben estar seguidos del error de muestreo implicado, la metodología utilizada, el tamaño de la muestra, el intervalo de confianza hallado.
94
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN EN EL MUESTREO
“No diga: He hallado la verdad, sino he hallado una verdad” Kahlil Gibran
La prueba de hipótesis comienza con una afirmación o suposición acercad de un parámetro poblacional.
HIPOTESIS NULA - Ho -
El planteo de la hipótesis comienza con la denominada Hipótesis Nula –Ho – cuyo subíndice 0
indica no hay diferencia, no hay cambio y convenimos (por convención general en la mayoría
de la literatura estadística) que tiene que contener el signo igual por lo que se trata de la
afirmación de algo.
Es el punto de partida del investigador. Mantiene el status quo
95
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
La hipótesis nula siempre tiene el signo igual y NUNCA el igual aparecerá en la hipótesis
alternativa, porque la Ho es la afirmación y cuando se realizan los cálculos se requiere de un
valor específico.
La Ho es una afirmación que no se rechaza a menos que exista evidencia muestral que nos lleve
a rechazarla, es decir a no aceptarla.
Ahora bien, si la evidencia muestral nos lleva a aceptarla, no significa que sea la Ho verdadera,
sino que no encontramos evidencia suficiente para rechazarla. Para probar que sea la Ho
verdadera tendríamos que hacer un censo de la población.
Por ese motivo, cuando se concluye “Aceptar la Ho” en realidad se debe decir “No se rechaza la
“Ho” ya que no se encontró evidencia muestral suficiente que permita rechazarla.
Se concluye expresando: Existe evidencia muestral que indica que la hipótesis nula …….
PARAMÉTRICO NO PARAMÉTRICO
o Requieren hipótesis con respecto a parámetros o La prueba no necesariamente se relaciona con
poblacionales parámetros poblacionales
o El nivel de medición, debe permitir operaciones o Los datos no tienen fuerza suficiente como para
aritméticas que tengan significado (escala de recomendar operaciones aritméticas con
medición intervalar o de razón) verdadero significado (escala de medición
inferiores a la de intervalos)
96
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Decisión Situación
Estadística Ho –Verdadera- Ho –Falsa-
No rechazar Ho
Rechazar Ho
DE
CORRIDA
97
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
LOS 6 PASOS EN LA
PRUEBA DE HIPÓTESIS
1. Establecer
hipótesis nula H0
hipótesis alternativa H1
2. Elegir
: nivel de significación -máximo riesgo tolerable
de rechazar incorrectamente la H0
n: tamaño de la muestra
3. Determinar
- el estadístico estandarizado de prueba: Z, T, X2
como único número calculado a partir de los datos muestrales
- el valor p: probabilidad calculada usando el estadistico de prueba
4.Hallar
el o los valores críticos, que divide en dos regiones,
rechazo, aceptación de la hipótesis nula
98
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
1) Exprese en cada caso, si está bien planteada la hipótesis estadística (V ó F) y por qué. Luego, en
cada caso, exprese el tipo de test a utilizar (bilateral, unilateral contra mayor, unilateral contra
menor) con la representación gráfica.
a) Ho : µ > 200 g) H1 : µ = 200
b) Ho: 350 h) Ho: p 0,80
c) Ho : µ = 2
i) H1 : p 1, 80
d) H1 : x 0,80 j) H0 : p 0,80
e) Ho: : x <4320 k) H1: µ ≠200
f) Ho: µ < 350
Rta: V: c); j) y k; Test bilateral –contra distinto-: b) ; c) g) y k); Test
unilateral contra mayor: e); f) h) y j). ; Test unilateral contra menor: a); d); i)
2) En el envase de las barras de arroz con semillas de amaranto, chia y sésamo de 12 gramos se informa que
aporta 46 calorías. Responda a las preguntas relacionadas con un test de hipótesis para probar lo expresado
en el envase sobre las calorías. a) Plantee el Ho y la H1 adecuada b) En esta situación, interprete ¿cuál es
el error de tipo I y las consecuencias que genera cometer este tipo de error? c) ¿cuál es el error de tipo II y
las consecuencias de cometer este tipo de error?
3) Se está evaluando implementar un nuevo método de enseñanza si mediante una prueba de hipótesis se
confirma la conclusión de que el nuevo método de enseñanza reduce la proporción de ausentismo en la
materias. a) Plantee la hipótesis nula y la alternativa si la proporción de ausentismos actual en la materia
es del 30% b) En esta situación, interprete ¿cuál es el error de tipo I y las consecuencias que genera cometer
este tipo de error? c) ¿cuál es el error de tipo II y las consecuencias de cometer este tipo de error?
1) En una compañía que vende todo a crédito, se sabe que el valor medio de la totalidad de las cuentas por cobrar
es de $ 2600 con una desviación estándar de $430. Para ello, el auditor de la misma tomará una muestra de 36
cuentas y rechazará el supuesto de $ 2600 solo si es claramente contradicho por la media muestral.
Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test b) Especifique el nivel
de significancia c) Seleccione el estadístico de la prueba d) Establezca los valores críticos de la estadística de
prueba e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $ 2400. ¿Acepta la hipótesis
con un error de tipo I del 5%? Además, Halle el valor del estadístico de prueba : (en función a los valores observados
en la muestra):teórico y empírico
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio diferente a $ 2600.
2) Con relación a los datos anteriores, al auditor anterior no le interesa el promedio de la totalidad de las cuentas
por cobrar que excedan los $ 2.600 sino que está preocupado por las cuentas a cobrar menores a $ 2600.
a) Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test
b) Especifique el nivel de significancia c) Seleccione el estadístico de la prueba d) Establezca los valores críticos
de la estadística de prueba e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $
2400.Acepta la hipótesis a un nivel de significancia del 5% Además, Halle el valor del estadístico de prueba :
(en función a los valores observados en la muestra):teórico y empírico
99
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio menor a los datos anteriores que eran de $
2600. La decisión es informar a la compañía que las ventas a plazo han bajado.
3)Los ingresos promedio anuales para determinado cargo son de $ 670 miles para las mujeres. El Sindicato decide
investigar si es cierto el reclamo presentado por un grupo de mujeres sobre la diferencia de sexo para las
remuneraciones. Se pregunta ¿los varones tienen ingresos promedio mayor a las mujeres? Si tomada la muestra a
40 varones dio un promedio de $ 725 miles con un desvío de $ 102 miles. Considerando un nivel de significancia
del 1% determine si será cierto lo que el investigador está investigando frente al reclamo presentado.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 1%. Luego,
se concluye que las remuneracioes promedio de los varones son mayores que la de las mujeres. La
Probabilidad de que se tome una decision incorrecta es del 1%
4)El rendimiento diario de la soja ha promediado 880 toneladas en un determinado lugar del Gran Buenos. A la AFIP
le gustaría conocer si este promedio cambió en los meses recientes. Los inspectores seleccionan al azar de la base
de contribuyentes sojeros 50 días y surge como rendimiento diario medio de 871 toneladas con desvío muestral
de 21 toneladas. Contraste la hipótesis con un 5% de nivel de significancia.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el rendimiento diario promedio de soja de los valores informados de 880 toneladas.
5)En los estuches de las lámparas se especifica que el ciclo medio de vida útil de esas lámparas de bajo consumo es
de 4200 horas. Como estudio preliminar, ante reiterados reclamos de los consumidores una empresa decide
investigar la situación planteada a partir de una muestra que le ayuda a determinar si el consumo de las lámparas
actualmente es menor a las especificaciones del producto.
Tomada una muestra de 10 lámparas, se extrae que el ciclo medio es de 4000 horas con una desviación estándar
muestral de 200 horas. Dado que el ciclo de vida útil de las lámparas sigue una distribución normal. Probar la
hipótesis nula a nivel de significancia del 5%.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el ciclo medio de vida útil de las lámparas es menor al informado en el producto, razón
por la cual se toma la decision de realizer una reunion con el Sector de Producción y de Calidad, para
tomar las medidas correctivas.
6)Se quiere determinar si el proceso de llenado de una caja chica de arroz yamaní funciona de manera adecuada,
es decir que el llenado medio a lo largo de todo el proceso de empaque continúa en 368 gramos especificado en la
caja y no se requiere acción correctiva. Para evaluar el requisito de 368 gramos conociendo además el desvío
estándar poblacional de 15 gramos proveniente de una población normal el gerente de empaque selecciona al azar
una muestra de 25 cajas, pesa cada caja, registra los valores‐ Procesados los mismos, da una media muestral de
372,5 gramos y debe evaluar la diferencia existente entre el estadístico de la muestra y el parámetro poblacional
establecido. A un nivel de significancia del 5% ¿cuál es la conclusión?
Rta: Existe evidencia muestral suficiente para aceptar la Ho al nivel de significancia del 5%. Luego,
se concluye que el proceso de llenado del arroz funciona de manera adecuada, pues en promedio el
contenido es de 368 gramos con un nivel de significancia del 5%
7)Usted como gerente de Kansas quiere determinar si el tiempo de espera al pedir una orden se ha modificado
durante el último año respecto a su valor de media poblacional de 4,5 minutos. Los tiempos de espera siguen una
Distribución Normal. A partir de experiencias anteriores, se supone que la desviación estándar poblacional es de
1,2 minutos. Seleccionada una muestra aleatoria de 25 pedidos u órdenes en el transcurso de una hora, la media
muestra es de 5,1 minutos.
Determine si hay evidencia muestral que indique con un nivel de significación del 5% que el tiempo de espera medio
para servir un pedido se ha modificado.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que a un nivel de significancia del 5% los tiempos de espera se han modificado de la media
de 4,5 minutos. Sería conveniente, comprobar si los tiempos se redujeron demostrando una eficiencia
100
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
8)Un auditor decide probar el supuesto de que el valor medio de la totalidad de las cuentas por cobrar de clientes
chicos de una Pyme es de $ 260 con una desviación estándar de los montos de las cuentas por cobrar de $ 43,
tomando una muestra de 36 cuentas de clientes chicos y calculando la media muestral. El auditor desea rechazar
el valor supuesto de $260 solo si es claramente contradicho por la media muestral, caso éste en el que el valor
hipotético recibiría el beneficio de la duda en el procedimiento de prueba. Para ello fija un nivel de significancia del
5%. a) ¿Cuáles son las conclusiones del auditor si una vez obtenida la muestra de 36 clientes chicos, la misma arroja
una media de cuentas a cobrar de $240?
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el valor medio de las cuentas a cobrar es de $260 La probabilidad de que se tome una
decision incorrecta es del 5% y en este caso el auditor puede concluir que los valores informados por
la empresa son razonables y abrir otra auditoria de dicha cuenta.
9)Recientemente una empresa que realiza ventas de lámparas para proyectores ha recibido numerosos reclamos
respecto a que la duración de los repuestos es inferior a 1000 días comprometidos en el prospecto. Toma una
muestra al azar de 9 lámparas y el promedio de vida útil de las lámparas según la muestra de 9 lámparas es de 973
días y el desvío es de 37,50 días. Se pide: a) Realice la prueba a un nivel de significación del 1%, b) Realice la prueba
a un nivel de significación del 5% considerando que la duración de los repuestos de lámparas para proyectores sigue
una distribución aproximadamente normal. c) Determinar la potencia del test considerando que la verdadera
duración promedio es de 990 días.
Rta: a) No se dispone de un test paramétrico por falta de conocimiento de la forma de distribución de
las lámparas. b) Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del
5%. Luego, se concluye que la duración de las repuestas de lámparas para proyectores es menor. La
probabilidad de que se tome una decisión incorrecta es del 5%. La decisión lleva a presentar un informe
a la Gerencia de Control de Calidad para que tome las medidas correctivas.
10)Usted está convencido de que su instrumento de medición tiene una variabilidad medida por la desviación
estándar σ=2. D. Normal. Se considerará un erro r de tipo I del 10% para probar la hipótesis. Un experimento
realizado registró las siguientes medidas: 4,1; 5,2 y 10,2. ¿Qué conclusiones extrae usted a partir de la evidencia de
esta muestra aleatoria?
Rta: a) Existe evidencia muestral que indica no rechazar la Ho al nivel de significancia del 10%.
Luego, se concluye que el instrumento de medición no registra variabilidad diferente a la de la hip.nula.
11)En el restaurante Clo‐Clo el 20% de los clientes al mediodía son mujeres. Para incrementar la proporción de
mujeres se realiza un menú (2*1). Un mes después de realizada la promoción se realiza un estudio observacional
para determinar si la proporción de mujeres aumento. Usando un nivel de significancia del 5% ¿qué concluye?
Considere una muestra de 400 clientes en las que 100 son mujeres.
Rta: a) Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego, se
concluye que la publicidad del 2*1 generó un aumento de clientes mujeres, por lo que le resultaría favorable en
los ingresos del restaurante.
12)En una empresa que arma autopartes piensa el Supervisor que existe demasiada variabilidad en el tiempo de
vida útil de los que están armadas durante el turno de los fines de semana. Se sabe que el ciclo de armado funciona
correctamente y deberían durar dichas autopartes 45000 horas con una desviación estándar de 4000 hs. Un
Supervisor encargado de hacer una prueba para determinar si la variabilidad de las autopartes armadas que se hace
en el turno de los fines de semana supera al de la variabilidad del resto de los días, por ello, toma una muestra de
12 autopartes armadas que arrojaron una desviación estándar de 4120 hs. Considerando un nivel de significancia
del 2,5% ¿qué conclusiones extrae?
Rta: Como el valor empírico resulta menor al valor teórico, se acepta la hipótesis nula a un nivel de significancia
del 2,5% . Por lo tanto, existe evidencia muestral que indica que la variabilidad de los tiempos de vida útil del
armado de auto-partes no supera 4000 hs, con un nivel de significancia del 2,5%. Por ello, no sería cierta la
sospecha del Supervisión acerca del funcionamiento incorrecto del ciclo de armado durante los fines de semana.
101
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
13)Se desea conocer a un nivel de significación del 10% si el desvio estándar del peso de las mermeladas de
arándanos para la exportación difieren del límite aceptable de 1,7 kg. por lote. Para ello, se toma una muestra de
25 lotes la que arroja una desviación estándar de 2,2 kg.
Rta: Como el valor empírico se encuentra fuera de los valores críticos o teóricos , se rechaza la hipótesis nula
a un nivel de significancia del 10% . Existe evidencia muestral que indica que el desvío de los pesos de las
mermeladas de arándanos difieren del límite acceptable de 1,7 kg. por lote , con un nivel de significancia del
10%. Consecuentemente, se debe advertir a los responsables de la firma para que generen medidas correctivas.
14)El Departamento de Control de Calidad de una fábrica de cosméticos afirma que el porcentaje de defectos
supera el límite tolerable del 1%. Por ende, se hace una prueba seleccionando 100 envases de los cuales resultaron
con defectos 5 de ellos y se considera un error del tipo I del 2,5%. Determine si es cierta la afirmación del
Departamento de Calidad que lo lleva a realizar esta investigación.
Rta: Como el valor empírico resulta mayor al teórico , se rechaza la hipótesis nula a un nivel de significancia
del 2,5% . Existe evidencia muestral que indica que la proporción de defectos en los cosméticos supera el límite
tolerable del 1%, con un nivel de significancia del 2,5%. Consecuentemente, se debe advertir a los responsables
de la firma para que generen medidas correctivas.
15)Sushi Club ofrece un servicio a domicilio en donde le garantiza al cliente una puntualidad en el tiempo medio de
entrega, por lo que le dice que la entrega es inferior a los 10 minutos. Por otro lado, el Servicio de Personal de Sushi
Club decide dar un premio a fin de año como estímulo a sus empleados, si es cierto que eso sucede. De los 250
pedidos del día, se tomó una muestra de 20 pedidos calculándose un tiempo medio de 8,5 minutos y un desvio
estándar de 1,3 minutos. Admitiéndose que los tiempos se distribuyen normalmente, con un nivel de significación
del 3% concluya su informe comunicando si es cierta la hipótesis nula y que decisión deberá tomar Personal.
Rta: Como el valor empírico es menor al valor crítico o teórico, no se rechaza la hipótesis nula a un nivel de
significancia del 1%. Existe evidencia muestral que indica que con un nivel de significancia del 1% que la
publicidad que realiza Sushi Club está en lo cierto y por lo tanto Personal podrá dar un premio a fin de año a
sus empleados.
16)En una publicidad de un lavarropas se expresa que a lo sumo el 3% de los lavarropas de marca “GENIUS”
requieren servicio técnico antes del segundo año de uso. Para comprobar dicha publicidad, dada la cantidad de
reclamos de consumidores a la Organización de Derechos del Consumidor, ésta sospecha que los lavarropas de
maca “Genius” que requieren servicio técnico antes del segundo año de uso son más que el 3% que lo publicitado
por esa marca. Por ende, la O.D.C. realizó encuestas a 150 personas que compraron la marca GENIUS de lavarropas
solicitándoles informen si “solicitaron servicio técnico dentro de los dos años de la compra del producto”.
Procesadas las encuestas, se detectó que las respuestas afirmativas ha sido 15. ¿Qué conclusiones puede extraer
con un nivel de significancia del 1,0%?
Rta: Como el valor empírico es mayor al valor crítico o teórico , se rechaza la hipótesis nula a un nivel de
significancia del 1% . Existe evidencia muestral que indica que con un nivel de significancia del 1% que el
porcentaje de lavarropas que requieren servicio técnico antes de los dos años es mayor a lo que dice la publicidad
17)Una empresa controla la calidad de sus productos, porque la exportación de los mismos se concreta si el
porcentaje de productos en mal estado es menor al 3%. Para despachar un lote y verificar que está en condiciones
de exportación se toma una muestra de 500 productos de los 4000 productos que conforman el lote de exportación
y se detectaron 12 productos en mal estado. ¿Cuál es la decisión que toma el encargado de calidad ¿despacha la
mercadería porque se ha comprobado que el lote está en buenas condiciones de exportación? Considere un error
de tipo I del 5%. Realice un test contra menor, por lo que se le pide plantee las hipótesis en función al tipo de test
solicitado.
Rta: Como el valor empírico es mayor al valor crítico o teórico,no se rechaza la hipótesis nula a un nivel de
significancia del 5% . Existe evidencia muestral que indica que con un nivel de significancia del 5% que la
proporción de artículos en mal estado es mayor al 3%. Por lo tanto en esas condiciones no se podrá exportar.
102
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO DE
CONCEPTOS DE INFERENCIA ESTADÍSTICA CON TEST DE HIPÓTESIS
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser Falso, modifique
el texto de forma tal que se haga Verdadero.
1. La estadística de prueba es una variable aleatoria cuyo valor se calcula a partir de los datos muestrales y al ser
nuestro valor empírico se usa para tomar la decisión de rechazo o no rechazo de la hipótesis nula. Rta: V_/F_
3. Cuando se plantea la hipótesis y se concluye siempre se lo hace sobre la hipótesis alternativa. Rta: V_/F_
4. La Distribución es una distribución sesgada cuya forma depende exclusivamente de los grados de libertad.
Rta: V_/F_
5. La estadística de prueba sigue una Distrib. “t” con n-1 grados de libertad y se usa para una muestra en donde
los datos son tomados de manera independiente y representan una muestra aleatoria de tamaño chico, de una
distribución poblacional está distribuida normalmente cuyo desvío poblacional se desconoce. Rta: V_/F
9. Alfa es la medida del área bajo la curva del puntaje estándar que se encuentra en la región de rechazo para la
hipótesis nula. Rta: V_/F_
10. El riesgo de cometer un error tipo I está directamente controlado en una prueba de hipótesis en donde el
investigador establece un nivel para α. Rta: V_/F_
11. Si la estadística de prueba cae en la región crítica, la hipótesis nula ha sido probada verdadera. Rta: V_/F_
12. Cuando la estadística de prueba t y el número de grados de libertad se hacen muy grandes, el valor crítico de t
es muy cercano al de la Z normal estándar. Rta: V_/F_
14. La distribución muestral de la proporción está distribuida aproximadamente como una distribución t de Student.
Rta: V_/F_
15. En la prueba de hipótesis, suponemos que algún parámetro de población toma un valor particular antes de
muestrear. Esta suposición que se va a probar se denomina hipótesis alternativa. Rta: V_/F_
16. Suponiendo que una hipótesis dada acerca de la media de una población es correcta, el porcentaje de medias
muestrales que pudieran caer fuera de ciertos límites de esta media hipotética se denomina nivel de significancia.
Rta: V_/F_
17. En la prueba de hipótesis, la distribución de probabilidad apropiada es siempre la distribución normal.
Rta: V_/F_
18. Si cometiéramos un error tipo I, rechazaríamos una hipótesis nula cuando realmente es verdadera. Rta: V_/F_
103
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
19. Una prueba en la escala sin procesar o en la escala estandarizada nos lleva a la misma conclusión. Rta: V_/F_
20. Sí 1.96 es el valor crítico de z, entonces el nivel de significancia de la prueba es 0.05. Rta: V_/F_
21. Si nuestras hipótesis nula y alternativa son H0: µ≥80 y H1: µ <80, es apropiado utilizar una prueba de cola
izquierda. Rta: V_/F_
22. Si la media de muestra estandarizada está entre cero y el valor crítico, entonces no se rechaza H0. Rta: V_/F_
23. El valor ( 1 – β ) se conoce como la potencia de la prueba y significa la probabilidad de aceptar la hipótesis nula,
dado que ésta es verdadera. Rta: V_/F_
24. Después de realizar una prueba de una cola y rechazar H0, se da cuenta de que debió haber hecho una prueba
de dos colas, al mismo nivel de significancia. También rechazará H0 para esa prueba. Rta: V_/F_
25. Elegir el nivel de significancia apropiado es más fácil que elegir la prueba correcta que se debe utilizar.
Rta: V_/F_
26. Existen métodos matemáticos que garantizan que el nivel de significancia seleccionado siempre será el adecuado.
Rta: V_/F_
27. La prueba de hipótesis nos ayuda a sacar conclusiones sobre parámetros estimados por la muestra Rta: V_/F_
28. Una prueba de hipótesis será útil para determinar si una media de población es 45 o 60 (es decir, H0: µ=45; H1:
µ=60). Rta: V_/F_
29. Es apropiado utilizar la potencia de una prueba de hipótesis sólo con pruebas de una cola. Rta: V_/F_
30. La hipótesis nula siempre tiene el signo igual porque se trata de la afirmación a probar y cuando se realizan los
cálculos se requiere de un valor específico. Rta: V_/F
31. Un test paramétrico debe realizarse con datos cuyos niveles de medición sean por intervalos o bien de razón.
Rta: V_/F
32. El supuesto para un test de hipótesis en el caso de una muestra chica es que las observaciones que componen la
muestra sean independientes entre sí y que esa muestra tomada provenga de una población normal o
aproximadamente normal. Rta: V_/F
1. Un fabricante de automóviles importante ha tenido que retirar varios modelos de su línea 1993 debido a problemas
de control de calidad que no fueron descubiertos con los procedimientos finales de inspección aleatoria. Éste es un
ejemplo de:
a) Error tipo I.
b) Error tipo II.
c) Error tipo I y error tipo II.
d) Ningún tipo de error.
104
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
2. Si n = 24 y α = 0, 05, entonces el valor crítico de t para probar las hipótesis H0: µ≥ 38 y H1: µ < 38 es:
a) 2.069
b) 1.714.
c) -1.714.
d) 22.069.
3. Suponga que deseamos probar si la media es significativamente mayor o menor que 10.
Tomamos una muestra aleatoria que revela un valor de ̅ = 8. ¿Cuál debe ser nuestra hipótesis alternativa?
a) µ < 10.
b) µ≠ 10.
c) µ > 10.
d) No puede determinarse de la información dada.
5. Suponga que se realiza una prueba de hipótesis para un proceso en el que un error de tipo I puede ser muy
costoso, pero un error tipo II puede resultar relativamente barato y sin importancia. ¿Cuál de los siguientes sería la
mejor elección para α en esta prueba?
a) 0.01.
b) 0.10.
c) 0.25.
d) 0.50.
e) Ninguno de los anteriores.
6. Cuando usamos la proporción de la muestra para probar las hipótesis enunciada H0: p = 0,30 y H1: p ≠ 0,30, el
error estándar es:
.
a)
.
b)
.
c)
d)
e) e) Ninguno de los anteriores.
7. Para una prueba de hipótesis de dos colas, con α = 0,10, la región de aceptación es toda la región:
a) A la derecha del valor crítico negativo.
b) Entre los dos valores críticos.
c) Fuera de los dos valores críticos.
d) A la izquierda del valor crítico positivo.
105
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
10. Cuando la hipótesis nula es H0: µ = 67, la hipótesis alternativa puede ser:
a) H1: µ ≥ 67.
b) H1: µ < 67.
c) H1: µ ≠ 67
d) H1: µ ≠ 40.
e) Ninguno de los anteriores.
11. Con un nivel de significancia más bajo, la probabilidad de rechazar una hipótesis nula que de hecho es cierta:
a) Disminuye.
b) Permanece igual.
c) Se incrementa.
d) Todos los anteriores.
2)Con el fin de usar la distribución t para probar hipótesis acerca de la media de una población, utilizando una
muestra chica debe suponerse que la población tiene una distribución______________ y que su desviación
estándar es ______________.
3) Para estar seguros de que la prueba de hipótesis trabaja correctamente, es mejor que el valor de (1-β) esté
tan cerca de ______________como sea posible.
6) Aceptar una hipótesis nula cuando es falsa constituye un error tipo ______________ y su probabilidad se
identifica con ______________.
8) Una prueba de hipótesis que involucra dos regiones de rechazo se conoce como una prueba de dos
______________.
9) Si la hipótesis nula es µ ≤ 10 y la hipótesis alternativa es µ > 10, la prueba apropiada para este caso sería una
prueba ______________.
LA ÉTICA EN LA ESTADÍSTICA
106
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Consentimiento informado de los participantes humanos en “tratamiento”, lo que significa que debe ser advertidos del proyecto de investigación
y de todos los efectos colaterales. El sujeto participante debe proporcionar el consentimiento.
Tipo de prueba: unilateral y en qué sentido o bilateral, en función a lo que se trata investigar. Nunca deben modificarse la dirección de la prueba
después de recolectados los datos.
Selección del nivel de significancia antes de emprender la recopilación de los datos, reportando también el p-value.
No entrometerse en los datos, para modificar conclusiones y seleccionar luego el nivel de significancia, o el tipo de prueba., como tampoco
modificar, o eliminar los datos inusuales o atípicos.
Reportar los resultados de la investigación, tantos los que son buenos como los malos.
En resumen hemos visto TEST DE HIPOTESIS PARA un solo parámetro
Tipo de datos
Tipo de análisis
Cuantitativos Categóricos
Recomendación: Como en esta guía hemos visto prueba de hipótesis para una sola muestra. Se recomienda a partir de la
bibliografía del Programa trabajar con dos muestras para Probar hipótesis de diferencias de medias, de varianzas, de
proporciones.
107
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
Es un número que expresa la variación relativa del precio, la cantidad o el valor, en comparación con un
período base (Lind,)
Es un indicador que sirve para comparar, para poner se relieva cambios en una variable –indice simple- o
cambios en un grupo de variables relacionadas con respecto al tiempo.
PROPIEDADES
IDENTIDAD Si coinciden el Índice del periodo base I(o) y el de comparación I(p); es decir
Igual a 100 cuando el índice está expresado en porcentajes. En consecuencia 1.
Ej. Si el Índice de precios a una fecha 2014 de un determinado producto es 123,40
,
La identidad se comprueba porque: I2014/2014= 1
,
propiedad cíclica. Si Incorporamos un período –en este caso: año- intermedio, 2014
I(p)2014 =115,5
, ,
Es decir: I2015/2013= ∗ ∗ 1,08155
, ,
108
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
109
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
110
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
111
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A.1°C 2019. –Prof. Aída B. Castegnaro
112
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Los resultados son: 1) a. 103,39 b= 102,15 2) Base junio 1995. Mayo: 100,06; junio: 100;
JULIO 99,46 Y AGOSTO 99,37 - B) BASE AGOSTO 1995. Mayo: 100,68, julio: 100,62, julio
100,08 y agosto: 100. c) La reversión cronológica es una prueba en donde el índice del periodo t con base
0 multiplicado el índice del periodo 0 con base t debe dar 1. Por ej. Índice de agosto (base junio) da 99,37
113
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
y el índice de junio (base agosto) da 100,62. El producto de ambos es 1. 3) Ind. Passche: 103,98 - Ind.
Laspeyres 103,69 - Cantidad Laspayeres 108,51 y Cantidad Fisher 108,8’0
C – INDICE DE VALOR
En función a los datos del ejercicio 3 del punto C. Calcule los Indices de Valor Base 2008-
D - EMPALME DE INDICES
4) Dado los siguientes indices efectuar el empalme de las series, llevando los índices a
la base 1990=100
Años Indice Base Nuevo Indice
1982=100 Base 1990=100
1986 100
1987 104
1988 106
1989 110
1990 115 100
1991 102
114
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO DE
CONCEPTOS TEÓRICOS DE NÚMEROS ÍNDICES
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos
corregir para transformarlo en verdadero
3. Un índice de valores mide los efectos combinados de los cambios en precios y cantidades.
V:__F:__
4. Siempre se encuentra un número índice al obtener el cociente entre un valor actual y un valor
base y multiplicar por 100. V:__F:__
7.No ponderado se refiere a que todos los valores que son utilizados para calcular el índice
tienen igual importancia. V:__F:__
8. La desventaja del índice de Laspeyres es que no considera los cambios que se producen en los
patrones de consumo V:__F:__
9. El índice de Fisher es la media aritmética de los índices de Laspeyres y de Paasche.
V:__F:__
Seleccione la opción que considera Verdadera
1. Las mercancías sujetas a variaciones considerables de precio se pueden medir mejor mediante:
a) El índice de precios. b) El índice de cantidad. c) El índice de valor d) Ninguno de los anteriores.
RTA: _____
2. Los pesos utilizados en un índice de cantidad son: a) Porcentajes de la cantidad total. b) Precios.
c) Un promedio de cantidades. d) Ninguno de los anteriores. RTA : ______
1. Si todos los valores considerados al calcular un índice tienen igual importancia, el índice es
_____________________
2. El método de índice ponderado en el cual las cantidades consumidas durante el periodo base
se usan como pesos es el método _____________________.
3. El método que utiliza las cantidades consumidas en el periodo actual en cuestión cuando se
calcula un índice ponderado es el de _____________________.
4. Los tres tipos principales de índices son el índice_____________________ , el índice
_____________________y el índice_____________________.
115
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
En la primera parte del curso en Estadística Descriptiva hemos trabajado con datos bivariados
incorporando los conceptos de COVARIANZA primero y CORRELACIÓN después, dado que la
esta primera medida no permitía comparar diferentes covarianzas.
El Análisis de Correlación aporta mayor información que la Covarianza pues permite medir la
intensidad de la asociación entre variables numéricas, pues arroja un valor numérico que sirve
para interpretar la fuerza de esa asociación lineal entre dos variables.
Entonces:
COEFICIENTE DE CORRELACIÓN
Es el grado de interconexión entre variables que intenta determinar con qué precisión describe o
explica la relación entre variables la ecuación lineal o de cualquier otro tipo.
CORRELACIÓN LINEAL
Si X e Y son las dos variables para analizar, un “DIAGRAMA DE DISPERSIÓN” muestra la
localización de los puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersión parecen estar en una recta, la correlación se llama lineal. Cuando más
cercanos estén en la recta será el valor de la correlación más cercano a 1 (en el caso de correlación
lineal positiva) o bien más cercano a -1 (en el caso de correlación lineal negativa).
Gráficos que permiten visualizar el tipo de correlación lineal entre dos variables
116
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
CORRELACIÓN REGRESIÓN
Objetivo Medir la fuerza de relación lineal Predecir o estimar el valor poblacional
entre dos variables medio de una variable dependiente en
términos de valores conocidos (muestrales)
de la variable explicativa.
Se debe tener en cuenta que dos variables pueden variar conjuntamente o covariar, en el mismo sentido
cuando al aumentar los valores de una aumentan los valores de la otra; o bien variar conjuntamente o
covariar en sentido contrario, si al aumentar los variables de una, disminuyen los de la otra.
Observar la relación entre dos variables en un diagrama de dispersión, se podrá diferenciar si se trata de
una dependencia funcional cuando Y = f(X) en forma perfecta, si se trata de una dependencia estocástica,
cuando Y = bo + b1 . X + e; o por el contrario ambas variables X e Y son independientes, en lugar de
dependientes.
117
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Ésta última –Y - constituye la variable a medir denominada variable explicada o variable respuesta, entre
sus diferentes acepciones-
La primer variable X que puede influenciar en la variabilidad de la respuesta es la variable explicativa, o
la variable de predicción potencial, entre una de sus distintas denominaciones.
El conjunto de datos que surge de la medición de las variables permitirá examinar la asociación cuantitativa
entre las mismas con la finalidad de obtener una fórmula matemática empírica de predicción que mejor
ajuste el conjunto de datos observados a ese modelo teórico que se construye.
Se logrará establecer la relación de asociación entre las variables, sin que eso signifique una relación causa-
efecto, no pudiendo establecer que esa variable X es causa y la variable Y es el efecto que produce X. Como
ejemplo de ello, la relación entre la mortalidad humana y el consumo de carbón en el siglo XX, no son una
relación causa-efecto; dado que tanto el consumo de carbón como las muertes se producían en el invierno
duro, no siendo el carbón la causa de las muertes.
El principio de parsimonia científica lleva al investigador a utilizar modelos sencillos considerando para
este curso el M.R.L.S. –siglas que significa Modelo de Regresión Lineal Simple.
CONDICION: Se podrá hacer el análisis de la regresión lineal simple siempre y cuando dicha
relación representada en un diagrama permita que pueda ser expresada mediante una recta.
La REGRESIÓN
Técnica que permite establecer relaciones funcionales entre variables de tipo cuantitativas.
Después de conocer el patrón de esta relación, podremos aplicar el “análisis de correlación” para
determinar el grado en que las variables se relacionan. Entonces, el análisis de correlación indicará que
tan bien la ecuación de estimación describe realmente la relación.
118
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
El objetivo es ajustar un modelo matemático (veremos que se trabajará con el modelo lineal simple) a un
conjunto de datos, para realizar un análisis de regresión, es decir que con el modelo matemático obtener
la estimación y predicción.
1. Recolección de datos
Resultan los datos apareados de un conjunto de “n” observaciones que muestran los valores
correspondientes de las variables cuantitativas X e Y.
2. Gráfica de datos: Diagrama de Dispersión
Cada pareja de datos se representa en el gráfico con un solo punto y visualizando los puntos se puede
Trazar una curva aproximante, o sea una curva suave que aproxima los datos.
119
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
ESTADISTICA EN EXCEL
Para el análisis del tema “Regresión” verifique que en el Excel esté habilitada la función “Análisis de datos”
dentro de la solapa “Datos” Si no lo estuviese,deberá habilitarla mediante los siguientes pasos:
1° Abrir el Programa Excel
2° Hacer click en “Archivo”
3° Hacer click en “Opciones”
4° Hacer Click en “Complementos”
5° Hacer Click en “Ir” que está al lado de “Administrar: Complementos de Excel”
6° Tildar “Herramientas para análisis” y “Aceptar
Suponga que Ud. ha ingresado los siguientes datos observados en total 10 datos apareados en ese orden,
primero el de la variable explicativa y luego la variable respuesta. Para visualizar si hay algún tipo de
relación lineal entre las variables se procederá a representar los datos a través del diagrama de dispersión
En Excel:
1°) Sombrear los datos de X e Y
2°) En la solapa “Insertar” seleccionar Gráfico “Diagrama de Dispersión”
Permitirá ver si los puntos representados en el gráfico presentan una relación lineal para poder trazar una
recta que mejor los represente.
En conclusión queda:
Usando excel
1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
las celdas que contienen los datos marcadas.
2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear
300
250
200
150 Series1
100
50
0
0 10 20 30 40 50 60
3.Tipo de Regresión
Una vez representado el diagrama de dispersión, posicionándose con el puntero o mousse en cualquiera
de los puntos haciendo click se ingresa a un menú en el que se debe clickear “Agregar línea de tendencia”
Las distintas curvas que pueden formarse son la que vemos en el gráfico del Excel que se acompaña en este
punto.
120
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Observamos que las opciones de línea de tendencia que devuelve el Excel responden a:
- Modelos Lineales en los parámetros βo, β1, β2 ,…, βn
El Modelo es lineal en los parámetros, porque ningún parámetro en el modelo aparece como
exponente o multiplicado o dividido entre otro parámetro.
o Lineal Simple: Y = βo + β1. X + e
o Lineal Logarítmico: Y = βo + β1 .ln ( X) + e
o Lineal Parabólico: Y = βo + β1 .X + β2 .X2 +e
(Curva cuadrática o Parábola, denominada en Excel
Polinómica de orden 2). Los otros polinomios de otro orden,
serán:
o Curva cubica: Y = βo + β1 .X + β2 .X2 + β3 .X3 +e
o Curva cuartica: Y=βo + β1 .X + β2 .X2 + β3 .X3 + β4 .X4 +e
o Curva de grado “n”: Y = βo + β1 .X + … + βn .Xn +e
*Relaciones curvilíneas: la variable dependiente no cambia con una tasa constante con incremento igual en
la variable independiente.
Graficamente las primeras dos representaciones y la última que se ven en las seis figuras responden a
una relación lineal simple, que son las que se estudiará en esta unidad.
4. Ajuste de curvas en el M.R.L.S.
Cuando a prima facie se realiza, recurriendo a la intuición personal, un dibujo de una curva que ajuste el
conjunto de datos se denomina “Método de ajuste de curvas a mano”. Este método es el movimiento de
una regla sobre el conjunto de puntos hasta que parezca que pase por la mitad entre los puntos. Ésta sería
el mejor ajuste.
121
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
El ajustar una línea matemáticamente si ninguno de los puntos caen sobre ella, significa trazarla de forma
tal, que podamos minimizar el error entre los puntos estimados en la línea y los observados. Es sensato
pensar que actualmente hay un método mejor que el manual a través de un trazado a mano alzada. Si el
tipo de ecuación que describe la curva es conocido, ejemplo una recta, sólo se necesitan dos puntos, si es
una parábola son precisos tres puntos.
Si el objetivo es estimar los parámetros del modelo lineal, tenemos entonces que dado los datos observados
“apareados” para estimar los parámetros de la ecuación elegida, una técnica es el M.M.C. -Método de
Mínimos Cuadrados- a través de la minimización de la suma de los cuadrados de las diferencias entre los
valores observados de la variable respuesta y los valores de la ecuación de predicción que en nuestro caso
será la ecuación lineal.
Recolectados los datos en el caso del M.R.L.S. tenemos para Y= variable respuesta y X= variable explicativa
o de predicción potencial, cada uno de los “n” datos apareados:
(x1, y1); (x2, y2); (x3, y3)… (xn, yn)
122
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Por lo comentado , el principio de mínimos cuadrados es el criterio de bondad que establece “escoger como
recta de mejor ajusta aquella que minimiza la suma de los cuadrados de las desviaciones de los valores
observados respecto de los pronosticados. Es una técnica empleada para obtener la ecuación de regresión
y se consigue: Minimizando la suma de los cuadrados de los diferentes verticales entre los valores Y
verdaderos y los valores Ŷ pronosticados. Es un procedimiento estadístico que se utiliza para encontrar la
recta de “mejor ajuste” para un conjunto de puntos. Porque como se observará la recta de regresión tiene
carácter de línea media
Recordando que la ecuación de regresión es una expresión matemática que define la relación lineal entre 2
variables X e Y, cuyo modelo es Y = bo + b1 .X : es un modelo matemático determinista porque al sustituir
un valor de X en la ecuación, el valor de Y queda determinado y no se considera margen alguno de error.
Se aplica para la predicción solo cuando los errores de predicción son pequeños
Se aclara que cuando los errores de predicción son grandes, que se daría en el caso general de los
pronósticos en la administración de negocios se debe considerar el error de predicción, en donde se debe
agregar al modelo matemático determinista una o más componentes aleatorias para tomar en cuenta el
error aleatorio e inexplicado de la predicción y se transforma el modelo matemático determinista al modelo
matemático probabilístico
∑ ∑
2 2
∑ ∑ ∑ ∑ . . ∑ . ∑ .
∑ . .∑ ∑ . . ∑ . ∑
Se llega a las denominadas ecuaciones normales de los mínimos cuadrados (ecuaciones normales de Gauss)
∑ . .∑ (1)
∑ ∑ .∑ (2)
En cada una de estas ecuaciones normales para encontrar en el modelo de regresión que se forma cuando
la función de regresión es una función afín o sea una recta de aproximación por mínimos cuadrados del
conjunto de puntos (X1 , Y1) ;(X2 , Y2) ; (X3 , Y3) ;… (Xn , Yn) ; en donde las constantes y se determina
mediante el sistema de ecuaciones.
A partir de (1) se divide ambos miembros por n y queda:
∑ ∑
(3)
Despejando de (3) queda: Despejando de (3) queda:
∑
∑ ∑
4 5
∑
123
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
∑
∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
1
. . ∑ . . ∑
∑ ∑ ∑ ∑ 2 ∑ ∑ ∑ ∑ ∑ .∑
2 1 2
. . ∑
. ∑
∑ ∑ ∑ ∑ ∑ 2 ∑ ∑ .∑ ∑ ∑
2 . .
2 ∑ ∑
.∑ ∑ ∑ ∑ ∑ 2 ∑ ∑ ∑ .∑ ∑ ∑
2 . .
2 .∑ .∑
.∑ ∑ ∑ ∑ ∑ ∑ .∑
2 .∑
2
∑ ∑ ∑ .∑
. .∑
2
.∑ ∑ ∑ ∑ ∑ ∑ .∑
∑ ∑
………………………… ∑
.∑
∑ ∑
∑
O dividiendo por n
∑
∑
Otra forma que se puede expresar B1 Para tener igual denominador se multiplica numerador
Si dividimos nuevamente por n. y denominador por (-1) y queda:
, ∑ .∑ ∑ ∑
∑ ∑
Con varios pasos matemáticos se obtuvieron los valores constantes del Intercepto: b o también βo y de la
pendiente: m o también β1 que representa el cambio medio en Y por unidad de cambio en X.
Siendo: Ŷ : la ecuación de estimación o de predicción y representa la ecuación que mejor ajusta a los datos.
Afirmar que Y no aumenta ni disminuye linealmente cuando X aumenta o disminuye equivale a decir que
m o β1=0
Se reitera que no se puede hablar de relación causal entre X e Y, solamente podemos decir que hay una
asociación en donde si Y cambia cuando X varía y que puede ser posible lograr una mejor predicción para
Y al utilizar X y la recta de predicción, que simplemente utilizar Y ignorando a X.
Para comprobar que la ecuación de estimación sea la correcta, podemos determinar los errores o
perturbaciones estocásticas o residuos individuales y sumarlos, dado que la suma de los errores positivos
y negativos debe dar cero.
Una recta de regresión lograda por el método de mínimos cuadrados permite obtener ciertas propiedades,
una de ellas la mencionada anteriormente:
Propiedades :
∑ 0
. 0
124
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Cuando se utiliza un modelo de regresión con motivo de predicción, es importante que consideremos solo
el rango relevante de la variable independiente en nuestra predicción. Con este rango relevante, todos los
valores desde el X más pequeño al mayor han sido utilizados para desarrollar el modelo. Nosotros
podemos interpolar SOLAMENTE en ese rango relevante de los valores de X pero NO PODEMOS
EXTRAPOLAR fuera del rango de X.
SUPUESTOS DE LA REGRESIÓN
Las cuatro suposiciones básicas de regresión (acrónimo LINE) son
Linealidad: la relación entre las variables es lineal
Independencia de errores: cuando se recolectan los datos, los errores deben ser independientes.
Es decir, hay situaciones en que los errores para un período específico a menudo están
correlacionados con aquellos del período anterior.
Normalidad: los errores se distribuyen normalmente en cada valor de X.
Equality =Igual Varianza (HOMOCEDASTICIDAD): la varianza de los errores es constante para
todos los valores de X.
Y *
Como figura de análisis:
Grafique las variaciones en el diagrama de dispersión * *
*
* *
*
0 X
Notación:
S.C.: Suma de los Cuadrados C.M.: Cuadrados Medios (Varianza)
S.C.E. : Suma de los Cuadrados Explicados por la Recta de Regresión
S.C.R.: Suma de los Cuadrados de los Residuos o Errores o perturbaciones estocásticas.
125
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
7. Medidasestadísticas
MEDIDAS Estadísticasenenlala Regresión
Regresión
S.C.T
. . .
S.C.R= ∑ S.C.E.=∑
El error estándar de estimación denotado como e.e.e , o bien se mide la variabilidad o dispersión de los
valores observados alrededor de la recta de regresión. A medida que sea menor la variación de los valores
de Y respecto a la recta de regresión, tanto más cerca se encontrará la recta de mínimos cuadrados de la
recta de la regresión.
Indica la confiabilidad de la ecuación de estimación.
126
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
El numerador de la raíz está formado por la suma de los cuadrados residuales debe ser lo más bajo posible.
En cuanto al denominador es en el caso de un M.R.L.S. igual a (n-2) . Se resta 2 porque significa la érdida
de 2 grados de libertad (para los valores de la pendiente y del intercepto) al estimar la recta de regresión.
Cuanto más grande es el e.e.e., entonces mayor será la dispersión de los puntos alrededor de la recta de
regresión. El caso particular es que el e.e.e. de cero, en donde no hay dispersión de los puntos, por ende,
todos los puntos se encuentran sobre la línea de regresión.
Una aplicación intuitiva del e.e.e. – Una aproximación en la estimación de un intervalo de predicción
Podríamos interpretar que, si los puntos observados se distribuyen normalmente alrededor de la línea de
regresión, entonces podemos esperar que el 68% de los puntos caerían dentro de 1 ; el 95,5% de los
puntos caerían dentro de 2 y el 99,7% de los puntos caerían dentro de 3 .
Y *
* *
*
* *
*
0 X
El e.e.e. también sirve para estimar un intervalo de predicción aproximada. Es decir si tenemos que estimar
un determinado valor de Y dado un valor (dentro del rango de la variable explicativa de nuestra muestra)
de X, lo consideramos ese valor estimado como una estimación puntual y entonces, para calcular los limites
inferior y superior de un intervalo de confianza, a ese valor puntual le sumamos y restamos 1 e.e.e.; 2 e.e.e. ,
3 e.e.e. según, querramos informar que aproximadamente el 68%, o el 95,5% o el 99,7% del valor de Y estará
dentro de 1, 2 o 3, respectivamente errores estándar de estimación. Pero, para ello necesitamos, dado que
utilizamos la distribución normal que la muestra sea mayor a 30; caso contrario si la muestra es chica,
utilizamos la distribución t.
Sin embargo, utilizaremos otras fórmulas específicas para la construcción de los intervalos de confianza y
de predicción.
Coeficiente de determinación
Mide solo la fuerza de una relación lineal entre las variables. Denotado como R2 o bien r2
Es la cantidad de variación en Y que es explicada por la línea de regresión. Es decir mide que tan bien X
explica Y. Constituye la parte determinística del modelo.
Si el modelo lineal tiene un bajo coeficiente de determinación, deberá probarse otro modelo. Aunque la
decisión final del modelo de regresión, se sostiene, es atributo del predictor
Coeficiente de Correlación
Es tan solo la raíz cuadrada del coeficiente de determinación, cuyo signo tendrá el de la pendiente de la
línea de regresión. Denotado como r -si es muestral- y ρ -si es poblacional-
En el caso de calcular el coeficiente de correlación a partir de la Covarianza, en este caso es el signo de la
covarianza el que da el signo del coeficiente de correlación. Porque calculado por esta vía, el coeficiente de
correlación es el cociente entre la Covarianza y el producto de los desvíos de las variables, denominador
que siempre es positivo
El coeficiente de correlación superior al 0,75 para el caso de variables micro y macroeconómicas se
interpreta en general la existencia de asociación entre las variables.
127
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Estas dos últimas: coeficiente de determinación y de correlación constituyen medidas que deben ser
interpretadas en conjunto. Pues si el grado de asociación entre dos variables fuese del 70%, relación
bastante fuerte, mientras que por ejemplo, el coeficiente de determinación sería del 49%, significa que X
explica solo el 49% de la variación en Y.
8. Test
Test de hipótesis
de hipótesis paraelelcoeficiente
para coeficiente de
de correlación
correlación
1
Ho : ρ=0 No existe relación lineal entre las variables X e Y
H1 : ρ≠0 Existe relación lineal entre las variables X e Y
2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)
3
Estadístico de Prueba tn-2 = . . .
5
V.T.= tt (n-2 gl)
6
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables
Existen dos caminos (El Método de la Prueba de significancia “t” y el de “F” de Snedecor, para
concluir si existe significatividad estadística en la relación entre X e Y.
128
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y
2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)
3
Estadístico de Prueba tn-2 = . . .
6
Comparado ambos Valores obtenemos las conclusiones a través de la :
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables.
NOTA ACLARATORIA: Ambos test de hipótesis para la pendiente y para el coeficiente de correlacion en
el que se utilizan para la prueba de significancia estadística que indica la relación lineal entre X e Y y que
contrastaron los valores empíricos con un valor “t” arrojan el mismo valor empírico.
1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y
2
α= nivel de significancia (en general, un valor que oscila entre el 0,01 y 0,10)
n= (cantidad de datos apareados)
3
Estadístico de Prueba tn-2 = . . .
129
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
6
Comparado ambos Valores obtenemos las conclusiones a través de la :
Regla de Decisión: Si el te está fuera de la zona de aceptación de la hipótesis nula,
entonces se rechaza la hipótesis nula con ese nivel de significancia α y se concluye
que existe evidencia muestral que indica que hay relación lineal entre las variables.
Sea un determinado Xf : valor fijo, un valor particular para el cual se desea estimar la media de la
variable respuesta Y . En consecuencia, el estimador es Y
Por tratarse de una muestra la cantidad de observaciones con sus valores observados, ésta cambia
de muestra en muestra, por lo que de acuerdo a la muestra seleccionada se determinó la recta
de regresión, pero el estimador Y cambiaría entonces construimos un intervalo de confianza.
Si la VAR(Y
∑
1
. . . . . 1
∑
A diferencia de la fórmula que resulta para construir el intervalo de confianza para la media de
Yf ; es decir si en lugar de estimar la media de Yf en xf , se desea predecir un valor particular de xf
que se observaría si se impusiera un valor xf para la variable de predicción, se deberá aumentar
la varianza, ya que ésta varianza denota dos variaciones:
- Las variaciones muestra a muestra de
- Las variaciones inherentes de la distribución de probabilidades de Yf
Entonces: VAR(Y Y
VAR(Y
∑
VAR(Y 1
∑
Recordando que (Y es la predicción particular para Yf en xf
130
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
1
. . . . . 1 1
∑
Como ya hemos visto, la interpretación del I.C. es la siguiente: Si se toman muestras repetidas de “n”
observaciones de la variable respuesta Y para algunos de los valores de x, producen una recta estimada de
Y , construyéndose para cada muestra de tamaño “n” un intervalo de confianza; en donde
el (1-α).100%de los intervalos contendrán al parámetro
131
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
a) Predecir el valor de la variable a partir de una variable explicativa mediante un modelo matemático
que represente la función de regresión muestral
b) Relacionar las medidas estadísticas ya estudiadas en la primera parte del curso (Covarianza y
Correlación muestral) con la REGRESION.
c) Reconocer si resulta viable construir un modelo de regresión lineal en función a los datos
observados
d) Construir una tabla ANOVA que de información sobre las variaciones en los errores y las
variaciones que resultan explicadas por la regresión.
TAREA:
1- ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una determinada
posición, o marco teórico sobre el tema que trata esas variables.
SEGUNDA PARTE
Volver a graficar el diagrama de dispersión y ahora sí , la recta que resulta de mejor ajuste
Hacer una tabla con la S.C.T desagregados en S.C.R y S.C.E por la recta de regresión. Construir la
tabla resumen ANOVA.
A partir de la suma de los cuadrados, calcular el coeficiente de determinación y luego el coeficiente
de correlación. Comprobar los valores del coeficiente de correlación con el calculado en el punto
ya hecho en covarianza y correlación.
Determinar el error estándar de estimación.
132
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Por último pronosticar para un determinado valor de la variable explicativa . Es decir si X tuviese
determinado valor cuál sería el de Y.
Construya un test de hipótesis para probar la relación entre las variables si existe o no, a través de
los valores del coeficiente de correlación y también de la pendiente obtenida en la función de
regresión. Compruebe los resultados hallados.
Construya un test de hipótesis a través de los resultados de las varianzas, es decir las variaciones
explicadas por la recta de regresión y las variaciones de los errores.
1)
Los gastos anuales en reparación de motores son los que logró informarse la directora del Departamento de Salu-
bridad quien está interesada en la relación que existe entre la antigüedad de un motor y los gastos anuales.
Con el fin de determinar dicha relación , la directora reunió información de cuatro motores
La información es la siguiente
a) Desarrolle una ecuación de regresión que describe la relac. Entre la antig. Y sus gs. Anuales de reparación.
b) Pronostique los gastos anuales de reparacion en miles de dólares si la antigüedad del motor fuese de 4 años
c) Calcule el error estandard de la estimación
y = 0,75x + 3,75 El gráfico queda representado así
R² = 0,75 Ser…
2) En la empresa "Tecnobuenosaires" en el Sector Contable "Contabilidad de Costos" se encuentran abocados a la estimación de los gs.gs
con base en el nivel de producción. Por ello, el Supervisor logró reunir información acerca de los gastos generales y de las unidades producid.
en diferentes plantas, y ahora desean estimar una ecuación de regresión para predecir los gastos generales futuros.
La información es la siguiente
Gastos Ge 191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40
133
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Embarque 1 2 3 4 5 6 7 8 9 10
Distancia ( 825 215 1070 550 480 920 1350 325 670 1215
Tiempo de 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0
5) Determine la recta de regresión en los ejercicios de estadística descriptiva consignados en el punto
de correlación.
134
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2 2
Restaurante xi yi XiYi xi yi xi - m(xi) yi - m(yi) [x i-m(x i )][yi-m(yi )] Los resultados del cuadro:
Pobl est Ventas
1 2 58 116 4 3364 -12 -72 864 N 10 Usando excel
2 6 105 630 36 11025 -8 -25 200 ∑x= 140 1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
3 8 88 704 64 7744 -6 -42 252 ∑y= 1300 las celdas que contienen los datos marcadas.
4 8 118 944 64 13924 -6 -12 72 ∑ x 2= 2528
5 12 117 1404 144 13689 -2 -13 26 ∑ y 2= 184730 250
6 16 137 2192 256 18769 2 7 14 ∑x.y= 21040
7 20 157 3140 400 24649 6 27 162
x
x 14
200
8 20 169 3380 400 28561 6 39 234 N
9 22 149 3278 484 22201 8 19 152 (∑ x)2= 19600
10 26 202 5252 676 40804 12 72 864 150
-------------- --------------- --------------- --------------- --------------- --------------- --------------- --------------- y
y 130
N Series1
∑ 140 1300 21040 2528 184730 0 0 2840 100
m 14 130
Cálculo de los valores de la pendiente m y de la ordenada al origen b de la ecuación lineal de regresión.
50
( y ).( x ) ( x. y ).( x )
2
b= 340800 0
b 5680 0 10 20 30
N .( x ) ( x )
2 2
b= 60
2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear
3°) Se pueden ir completando los datos en las abscisa y ordenada
haciendo click con el botón derecho dentro del gráfico.
N .( x. y ) ( x ).( y ) m= 28400 4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
m 5680
N .( x ) ( x ) 2
2 que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
m= 5 hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
La recta de regresión será
b m x y 60 5 x
Presentar valor de R cuadrado en el gráfico.
250
c) Verificación de la ecuación de estimación
Residual ó
Cálculo de la suma de los errores individuales de la tabla Valor ajustado Error Individ 200 y = 5x + 60
y y
2
2
2 R² = 0,9027
e2 y y y y
y ey y
Y 150
1 58 60 + 5* 2 70,00 -12,00 144,00 3600 5184 Series1
2 105 60 + 5* 6 90,00 15,00 225,00 1600 625 100 Lineal (Series1)
3 88 60 + 5* 8 100,00 -12,00 144,00 900 1764
4 118 60 + 5* 8 100,00 18,00 324,00 900 144
50
5 117 60 + 5* 12 120,00 -3,00 9,00 100 169
6 137 60 + 5* 16 140,00 -3,00 9,00 100 49
7 157 60 + 5* 20 160,00 -3,00 9,00 900 729 0
8 169 60 + 5* 20 160,00 9,00 81,00 900 1521 0 10 20 30
9 149 60 + 5* 22 170,00 -21,00 441,00 1600 361
10 202 60 + 5* 26 190,00 12,00 144,00 3600 5184
------------------- ------------------- ------------------- ------------------- ------------------- 5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
1300 ERROR TOTAL =====> 1300,00 0,00 1530,00 14200,00 15730,00 podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales
130
d) Error Estándar de la estimación 6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
Mirando la linea de tendencia si R2 =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
si R2 es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac
SY , X
( y y) 2
e2 1530 si R2 es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
SY , X 191, 25 13,8293 nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
n2 n2 10 2
ajuste.
135
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
136
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
1
Ho : ρ=0 No existe relación lineal entre las variables X e Y
H1 : ρ≠0 Existe relación lineal entre las variables X e Y
2
α=0,01 (en general, un valor que oscila entre el 0,01 y 0,10)
n= 10 (cantidad de datos apareados)
3
Estadístico de Prueba tn-2 =
1
Ho : β1=0 No existe relación lineal entre las variables X e Y
H1 : β1≠0 Existe relación lineal entre las variables X e Y
2
α= 0,01 (en general, un valor que oscila entre el 0,01 y 0,10)
n= 10 (cantidad de datos apareados)
137
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
3 ∑
138
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
139
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE CONCEPTOS TEÓRICOS DE REGRESIÓN LINEAL SIMPLE
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero.
1) Una de las razones para encontrar una ecuación de regresión es para hacer predicciones fuera o dentro
del dominio muestral de la variable explicativa, para cualquier periodo y población. V:__F:__
2) En el análisis de regresión se mide la fuerza de la relación lineal entre las variables. V:__F:__
3)Un coeficiente de correlación fuerte significa que la variable X es causa de la variable Y que es su efecto.
4) El análisis de correlación es un método de obtener la ecuación que representa la relación entre dos
variables. V:__F:__
5) Un coeficiente de correlación de cero significa que las dos variables están perfectamente correlacionadas.
V:__F:__
6)Cuando el coeficiente de correlación r es positivo, la pendiente de la recta será siempre negativa.
V:__F:__
7)Cuando el valor calculado del coeficiente de correlación es negativo, el valor calculado de la pendiente
de la recta será negativo. V:__F:__
8) La pendiente de la recta de regresión representa la cantidad de cambio que se espera tenga lugar en la
variable explicada, cuando la variable explicativa aumenta en una unidad. V:__F:__
11) La recta de mejor ajuste se emplea para predecir el valor promedio de Y que se puede esperar, ocurra a
un valor determinado de X, dentro del rango de los valores de X, para esa población y periodo en que se
obtuvo las observaciones V:__F:__
12) Dado que la ecuación para una recta es Y = 26 – 24 X, podemos decir que la relación de Y con X es
directa y lineal. V:__F:__
13) Un valor r2 cercano a cero indica una fuerte correlación entre X y Y. V:__F:__
14) Los análisis de regresión y correlación se usan para determinar relaciones de causa y efecto. V:__F:__
16) El error estándar de la estimación mide la variabilidad de los valores observados alrededor de la
ecuación de regresión. V:__F:__
140
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
20) Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos cuadrados, los errores
individuales positivos y negativos respecto a la línea suman cero. V:__F:__
21) Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el valor de r debe
ser la raíz cuadrada positiva de r2. V:__F:__
22) Si r = 0.8, entonces la ecuación de regresión explica el 80% de la variación total en la variable
dependiente. V:__F:__
24) Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de la muestra de la
variable independiente. V:__F:__
1) Suponga que conocemos la estatura de una estudiante, pero no su peso. Usamos una ecuación de
estimación para determinar una estimación de su peso, basándonos en su estatura. Por tanto, podemos
concluir que:
a) El peso es la variable independiente.
b) La altura es la variable dependiente.
c) La relación entre peso y altura es inversa.
d) Ninguno de los anteriores.
e) b) y c), pero no a).
2) Suponga que le dicen que existe una relación directa entre el precio de los tomates cherry y la cantidad
de lluvia que cayó durante la época de cultivo. Puede concluirse que:
a) Los precios tienden a ser altos cuando la lluvia es alta.
b) Los precios tienden a ser bajos cuando la lluvia es alta.
c) Una gran cantidad de lluvia ocasiona que los precios suban.
d) La falta de lluvia ocasiona que los precios suban.
3) Suponga que se calcula que a es 4 y b es 2 para una línea de estimación particular con una variable
independiente. Si la variable independiente tiene un valor de 2, ¿qué valor debe esperarse para la variable
dependiente?
a) 8.
b) 10.
c) 21.
d) 0.
4). Suponga que se calculó la ecuación de estimación 5 2. , para un conjunto de datos. ¿Qué es cierto
de lo siguiente para esta situación?
a) La ordenada Y de la recta es 2.
b) La pendiente de la recta es negativa.
c) La recta representa una relación inversa.
d) Todos los anteriores.
e) b) y c), pero no a).
5)27. La variación de los valores de Y alrededor de la recta de regresión se expresa mejor como:
a) ∑
b) ∑
c) ∑
d) ∑
141
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
7) En la ecuación Y= A + BX + e, la e representa:
a) La ordenada X de los datos observados.
b) El valor de Y con el cual se comparan otros para determinar el “mejor ajuste”.
c) Variaciones aleatorias respecto a la recta de regresión de la población.
d) Ninguno de los anteriores.
2) Una asociación entre dos variables descrita por una línea curva es una _______________.
3) Toda línea recta tiene una _______________.que representa cuánto cambia la variable dependiente con
cada cambio unitario de la variable independiente.
4) El grado en el que los valores observados difieren de sus valores pronosticados sobre la línea de regresión
se mide por _______________.
8) El método de mínimos cuadrados encuentra la línea de “mejor ajuste” a través de un conjunto de puntos,
esto es, la recta que _______________. el error entre los puntos observados y los puntos estimados sobre esa
recta.
LA ÉTICA EN LA ESTADÍSTICA
142
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
Presentar valor de R cuadrado en el gráfico.
200
150 Serie1
Lineal (Serie1)
100
50
0
0 10 20 30 40 50 60
Unidades
5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales
6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
2
Mirando la linea de tendencia si R =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
2
si R es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac
2
si R es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
ajuste.
Aca vemos el coeficiente de correlación que tenemos una diferencia con el realizado en el ejercicio (problemas de
aproximación en los decimales).Pues si pasamos a otro ejemplo: El ejercicio que busca el modelo de regresión entre
los gastos anuales en reparación de motores y su antigüedad, llegamos a iguales resultados también en correlación con
el desarrollo nuestro.
-
8 y = 0,75x + 3,75
7 R2 = 0,75
6
5
Serie1
4
Lineal (Serie1)
3
2
1
0
0 2 4 6
143
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
A diferencia de Regresión, en este caso estudiar la serie nos permitirá PRONOSTICAR o predecir datos a
futuro suponiendo que los patrones de comportamiento pasados se mantienen en el futuro.
La suposición básica que subyace en el tratamiento de las series temporales es que “los factores
que han provocado patrones de comportamiento en el pasado y en el presente continuarán
haciéndolo en el futuro”
Por ello, expresa Berenson Levine que los principales objetivos del análisis de series consiste en identificar
y aislar tales factores de influencia con propósito de hacer predicciones (pronósticos), así como para
efectuar una planeación y un control administrativo
La sugerencia que se hace es que ante el hecho de explicar variaciones en serie de tiempo con datos
históricos en donde no se sabe si el patrón de comportamiento continuará en el futuro, es que se deben
combinar con un análisis que se extiende a buscar respuestas de tipo. ¿Qué pasaría si…? Ya que forman
parte de la planeación estratégica de lo que estoy sometiendo a análisis el marco de referencia de los datos
que se desenvuelvennen diferentes entornos económico, político, sociológico y hasta sicológico.
La Serie Y(t) se descompone si seguimos el modelo multiplicativo clásico (uno de los tantos):
Y(t ) = T(t) * C(t) * E(t) * I(t)
144
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
PROMEDIO MOVIL
El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil.
La media móvil se basa en la idea que cualquier componente irregular en cualquier mom.ento del tiempo
ejercerá un efecto menor si se promedia el punto con sus vecinos inmediatos (Newbold). El objetivo de usar
medias móviles será la eliminación del componente irregular subyacente en la serie temporal
Una aplicación muy importante para el tratamiento de series que tienen componente estacional es usar las
medias móviles para extraer ese componente. Así, cuando graficamos la serie de medias móviles centradas
–PMC- junto con la serie original hemos eliminado el componente estacional y por otro lado, también se
ha suavizado el componente irregular. El grafico que se pueda representar nos permite juzgar las
regularidades no estacionales de los datos y comenzar a interpretar gráficamente que tipo de tendencia y
ciclo domina en esa serie representada ya suavizada.
Entonces, la serie de PMC de “p” puntos –en donde p representa la cantidad de subperiodos que en el año
están informados los datos observados o relevados- pueden resultar útil para comprender la estructura de
una serie temporal.
1) Enumere y defina los componentes de una serie cronológica
2) Cuáles de los componentes de una serie de tiempo puede esperarse que estén presentes en cada
una de las siguientes series:
a. Ventas mensuales de piletas de natación
b. El índice de precios al consumidor para los meses comprendidos entre diciembre 2009 a
diciembre 2014.
c. La tasa de desempleo en los últimos 10 años
d. El número de turistas que visitan el Complejo Las Leñas en Mendoza entre los meses de
enero 2009 a diciembre 2014.
145
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
e. Las tasas de interés pasivas en el periodo comprendido entre diciembre 2001 a diciembre
2014.
3) Marque en los ejemplos que se citan a continuación , aquellos en donde Ud. considere que no son
series cronológicas.
a. Series Económicas sobre Tasas de desempleo, Tasas de Inflación, Indicadores Economicos
que informan Índices de Precios, Precios de determinados productos.
b. Series Demográficas: sobre tasas de crecimiento, mortalidad, natalidad
c. Series Físicas sobre Evolución de Precipitaciones, temperaturas.
d. Series Geofísicas sobre Evolución de Movimientos Sísmicos en el área de Mendoza
e. Series de tráfico, series de turismo….
4)
EJERCICIO DE APLICACIÓN DE SERIE DE TIEMPO:
Dado los siguientes valores originales observados en las ventas en miles de $ en esos periodos.
a) Identifique el componente estacional y desestacionalice la serie de observaciones.
Resolución:
Estos valores se pueden representar en la siguiente tabla como una serie de tiempo y luego
graficarlos
Valores .Originales
año TRIM De Ventas en ‐Miles de $‐
1 1 16 ETAPA PREVIA
2 21
3 9
4 18
2 1 15
2 20 Ventas históricas en Valores originales
3 10 30
4 18
3 1 17 20
2 24 10 V.O.
3 13
0
4 22 0 5 10 15 20
4 1 17
2 25
3 11
4 21
5 1 18
2 26
3 14
4 25
146
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
ETAPA DE TRABAJO
Para el caso de series informadas por periodos menores al año, hallaremos el componente estacional para
desestacionalizar la serie. Por eso, comenzamos con
El descomponer la serie en sus elementos, permite con un enfoque mecánico del análisis de serie
de tiempos “Pronosticar”. A diferencia de lo visto en regresión, que podíamos interpolar dentro del rango
de la variable explicativa, en el caso de Series Cronológicas podemos proyectar la tendencia histórica y
variación cíclica en el futuro, cuidando de ver si los patrones están cambiando, pues de nada nos serviría
la proyección en ese caso, como tampoco serviría si no son regulares y duraderas las tendencias pasadas.
SUPUESTO FUERTE: “El patrón de comportamiento histórico se considera válido para el futuro.”
El análisis de la Serie de tiempo también requiere de ver cuán precisos son los datos históricos, ello
incluye considerar en el caso de Series de precios, a diferencia de cantidad, que pueden estar registradas
contablemente a valores corrientes. Por ende, interpretar una tendencia positiva en el comportamiento de
los precios de una determinada serie, sería errónea si se tratase tan solo de la inflación que acompañan
dichos precios. Para dicho análisis, debieran primeramente deflacionarse dichos valores, nos estamos
refiriendo a trabajar en valores homogéneos, lo que equivaldría decir, trabajemos a valores constantes. Allí
necesitamos del manejo de NÚMEROS INDICES.
El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una
imagen más clara a través de la media móvil
2) Puede ocurrir que el número de subperiodos en el año es un número impar, por lo que cada
promedio movil se dice que queda ubicado en el centro de aquellos que formaron parte del cálculo.
(Recordemos el cálculo de la mediana que para datos sueltos queda posicionada en el orden
[n+1]/2) . En el caso de que el número de subperiodos en el año sea par, tal como este caso 4
trimestres, nos queda el PM –Promedio Móvil- ubicado en la posición 2,5, es decir entre dos valores
y así queda posicionado.
147
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
3) Si los PM hallados son de orden par debemos centrarlos y entonces para calcular el PMC –
Promedio Móvil Centrado- se procede a centrar el promedio móvil y así poder asociarlo con los
datos reales de cada período , en este caso periodo trimestrAL. Enel caso de datos impares (ej. 5
bimestres) no necesitamos este paso pues, el 1° PM quedaría centrado en el subperíodo 3. Centrar
significa hallar la semisuma de dos PM que en su posición quedarán nuevamente alineados con un
valor original.
Y t T C E I
EI
P.M.C T C
30
25
20
15 V.O.
10 PMC
5
0
0 5 10 15 20 25
Para cada período calculamos el porcentaje de valor original o valor real respecto del valor
promedio móvil centrado para cada uno de los períodos de la serie de tiempo. Con este PMC
observamos que se han eliminado el componente irregular asi como el componente estacional.
La siguiente relación permite recuperar el componente Estacional y la podemos denominar “Valor
Estacional”
Y t
Valor Estacional .100
. .C
PM
148
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2 2 21
16,000
3 3 9 15,875 56,69
15,750
4 4 18 15,625 115,20
15,500
II 1 5 15 15,625 96,00
15,750
2 6 20 15,750 126,98
15,750 62,50
3 7 10 16,000
16,250 197,46
4 8 18 16,750
17,250 96,45
III 1 9 17 17,625
18,000 129,73
2 10 24 18,500
19,000 68,42
3 11 13 19,000
19,000 115,03
4 12 22 19,125
19,250 89,47
IV 1 13 17 19,000
18,750 134,23
2 14 25 18,625
18,500 59,06
3 15 11 18,625
18,750 111,26
4 16 21 18,875
19,000 92,90
V 1 17 18 19,375
19,750 128,40
2 18 26 20,250
20,750
3 19 14
4 20 25
Forma parte del proceso de promediar el componente irregular que se realiza enlistando los
diversos cocientes aplicables al mismo trimestre, eliminando los valores más alto y más bajo y
calculando la media de los cocientes restantes. Esta medida se denomina media modificada, a causa
de la eliminación de los dos valores extremos.La media modificada será el índice de componente
estacional. Esta media modificada es un índice desajustado
Observaremos que El índice estacional se puede utilizar para eliminar los efectos de estacionalidad en una
serie de tiempos haciendo la desestacionalización.
Veremos que las medias modificadas al multiplicarse por un factor de ajuste permiten que la suma del
índice en este caso sea 100 para cada trimestre y 400 en los cuatro trimestres que comprenden el año.
Veamos:
149
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
TRIM I II III IV
AÑO 1 - - 56,69 115,20
AÑO 2 96,00 126,98 62,50 107,46
AÑO 3 96,45 129,73 68,42 115,03
AÑO 4 89,47 134,23 59,06 111,26
AÑO 5 92,90 128,40 - -
Sumas 374,83 519,34 246,67 448,95
mediana 94,45 129,06 60,78 113,15 397,440
Sumas 100 100 100 100 400,000
I.E 95,1 129,9 61,2 113,9 400,000
Interpretación del IE .
El trimestre con mayor efecto estacional positivo es el Segundo Trimestre, cuyas ventas son superiores
en alrededor del 29,9% a las del trimestre normal. Por el contrario, las ventas del Tercer Trimestre son
apenas el 61,2% de las ventas del trimestre normal.
Una empresa puede tomar las variaciones en consideración para planificar su programa de trabajo y
realizar el pronóstico de ventas.
Utilidad: Los datos desestacionalizados o denominados datos con ajuste estacional son pertinentes cuando:
Se desea comparar datos de diferentes subperiodos para determinar si ha tenido lugar un
incremento o decremento en relación con las expectativas estacionales.
. 100
Ej.
16
. 100 16,8
95,10
150
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
( y ).( x ) ( x. y ).( x)
2 N .( x. y ) ( x).( y )
b (o ) b(1)
N .( x ) ( x) 2
2
N .( x ) ( x) 2
2
La línea de tendencia, en términos estadísticos parece similar a la línea de regresión. PERO, no lo es.
La variable dependiente Y no es una V.A.==> Es Una serie de valores históricos.
Sólo puede haber un valor histórico (no una distribución de valores) para un periodo dado
Es probable que los valores asociados con periodos contiguos sean dependientes y no
independientes.
De todas formas el método de mínimos cuadrados es una base adecuada para la determinación de
la T(t)
151
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
Tendencia
x V.O.DESEST xy x2 y2 X Y desestacionalizada
1 -19 16,8 -319,8 361 283,30 -19 16,831462 15,04138
2 -17 16,2 -274,8 289 261,37 -17 16,167051 15,35874
3 -15 14,7 -220,7 225 216,46 -15 14,712674 15,6761
4 -13 15,8 -205,5 169 249,86 -13 15,806894 15,99346
5 -11 15,8 -173,6 121 248,99 -11 15,779496 16,31082
6 -9 15,4 -138,6 81 237,07 -9 15,397192 16,62818
7 -7 16,3 -114,4 49 267,24 -7 16,347416 16,94554
8 -5 15,8 -79,0 25 249,86 -5 15,806894 17,2629
9 -3 17,9 -53,7 9 319,82 -3 17,883429 17,58026
10 -1 18,5 -18,5 1 341,39 -1 18,47663 17,89762
11 1 21,3 21,3 1 451,63 1 21,251641 18,21498
12 3 19,3 58,0 9 373,24
3 19,319537 18,53233
13 5 17,9 89,4 25 319,82
5 17,883429 18,84969
14 7 19,2 134,7 49 370,43
7 19,24649 19,16705
15 9 18,0 161,8 81 323,36
16 11 18,4 202,9 121 340,08 9 17,982157 19,48441
17 13 18,9 246,2 169 358,55 11 18,441376 19,80177
18 15 20,0 300,2 225 400,65 13 18,935395 20,11913
19 17 22,9 389,1 289 523,79 15 20,016349 20,43649
20 19 22,0 417,1 361 481,98 17 22,886382 20,75385
-------------- -------------- -------------- 19 21,95402 21,07121
- --------------- - - ---------------
∑ 0 361,12591 422,0878 2660 6618,88948 La ecuación estimada de tendencia
m 0 18,056296 21,10439 133 330,944474
y 18,0563 0,1587. X
Luego, armamos la Tendencia desestacionalizada haciendo el cociente entre los valores de las ventas
desestacionalizadas y los valores de la ecuación estimada de tendencia.
Podemos determinar también, el Porcentaje de Tendencia desestacionalizada si multiplicamos por 100 el
cociente entre los valores de las ventas desestacionalizadas y los valores de la ecuación estimada de
tendencia.
30 Observemos que
representamos los valores
25 V.O. hallados en cada uno de los
pasos:
20 - Y(t) : Valores Originales
PMC
- PMC: Promedios Móviles
15
Centrados
Val. Desestac
10 - Z(t): Valores
Desestacionalizados
5 b(o)+b(1).x - Tendencia: b(o)+ b(1) . X
0
0 5 10 15 20 25
Por último el cálculo del Residuo restando 100 al valor de la tendencia desestacionalizada. Ver cuadro
siguiente. Posteriormente, el gráfico nos queda así.
Es lo mismo que calcular el Residuo Cíclico Relativo haciendo La diferencia entre el valor
desestacionalizado de la serie y la tendencia desestacionalizada. Luego esa diferencia la dividimos por la
tendencia desestacionalizada y multiplicamos por 100.
152
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
∗ 100
, ,
Ej. ∗ 100
,
Veamos:
=T(t)
Y(t) Tendencia Residuo
X desestacionalizada desestacionalizada cíclico relativo
-19 16,8315 15,0414 11,9010
-17 16,1671 15,3587 5,2629
-15 14,7127 15,6761 -6,1458
-13 15,8069 15,9935 -1,1665
-11 15,7795 16,3108 -3,2575
-9 15,3972 16,6282 -7,4030
-7 16,3474 16,9455 -3,5297
-5 15,8069 17,2629 -8,4343
-3 17,8834 17,5803 1,7245
-1 18,4766 17,8976 3,2351
1 21,2516 18,2150 16,6713
3 19,3195 18,5323 4,2477
5 17,8834 18,8497 -5,1262
7 19,2465 19,1671 0,4144
9 17,9822 19,4844 -7,7100
11 18,4414 19,8018 -6,8701
13 18,9354 20,1191 -5,8836
15 20,0163 20,4365 -2,0558
17 22,8864 20,7538 10,2754
19 21,9540 21,0712 4,1897
CONCLUSION: Expresa Levin, Rubin en su texto “SUGERENCIA: La manera correcta de proceder al analizar
todas las componentes de una serie de tiempo es:
1° Desestacionalizar
2° Encontrar la línea de tendencia
3° Calcular la variación alrededor de la línea de tendencia
4° Identificar la variación irregular en lo que queda.
153
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
1)EJERCICIO DE APLICACIÓN DE SERIES DE TIEMPO
Dada la siguiente serie “SALIDA DE TURISTAS” extraido de un Cuadro titulado “Turismo emisivo. Salida de turistas,
estadía promedio y gasto gasto diario diario promedio por tipo de alojamiento utilizado
Aeropuerto Internacional de Ezeiza y Aeroparque Jorge Newbery. Años 2010‐2015, por trimestre”
Que fuera extraido de http://www.indec.mecon.ar/nivel4_default.asp?id_tema_1=3&id_tema_2=13&id_tema_3=55
Se pide:
a) Grafique la serie de tiempo original.
b) Identifique los componentes que ve presentes en la serie de tiempo.
Desagreguelos en la serie.
c) ¿Hay una tendencia creciente o decreciente en el turismo?
d) Pronostique para el primer trimestre 2015 la tendencia y compárela con
los datos reales. Observe si es necesario corregir el dato real para su
comparación.
154
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE SERIES CRONOLOGICAS
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero
1. El análisis de series de tiempo se utiliza para detectar patrones de cambio en información estadística
durante intervalos regulares de tiempo.
V:__F:__
2. Las tendencias seculares representan la dirección a largo plazo de una serie de tiempo.
V:__F:__
3. El residuo cíclico relativo puede calcularse para un elemento de una serie de tiempo restando 10 al
porcentaje de tendencia de ese elemento.
V:__F:__
4. Una vez calculados los índices estacionales de una serie de tiempo, la serie puede ser desestacionalizada
de modo que solamente quede la componente de tendencia.
V:__F:__
5. El porcentaje de tendencia no debe utilizarse para pronosticar variaciones cíclicas futuras.
V:__F:__
6. De los cuatro tipos de variación, la cíclica es la más difícil de pronosticar.
V:__F:__
7. La variación estacional es una variación repetitiva y predecible alrededor de la línea de tendencia que se
da en un periodo de un año.
V:__F:__
8. Los índices estacionales ajustados deben sumar siempre 400. V:__F:__
9. Una serie de tiempo puede ser desestacionalizada si los valores originales se lo multiplican por los PMC
y el valor 100 V:__F:__
10. Una serie de tiempo de datos anuales puede contener los siguientes componentes: a) Tendencia secular.
b) Fluctuación cíclica y c) Variación estacional. V:__F:__
11. El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil V:__F:__
1 . Al dividir cada valor real de una serie de tiempo por el valor de tendencia correspondiente y multiplicar
el resultado por 100, obtenemos el _______________.
2. El movimiento repetitivo y predecible alrededor de la línea de tendencia que se da en un año o menos es
la variación_______________ .
3. La variación _________________de una serie de tiempo está caracterizada por un movimiento
impredecible y aleatorio que por lo general ocurre durante intervalos cortos.
4. La variación __________________es la componente de una serie de tiempo que oscila alrededor de la
línea de tendencia en periodos mayores que un año.
5. El uso de índices estacionales para eliminar los efectos de la estacionalidad de una serie de tiempo se
conoce como _________ la serie de tiempo.
6. El primer paso para calcular los índices estacionales de los datos de una serie de tiempo consiste en
calcular el ______________________.
7. El resultado de descartar los valores más alto y más bajo antes de promediar se conoce como
___________________.
155
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
156
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
las actividades estadísticas internacionales. La UNCTAD, al igual que la mayoría de los organismos, se ha comprometido a
aplicarlos.
Declaración de Ética Profesional del Instituto Internacional de Estadística.
ÉTICA EN ESTADÍSTICA:
RESPONSABILIDAD DE LAS UNIVERSIDADES EN LA FORMACIÓN DEL PROFESIONAL
María Teresa Blaconá *Facultad de Ciencias Económicas y Estadística de Rosario ‐ Universidad Nacional de Rosario
Extraido de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99. Consulta 20 de mayo de 2014
ETICA:
Expresa Blaconá …”Se puede definir la noción de ética como un conjunto de reglas compiladas en una guía o estándares
profesionales que pueden ser importantes en la educación y entrenamiento de los estadísticos. Por ejemplo, el objetivo de la Guía
Ética de la American Statistical Association (1999) expresa: el propósito de la guía ética de la ASA es asegurar que el trabajo
estadístico sea ético y efectivo cuando se realizan trabajos del medio ambiente y asistir a los estudiantes a aprender a desarrollar
el trabajo estadístico razonablemente. Pero por otro lado, el desempeño ético de un profesional estadístico no puede estar
solamente restringido a conocer dichas guías o estándares.
Es importante tener en cuenta lo enunciado por la Comisión de Estadística de la Asamblea General de las Naciones Unidas, cuando
decidió celebrar el Día Mundial de la Estadística (World Statistics Day, WSD), el día 20 de octubre de 2010, en reconocimiento de
los servicios prestados por el sistema estadístico global a nivel nacional e internacional. Al respecto definieron como palabras
claves: Servicio – Profesionalismo – Integridad.
En una democracia es altamente reconocido que el libre acceso a la información estadística es un derecho que tienen los
ciudadanos para obtener información correcta. Para que esto se pueda cumplir los organismos de Estadísticas Oficiales, enfrentan
desafíos éticos los cuales se pueden enunciar brevemente como: a) utilizar una metodología adecuada; b) proteger la
confidencialidad y c) mantener la integridad de las Agencias Estadísticas en el Sistema Estadístico Nacional.
No obstante, que los estudiantes en la Universidad reciban una buena formación en metodología estadística, ¿alcanzará para
permitirles que puedan resolver desafíos éticos que surgen en el desempeño de la profesión?.
En este artículo en la sección 2 se desarrollan algunas premisas sobre las condiciones necesarias para desempañarse éticamente
en estadística, en la sección 3 se enuncian otros aspectos que se deben considerar para desarrollar una actividad ética en
estadística y en la sección 4 se presentan las consideraciones finales.
2. Condiciones necesarias para desempañarse éticamente en estadística
En primer lugar se puede considerar lo expresado por Seltzer (2005) sobre los desafíos éticos que surgen en las Estadística
Oficiales, las cuales se pueden expresar como: a) utilizar una metodología adecuada; b) proteger la confidencialidad y c) defender
la integridad de las Agencias Estadísticas en el Sistema Estadístico Nacional.
Sin duda estas premisas son necesarias para el desempeño ético de los profesionales estadísticos. Las preguntas que caben son:
1) ¿estas premisas son suficientes? y 2) ¿cómo contribuye la Universidad para que los profesionales posean el mayor número de
herramientas para enfrentar dicho desafío?. Se enunciaran brevemente algunas respuestas a estas preguntas, para ello se
comienza con las condiciones necesarias expresadas anteriormente.
a.‐ Utilizar una metodología adecuada. Si bien como dice Seltzer (2005), la ciencia correcta no es necesariamente ciencia ética,
el no utilizar la metodología adecuada presenta serios problemas éticos. Por ello para el cumplimiento de este ítems es primordial
la responsabilidad de la formación profesional universitaria.
Por un lado, desde la función docente se deben impartir conocimientos sobre metodologías correctas, actualizadas y
especialmente brindar herramientas para adaptar las metodologías a nuevos problemas que surjan. Desde la función de
investigación, los docentes deben estar abiertos y alertas para encarar estudios que puedan contribuir a nuevos desarrollos
metodológicos que ayuden a resolver problemas que se presentan en las agencias estadísticas u otras áreas del conocimiento.
Por último, desde la función de transferencia se deben dar a conocer los resultados encontrados en sus investigaciones, sean estos
positivos o negativos e interactuar con los directivos y personal de las agencias estadísticas, como así también con profesionales
de otras áreas.
Se puede agregar, que no necesariamente un procedimiento errado es un indicador de falta de ética, pero el profesional Estadístico
debe tener la capacidad para corregirlo cuando se advierte un error. La educación debe asegurar las ventajas e integridad de los
métodos a utilizar.
b.‐ Protección de la confidencialidad. Generalmente se hace mucho hincapié en la confidencialidad a nivel del micro dato, que es
además lo que protege la ley, no es tan claro cómo se maneja la confidencialidad de datos agregados (tabulados para pequeñas
unidades geográficas, grupos étnicos, etc.). Se puede mencionar el ejemplo dado por varios autores sobre la reubicación en 1942
de la población estadounidense de origen japonés, en base a información surgida de la Oficina de Censos de EEUU. Se violó la
confianza pública, porque se permitió que los datos fueran usados en detrimento de la comunidad japonesa, es decir se violó la
promesa de que los registros no se utilizarían contra los individuos. Si bien la ley protege los datos individuales, esto no implica
que los datos se puedan utilizar con perjuicio a pequeños grupos.Todavía no se ha delimitado claramente en los estándares
profesionales y éticos de las agencias estadísticas, ni en la comunidad estadística, las responsabilidades u obligaciones de
perjuicios anticipados. De esto surge el dilema, si en estadística a todas las acciones legales se las puede considerar éticas. Una
157
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
pregunta para los Estadísticos, es si la sociedad y la comunidad estadística entiende la ley y las responsabilidades que de ella
surgen, así como los estándares profesionales y éticos que de ella se desprenden y en el mismo contexto si la comunidad
estadística tiene alguna responsabilidad u obligación de “anticipar los perjuicios”. Este es un debate abierto, que las Universidades
deberían instalar en su ámbito
c.‐ Integridad de las agencias estadísticas en el sistema estadístico nacional.Como menciona Seltzer (2005), un importante
tópico del Fundamental Principles of Oficial Statistics, es el mantener e incrementar la integridad del sistema estadístico nacional,
debido a que pueden surgir amenazas a la integridad de muchas formas, incluyendo entre otras, conceptos de manipulación
política arbitraria, definiciones e información de los datos muy atrasada, informando los datos reales manipulados, usando la
agencia para análisis políticos y politizando el personal técnico de la agencia.
Por otro lado, como expresa Habermann (2005), en un sentido amplio, puede existir tensión entre la agencia estadística y el uso
del dato estadístico (especialmente en el contexto de la aplicación de la ley y otras actividades de defensa o inteligencia) y también
con respecto a la autonomía de la agencia estadística y el contexto de la agencia dentro del gobierno. De acuerdo al mismo autor
es importante saber que esta tensión puede no resolverse. Las agencias del gobierno, como pequeñas organizaciones dentro de
una estructura de gobierno mucho más amplia, no están bien equipadas para ejercitar autoridad moral.
En este sentido la Universidad debería colaborar cuando se plantea alguna tensión, especialmente brindando una opinión externa,
basada en el conocimiento académico e incluyendo el tópico ético.
3. Otros aspectos que se deben considerar para desarrollar una actividad ética en estadística
Hasta aquí se han enunciado las condiciones necesarias para el desarrollo ético de un trabajo estadístico, pero en algunos casos
dichas condiciones no resultan ser suficientes.
Para las Naciones Unidas el primero de los principios fundamentales de las estadísticas oficiales es proporcionar un elemento
indispensable en el sistema de información de una sociedad democrática, al servicio del gobierno, la economía y el público con
datos sobre la situación económica, demográfica, social y ambiental. Con este fin, las estadísticas oficiales que encuentran las
pruebas de la utilidad práctica deben ser compiladas y puestas a disposición de manera imparcial, por agencias estadísticas
oficiales, para honrar el derecho de los ciudadanos a la información pública (United Nations Statistical Commission, 1994).
Por otro lado, Habermann (2005) agrega al respecto que, por supuesto, para que el debate tenga lugar, la sociedad debe estar
informada y señala que la agencia Estadística debería abrirse y ser transparente acerca de la solicitud de los datos que se solicitan
y que los datos requeridos sean informados oportunamente para que las respuestas sean ser información pública.
No es fácil resolver tensiones que afectan a las agencias estadísticas. Entre las estrategias de prevención para reducir probables
problemas éticos, Seltzer (2001) menciona: Incluir educación y tratamientos sobre ética en la universidad y programas de
entrenamiento de las agencias y desarrollar planes de la agencia específica para discusiones externas a la agencia sobre temas
éticos y mecanismos específicos de la agencia para responder a lo que se refiere a la ética. Es decir, considera la mirada académica
externa uno de los pilares para resolver problemas éticos en las agencias estadísticas.
La mayoría de lo que se ha expuesto con respecto a ética en Estadística en las agencias oficiales, tiene vigencia para trabajos
profesionales y/o académicos de cualquier área, como por ejemplo, biología, medio ambiente, economía, epidemiología, etc.
En este tópico las Universidades pueden contribuir a que la sociedad esté informada y tenga una mirada externa de especialistas
en el tema, a través de tareas de extensión y divulgación de opiniones.
4. Consideraciones finales
Por lo expresado se podría concluir que las Universidades deben realizar esfuerzos para formar profesionales estadísticos que
puedan enfrentar nuevos temas en nuevos contextos.
Como dice Ostapski et al. (2001), los estadísticos establecen estándares profesionales por su educación continua para asegurar
las ventajas e integridad de su metier. El título significa prometer valores profesionales para cultivar un gran sentido de
responsabilidad (Imrey, 1994) y generalmente acrecienta el profesionalismo para distinguir al estadístico bien entrenado de
aquellos que poseen menos calificación o habilidades. El título no resuelve, por si mismo, cómo cualquier individuo responderá
cuando se enfrente a presiones conflictivas, para arribar a una de las diferentes determinaciones críticas. El título por si mismo no
garantiza que el individuo reflejará las implicaciones éticas de una tarea estadística, cuando realice una acción.
No es fácil resolver tensiones que afectan el comportamiento ético en Estadística. Entre las estrategias de prevención para reducir
probables problemas éticos, se pueden mencionar: incluir educación y tratamientos sobre ética en la Universidad y programas de
entrenamiento específicos para discusiones sobre temas éticos y mecanismos para responder a los mismos.
Una pregunta relacionada es de qué manera se puede investigar la mala conducta ética. Existen algunas profesiones, como por
ejemplo: abogados, médicos, contadores, etc. que tienen desarrollados mecanismos para investigar violaciones éticas. Mientras,
por contraste, muchas organizaciones profesionales y científicas en las ciencias sociales, cuando se estudia una alegación
específica de mala conducta ética, tiene procedimientos de investigación mínima. Por otro lado, tampoco se controla que el
trabajo estadístico sea realmente realizado por profesionales estadísticos.
Una buena preparación universitaria colaborará a que el profesional estadístico tenga herramientas necesarias con el fin de
decidir de acuerdo a sus principios, el camino más acertado para resolver conflictos éticos. En su formación se debe enfatizar la
responsabilidad de que deben actuar éticamente, especialmente porque son profesionales que manejan información sensible y
que diseñan métodos y experimentos donde se involucran seres humanos, animales, medio ambiente, etc.”
Material extraido de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99. Consulta 20 de mayo de
2014. María Teresa Blaconá , “ÉTICA EN ESTADÍSTICA: RESPONSABILIDAD DE LAS UNIVERSIDADES EN LA FORMACIÓN DEL
PROFESIONAL” *Facultad de Ciencias Económicas y Estadística de Rosario ‐ Universidad Nacional de Rosario
158
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
REFERENCIAS BIBLIOGRÁFICAS
159
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
ALFABETO GRIEGO
letra Nombre Sonido AFI Valor HTML (1)
Α α Alfa [a] [aː] 1 α
Β β Beta [b] 2 β
Γγ Gamma [g] siempre 3 γ
Δδ Delta [d] 4 δ
Εε Épsilon [e] 5 ε
Ζζ Dseta [zd] o [dz] o [z] 7 ζ
Η η Eta [ɛː] 8 η
Θ θ Zeta o Theta [tʰ] 9 θ
Ιι Iota [i] [iː] 10 ι
Κ κ Kappa, Cappa [k] 20 κ
Λ λ Lambda [l] 30 λ
Μ μ Mi [m] 40 μ
Ν ν Ni [n] 50 ν
Ξξ Xi [ks] 60 ξ
Ο ο Ómicron [o] 70
Π π Pi [p] 80 π
Ρρ Ro [ɾ] [r]; [ɾʰ], [rʰ] 100 ρ
Σσ Sigma [s] 200 σ
Ττ Tau [t] 300 τ
Υ υ Ípsilon [u] [uː] > [y] [yː] 400 υ
Φ φ Fi [pʰ] 500 φ
160
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
TERMINOLOGÍA ESTADÍSTICA
Conceptos generales
O. NORMAS POR CONSULTAR
IRAM TEMA
14 Y 15 Definiciones referentes a control de la calidad
1. OBJETO
1.1 Establecer las definiciones de los términos de uso más frecuente que se utilizan en estadística. Se excluyen de esta norma los
términos referentes al control estadístico de calidad, por hallarse definidos en las normas IRAM 14 e IRAM 15.
2. DEFINICIONES
2.1 CONCEPTOS INICIALES
2.1.1 elemento Objeto real, convencional o ideal de carácter singular, sobre el cual pueden efectuarse observaciones.
NOTA: Denominado también “unidad” o “unidad estadística”.
2.1.2 población Conjunto de elementos que satisfacen una definición común.
NOTA: Denominada también “universo”
2.1.3 Tamaño de la población Cantidad de elementos que la componen.
2.1.4 Datos o datos estadísticos Conjunto de valores observados que pueden ser comparados, analizados, interpretados o
relacionados.
NOTA: Denominado también “información estadística”.
2.1.5 Característica Propiedad que permite diferenciar los elementos de una población.
2.1.6 Variable Característica cuantitativa.
2.1.7 Variable contínua Característica cuantitativa que puede tomar cualquier valor dentro de su dominio.
2.1.8 Variable discreta Característica cuantitativa que solamente puede tomar determinados valores de su dominio.
2.1.9 Atributo Característica cualitativa.
2.1.10 Valor observado Cantidad o calidad que tiene una característica de un elemento determinado, en el momento que es sujeto
de observación.
NOTA: Denominado también “observación”.
2.2 CENSOS Y ENCUESTAS
2.2.1 Empadronamiento Operativo para identificar y listar todos y cada uno de los elementos de una población // Entrevista
mediante la cual se obtiene y se registra información sobre cada uno de los elementos de la población.
2.2.2 Encuesta Método para recolectar información estadística de una población, contactando cada uno de los elementos de la
misma o a una parte de ella, con el objetivo de deducir características de conjunto relativas a esta población, en un momento dada
o relativas a su evolución en el transcurso del tiempo.
161
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2.2.3 Censo Encuesta exhaustiva de una población realizada en un momento determinado y con respecto a característica especí‐
ficas.
2.2.4 Encuesta por muestreo Encuesta realizada a una muestra de la población.
2.2.5 Encuesta piloto Encuesta, generalmente de tamaño pequeño, llevada a cabo con anterioridad a la encuesta principal, para
lograr información tendiente a aumentar la eficiencia de la encuesta principal.
2.2.6 Censo por muestreo Operativo censal en el que a todos los elementos de la población se los interroga respecto de las
características básicas y a solo una muestra de ellos, sobre características no básicas.
2.2.7 Cuestionario Documento que contiene una sucesión de preguntas a las que deberá responder el encuestado y que ha sido
planeado para obtener y registrar información sobre una o varias características.
NOTA: Denominado también “cédula” o “formulario”.
2.2.8 Tabla Forma de presentación de datos estadísticos arreglados sistemáticamente en columna o filas.
NOTA: También denominada “cuadro” o “tabulado”.
2.2.9 Plan de tabulación Conjunto de tablas por medio del cual se prevé ordenar la información estadística y presentar los
resultados provenientes de un operativo de recolección de información.
2.3. DISTRIBUCIÓN DE FRECUENCIAS
2.3.1 Clase Cada una de las subdivisiones e intervalos en que se ha dividido el dominio de una variable.
NOTA: Denomina también “intervalo de clase”.
2.3.2 Limites de clase Valores que define los extremos de una clase.
2.3.3 Marca de clase Punto medio o centro de una clase.
2.3.4 Frecuencia absoluta Cantidad de veces que se presentan un determinado valor observado o cantidad de valores observados
incluidos en una clase.
NOTA: Denominada también “frecuencia”.
2.3.5 Frecuencia relativa Cociente entre la frecuencia absoluta y la cantidad total de valores observados.
2.3.6 Frecuencia acumulada Suma de las frecuencias (absoluta o relativas) para todos los valores inferiores o iguales a un
determinado valor de una característica o al límite superior de una clase.
2.3.7 Distinción de frecuencias Cuadros que presenta en forma ordenada a las clases o a los distintos valores de una variable
(derivados de valores observados) y sus correspondientes frecuencias.
2.3.8 Histograma Representación de la distribución de frecuencia absolutas o relativas, de una variable agrupada en clases
mediante un gráfico de superficies en un sistema de coordenadas cartesianas ortogonales. Sobre el eje de abscisas se presentan
las clases y se levantan sobre cada una de ellas un rectángulo cuya área es igual a la respectiva frecuencia.
2.3.9 Polígono de frecuencias Línea poligonal obtenida en un histograma, uniendo los puntos medios de los lados superiores de
los rectángulos. Los dos extremos del polígono pueden o no ser conectados con el eje de la variable. Cuando ello ocurre, se
emplean dos clases hipotéticas con frecuencia cero, colocada cada una de ellas en ambos extremos del histograma.
2.3.10 Gráfico de bastones Representación gráfica de las frecuencias acumuladas de una variable discreta mediante un gráfico de
puntos, en un sistema de coordenadas cartesianas ortogonales cuya abscisas son valores de una variable y cuyas ordenadas son
las frecuencias absolutas o relativas.
NOTA: Denominado también “diagrama breve”.
2.3.11 Polígono de frecuencia acumuladas Representación gráfica de las frecuencias acumuladas de una variable agrupada en
clases, mediante una línea poligonal obtenida uniendo los puntos que tienen por abscisa los límites superiores de clases y por
ordenadas las respectivas frecuencias acumuladas.
162
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2.3.12 Gráfico acumulativo de frecuencias Representación gráfica de las frecuencias acumuladas de una variable discreta
mediante segmentos paralelos al eje de abscisas. Cada segmento se extiende entre dos valores consecutivos de la variable, siendo
las respectivas ordenadas las frecuencias acumuladas correspondientes al valor de variable que es abscisa del punto inicial del
segmento.
NOTA: Denominado también “gráfico escalonado”.
2.3.13 Tabla de contingencia simple Cuadro que representa en forma ordenada las categorías de un atributo y sus correspon‐
dientes frecuencias.
2.4 MEDIDAS DE POSICIÓN Y VARIABILIDAD
2.4.1 Media aritmética Suma de los valores disponibles de una variable, dividida por la cantidad de los mismos.
NOTA: Denominada también “medida” o “promedio aritmético”.
2.4.2 Ponderación Coeficiente numérica que expresa la importancia relativa de cada valor.
2.4.3 Media aritmética ponderada Suma de los productos de cada valor disponible de una variable por su ponderación, dividida
por la suma de las ponderaciones.
2.4.4 Modo Valor o valores de la variable que se repiten la máxima cantidad de veces.
NOTA: Denominado también “moda”, “valor tipo” o “valor típico”
2.4.5 Mediana Valor que en un conjunto de valores de una variable, ordenadas de acuerdo con su magnitud, supera a no más de
la mitad de los mismos y es simultáneamente superado por no más de la otra mitad.
2.4.6 Media geométrica Raíz enésima del producto de los n valores disponibles de una variable.
2.4.7 Media armónica Inversa de la medida aritmética de las inversas de los valores disponibles de una variable.
2.4.8 Amplitud Diferencia entre el mayor y el menor de los valores disponibles.
NOTA: Denominada también “rango”, “recorrido” o “intervalo”.
2.4.9 Desvío Diferencia entre un valor disponible de una variable y un valor constante.
2.4.10 Desvío con respecto a la media aritmética Desvío cuyo valor constante es la media aritmética de los valores disponibles de
la variable considerada.
NOTA: Denominada también “desviación”.
2.4.11 Desvío medio aritmético Promedio aritmético de los módulos de los desvíos con respecto a la media aritmética.
2.4.12 Variancia Promedio aritmético de los módulos de los cuadrados de los desvíos con respecto a la media aritmética.
NOTA: Denominada también “varianza”.
2.4.13 Desvío estándar Raíz cuadrada positiva de la variancia
NOTA: Denominado también “desviación típica”, “desviación normal” o “desviación estándar”.
2.4.14 Coeficiente de variación Cociente entre el desvío estándar y la media aritmética de los valores disponibles de una misma
variable.
NOTA: Denominada también “coeficiente de variabilidad”
2.5 SERIES CRONOLÓGICAS
2.5.1 Serie cronológica Conjunto de valores ordenados cronológicamente, provenientes de sucesivas observaciones de un mismo
fenómeno que se refieren a diferentes períodos de tiempo. En general los intervalos entre las sucesivas observaciones son
163
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
constantes. Sus factores de variación o componentes se denominan: “tendencia”, “variación estacional”, “variación clínica” y
“variación residual”.
NOTA: Denominada también “serie de tiempo” o “serie temporal”.
2.5.2 Serie económica Serie cronológica en la que se analiza el comportamiento de variables económicas.
2.5.3 Tendencia Componente sistemático o regular, no periódica, de una serie cronológica, que describe la evolución básica del
movimiento de la serie en un período extenso. Se representa generalmente por medio de alguna función matemática cuya ecua‐
ción describe un movimiento suave a lo largo del tiempo.
NOTA: Denominada también “tendencia secular”.
2.5.4 Variación estacionales Componentes periódicas de una serie cronológica, cuyas fluctuaciones se repiten en forma regular,
inscriptas en el marco de cada año y que se reproducen de manera más o menos permanente de un año a otro.
NOTA: Denominadas también “fluctuaciones estacionales” o “movimientos estacionales”.
2.5.5 Índice de variación estacional Valor relativo que cuantifica la incidencia de la variación estacional en el comportamiento
periódico de una serie cronológica.
2.5.6 Variaciones cíclicas Componentes periódicas de una serie cronológicas cuyas fluctuaciones se repiten en forma regular con
períodos mayores a un año y que se reproducen de manera más o menos permanente cada cierta cantidad de años, según el
período.
2.5.7 Variaciones residuales Componentes no periódicas de una serie cronológica cuyas fluctuaciones se presentan en forma
irregular e imprevisible. Son debidas a factores perturbadores no permanentes.
NOTA: Denominadas también “variaciones irregulares”.
2.6 PROBABILIDAD Y VARIABLES ALEATORIAS
2.6.1 Suceso aleatorio Acontecimiento con relación al cual existe incertidumbre acerca de su ocurrencia; es decir que antes de
realizar el experimento no se lo puede predecir con seguridad completa.
NOTA: Denominado también “evento aleatorio” o “estocástico”.
2.6.2 Probabilidad de un suceso aleatorio Medida del grado de incertidumbre. Se puede calcular según la ascripción a una
determinada teoría del cálculo de probabilidades, como:
a) Cociente entre en número de casos favorables que corresponden al suceso aleatorio y el número de casos posibles res‐
pectivos, siempre que estos sean igualmente probables, equiprobables o simétricos (definición clásica de probabilidad);
b) Límite hacia el cual tiene la frecuencia relativa del suceso aleatorio cuando el número de experimentos crece indefinidamente
(definición frecuencial, experimental o empirista);
c) En forma axiomática objetiva o subjetiva.
2.6.3 Sucesos aleatorio combinado Combinación de dos o más acontecimientos aleatorios, de los cuales interesa calcular la
probabilidad. Las combinaciones más habituales, son las que se establecen con el uso de las conjunciones disyuntiva o y copulativa
y, cuando se dice la probabilidad de un suceso aleatorio u otro y la probabilidad de un suceso aleatorio y otro. Tales combinaciones
corresponden el Lógica a dos Clases de operaciones: la suma lógica y el producto o intersección.
2.6.4 Probabilidad total Probabilidad de un suceso aleatorio combinado, cuando la combinación se 0establece usando la con‐
junción disyuntiva o. En el caso de dos sucesos es la suma de las probabilidades simples correspondientes a cada uno de ellos
menos la probabilidad conjunta de ambos.
2.6.5 Sucesos aleatorios incompatibles Aquellos que no pueden verificarse juntos al realizarse un experimento, es decir aquellos
cuya probabilidad conjunta vale cero. En consecuencia la probabilidad total correspondiente a ellos es la suma de las
probabilidades simples respectivas.
164
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2.7.12 Límites inferiores y superiores del intervalo de confianza (1 ‐ “) Son los respectivos extremos, t1, t2 del intervalo que tiene
probabilidad (1 ‐ “) de contener al verdadero desconocido del parámetro. Dichos extremos son aleatorios porque se calculan en
función de un estimador.
2.7.13 Nivel de confianza (1 ‐ “) Es la probabilidad (1 ‐ “) definida previamente, de que el intervalo (t1, t2) cubra el verdadero valor
desconocido del parámetro.
NOTA: Denominado también “coeficiente de confianza”.
2.7.14 Nivel de riesgo (“) Es la probabilidad “ de que el intervalo (t1, t2) no contenga el verdadero valor desconocido del parámetro.
NOTA: Denominado también “coeficiente de riesgo”.
2.8 REGRESIÓN, CORRELACIÓN Y ASOCIACIÓN
2.8.1 Regresión Método estadístico utilizado para establecer y estimar la función que relaciona una variable aleatoria dependiente
con una o más variables independientes, que pueden o no ser aleatorias. En algunos casos a las variables independientes se las
denomina explicativas o descriptivas y a la variable dependiente explicada.
2.8.2 Función de regresión Función matemática que liga los valores de la o las variaciones independientes con la media aritmética
o con la esperanza matemática de las distribuciones de la variable dependiente.
NOTA: Denominada también “ecuación de regresión”.
2.8.3 Recta de regresión Función de regresión lineal.
2.8.4 Coeficiente de regresión Cada uno de los parámetros que determinan o identifican una función de regresión.
2.8.5 Correlación Método estadístico utilizado para medir la interdependencia o ligazón aparente dos o más variables aleatorias.
2.8.6 Coeficiente de correlación Medida de la relación o interdependencia existente entre dos o más variables aleatorias.
2.8.7 Asociación Métodos estadísticos utilizado para medir la interdependencia o ligazón aparente entre dos o más características.
2.8.8 Coeficiente de asociación Medida de la asociación existente entre dos o más características.
2.9 NÚMERO ÍNDICE
2.9.1. número índice. Coeficiente estadístico que refleja las variaciones, en el tiempo o en el espacio, de una magnitud o de un
subconjunto de magnitudes, considerado como representativo de un conjunto mayor. Se calcula respecto de un punto de
referencia denominado base del número índice y generalmente se expresa como porcentaje. Los números índices más
frecuentemente utilizados son los de precio, de cantidades y de valores.
NOTA: Denominado también índice.
2.9.2. base de un número índice. Momento, período o punto con respecto al cual se establece la comparación. Generalmente al
índice en la base se le asigna valor 100.
2.9.3. número índice de precios. Aquel que refleja la variación de los precios de un conjunto de bienes o servicios, entre dos
momentos en el tiempo o dos puntos en el espacio.
2.9.4. número índice de cantidades. Aquel que refleja la variación de las cantidades de un conjunto de bienes o servicios, entre
dos momentos en el tiempo o dos puntos en el espacio.
2.9.5. número índice de valor. Aquel que refleja la variación en el valor total (precio multiplicado por cantidad) de un conjunto de
bienes o servicios, entre dos momentos en el tiempo o dos puntos en el espacio.
2.9.6. relativo de precio. Razón del precio de un bien o servicio, en un período o punto dado, respecto al precio del mismo bien o
servicio, en el período o punto base. Estos relativos integran los números índices entre los cuales las fórmulas más frecuentemente
usadas son las de Laspeyres o Paasche.
166
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
NOTA: Denominados también “sucesos aleatorios excluyentes” o “mutuamente excluyentes”.
2.6.6 Sucesos aleatorios independientes Dos o más sucesos aleatorios son independientes cuando el hecho de saber que se ha
verificado o no uno de los acontecimiento, no modificada la probabilidad de ocurrencia del otro u otros sucesos compatibles con
el anterior.
2.6.7 Sucesos aleatorios dependientes Dos o más sucesos aleatorios son dependientes cuando el hecho de saber que se ha
verificado o no uno de los acontecimientos modifica la probabilidad de ocurrencia del otro u otros sucesos compatibles con el
anterior.
2.6.8 Probabilidad condicional Probabilidad de un acontecimiento aleatorio dependiente cuando se ha verificado previamente
otro u otros sucesos compatibles con el anterior.
2.6.9 Probabilidad compuesta Probabilidad de un suceso aleatorio combinado cuando la combinación se establece usando la
conjunción copulativa y. En el caso de dos sucesos es el producto de la propiedad simple de uno de ellos por la probabilidad
condicional del otro. Si los sucesos aleatorios son independientes, la probabilidad compuesta es igual al producto de las respectivas
probabilidades simples de cada uno de los acontecimientos.
2.6.10 Variable aleatoria Aquella que puede tomar uno cualquiera de los valores posibles de un conjunto finito o infinito (dominio),
cada uno de los cuales tiene asociada una probabilidad si la variable es discreta o una densidad de probabilidad si la misma es
contínua. La suma de estas probabilidades es igual a uno.
NOTA: Denominada también “variable estocástica”.
2.7 INFERENCIA
2.7.1 Parámetro Valor fijo o constante que caracteriza a una población.
2.7.2 Muestra Conjunto de elementos tomados de una población dad, destinado a suministrar información sobre ésta.
2.7.3 Muestra probabilística Muestra seleccionada mediante la aplicación de algún método información en el Cálculo de Proba‐
bilidades.
2.7.4 Tamaño de muestra Cantidad de elementos que la componen.
2.7.5 Estadístico Relación matemática que vincula los valores de una o más características, los cuales proceden de una o varias
muestras.
NOTA: Denominado también “estadígrafo”.
2.7.6 Coeficiente estadístico Denominación que se emplea generalmente para llamar a los estadísticos sin dimensión, es decir
número puro.
2.7.7 Estimación Conjunto de métodos de la Estadística Inductiva que, basado en el Cálculo de probabilidades, permite a partir de
muestras probabilísticas, inferir las leyes de distribución de las características consideradas en la población de la cual provienen,
o juzgar la validez de ciertas hipótesis // Resultado obtenido por la aplicación del método de estimación utilizado.
2.7.8 Estimador Estadístico aplicado a una o varias muestras probabilísticas para estimar un parámetro desconocido de la
población. Es una variable aleatoria.
2.7.9 Estimación puntual Método que permite a partir de los valores muestrales y de un estimador, calcular un único valor como
estimación de un parámetro desconocido. Se utiliza como estimación un sólo punto del dominio de dicho estimador.
2.7.10 Estimación por intervención Método que permite obtener un intervalo aleatorio que tiene una probabilidad (1 ‐ “) definida
previamente, de contener al verdadero valor desconocido de un parámetro. Es un método de estimación que, si se aplicara una
gran cantidad de veces, cubriría al verdadero valor del parámetro en 100 (1 ‐ “) % de los casos.
2.7.11 Intervalo de confianza (1 ‐ “) Es el intervalo (t1, t2) que tiene probabilidad (1 ‐ “) de contener el verdadero valor desconocido
del parámetro que desea estimar.
165
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
2.9.7. relativo de cantidad. Razón del precio de un bien o servicio, en un período o punto dado, respecto a la cantidad del mismo
bien o servicio en el período o punto base.
2.9.8. canasta. Conjunto seleccionado de los bienes y servicios sobre el que se basa el cálculo de un determinado número índice.
La selección se realiza generalmente a partir de la lista exhaustiva de bienes y servicios vinculados con el fenómeno que se desea
reflejar, y debe cumplir la condición de respetar la representatividad o participación de las distintas categorías o capítulos en el
conjunto total.
2.9.9. número índice de precios de Laspeyres. Aquel que se calcula como un conjunto cuyo numerador es la suma de los precios
de un período o punto dado, ponderados por las cantidades del período o punto base. Ambas sumas involucran todos los bienes
y servicios de la canasta respectiva.
2.9.10 número índice de cantidad de Laspeyres. Aquel que se calcula como un cociente cuyo numerador es la suma de las
cantidades de un período o punto dado, ponderados por los precios del período o punto base, y cuyo denominador es la suma de
las cantidades, por los precios del período o punto base.
2.9.11 número índice de precios de Paasche. Aquel que se calcula como un cociente cuyo nominador es la suma de los precios por
las cantidades de un período o punto dado y cuyo denominador es la suma de los precios del período o punto base, ponderados
por las cantidades del período dado.
2.9.12 número índice de cantidades de Paasche. Aquel que se calcula como un cociente cuyo denominador es la suma de las
cantidades por los precios de un período o punto dado y cuyo denominadores es la suma de las cantidades del período o punto
base, ponderadas por los precios del período dado.
APROBADO SU ENVÍO A DISCUSIÓN PUBLICA POR EL SUBCOMITÉ DE ESTADÍSTICA EN SU SESIÓN DE 14 DE DICIEMBRE DE 1982
(Acta 5‐82)
(Firmado) (Firmado)
Lic. J. Ibáñez Lic. S. B. Esrequis
IRAM Secretario del Subcomité
(Firmado)
Dr. E.V. Pineda
Vº Bº Equipo A
167
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 2°C 2018. –Prof. Aída B. Castegnaro
ESTADÍSTICA
p(r )
R
r nr
. N R
N p ( x ) nx . p x .q n x
n
e x
p( x)
x!
z 1 12 z 2
F ( z)
xm
z
.e dz
2
168