Professional Documents
Culture Documents
INGENIERIA INDUSTRIAL
MATERIA:
FUNDAMENTOS DE LA INVESTIGACION
CATEDRATICO:
VICENTE AGUSTIN COELLO CONSTANTINO
ACTIVIDAD:
PROYECTO DE INVESTIGACION
PRESENTAN:
FUNDAMENTOS DE LA INVESTIGACION
1
Estadística Descriptiva
FUNDAMENTOS DE LA INVESTIGACION
2
Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA
- Población son todos y cada uno de los elementos que se quieren analizar.
Puede ser finita o infinita( en realidad las poblaciones infinitas no existen,
pero cuando se trata de un número grande se trata como si lo fuera).
FUNDAMENTOS DE LA INVESTIGACION
3
Estadística Descriptiva
ESCALAS DE MEDIDA
FUNDAMENTOS DE LA INVESTIGACION
4
Estadística Descriptiva
Las representaciones gráficas tienen que estar hechas para que el simple
impacto visual nos dé información de la distribución
Diagrama de Barras
12
10
Frecuencias
8
6
4
2
0
x1 x2 x3 x4 x5
Datos X
FUNDAMENTOS DE LA INVESTIGACION
5
Estadística Descriptiva
Diagrama rectángulos
10
8
Frecuencias
0
x1 x2 x3 x4 x5
X
FUNDAMENTOS DE LA INVESTIGACION
6
Estadística Descriptiva
x1 x2 x3 xn
Datos
Intervalos clase
FUNDAMENTOS DE LA INVESTIGACION
7
Estadística Descriptiva
El área de cada rectángulo nos da la frecuencia del intervalo, por tanto la base es
la amplitud y la altura la densidad de frecuencia de dada uno di
f5
Densidades
f3
f1 f4
f2
a1 a2 a3 a4 a5
Amplitudes
FUNDAMENTOS DE LA INVESTIGACION
8
Estadística Descriptiva
MEDIDAS DE POSICIÓN
1. Media
2. Mediana
3. Moda
• De tendencia no central
1. Cuantiles.
Las medidas de posición tienen que cumplir que intervengan todos los valores de la
variable, que se puedan calcular y que su valor sea único para cada distribución de
frecuencias.
1.- MEDIA
Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y
dividido todo ello por el número total de observaciones
n
− ∑x f i i
x=
i =1
N
La media aritmética es siempre el centro de gravedad de la distribución y es
siempre un valor que entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada
intervalo para su cálculo.
Propiedades
1.- Cuando a los valores de la variable se les suma una constante, la nueva media
es la antigua más la constante.
− −
x´= x + K ⇒ x´ = x + K
FUNDAMENTOS DE LA INVESTIGACION
9
Estadística Descriptiva
Demostración
x´ =
∑ x ´ f = ∑ ( x + K ) f = ∑ x f + k ∑ f = x + K puesto que la suma
i i i i i i i
−
N N N N
de las fi es N.
2.- Si a los valores de la variable se les multiplica por una constante, la nueva
media es la antigua multiplicada por la constante.
− −
x , ´= x i K ⇒ x´= K x
Demostración
x´=
∑ x ´ f = ∑ Kx f = K ∑ x f = k x
i i i i i i
−
N N N
3.- Como consecuencia de las dos anteriores si a los valores de una variable se
les multiplica por constante y se les suma un número, la media aritmética queda
multiplicada por la constante y sumado el número.
− −
Es decir si : Y = KX + B entonces Y = K X + B
Media cuadrática
∑x f
− 2
x2 = i i
FUNDAMENTOS DE LA INVESTIGACION
10
Estadística Descriptiva
Media Armónica
N
H =
f
∑ i
xi
Media Geométrica
Es la raíz N-ésima del producto de los valores de la variable elevado cada uno de ellos a
su frecuencia absoluta
G = N x1f .x 2f .......... x nf
1 2 n
2.- MEDIANA
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la
variable de forma creciente, y escribir los valores de las frecuencias acumuladas Fi.
FUNDAMENTOS DE LA INVESTIGACION
11
Estadística Descriptiva
3.- MODA
Es el valor de la variable que más veces se repite. En algunos casos existen varias
modas, pero normalmente es una, si son dos se llama bimodal.
d i − d i −1
Mo = Li + .a i
( d i − d i −1 ) + (d i − d i +1 )
CUANTILES
Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:
1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes
iguales, por lo tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la
población, C2 que divide a la población en dos partes iguales y C3 que deja dtrás de él al
75% de la población.
2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales,
por lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente
hasta D9 que deja al 90% antes y al 10% después de él.
FUNDAMENTOS DE LA INVESTIGACION
12
Estadística Descriptiva
MEDIDAS DE DISPERSIÓN
Recorrido
Recorrido Intercuartílico
Desviación Media
Varianza
Desviación Típica
RECORRIDO
R = xn – x1
RECORRIDO INTERCUARTÍLICO
RI = Q 3 – Q 1
DESVIACIÓN MEDIA
∑ x − x f
i=n −
D =
i =1 i
i
−
x N
FUNDAMENTOS DE LA INVESTIGACION
13
Estadística Descriptiva
VARIANZA
S 2X =
∑( xi − x)2 fi
N
Propiedades:
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y
es cuando todos los valores de la variable son iguales.
2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable
es la misma que la que tenía antes.
Demostración:
− −
S x´2 =
∑( xi ´− x´) fi =
∑( xi + k − ( x + k )) 2 fi = S x2
N N
3.- Si a los valores de la variable se les multiplica por una constante, la varianza de la
nueva variable es la que tenía por el cuadrado de la constante.
Demostración
´− − −
S 2
´=
∑( x ´− x)
i
2
fi
=
∑(kx i − k x)2 fi
=k 2 ∑( x i − x) 2 f i
= k 2 S x2
x
N N N
S y2 = a 2 S x2
FUNDAMENTOS DE LA INVESTIGACION
14
Estadística Descriptiva
− −2
5.- Cálculo abreviado de la varianza
S = x − x que es la fórmula más utilizada.
2
x
2
Demostración
−2
−2 − −2 −
∑2 xi− x fi ∑ (xi2+ x− 2 i )fxx i ∑ i2fx i x∑ fi 2x∑ fx ii −2 −2 .
Sx = = = + − = x − x
N N N N N
DESVIACIÓN TÍPICA (Sx)
FUNDAMENTOS DE LA INVESTIGACION
15
Estadística Descriptiva
Sx
CVx = −
x
Tipificación de variables
Tipificar una variable es cambiarla por otra que tenga de media cero y
desviación típica 1. Se utiliza para comparar distribuciones .
MEDIDAS DE FORMA
−
−
x− M o
Ap =
Sx
Este coeficiente puede ser:
g1 =
∑( xi − x)3 fi
N .S x3
FUNDAMENTOS DE LA INVESTIGACION
16
Estadística Descriptiva
g2 =
∑(x i − x) 4 f i
−3
N .S x4
Este coeficiente puede ser:
FUNDAMENTOS DE LA INVESTIGACION
17
Estadística Descriptiva
Las medidas más utilizadas son el Índice de Gini y la curva de Lorentz, su cálculo se
basa en la siguiente tabla de distribución:
Li-1-Li mi fi Fi Fi u
ui = ∑f i .mi
pi = .100 qi i = i .100
N un
10-20 15 6 6 90 26,09 8,45
20-40 30 4 10 210 43,48 19,72
40-50 45 3 13 345 56,52 32,39
50-70 60 5 18 645 78,26 60,56
70-80 75 2 20 795 86,96 74,65
80-100 90 3 23 1065
N=23 291,31
Siempre pi > qi en caso de igualdad implica que todos perciben la misma cantidad, por
lo tanto hay nula concentración o total uniformidad en el reparto.
Indice de Gini
IG =
∑( p − q ) = 95,54 = 0,3280
i i
en nuestro ejemplo hay escasa
∑p i 291,31
concentración por lo tanto bastante uniformidad en el reparto.
FUNDAMENTOS DE LA INVESTIGACION
18
Estadística Descriptiva
xi fi
47 1
48 3
49 2
50 8
51 3
52 2
53 1
3.- Un hotel tiene cinco tipos de habitaciones cuyos precios así como los ingresos son:
FUNDAMENTOS DE LA INVESTIGACION
19
Estadística Descriptiva
4.- Un empresario desea repartir unas bonificaciones entre sus empleados en base a
la categoría y productividad de los mismos. Dicha distribución quedó de la siguiente
forma:
3
2,8
2,6
2,4
2,2
2
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
25 50 75 100 125 150
Calcular:
• Tabla estadística
• Establecer nº de empresas con beneficios superiores a 75 millones
• Calcular media mediana y moda
• Coeficiente de variación y de asimetría de Pearson ( significado)
FUNDAMENTOS DE LA INVESTIGACION
20
Estadística Descriptiva
xi fi
0 4
1 10
2 13
3 11
4 13
5 10
6 9
7 7
8 7
9 4
10 2
7.- La tabla adjunta muestra la distribución de los salarios/mes en Euros percibidos por
los 65 empleados de la empresa AVISO.
8.- Una variable estadística tiene una media igual a 7, y una desviación típica igual a 5.
Calcular la media y la varianza de las variables:
• Y = (X-2)/4
• Z= 5X+2
FUNDAMENTOS DE LA INVESTIGACION
21
Estadística Descriptiva
9.- Completar los datos que faltan en la siguiente tabla de distribución de frecuencias:
xi fi FI hi HI
70 2 - - -
60 - 12 - -
50 8 - - -
40 6 - - -
30 - 34 - -
20 4 - - -
10 3 - - -
Calcular:
• Media aritmética
• Varianza
• Coeficiente de variación
• Mediana
• Recorrido intercuartílico
10.- La puntuación que han obtenido 50 personas que se presentaron para ocupar un
puesto en la plantilla de una empresa, ha sido la siguiente:
Puntuación Nº personas
14.18 3
18.20 6
20.25 11
25.28 15
28.32 8
32.36 7
11.- Las últimas cien ventas facturadas por un establecimiento se habían agrupado en
cuatro intervalos de clase, recordamos tan sólo la siguiente información:
• El primer intervalo tiene seis semanas como extremo superior, una frecuencia
relativa de 0,2 y una amplitud de cuatro semanas.
• La marca de clase del segundo y cuarto intervalo son ocho y cincuenta semanas
respectivamente.
• Hasta el segundo intervalo se acumulan sesenta ventas.
• El tercer intervalo presenta una frecuencia de treinta ventas y una amplitud de
treinta semanas.
FUNDAMENTOS DE LA INVESTIGACION
22
Estadística Descriptiva
13.- Durante la última semana dos librerías han vendido los libros que ocupan los tres
primeros puestos en las listas de ventas a los siguientes precios
Librería 1 Librería2
Precio Nº Ejemplares Precio Nº Ejemplares
18 10 15 25
21 13 19 18
23 15 20 25
14.- Una empresa automovilística ha abierto una nueva factoría en un país del este. En
este año en dicha factoría se han obtenido unas ventas medias mensuales de 100
automóviles con una desviación típica de 10, mientras que en España por término medio
se han vendido 75 coches con una desviación típica de 8.
FUNDAMENTOS DE LA INVESTIGACION
23
Estadística Descriptiva
Se pide a los alumnos de la clase las notas de la evaluación en las dos asignaturas y
se anotan los resultados. Una vez anotados los resultados en dos filas, se pide:
16.- Con los datos de la siguiente tabla obténgase las medias, varianzas y covarianza de
las variables X e Y
yj 1 2 4 ni
xi
5 1 0 2 3
10 2 1 0 3
15 0 1 3 4
nij 3 2 5 10
xi yj nij
2 1 6
2 4 7
3 2 4
3 5 2
5 4 1
FUNDAMENTOS DE LA INVESTIGACION
24
Estadística Descriptiva
18.- Se ha encuestado a 100 familias en una ciudad sobre su gasto mensual en ocio
(variable Y) y sus ingresos mensuales (Variable X). En la siguiente tabla se presentan
los resultados obtenidos, donde las variables vienen expresadas en Euros.
20.- Calcular las rectas de regresión de una variable bidimensional (X,Y) sabiendo los
siguientes datos :
x = 1 4 y = 7 S x2 = 3 S y2 = 1 r = 0,9 5
• ¿ Qué valor asignaría a X para un valor Y=5
FUNDAMENTOS DE LA INVESTIGACION
25
Estadística Descriptiva
21.- Dada la recta de regresión Y = - 0,25 + 3,2X ¿ Puede ser Sy< 6,4 si Sx = 2?
22.- En una región de España se observó el precio del vino y la cantidad de producción
durante algunos años , obteniéndose los siguientes datos :
X 35 31 42 60 52 49 61 50 55 58
Y 100 140 120 110 200 200 110 160 160 200
• Distribuciones marginales
• Media, mediana, desviación típica y coeficiente de variación de Pearson
de X
• Covarianza entre las variables
• Porcentaje de años en los que el precio del vino fue inferior a 48
céntimos
• Recta de regresión de Y/X
• Coeficiente de correlación y de determinación , significado.
23.- La recta de regresión entre dos variables viene dada por Y = 5 + b.X. Sabiendo que
las medias de las variables son respectivamente 5 y 20. Calcular el coeficiente de
regresión .
• El ajuste es bueno
• El coeficiente de correlación es 0,9
• El 10% de los valores no se explican por la regresión
25.- Media aritmética y varianza. Tipos de medida que son. Utilidad, importancia y
propiedades que cumple cada una de ellas.
FUNDAMENTOS DE LA INVESTIGACION
26
Estadística Descriptiva
TEORÍA
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
5.10 20
10.15 15
15.20 25
20.30 40
2.- ( 2 puntos ) Halle las rectas de regresión de una variable bidimensional (X,Y)
− −
sabiendo x = 20 y = 10 S x = 4 S y = 2 , siendo el coeficiente de correlación lineal r =
0,95.
En cual de las dos variables la media es más representativa?. ¿ Qué valor asignaría
a Y = 6? Sería la predicción fiable?
FUNDAMENTOS DE LA INVESTIGACION
27
Estadística Descriptiva
FUNDAMENTOS DE LA INVESTIGACION
28
Estadística Descriptiva
TEORÍA
1.- ( 2 puntos ) Conteste a la pregunta que mejor sepa de entre las propuestas por el
profesor en clase.
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
1.-(2 puntos ) Una empresa quiere realizar un estudio sobre la influencia de las
campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a
publicidad y sus ventas en los últimos cinco años:
FUNDAMENTOS DE LA INVESTIGACION
29
Estadística Descriptiva
2.-(2 puntos ) Calcular los tres cuartiles de las dos distribuciones siguientes:
Xi fi
2 8
3 10
8 12
12 6
15 3
Li-1-Li fi
5-10 6
10-15 7
15-20 10
20-30 9
FUNDAMENTOS DE LA INVESTIGACION
30
Estadística Descriptiva
CONCLUSION
FUNDAMENTOS DE LA INVESTIGACION
31
Estadística Descriptiva
FUNDAMENTOS DE LA INVESTIGACION
32