You are on page 1of 12

Probabilidad y Estadstica Descriptiva

OBJETIVO) GENERAL
Realizar el proceso de recopilacin, presentacin y anlisis de informacin
econmica-administrativa, formulando conclusiones, interrelacionando datos y
alternativas de evaluacin.
Interpretar estadsticas y parmetros en muestras y poblaciones para evaluar con
niveles de confianza estadstica variables econmicas y administrativas.
Utilizar los mtodos de clculo de probabilidades para caracterizar y pronosticar el
comportamiento de los datos que pueda proporcionarle una poblacin o una
situacin dentro del entorno econmico al analizar una muestra, para la toma de
decisiones.
Unidad 1
Distribuciones de frecuencia.
1.1 Conceptos de estadstica y su clasificacin.
1.2 Recopilacin de datos.
1.3 Distribucin de frecuencias.
1.3.1 Polgonos de frecuencia, histogramas y ojivas.
1.4 Medidas de tendencia central. Para un conjunto de datos y datos agrupados.
1.4.1 Media, Media ponderada.
1.4.2 Mediana.
1.4.3 Moda.
1.4.4 Relacin entre media, mediana y moda.
1.5 Medidas de dispersin para un conjunto de datos y datos agrupados.
1.5.1 Rango.
1.5.2 Desviacin media.
1.5.3 Varianza.
1.5.4 Desviacin estndar.

Probabilidad y Estadstica Descriptiva


1.1 Conceptos de estadstica y su clasificacin.
Origen etimolgico de la palabra estadstica
Del vocablo latino Status, referido fundamentalmente a la recopilacin de datos
tiles al Estado como Nacin o Estado de situacin de un pas, de una empresa,
de una industria, etc.
Estadstica: Conjunto de mtodos que trata de la recoleccin, presentacin y
agrupacin de los datos, as como del anlisis, interpretacin, proyeccin e
inferencia de ellos.

Utilidad e importancia de la estadstica


La estadstica resulta muy til no slo para recopilar y describir datos, sino
tambin para interpretar la informacin obtenida, que puede ser aprovechada para
demostrar la evolucin de un fenmeno a travs de cierto tiempo.

Ejemplos de actividad humana donde se involucra:


Personalmente: Comparacin de alternativas, evaluacin de servicios, ingresos
contra pagos, etc.
Cotidianamente: Censos, ndices de precios, ajustes de tarifas, frecuencia de
enfermedades, preferencia de candidatos polticos.

Empresarialmente: Control de proceso y calidad, evaluacin de productividad,


estudios de costos, nivel de satisfaccin de clientes, proyectos de inversin, etc.

Clasificacin de la estadstica
El estudio de la estadstica se ha concretado primordialmente en el anlisis de
datos y su aplicacin en la toma de decisiones, lo que ha permitido dividir a la
estadstica por su aplicacin en:
1. Estadstica descriptiva.
2. Estadstica inferencial

Probabilidad y Estadstica Descriptiva


1. Estadstica descriptiva.
La funcin descriptiva de la estadstica se enfoca en la presentacin y clasificacin
de los datos obtenidos de la poblacin que se analiza. Otra manera de describirla:
el proceso que se relaciona con los mtodos y/o tcnicas para la recopilacin,
organizacin y anlisis de un conjunto de datos cuantitativos, con el objeto de
describir en forma apropiada las diversas caractersticas de dicho conjunto.
2. Estadstica inferencial.
Esta aplicacin de la estadstica busca plantear y resolver problemas especficos
y/o hacer previsiones a partir de los datos de una muestra. Otra manera de
describirla: la tcnica o metodologa mediante la cual es posible realizar la
estimacin de las caractersticas de una poblacin o realizar la toma de decisiones
basados en resultados mustrales.

1.2 Recopilacin de datos.


Es la base para cualquier estudio estadstico, es la toma de datos u
observaciones; estos se llevan a cabo mediante la recopilacin de los mismos sin
ninguna ordenacin de acuerdo a lo que se est investigando.
Por ejemplo la empresa ARVI recopil la informacin resultante de encuestar 60
establecimientos pequeos, para estudiar sus ventas semanales en miles de peso,
los resultados son:

40
22
28
19
24
28

17
33
28
35
20
11

26
24
33
23
31
34

10
20
22
28
29
39

26
28
25
22
18
10

21
14
29
15
19
25

18
30
29
34
11
17

27
25
29
13
23
21

16
29
21
16
20
34

38
37
32
26
24
18

1.3 Distribucin de frecuencias.


Distribucin de frecuencias es como se denomina en estadstica a la agrupacin
de datos en categoras mutuamente excluyentes que indican el nmero de
observaciones en cada categora. Esto significa una de las cosas ms importantes
de la matemtica, su estadstica con la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
nmero existente en cada clase.

Probabilidad y Estadstica Descriptiva


Elementos fundamentales para elaborar una distribucin de frecuencia:

1) Rango
Es una medida de dispersin que se obtiene como la diferencia entre el nmero
mayor y el nmero menor de los datos.

R = Dm - dm,
Dnde:
R = rango
Dm = dato mayor
dm = dato menor
R= 40 - 10 = 30

2) Intervalos
Al resumir grandes colecciones de datos es til distribuidos en clases o categoras;
en cuanto al nmero de clases el investigador es autnomo para escoger el
nmero de intervalos para trabajar, sin embargo existe una frmula que se utiliza
como base o gua para indicar la cantidad de intervalos que se van a crear en la
tabla de frecuencias. Esta frmula est determinada por:

m = 1 + 3.33 log n; donde m = nmero de intervalos


m = 1 + 3.33 log 60 = 6.92 n = tamao de la muestra
Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6
intervalos. pero se agregan dos ms que son: el intervalo menor que el dato
menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa
de computador.
3) Amplitud
El rango nos ayuda a determinar la amplitud o el tamao de cada clase, siendo
esta una constante para cada intervalo. La amplitud indica la distancia que debe
tener cada clase.
La amplitud se puede determinar como el cociente entre el rango y el nmero de
intervalos.

Probabilidad y Estadstica Descriptiva


A = R / m; Donde A = amplitud
A = 30 / 6 = 5 miles de pesos.
Para formar los intervalos de clase, si es utilizando un programa estadstico, se
parte del dato menor 10 y se le suma la amplitud, as, 10 + 5=15. Entonces el
primer grupo est comprendido entre 10 y 15 miles de pesos.
El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15 y 20miles
de pesos. En forma similar se crean los dems intervalos, incluyendo los intervalos
menores a 10 miles de pesos y mayores a 40 miles de pesos.
Numero de clases
1
2
3
4
5
6

Intervalos
-10
10-15
15-20
20-25
25-30
30-35
35-40
40-

Otra manera de formar los intervalos de clase es tomar un dato como medida de
referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de
la amplitud:
Numero de clases
1
2
3
4
5
6
7

Intervalos
5-10
10-15
15-20
20-25
25-30
30-35
35-40

Probabilidad y Estadstica Descriptiva

1.3.1 Polgonos de frecuencia, histogramas y ojivas.


HISTOGRAMA
En estadstica, un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente sealando las
marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los
datos. En trminos matemticos, puede ser definida como una funcin inyectiva (o
mapeo) que acumula (cuenta) las observaciones que pertenecen a cada
subintervalo de una particin.
Est formado por un conjunto de barras rectangulares, levantadas sobre el eje de
las abscisas (x), cuyas reas son proporcionales a las frecuencias, la altura de
cada barra representa a la frecuencia.

POLIGONO DE FRECUENCIA
Es un diagrama de lnea que usa los mismos ejes y escala del histograma,
formando un polgono.

Probabilidad y Estadstica Descriptiva

OJIVAS:
En ocasiones se desea mostrar la distribucin de datos, en forma acumulada. Las
frecuencias acumuladas se pueden formar sobre una base menor que mayor
que y se obtienen sumando en orden ascendente o descendente las frecuencias.

Probabilidad y Estadstica Descriptiva

1.4 Medidas de tendencia central. Para un conjunto de datos y


datos agrupados.
La estadstica busca entre otras cosas, describir
conjuntos de datos y, como hay varias formas de
varios tipos de promedios. Se les llama medidas
general mente la acumulacin ms alta de datos
intermedios.

las caractersticas tpicas de


hacerlo, existen y se utilizan
de tendencia central porque
se encuentra en los valores

1.4.1 Media, Media ponderada.


La media aritmtica: Es el promedio ms comnmente usado, este puede ser
simple o ponderado. La media aritmtica simple est dada por la formula X/n y
que significa: la suma de todos los valores dividida por el nmero de datos.
8

Probabilidad y Estadstica Descriptiva

Por ejemplo:
10, 13, 10, 13, 14, 10, 13, 10, 15

M = 108/9 = 12

Media Aritmtica Ponderada: Si los valores que toma x en una serie de datos, no
todos tienen la misma importancia, es vlido asignar "pesos" o "ponderaciones" de
acuerdo a la importancia de cada dato.
En la serie del ejemplo anterior aparecen los nmeros; pero cada uno con
diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva
frecuencia o ponderacin y se suman estos productos, se obtendr la misma suma
que si se hubieran sumado uno por uno.

Sin ponderar
Numero X
10
13
14
15
Suma: 52
52/4= 13

Numero X
10
13
14
15

Calculo ponderado
Frecuencia
4
3
1
1
9

Producto (fx)
40
39
14
15
108
108/9= 12

1.4.2 Mediana.
La mediana toma en cuenta la posicin de los datos y se define como el valor
central de una serie de datos o, ms especficamente, como un valor tal que
noms de la mitad de las observaciones son menores que l y no ms de la mitad
mayores.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina
el valor central de la serie y esa es la mediana. Si el nmero de datos es par,
existirn dos valores centrales y entonces la mediana se obtiene sacando el
promedio de ellos.
Por ejemplo: 7, 8, 8, 10, 12, 19, 23 Mes = 10
3, 4, 4, 5, 16, 19, 25, 30
Med = (5+16)/2 = 10.5

Probabilidad y Estadstica Descriptiva


1.4.3 Moda.
La moda es el valor que aparece con mayor frecuencia en la serie de datos. As
por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
La moda es una medida muy natural para describir un conjunto de datos; su
concepto se adquiere fcilmente: es la altura ms corriente, es la velocidad ms
comn, etc. Adems tiene la ventaja de que no se ve afectada por la presencia de
valores altos o bajos. La principal limitacin est en el hecho de que requiere un
nmero suficiente de observaciones para que se manifieste o se defina
claramente. Otros inconvenientes son que puede darse el caso de que una
determinada serie no tenga moda o que tenga varias modas.
Por ejemplo:
L, K, M, O, N (no hay moda)
5, 6, 10, 5, 8, 6, 7, 4 (2 modas)

1.5 Medidas de dispersin para un conjunto de datos y datos


agrupados.
Medidas de dispersin
Es una propiedad que describe a un conjunto de datos en relacin al grado de
variacin o dispersin de los mismos las medidas ms usuales son: el rango, la
deviacin media, la varianza y la desviacin estndar.
1.5.1 Rango.
Se denomina rango estadstico (R) o recorrido estadstico al intervalo de menor
tamao que contiene a los datos; es calculable mediante la resta del valor mnimo
al valor mximo; por ello, comparte unidades con los datos. Permite obtener una
idea de la dispersin de los datos.
Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura
tal y como:
x1 = 185, x2 = 165, x3 = 170, x4 = 182, x5 = 155

R = Dm - dm,
Dnde:
R = rango
10

Probabilidad y Estadstica Descriptiva


Dm = dato mayor
dm = dato menor

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30


1.5.2 Desviacin media.
La desviacin media es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media.
La desviacin media se representa por signo
D.M = (Xi-X)
N
1.5.3 Varianza.
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la
media de una distribucin estadstica.
La varianza se representa por signo.
= (Xi-X)
N

1.5.4 Desviacin estndar.


La desviacin estndar o desviacin tpica es la raz cuadrada de la varianza.
Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de
desviacin.
La desviacin estndar se representa por .
= (Xi-X)

11

Probabilidad y Estadstica Descriptiva

12

You might also like