Professional Documents
Culture Documents
INTRODUCCIN A LA ESTADSTICA
1.1 Estadstica
Se denomina Estadstica a la rama de las matemticas que se ocupa de reunir, organizar, presentar, analizar e interpretar
datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
1.2 Tipos de Estadstica
1.2.1 Estadstica descriptiva 1.2.2 Estadstica inferencial
Se encarga de la recoleccin, agrupacin y presentacin de Involucra la utilizacin de una muestra para sacar alguna
los datos de una manera tal que los describa fcil y inferencia o conclusin sobre la poblacin de la cual
rpidamente procede la muestra. Puede definirse como aquellos
mtodos que hacen posible la estimacin de una
caracterstica de una poblacin o la toma de una decisin
referente a una poblacin, basndose slo en los
resultados de una muestra. El objetivo de la inferencia
estadstica es obtener informacin acerca de la
poblacin, partiendo de la informacin que contiene la
muestra.
1.2.2 Estadstica inferencial
Poblacin Muestra
Parmetro Estadstico
Caracterstica numrica de una poblacin, como el A la caracterstica numrica de una muestra, como el
promedio de la poblacin, la desviacin estndar de la promedio de la muestra, la desviacin estndar de la
poblacin, etc. muestra, etc.
El parmetro es una medida de resumen que se calcula para El estadstico es una medida de resumen que se calcula
describir una caracterstica de toda una poblacin. para describir una caracterstica de una sola muestra de
la poblacin
Poblacin Muestra
Es el conjunto de todos los individuos Es un subconjunto que seleccionamos de la poblacin, es
una parte representativa de la poblacin que se
selecciona para ser estudiada ya que la poblacin es
demasiado grande para analizar su totalidad.
Individuo Muestreo
Se entiende cualquier elemento que porte informacin sobre Proceso de obtener muestras
el fenmeno que se estudia. As, si estudiamos la altura de
los nios de una clase, cada alumno es un individuo; si
estudiamos el precio de la vivienda, cada vivienda es un
individuo
Clasificacin del muestreo
El muestreo aleatorio es en el cual la muestra se obtiene Mientras que en el muestreo no aleatorio la muestra se
dando la misma oportunidad a cada elemento de la obtiene sin darle la misma oportunidad a cada elemento
poblacin de pertenecer a ella. Al muestro aleatorio tambin de la poblacin de pertenecer a ella., mientras que el
se le conoce como muestreo representativo. El muestreo muestreo no aleatorio se realiza a juicio.
aleatorio puede llevarse a cabo a travs de urnas o tmbolas,
o bien usando nmeros aleatorios
El muestreo con reemplazo es el muestreo en el cual cada El Muestreo sin reemplazo es en el cual cada miembro de
miembro de una poblacin puede seleccionarse ms de una una poblacin puede seleccionarse nicamente una vez y
vez, cada vez que se toma un elemento la poblacin en este caso el tamao de la poblacin se va reduciendo
conservar su tamao. conforme se conforma la muestra.
Se caracteriza por datos que consisten exclusivamente en Implica datos que pueden acomodarse en algn orden,
nombres, rtulos o categoras. Los datos no pueden pero no es posible determinar diferencias entre los
acomodarse segn esquema de ordenamiento (digamos valores de los datos, o tales diferencias carecen de
de bajo alto). El trmino nominal puede asociarse con significado.
slo nombres.
En caso de que puedan detectarse diversos grados de un
La escala de medida nominal, puede considerarse la atributo o propiedad de un objeto, la medida ordinal es
escala de nivel ms bajo, y consiste en la asignacin, la indicada, puesto que entonces puede recurrirse a la
puramente arbitraria de nmeros o smbolos a cada una propiedad de "orden" de los nmeros asignndolo a los
de las diferentes categoras en las cuales podemos dividir objetos en estudio de modo que, si la cifra asignada al
el carcter que observamos, sin que puedan establecerse objeto A es mayor que la de B, puede inferirse que A
relaciones entre dichas categoras, a no ser el de que cada posee un mayor grado de atributo que B.
elemento pueda pertenecer a una y solo una de estas
categoras. La asignacin de nmeros a las distintas categoras no
puede ser completamente arbitraria, debe hacerse
Se trata de agrupar objetos en clases, de modo que todos atendiendo al orden existente entre stas.
los que pertenezcan a la misma sean equivalentes
respecto del atributo o propiedad en estudio, despus de Los caracteres que posee una escala de medida ordinal
lo cual se asignan nombres a tales clases, y el hecho de permiten, por el hecho mismo de poder ordenar todas
que a veces, en lugar de denominaciones, se le atribuyan sus categoras, el clculo de las medidas estadsticas de
nmeros, puede ser una de las razones por las cuales se posicin, como por ejemplo la mediana.
le conoce como "medidas nominales".
Ejemplo: Al asignar un nmero a los vehculos en un taller
Se ha de tener presente que los nmeros asignados a de servicio, segn el orden de llegada, estamos llevando
cada categora sirven nica y exclusivamente para una escala ordinal, es decir que al primero en llegar le
identificar la categora y no poseen propiedades asignamos el n 1, al siguiente el n 2 y as sucesivamente,
cuantitativas. de esta forma, cada nmero representar una categora
en general, con un solo elemento y se puede establecer
relaciones entre ellas, ya que los nmeros asignados
guardan la misma relacin que el orden de llegada al
taller.
c) Escalas por intervalos es como el nivel ordinal, con la d) Escala de razn: Es el nivel de medida ms elevado y
propiedad adicional que podemos determinar se diferencia de las escalas de intervalos nicamente por
magnitudes de diferencias entre los datos que tienen poseer un punto cero propio como origen; es decir que el
algn significado. Sin embargo, no hay un punto de valor cero de esta escala significa ausencia de la magnitud
partida o cero inherente (natural) en el que la cantidad que estamos midiendo.
est totalmente ausente.
Si se observa una carencia total de propiedad, se dispone
En esta escala, adems de poseer las caractersticas de la de una unidad de medida para el efecto. A iguales
escala ordinal, encontramos que la asignacin de los diferencias entre los nmeros asignados corresponden
nmeros a los elementos es tan precisa que podemos iguales diferencias en el grado de atributo presente en el
determinar la magnitud de los intervalos (distancia) entre objeto de estudio. Adems, siendo que cero ya no es
todos los elementos de la escala. Sin lugar a dudas, arbitrario, sino un valor absoluto, podemos decir que A
podemos decir que la escala por intervalos es la primera tiene dos, tres o cuatro veces la magnitud de la propiedad
escala verdaderamente cuantitativa y a los caracteres presente en B.
que posean esta escala de medida pueden calculrsele
ALUMNO: NICTE HA PECH GUZMN 4
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
1.5.Recopilacion de datos
1.5.1 Fuentes para obtener datos 1.5.2 Tcnicas para recopilar datos
Los datos pueden obtenerse de dos tipos de fuentes: a) Encuesta:
Conjunto de preguntas tipificadas dirigidas a una muestra
a) Fuentes internas: cuando los datos son parte de la representativa, para averiguar estados de opinin o
propia actividad del ente que los recopila, se dice que diversas cuestiones de hecho. A diferencia de un censo,
el dato es interno y la fuente es interna. donde todos los miembros de la poblacin son
estudiados, las encuestas recogen informacin de una
porcin de la poblacin de inters, dependiendo el
tamao de la muestra en el propsito del estudio
b) Fuentes externas: cuando se tiene que otras b) Entrevista:
empresas, instituciones, poblaciones, etc., fuera del Las entrevistas se utilizan para recabar informacin en
ente recopilador forma verbal, a travs de preguntas que propone el
analista. Quienes responden pueden ser gerentes o
empleados, los cuales son usuarios actuales del sistema
existente, usuarios potenciales del sistema propuesto o
aquellos que proporcionarn datos o sern afectados por
la aplicacin propuesta. El analista puede entrevistar al
personal en forma individual o en grupos. Sin embargo,
las entrevistas no siempre son la mejor fuente de datos
de aplicacin. En otras palabras, la entrevista es un
intercambio de informacin que se efecta cara a cara. Es
un canal de comunicacin entre el analista y la
organizacin; sirve para obtener informacin acerca de
las necesidades y la manera de satisfacerlas, as como
concejo y comprensin por parte del usuario para toda
idea o mtodo nuevos. Por otra parte, la entrevista ofrece
al analista una excelente oportunidad para establecer
una corriente de simpata con el personal usuario, lo cual
es fundamental en transcurso del estudio.
c) Cuestionario:
Se entiende por cuestionario a la lista de preguntas que
se proponen por cualquier fin, el cuestionario
proporcionan una alternativa muy til para la entrevista;
sin embargo, existen ciertas caractersticas que pueden
ser apropiada en algunas situaciones e inapropiadas en
otra. Al igual que la entrevistas, deben disearse
cuidadosamente para una mxima efectividad.
ALUMNO: NICTE HA PECH GUZMN 5
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
d) Observacin:
Otra tcnica til para el analista en su progreso de
investigacin, consiste en observar a las personas cuando
efectan su trabajo. Como tcnica de investigacin, la
observacin tiene amplia aceptacin cientfica. Los
socilogos, siclogos e ingenieros industriales utilizan
extensamente sta tcnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros
de la organizacin. El propsito de la organizacin es
mltiple: permite al analista determinar que se est
haciendo, como se est haciendo, quien lo hace, cuando
se lleva a cabo, cunto tiempo toma, dnde se hace y por
qu se hace
Distribucin de frecuencias
La informacin estadstica puede constar de un gran nmero de observaciones y mientras mayor sea el nmero, mayor
puede ser la conveniencia y necesidad de presentarla en forma resumida, la cual puede permitir algunos detalles pero
en cambio puede revelar la naturaleza general de la informacin.
Un resumen de tal distribucin se denomina Distribucin de Frecuencias. Puede decirse tambin, que una distribucin
es el patrn de variabilidad mostrado por los datos de una variable. La distribucin muestra la frecuencia de cada valor
de la variable.
a) Intervalos de clase. La dificultad de resumir un conjunto de datos, puede ser superada agrupando los diversos
valores en un nmero reducido de clases llamados intervalos de clase.
b) Lmites de clase. Cada una de las clases tiene un extremo o lmite superior y uno inferior; el extremo inferior es
el menor valor que puede caer en esta clase y el superior el mayor valor.
c) Limites reales de clase. El punto medio entre el lmite superior de una clase y el lmite inferior de la siguiente
clase es la frontera superior o lmite real superior de la clase y la frontera inferior o lmite real inferior de la
siguiente clase. En una clase dada todos los valores deben ser mayores a la frontera inferior y menores a la
frontera superior. Para evitar ambigedades, las fronteras se expresan con una cifra decimal ms que los
extremos.
d) Marca de clase. El punto medio entre los dos extremos (o las dos fronteras) de una clase se denomina marca
de clase.
e) Frecuencia de clase. El nmero de datos incluidos en un intervalo de clase se denomina frecuencia de la clase.
Al construir una distribucin de frecuencias para datos cuantitativos es necesario primeramente decidir cul va a ser el
nmero de clases. En general, este nmero depende fundamentalmente de la naturaleza de los datos a resumir y del
objetivo que se persiga con ese resumen. Sin embargo, es posible dar ciertas guas generales que pueden ser de utilidad
en la determinacin del nmero de clases. En primer lugar, el nmero de clases no debe ser ni muy grande ni muy
pequeo; un nmero pequeo de clases puede ocultar la naturaleza general de los datos y uno muy grande puede ser
demasiado detallado como para relevar alguna informacin til.
Como regla general, se recomienda que el nmero de clases est entre 5 y 20.
La llamada regla de Sturges puede dar una aproximacin razonable para el nmero de clases, siendo esta:
=
= 1 + 3.3
= 2
Como estadstico residente de Pigs and People(P&P) Airlines,el director de la divisin de anlisis estadstico le pide
recolectar y agrupar datos sobre el nmero de pasajeros que han decidi viajar con (P&P).Tales datos correspondientes
a los ltimos 50 das aparecen en la tabla 2.1. Sin embargo, con estos datos en bruto, es improbable que el director
pueda obtener informacin til y significativa, respecto a las operaciones de vuelo. Los datos no estn organizados y es
difcil llegar a una conclusin significativa simplemente revisando una serie de nmeros anotados en un papel. Es preciso
agrupar y presentar los datos de manera concisa y reveladora para facilitar el acceso a la informacin que contienen.
68 71 77 83 79 50 70 76 81 90
72 74 57 67 69 57 70 77 82 91
50 60 70 66 76 59 71 77 83 92
70 84 59 75 94 60 71 78 83 93
65 72 85 79 71 65 72 78 83 93
83 84 74 82 97 66 72 79 84 94
77 73 78 93 95 67 73 79 84 95
78 81 79 90 83 68 74 79 84 97
80 84 91 101 86 69 74 80 85 101
93 92 102 80 69 69 75 80 86 102
6.4.- Distribucin de frecuencias acumuladas "mayor 6.5.- Distribucin de frecuencias acumuladas "menor
que" LRIC que" LRSC
Distribucin de frecuencias Distribucin de frecuencias
acumuladas "mayor que" LRIC acumuladas "menor que" LRSC
Mayor que Frecuencia Menor que Frecuencia
LRIC acumulada LRSC acumulada
(pasajeros) (das) (pasajeros) (das)
54.5 .. 50 58.5 .. 2
58.5 .. 48 67.5 .. 7
67.5 .. 43 76.6 .. 21
76.5 .. 29 85.5 .. 39
85.5 .. 11 94.5 .. 46
94.5 .. 4 103.5 .. 50
Informan sobre los valores medios del conjunto de datos. Son indicadores usados para sealar que porcentaje de datos
dentro de una distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribucin de frecuencia, es por esto que se les llama "Medidas de Tendencia Central".
Media
Las media o promedio es una medida de posicin que proporciona una descripcin compacta de cmo estn centrados
los datos y una visualizacin ms clara del nivel que alcanza la variable, puede servir de base para medir o evaluar valores
extremos y brinda mayor facilidad para efectuar comparaciones.
Es importante poner en relieve que la notacin de promedio lleva implcita la idea de variacin y que este nmero
promedio debe cumplir con la condicin de ser representativo de conjunto de datos.
El promedio como punto tpico de los datos es el valor alrededor del cual se agrupan los dems valores de la variable.
Media Aritmtica
Es una medida matemtica, un nmero individual que representa razonablemente el comportamiento de todos los
datos.
Caractersticas de la Media:
a) En su clculo estn todos los valores del conjunto de datos por lo que cada uno afecta la media.
b) La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero.
c) La suma del cuadrado de las desviaciones de una serie de datos a cualquier nmero A es mnimo si A = X
d) Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los valores
extremos, y de esa forma llegar a ser una medida menos representativa, por lo que si la distribucin es
asimtrica, la media aritmtica no constituye un valor tpico.
( )
=
=1()( ) 3915
= = = 78.3
50
Mediana
Es el valor de la observacin que ocupa la posicin central de un conjunto de datos ordenados segn su magnitud.
La mediana es un valor de la variable que deja por debajo de l un nmero de casos igual al que deja por arriba.
Geomtricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos
reas iguales.
Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeos con respecto a los dems,
entonces la media aritmtica se puede distorsionar y perder su carcter representativo, en esos casos es conveniente
utilizar la mediana como medida de tendencia central, es decir que la mediana no presenta el problema de estar influida
por los valores extremos, pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera
cada valor por el nmero de veces que se ha repetido).
Caractersticas de la mediana
CLCULO DE LA MEDIANA
Para datos no agrupados:
1. Se ordenan los datos ascendentemente.
2. La mediana corresponde al dato que est en la posicin central.
= + [ 2 ]
Dnde:
= .
= .
= .
= .
Mediana para datos agrupados
ALUMNO: NICTE HA PECH GUZMN 12
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
25 21
= 76.5 + ( ) 9 = 78.5
18
Moda
Es el valor de un conjunto de datos que ocurre ms frecuentemente, se considera como el valor ms tpico de una serie
de datos.
Para datos agrupados se define como Clase Modal el intervalo que tiene ms frecuencia.
La moda puede no existir o no ser nica, las distribuciones que presentan dos o ms mximos relativos se designan de
modo general como bimodales o multimodales respectivamente.
Caractersticas de la Moda
CLCULO DE LA MODA
Para datos no agrupados:
La moda corresponde al dato o datos que se repiten con ms frecuencia.
1
= + [ ]
1 + 2
Dnde:
= .
1 = .
2 = .
= .
Medidas de Posicin
Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los
valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos
iguales.
Deciles
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en
los que cada uno de ellos concentra el 10% de los resultados.
Cuartiles
Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales,
en los que cada uno de ellos concentra el 25% de los resultados.
Percentiles
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en
los que cada uno de ellos concentra el 1% de los resultados.
CLCULO DE PERCENTILES
Para datos no agrupados:
1. Se ordenan los datos ascendentemente.
2. Se calcula el ndice (posicin) del percentil con la siguiente frmula.
=( )
100
3. Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posicin del p-simo percentil.
Si i s es entero, el p-simo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1.
=( )
100
2. Se localiza la clase del percentil, la cual corresponde a la clase cuya frecuencia acumulada es mayor o igual a i.
3. En la clase del percentil se aplica la siguiente frmula:
( )
= + [ 100 ]
Dnde:
= .
= .
ALUMNO: NICTE HA PECH GUZMN 14
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
= .
= .
12.5 7
1 = 67.5 + ( ) 9 = .
14
25 21
2 = 76.5 + ( ) 9 = .
18
37.5 21
3 = 76.5 + ( ) 9 = .
18
MEDIDAS DE DISPERSIN
Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o
menos dispersos.
a) La dispersin proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia
central, si los datos se encuentran muy dispersos, la posicin central es menos representativa de los datos, como
un todo, que cuando stos se agrupan ms cerca del valor de la media.
b) Existen problemas caractersticos para datos muy dispersos, por lo que es necesario reconocer esa dispersin
alta para poder abordar ese tipo de problemas.
c) Cuando se desea comparar diferentes muestras, si no se desea tener una alta dispersin de valores con respecto
del centro de distribucin, o esto presenta riesgos inaceptables, se necesita reconocerla y evitar elegir
distribuciones que tengan las dispersiones ms grandes.
RANGO (R)
Rango Intercuartlico
El rango intercuartlico mide aproximadamente qu tan lejos de la mediana se debe ir en cualquiera de las dos
direcciones antes de recorrer una mitad de los valores del conjunto de datos.
= 3 1
Rango Interpercentlico
Es una medida de dispersin de la diferencia entre los valores del percentil 90 y el percentil 10.
= 90 10
Las descripciones ms completas de la dispersin son aquellas que manejan la desviacin promedio respecto a alguna
medida de tendencia central. En esta clasificacin las ms utilizadas son la varianza y la desviacin estndar. Ambas
medidas dan una distancia promedio de cualquier observacin del conjunto de datos respecto a la media de la
distribucin.
Varianza
Medida del cuadrado de la distancia promedio entre la media y cada observacin de la poblacin.
( )2
2 =
( )2
2 =
( )2
2 =
( 1)
( )2
2 =
( 1)
Desviacin Estndar
Se calcula obteniendo la raz cuadrada positiva de la varianza. Esta medida de dispersin tiene las mismas unidades que
los datos originales, a diferencia de la varianza en la que las unidades estn expresadas por los cuadrados de las unidades.
5710.68
= =
49
Una vez elaborada la tabla de distribucin de frecuencia es importante construir su representacin visual. Esta
representacin revela patrones de comportamiento de la variable en estudio. El tipo de grfico que se utilice depender
del tipo de datos y el concepto a representar.
Datos cualitativos
Las grficas que generalmente se utilizan para resumir datos cualitativos, de atributo o categricos son las grficas de
barras y la de pastel.
Grfica de barras
Las grficas de barras muestran la cantidad de datos que pertenecen a cada categora como reas rectangulares de
tamao proporcional. Cada barra slida, ya sea vertical u horizontal representa un tipo de dato.
Vamos a aprender a hacer un diagrama de barras cuando tenemos en una columna las categoras de una variable y en
otra columna las frecuencias absolutas de dichas categoras. Por ejemplo, vamos a realizar el diagrama de barras de los
datos de la Figura 7, correspondientes a los idiomas en que estn escritos los libros de los estantes de una determinada
biblioteca.
ALUMNO: NICTE HA PECH GUZMN 18
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
Idioma N de estantes
1 Francs 78
2 Alemn 47
3 Ruso 20
4 Espaol 30
Vamos a aprender a hacer un diagrama de barras agrupado (o apilado) cuando tenemos los datos en una tabla de doble
entrada. Por ejemplo, vamos a realizar el diagrama de barras agrupado de los datos de la Figura 8, correspondientes al
nmero de citas en diferentes campos de investigacin y en tres distintos aos.
Grfica Circular
Denominada tambin grfica de pastel o grfica del 100%, se utilizan para mostrar la cantidad de datos que pertenecen
a cada categora como una parte proporcional de un crculo.
a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa.
b) La unin de los sectores circulares forma el crculo y la suma de sus porcentajes es 100.
Es aconsejable que el nmero de elementos comparados dentro de un grfico circular, no sea mayor de 5, ordenando
los segmentos de mayor a menor, iniciando con el ms amplio a partir de las 12 como en un reloj.
Una manera sencilla de diferenciar los segmentos es sombrendolos de claro a oscuro, siendo el de mayor tamao el
ms claro y el de menor tamao el ms oscuro.
Vamos a aprender a hacer un diagrama de sectores cuando tenemos en una columna las categoras de una variable y en
otra columna las frecuencias absolutas de dichas categoras. Por ejemplo, vamos a realizar el diagrama de sectores de
los datos de la Figura 7, correspondientes a los idiomas en que estn escritos los libros de los estantes de una
determinada biblioteca.
Idioma N de estantes
1 Francs 78
2 Alemn 47
3 Ruso 20
4 Espaol 30
Category
RUSO
20, 11.4% RUSO
ESPAOL
ALEMAN RUSO FRANCES
FRANCES ESPAOL
FRANCES 78, 44.6%
78, 44.6% 30, 17.1% 20, 11.4%
ALEMAN
47, 26.9%
ALEMAN
47, 26.9%
Datos cuantitativos
Una razn fundamental para elaborar una grfica de datos cuantitativos es mostrar su distribucin.
Histograma
Un histograma es una grfica que se construye a partir de la tabla estadstica, consiste en rectngulos verticales unidos
entre s, en donde sus lados son los lmites reales inferior y superior de clase y cuya altura es igual a la frecuencia de
clase.
El criterio para calcular la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias absolutas
(o relativas) de cada intervalo y el rea de los mismos.
USANDO MINITAB:
2 Escribir o copiar (de Word o Excel) en la hoja de trabajo de Minitab los datos en bruto.
3 Elegir de la barra de herramientas la opcin de Graficas (Graph) y dar CLICK y aparece el siguiente men desplegado.
4 Bajamos en ese men hasta histogramas (histogram) y dar CLICK y aparece la siguiente ventana.
5 Elegimos una de las opciones de venta de histograma y damos CLICK y seleccionamos en la parte inferior la pestaa
OK y aparece la siguiente ventana.
6 Pulsamos la columna C1 en la hoja de trabajo donde se escribieron los datos y le damos SELECT; aparece C1 en la
segunda ventana y seleccionamos en la parte inferior en la pestaa OK y aparece la grfica.
Histogram of C1
6
Frequency
0
50 60 70 80 90 1 00
C1
7 Para ajustar esta grafica a las necesidades o deseos, en base al problema de ejemplo. Nos colocamos en cualquier
parte del rea de barras y aparece un men desplegado en donde elegimos editar barras (edit bars).
8 Damos CLICK en editar barras (edit bars y aparece la siguiente ventana en donde elegimos la pestaa binning).
9 Damos CLICK en binning y aparece la ventana siguiente en donde elegimos Marcas de Clase (Midpoint); en intervalos
de clase le damos 6 que es el nmero de clases deseadas y en la parte de la ventana inferior escribimos las seis marcas
de clase y le damos en la parte inferior en la pestaa OK.
Histogram of C1
20
15
Frequency
10
0
54 63 72 81 90 99
C1
10 Editamos nuestra grfica; colocndonos en los ejes X o Y; colocndonos en las barras, en la regin o rea de fondo,
en el ttulo; en las leyendas de los ejes, etc.
Polgono de frecuencias
Consiste en una serie de segmentos que unen los puntos cuyas abscisas son las marcas de cada clase y cuyas ordenadas
son proporcionales a sus frecuencias respectivas.
El polgono de frecuencias se construye fcilmente si tenemos representado previamente el histograma, ya que consiste
en unir mediante lneas rectas los puntos del histograma que corresponden a las marcas de clase.
Para representar el polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos existen
otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que
corresponden a sus marcas de clase.
De este modo, el polgono de frecuencias tiene en comn con el histograma el que las reas de la grfica sobre un
intervalo son idnticas.
Ojiva
Una grfica de distribucin de frecuencias acumuladas es llamada una ojiva. Se trazan los lmites reales superiores contra
las frecuencias acumuladas.
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por encima de ciertos valores,
en lugar de hacer un mero registro del nmero de elementos que hay dentro de los intervalos, esto es lo que refleja la
ojiva.
Se puede construir una ojiva de una distribucin de frecuencias relativas de la misma manera en que trazamos la ojiva
de una distribucin de frecuencias absolutas. Slo habr un cambio: la escala del eje vertical.
Grficas de puntos
La representacin grfica por medio de puntos (o grfica de puntos) es una de las grficas ms sencillas que se utilizan.
Presenta los datos de una muestra mediante la representacin de cada porcin de datos con un punto ubicado a lo largo
de una escala.
Esta escala puede ser vertical y horizontal. La frecuencia de los valores est representada a lo largo de la otra escala.
Grficas lineales
Consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una,
unindose consecutivamente con lneas.
DIAGRAMA DIGIPUNTO
DIAGRAMA DIGIPUNTO
54 63 72 81 90 99
Variable
54 63 72 81 90 99
C2
3 5 079
7 6 0567899
18 7 001122344567788999
12 8 001233344456
8 9 01233457
2 10 12
EJERCICIOS DE REFORZAMIENTO
PROBLEMA 1.-
Los siguientes datos son los ingresos de 60 ejecutivos de mercadotecnia para empresas de Estados Unidos. Los datos
estn expresados en miles de dlares.
DISTRIBUCIONES DE FRECUENCIAS
1- Datos en bruto
31 45 57 65 71 76
34 46 58 66 71 77
34 47 61 67 72 77
36 50 61 69 73 79
38 50 62 69 73 79
38 51 62 69 74 79
39 54 62 69 74 79
39 55 64 69 74 85
40 56 64 69 75 87
45 56 65 71 76 89
3- Encontrar el rango
58
= = = 9.66
6
NOTA: Verificar que mi dato mayor este contenido dentro de mi ltima clase (89 dato mayor)
Clases LIC LSC Marca de clase Limite real inferior Limite Real Superior (LRSC)
(MC) (LRIC)
1 31 40 35.5 30.5 40.5
2 41 50 45.5 40.5 50.5
3 51 60 55.5 50.5 60.5
4 61 70 65.5 60.5 70.5
5 71 80 75.5 70.5 80.5
6 81 90 85.5 80.5 90.5
( + )
=
2
DISTRIBUCIN DE FRECUENCIAS
30.5 60
40.5 51
50.5 45
60.5 38
70.5 21
80.5 3
DISTRIBUCIN DE FRECUENCIAS
40.5 9
50.5 15
60.5 22
70.5 39
80.5 57
90.5 60
GRAFICOS ESTADSTICOS
20 18
18 17
FRECUENCIAS ABSOLUTAS
16
14
12
10 9
8 7
6
6
4 3
2
0
35.5 45.5 55.5 65.5 75.5 85.5
MARCA DE CLASE (MC)
0.35 0.30
FRECUENCIAS RELATIVAS
0.28
0.30
0.25
0.20 0.15
0.15 0.12
0.10
0.10 0.05
0.05
0.00
35.5 45.5 55.5 65.5 75.5 85.5
MARCAS DE CLASE (MC)
20
POLGONO DE FRECUENCIAS ABSOLUTAS
18 INGRESOS EN MILES DE DOLARES DE EJECUTIVOS DE
16 MARKETING
FRECUENCIAS ABSOLUTAS
14
12
10
0
0 35.5 45.5 55.5 65.5 75.5 85.5 0
MARCA DE CLASE
0.40
0.30
FRECUENCIAS RELATIVAS
0.28
0.30
0.20 0.15
0.10 0.12
0.10 0.05
0.00 0.00
0.00
0 35.5 45.5 55.5 65.5 75.5 85.5 0
MARCAS DE CLASE (MC)
80
60
FRECUENCIA ACUMULADA
60 51
45
38
40 21
20 3
LRIC
0
0
30.5 40.5 50.5 60.5 70.5 80.5
LRIC
60
50 39
40
30 22
LRSC
15
20 9
10 0
0
0 40.5 50.5 60.5 70.5 80.5 90.5
LRSC
MEDIDAS ESTADISTICAS
19. Moda
20. Varianza
B) Dispersin
21. Desviacin tpica
22. Rangos
(f)(M. C. ) 3710
= = = .
60
18- Mediana
3022
Med= LRIC med + [ 2 ]+ Med= 60.5 + [ ] (10) = .
17
med
19- Moda
1
Mod= LRICmed + ( ) . . Mod= 70.5 + ( ) (10) = .
+ 1+15
20- Varianza
( )2
2 =
1
( )2
2 =
13393.334
2 = = .
60
( )2
=
13393.334
= = .
60
22. Rango
Rango = 89 31 =
= 3 1
= 73.83 50.5 = .
= 90 10
= 78.83 37.16 = .
23. Cuartiles
1
1 (1)(60) ( 4 ) (159)
Q1= = = 15 Q1= LRICQ1+ ( ) . . = 40.5 + ( ) 10 = .
4 4 6
(2)(60) (3022)
Q2= = 30 Q2= 60.5 + ( ) 10 = .
4 17
(3)(60) (4539)
Q3= = 45 Q3= 70.5 + ( ) 10 = .
4 18
(4)(60) (6057)
Q4= = 60 Q3= 80.5 + ( ) 10 = .
4 3
24. Deciles
(1)(60) (60)
D1= =6 D1= 30.5 + ( ) 10 = .
10 9
(2)(60) (129)
D2= = 12 D2= 40.5 + ( ) 10 = .
10 6
(3)(60) (1815)
D3= = 18 D3= 50.5 + ( ) 10 = .
10 7
(4)(60) (2422)
D4= = 24 D4= 60.5 + ( ) 10 = .
10 17
(5)(60) (3022)
D5= = 30 D5= 60.5 + ( ) 10 = .
10 17
(6)(60) (3622)
D6= = 36 D6= 60.5 + ( ) 10 = .
10 17
(7)(60) (4239)
D7= = 42 D7= 70.5 + ( ) 10 = .
10 18
(8)(60) (4839)
D8= = 48 D8= 70.5 + ( ) 10 = .
10 18
(9)(60) (5439)
D9= = 54 D9= 70.5 + ( ) 10 = 78.83
10 18
(10)(60) (6057)
D10= = 60 D10= 80.5 + ( ) 10 = .
10 3
25. Percentiles
(1)(60) (0.60)
P1= = 0.6 P1= 30.5 + ( ) 10 = .
100 9
(10)(60) (60)
P10= =6 P10= 30.5 + ( ) 10 = .
100 9
(50)(60) (3022)
P50= = 30 P50= 60.5 + ( ) 10 = .
100 17
(90)(60) 5439
P90= = 54 P90= 70.5 + ( ) 10 = .
100 18
20
18
18 17
FRECUENCIAS ABSOLUTAS
16
14
12
10 9
8 7
6
6
4 3
0
35.5 45.5 55.5 65.5 75.5 85.5
MARCAS DE CLASE
NICTE HA PECH GUZMAN
30
30 28.3333
25
20
15
15
11.6667
10
10
5
5
0
35.5 45.5 55.5 65.5 75.5 85.5
MARCAS DE CLASE
NICTE HA PECH GUZMAN
25
20
15
15
11.6667
10
10
5
5
0 0
0
25.5 35.5 45.5 55.5 65.5 75.5 85.5 95.5
MARCAS DE CLASE
NICTE HA PECH GUZMAN
15
10 9
7
6
5
3
0 0
0
25.5 35.5 45.5 55.5 65.5 75.5 85.5 95.5
MARCAS DE CLASE
NICTE HA PECH GUZMAN
3 3 144
8 3 68899
9 4 0
13 4 5567
17 5 0014
22 5 56678
29 6 1122244
(10) 6 5567999999
21 7 111233444
12 7 566779999
3 8
3 8 579
PROBLEMA 2.- Una organizacin estudiantil esta por revisar el monto que los estudiantes invierten en textos cada
semestre. Cincuenta estudiantes reportaron las siguientes cantidades, aproximadas al dlar ms prximo.
1. DATOS EN BRUTO:
DOLARES $
125 157 113 127 201
165 145 119 148 158
148 168 117 105 136
136 125 148 108 178
179 191 225 204 104
205 197 119 209 157
209 205 221 178 247
235 217 222 224 187
265 148 165 228 239
245 152 148 115 150
3. ENCONTRAR EL RANGO:
ALUMNO: NICTE HA PECH GUZMN 50
PROFESOR: MCG. OSCAR LPEZ AGUIRRE
INSTITUTO TECNOLGICO SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL
PROPEDEUTICO
PROBABILIDAD Y ESTADISTICA
161
= = = 26.83
6
( + )
=
2
DISTRIBUCIN DE FRECUENCIAS
103.5 50
130.5 39
157.5 27
184.5 20
211.5 11
238.5 4
DISTRIBUCIN DE FRECUENCIAS
130.5 11
157.5 23
184.5 30
211.5 39
238.5 46
265.5 50
GRAFICOS ESTADSTICOS
0.24
0.25 0.22
0.2 0.18
0.14 0.14
0.15
0.1 0.08
0.05
0
117 144 171 198 225 252
MARCA DE CLASE (MC)
Histograma de C1
9
6
Frecuencia
0
1 20 1 60 200 240
C1
10
FRECUENCIA ABSOLUTA
113
8
108 115
117
4
0
117 1 44 1 71 1 98 225 252
MARCA DE CLASE (MC)
0.3
0.24
0.25 0.22
0.2 0.18
0.14 0.14
0.15
0.1 0.08
0.05
0
117 144 171 198 225 252
MARCA DE CLASE (MC)
GRAFICOS EN MINITAB
104
20
113
15 108 115
10
117
0
117 1 44 1 71 1 98 225 252
MARCA DE CLASE (MC)
POLIGONO DE FRECUENCIAS
ABSOLUTAS
FRECUENCIA ABSOLUTA
10
FRECUENCIA ABSOLUTA
113
8
108 115
117
4
0
90 117 1 44 1 71 1 98 225 252 279
MARCA DE CLASE (MC)
FRECUENCIA RELATIVA O
INVERSION DE DOLARES EN TEXTOS DE ESTUDIANTES POR
SEMESTRE
PORCENTUAL
14
12
10
8
6 11 12
4 9
7 7
2 4
0 0 0
0 117 144 171 198 225 252 0
MARCA DE CLASE (MC)
25 105
104
20
113
15 108 115
10
117
0
90 117 1 44 1 71 1 98 225 252 279
MARCA DE CLASE (MC)
60 50
50 39
40
27
30 20
20 11
10 4
0
0
103.5 130.5 157.5 184.5 211.5 238.5
LRIC
MEDIDAS ESTADISTICAS
19. Moda
20. Varianza
E) Dispersin
21. Desviacin tpica
22. Rangos
(f)(M. C. ) 8577
= = = .
50
2523
Med= LRIC med + [ 2 ]+ Med= 157.5 + [ ] (27) = .
7
med
1
Mod= LRICmed + ( ) . . Mod= 130.5 + ( ) (27) =
+ 1+5
20. VARIANZA
( )2
2 =
1
( )2
2 =
94026.34
2 = = .
50
( )2
=
94026.34
= = .
50
Xi=marca de clase
(media aritmetica) = 171.5
22. RANGO
= 3 1
= 207 133.875 = .
= 90 10
= 234.6428 115.7727 = .
Clases LIC LSC Marca de clase Limite real Limite Real FRECUENCIA
(MC) inferior (LRIC) Superior (LRSC) ABSOLUTA
1 104 130 117 103.5 130.5 11
2 131 157 144 130.5 157.5 12
3 158 184 171 157.5 184.5 7
4 185 211 198 184.5 211.5 9
5 212 238 225 211.5 238.5 7
6 239 265 252 238.5 265.5 4
23. CUARTILES
1
1 (1)(50) ( ) (12.5011)
4
Q1= = = 12.5 Q1= LRICQ1+ ( ) . . = 130.5 + ( ) 27 = .
4 4 12
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(2)(50) (2523)
Q2= = 25 Q2= 157.5 + ( ) 27 = .
4 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(3)(50) (37.530)
Q3= = 37.5 Q2= 184.5 + ( ) 27 =
4 9
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(4)(50) (5046)
Q4= = 50 Q2= 238.5 + ( ) 27 = 265.5
4 4
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
24. DECILES
(1)(50) (50)
D1= = 5 D1= 103.5 + ( ) 27 = .
10 11
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(2)(50) (100)
D2= = 10 D1= 103.5 + ( ) 27 = .
10 11
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(3)(50) (1511)
D3= = 15 D1= 130.5 + ( ) 27 = .
10 12
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(4)(50) (2011)
D4= = 20 D1= 130.5 + ( ) 27 = .
10 12
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(5)(50) (2523)
D5= = 25 D1= 157.5 + ( ) 27 = .
10 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(6)(50) (3023)
D6= = 30 D1= 157.5 + ( ) 27 = .
10 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(7)(50) (3530)
D7= = 35 D1= 184.5 + ( ) 27 = .
10 9
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(8)(50) (4039)
D8= = 40 D1= 211.5 + ( ) 27 = 215.3571
10 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(9)(50) (4539)
D9= = 45 D1= 211.5 + ( ) 27 = .
10 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
25. PERCENTILES
(10)(50) (50)
P10= =5 P10= 103.5 + ( ) 27 = .
100 11
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(50)(50) (2523)
P50= = 25 P50= 157.5 + ( ) 27 = .
100 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
(90)(50) 4539
P90= = 45 P90= 211.5 + ( ) 27 = .
100 7
104-130 11 117 11
131-157 12 144 23
158-184 7 171 30
185-211 9 198 39
212-238 7 225 46
239-265 4 252 50
50
Estadsticos descriptivos: C1
3 10 458
8 11 35799
11 12 557
13 13 66
19 14 588888
24 15 02778
(3) 16 558
23 17 889
20 18 7
19 19 17
17 20 145599
11 21 7
10 22 12458
5 23 59
3 24 57
1 25
1 26 5