Historia y Desarrollo de La Estadistica Tutoria 2

Historia de la Estadística
Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones
gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales
o cosas. Hacia el año 3000 a.C. los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción
agrícola y sobre los géneros vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir las
pirámides, los egipcios analizaban los datos de la población y la renta del país. Los libros bíblicos de Números y Crónicas
incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo
describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al
año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año
3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto,
dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo
Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos
de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la
finalidad de conocer el número de la población.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines
tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica
revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística.
Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del
imperio.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de
todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los
reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los
años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra
encargó la realización de un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el
Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662
apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality
(Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de
Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera
tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las
ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para
evitar la ambigüedad de las descripciones verbales.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey,
Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon
los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos
económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste.
Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y
matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés
comenzó a publicar estadística semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of
Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó
documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabía esperar. El trabajo de Graunt,
condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y
Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de
datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó
indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría
Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación
sobre si la población aumentaba, decrecía o permanecía estática.
1
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas
monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la
política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador
se propuso destruir la antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y
para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de
defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann
fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de
la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su
aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término
italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o
situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de
las más variadas situaciones.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su
uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas
ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría
Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo
del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R.
H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de probabilidades,
particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido
en la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias
sociales como a las físicas.
DEFINICION
Estadística es la ciencia que trata de la recolección, ordenación, análisis, interpretación y presentación, de datos
correspondientes a un experimento previamente planeado o definido, o una situación histórica acumulada en una serie de
datos a manejar.
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los
diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que la estadística es un conjunto de
técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos.
OTRAS DEFICIONES
Definición de Estadística
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de
hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro 1[1].
La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de
datos numéricos con e fin de realizar una toma de decisión más efectiva.
Otros autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan semejantes. Para
Chacón esta se define como “la ciencia que tiene por objeto el estudio cuantitativo de los colectivos”; otros la definen como
la expresión cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y análisis. La más aceptada, sin
embargo, es la de Minguez, que define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la cantidad a
los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima”.
Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que es
conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término se usa para
referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para
analizar la información estadística; y el término estadístico2[2], en singular y en masculino, se refiere a una medida derivada
de una muestra.
1
2
2
Utilidad e Importancia
Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos
numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o
ilustrativa y el cálculo de medidas descriptivas.
Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en
otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la
educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.
Historia de la Estadística
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año
3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto,
dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo
Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos
de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la
finalidad de conocer el número de la población3[3].
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines
tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica
revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística.
Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del
imperio4[4].
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la
notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por
Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra,
Guillermo el Conquistador recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la
propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra 5[5].
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron
De revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durantes la Edad Media al método
científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía
ya un método capaz de aplicarse a los datos económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste.
Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y
matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés
Comenzó a publicar estadística semanal de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of
Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó
documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabía esperar. El trabajo de Graunt,
condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y
Naturales. Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de
datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó
indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría
Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación
sobre si la población aumentaba, decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas
monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la
política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador
se propuso destruir la antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y
para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de
3
4
5
3
defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann
fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de
la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su
aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término
italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o
situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de
las más variadas situaciones.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su
uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas
ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría
Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gastón ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo
del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R.
H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de probabilidades,
particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido
en la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias
sociales como a las físicas.
ETAPAS DE DESARROLLO DE LA ESTADÍSTICA:

La historia de la estadística está resumida en tres grandes etapas o fases.
1.- Primera Fase: Los Censos:

Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o menos regular la
población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos
administrativos.
2.- Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:

Las ideas mercantilistas extrañan una intensificación de este tipo de investigación. Colbert multiplica las encuestas sobre
artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus memorias. Vauban, más
conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se señala
como el verdadero precursor de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia
natural.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales
representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política.
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los estudios
industriales, de las producciones y los cambios, haciéndose sistemáticos durantes las dos terceras partes del siglo XIX.
3.- Tercera Fase: Estadística y Cálculo de Probabilidades:

El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el
estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas son demasiados
complejas para conocerlos totalmente y hacer posible su análisis”.
División de la Estadística
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende
cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes
adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales.
Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso
de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. Como consecuencia,
la característica más importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que
4
describen a métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población
partiendo de una muestra tomada.
Método Estadístico
El conjunto de los métodos que se utilizan para medir las características de la información, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el máximo de información, es lo que se llama métodos estadísticos.
Los métodos de análisis para la información cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
Errores Estadísticos Comunes

Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos
de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente
identificables. Algunos de éstos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y
existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la
información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión
que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y
después se utiliza el análisis estadístico para justificar la decisión ya tomada.
Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es
extremadamente importante que tales comparaciones se hagan entre datos que sean comparables.
Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que
más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se
hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra
se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el
muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada
Definición de estadística
La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos
obtenidos de la realidad, e inferir conclusiones respecto de ellos.
Por ejemplo, la estadística interviene cuando se quiere conocer el estado sanitario de un país, a través de ciertos parámetros
como la tasa de morbilidad o mortalidad de la población.
En este caso la estadística describe la muestra en términos de datos organizados y resumidos, y luego infiere conclusiones
respecto de la población.
Aplicada a la investigación científica, también infiere cuando provee los medios matemáticos para establecer si una hipótesis
debe o no ser rechazada.
La estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es utilizada en física, química, biología, medicina,
astronomía, psicología, sociología, lingüística, demografía, etc.
2. Población y muestra
Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El
conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población.
No debe confundirse la población en sentido demográfico y la población en sentido estadístico.
La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un país, todas las ratas de una
ciudad), mientras que una población en sentido estadístico es un conjunto de datos referidos a determinada característica o
atributo de los individuos (las edades de todos los individuos de un país, el color de todas las ratas de una ciudad).
Incluso una población en sentido estadístico no tiene porqué referirse a muchos individuos. Una población estadística puede
ser también el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios.
Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no
es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la población, una muestra,
mediante un procedimiento llamado muestreo.
Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma.
5
Por ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una
muestra será conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar.
3. Datos individuales y datos estadísticos

Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un dato de una muestra o de una
población en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una
muestra o población de personas es un dato estadístico.
Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede ser 37 años, y el promedio de edades de la muestra
donde está incluido Juan es 23 años.
Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente describe la muestra o población.
Los datos estadísticos que describen una muestra suelen llamarse estadísticos (por ejemplo, el promedio de ingresos
mensuales de las personas de una muestra), mientras que los datos estadísticos descriptores de una población suelen llamarse
parámetros (por ejemplo, el promedio de ingresos mensuales de las personas de una población).
4. Estructura del dato

Los datos son la materia prima con que trabaja la estadística, del mismo modo que la madera es la materia prima con que
trabaja el carpintero. Así como este procesa o transforma la madera para obtener un producto útil, así también el estadístico
procesa o transforma los datos para obtener información útil. Tanto los datos como la madera no se inventan: se extraen de la
realidad; en todo caso el secreto está en recoger la madera o los datos más adecuados a los objetivos del trabajo a realizar.
De una manera general, puede definirse técnicamente dato como una categoría asignada a una variable de una unidad de
análisis.
Por ejemplo, "Luis tiene 1.70 metros de estatura" es un dato, donde ‘Luis’ es la unidad de análisis, ‘estatura’ es la variable, y
‘1.70 metros’ es la categoría asignada.
Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de análisis, una variable y una categoría.
La unidad de análisis es el elemento del cual se predica una propiedad y característica. Puede ser una persona, una familia,
un animal, una sustancia química, o un objeto como una dentadura o una mesa.
La variable es la característica, propiedad o atributo que se predica de la unidad de análisis.
Por ejemplo puede ser la edad para una persona, el grado de cohesión para una familia, el nivel de aprendizaje alcanzado para
un animal, el peso específico para una sustancia química, el nivel de ‘salud’ para una dentadura, y el tamaño para una mesa.
Pueden entonces también definirse población estadística (o simplemente población) como el conjunto de datos acerca de
unidades de análisis (individuos, objetos) en relación a una misma característica, propiedad o atributo (variable).
Sobre una misma población demográfica pueden definirse varias poblaciones de datos, una para cada variable. Por ejemplo,
en el conjunto de habitantes de un país (población demográfica), puede definirse una población referida a la variable edad (el
conjunto de edades de los habitantes), a la variable ocupación (el conjunto de ocupaciones de los habitantes), a la variable
sexo (el conjunto de condiciones de sexo de los habitantes).
La categoría es cada una de las posibles variaciones de una variable. Categorías de la variable sexo son masculino y
femenino, de la variable ocupación pueden ser arquitecto, médico, etc, y de la variable edad pueden ser 10 años, 11 años, etc.
Cuando la variable se mide cuantitativamente, es decir cuando se expresa numéricamente, a la categoría suele llamársela
valor. En estos casos, el dato incluye también una unidad de medida, como por ejemplo años, cantidad de hijos, grados de
temperatura, cantidad de piezas dentarias, centímetros, etc. El valor es, entonces, cada una de las posibles variaciones de una
variable cuantitativa.
5. La medición
Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista, puede definirse medición como el
proceso por el cual asignamos una categoría (o un valor) a una variable, para determinada unidad de análisis.
Ejemplo: cuando decimos que Martín es varón, estamos haciendo una medición, porque estamos asignando una categoría
(varón) a una variable (sexo) para una unidad de análisis (Martín).
Se pueden hacer mediciones con mayor o menor grado de precisión.
Cuanto más precisa sea la medición, más información nos suministra sobre la variable y, por tanto, sobre la unidad de
análisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros.
Los diferentes grados de precisión o de contenido informativo de una medición se suelen caracterizar como niveles de
medición. Típicamente se definen cuatro niveles de medición, y en cada uno de ellos la obtención del dato o resultado de la
medición será diferente:
Ejemplos de datos en diferentes niveles de medición
Nivel de medición Nivel nominal Nivel ordinal Nivel cuantitativo Nivel cuantitativo
discreto continuo
DATO Martín es electricista Elena terminó la Juan tiene 32 dientes María tiene 70
secundaria pulsaciones por minuto
6
Unidad de análisis Martín Elena Juan María
Variable Oficio Nivel de instrucción Cantidad de piezas Frecuencia cardiaca

dentarias
Categoría o valor Electricista Secundaria completa 32 70
Unidad de medida ------------- ------------ Diente Pulsaciones por minuto
En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de análisis (Martín es electricista).
En el nivel ordinal, medir significa asignar un atributo a una unidad de análisis cuyas categorías pueden ser ordenadas en una
serie creciente o decreciente (la categoría ‘secundaria completa’ puede ordenarse en una serie, pues está entre ‘secundaria
incompleta’ y ‘universitaria incompleta’).
En el nivel cuantitativo, medir significa además asignar un atributo a una unidad de análisis de modo tal que la categoría
asignada permita saber ‘cuánto’ mayor o menor es respecto de otra categoría, es decir, especifica la distancia o intervalo entre
categorías (la categoría 70 es el doble de la categoría 35).
Las variables medibles en el nivel cuantitativo pueden ser discretas o continuas.
Una variable discreta es aquella en la cual, dados dos valores consecutivos, no puede adoptar ningún valor intermedio (por
ejemplo entre 32 y 33 dientes, no puede hablarse de 32.5 dientes).
En cambio, una variable es continua cuando, dados dos valores consecutivos, la variable puede adoptar muchos valores
intermedios (por ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles).
6. Clasificaciones de la estadística
Existen varias formas de clasificar los estudios estadísticos.
1) Según la etapa.- Hay una estadística descriptiva y una estadística inferencial. La primera etapa se ocupa de describir la
muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo con respecto a la
población).
2) Según el tiempo considerado.- Dentro de la estadística descriptiva se distingue la estadística estática o estructural, que
describe la población en un momento dado (por ejemplo la tasa de nacimientos en determinado censo), y la estadística
dinámica o evolutiva, que describe como va cambiando la población en el tiempo (por ejemplo el aumento anual en la tasa de
nacimientos).
3) Según la cantidad de variables estudiada.- Desde este punto de vista hay una estadística invariada (estudia una sola
variable, como por ejemplo la inteligencia, en una muestra), una estadística bivariada (estudia como están relacionadas dos
variables, como por ejemplo inteligencia y alimentación), y una estadística multivariada (que estudia tres o más variables,
como por ejemplo como están relacionados el sexo, la edad y la alimentación con la inteligencia).
LA ESTADÍSTICA: Es la rama de las Matemáticas que se va a encargar de Recopilar, Organizar, y Procesar datos con el fin de inferir
las características de la población objetivo.
LOS TIPOS DE ESTADÍSTICA.
Descriptiva: Es la técnica que se va a encargar de la recopilación, presentación, tratamiento y análisis de los datos, con el objeto de
resumir, describir las características de un conjunto de datos y por lo general toman forma de tablas y gráficas.
Inferencia Estadística: Técnica mediante la cual se sacan conclusiones o generalizaciones acerca de parámetros de una población
basándose en el estadígrafo o estadígrafos de una muestra de población.
OBJETIVO DE LA ESTADÍSTICA: Es la obtención de conclusiones basadas en los datos experimentales.
OBJETIVO DE LA ESTADÍSTICA DESCRIPTIVA: Describir las características principales de los datos reunidos.
OBJETIVO DE LA INFERENCIA ESTADÍSTICA: Extraer las conclusiones útiles sobre la totalidad de todas las observaciones
posibles basándose en la información recolectada.
POBLACIÓN: Es el conjunto de todos los posibles elementos que intervienen en un experimento o en un estudio.
CENSO: Al estudio completo de la población.
TIPOS DE POBLACIÓN:
POBLACIÓN FINITA: Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
Es aquella que posee o incluye un número limitado de medidas y observaciones.
POBLACIÓN INFINITA: Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el
conteo. Son poblaciones infinitas porque hipotéticamente no existe límite en cuanto al número de observaciones que cada uno de ellos
puede generar.
MUESTRA: Un conjunto de medidas u observaciones tomadas a partir de una población dada. Es un subconjunto de la población.
MUESTRA REPRESENTATIVA: Un subconjunto representativo seleccionado de una población de la cual se obtuvo.
MUESTREO: Al estudio de la muestra representativa.
PARÁMETRO: Son las características medibles en una población completa. Se le asigna un símbolo representado por una letra griega.
ESTADÍSTICO O ESTADÍGRAFO: Es la medida de una característica relativa a una muestra. La mayoría de los estadísticos
7
muéstrales se encuentran por medio de una fórmula y suelen asignárseles nombres simbólicos que son letras latinas.
DATOS ESTADÍSTICOS (VARIABLES): Los datos son agrupaciones de cualquier número de observaciones relacionadas. Para que
se considere un dato estadístico debe tener 2 características: a) Que sean comparables entre sí. b) Que tengan alguna relación.
VARIABLE: Una característica que asume valores.
CLASES DE DATOS:
VARIABLE CUANTITATIVA O ESCALAR: Será una variable cuando pueda asumir sus resultados en medidas numéricas.
VARIABLE CUANTITATIVA DISCRETA: Es aquella que puede asumir sólo ciertos valores, números enteros. Ejemplo: El
número de estudiantes (1,2,3,4)
VARIABLE CUANTITATIVA CONTINUA: Es aquella que teóricamente puede tomar cualquier valor en una escala de medidas, ya
sea entero o fraccionario. Ejemplo : Estatura : 1.90 m
VARIABLES CUALITATIVAS O NOMINALES: Cuando no es posible hacer medidas numéricas, son susceptibles de clasificación.
Ejemplo: Color de autos: rojo, verde, azul.
EXPERIMENTO: Es una actividad planificada, cuyos resultados producen un conjunto de datos. Es el proceso mediante el cual una
observación o medición es registrada. Ejemplo: ¿Cuál será la preferencia del consumidor ante dos marcas de refresco con similares
características en un ambiente armónico y sin publicidad?
La estadística surgió en épocas muy remotas. La historia demuestra que Tácito, historiador latino, cuenta que Augusto ordenó
una amplia encuesta sobre las riquezas del imperio, enumeró los soldados, los navíos, los recursos de todas clases y las rentas
públicas.
La Estadística, como todas las ciencias, no surgió de improviso, sino mediante un proceso largo de desarrollo y evolución,
desde hechos de simple recolección de datos hasta la diversidad y rigurosa interpretación de los datos que se dan hoy en día.
Así pues, el origen de la Estadística se remonta a los comienzos de la historia y esto se sabe tanto a través de crónicas, datos
escritos, como de restos arqueológicos, y esto es explicable por cuanto en ese tiempo se estaba formado recién la sociedad y
es algo inherente la necesidad de saber cosas elementales como: cuántos habitantes tiene a tribu, con cuantos bienes cuenta,
etc.
Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los
Nuragas, las primeros habitantes de la isla; estos monumentos constan de bloques de basalto superpuestos sin mortero y en
cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que
servían para llevar la cuenta del ganado y la caza. Poco a poco conforme fue evolucionando la sociedad, estos hechos fueron
más frecuentes y menos inciertos.
En los antiguos monumentos egipcios se encontraron interesantes documentos en que demuestran la sabia organización y
administración de este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacían censos. Tal
era su dedicación por llevar siempre una relación de todo que hasta tenían a la diosa Safnkit, diosa de los libros y las cuentas.
Todo esto era hecho bajo la dirección del Faraón y fue a partir del año 3050 a.C.
Fue Sardón II, rey de asiría, quien fundó una biblioteca en Nívine que luego fue ampliada y organizada bajo el reinado de
Assurbanipal; los "textos" que allí se guardaban eran tablillas de ladrillo de arcilla cocida de 25 por 16 cm., teniendo sólo en
una de sus caras inscripciones cuneiformes. Lo saltante de todo esto es que en esta biblioteca no se guardaban poemas u
obras literarias; sino simplemente era una recopilación de hechos históricos, religiosos, importantes datos estadísticos sobre
producción, cuentas; así como también datos de medicina, astronomía, etc.
En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó Moisés
después de la salida de Egipto. Textualmente dice: "Censo de las tribus: El día primero del segundo año después de la salida
de Egipto, habló Yavpe a Moisés en el desierto de Sinaí en el tabernáculo de la reunión, diciendo: "Haz un censo general de
toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones
aptos para el servicio de armas en Israel.."". Igual tipos de datos en varios libros que conforman la Biblia.
En China Confucio, en uno de sus clásicos "Shu-King" escrito hacia el año 550 a.C., nos narra cómo el Rey Yao en el año
2238 mandó hacer una estadística agrícola, industrial y comercial.
Grecia también tuvo importantes observaciones estadísticas en lo que refiere a distribución de terreno, servicio militar, etc.
También cabe citar entre los griegos principalmente a Sócrates, Herodoto y Aristóteles, quienes a través de sus escritos
incentivaron la estadística por su importancia para el Estado.
En Roma, con su perfecta organización político, jurídica y administrativa; favoreció para le desarrollo de la Estadística. Una
muestra es el Census que se realizaba cada 5 años y que tenía por objeto no sólo saber el número de habitantes, sino también
su cantidad de bienes. Bajo el mandato de Servio Tulio, éstos pasaron a ser base constitucional del gobierno. También en un
inicio se llevaba un registro de nacimientos y de fallecimientos; pero fue bajo Antoninos que la declaración de nacimientos
adquirió una verdadera institución legal que era necesaria hacerla ante el "prefecto del Erario" en el templo de Saturno y no
después de 30 días de nacimiento. Con la caída del Imperio Romano las estadísticas se pierden en Europa, floreciendo más
bajo la civilización árabe.
Con Carlo Magno, en Francia regresaron las estadísticas a Europa, teniendo un carácter netamente financiero y
administrativo. En Inglaterra Guillermo el Conquistador mandó a realizar una especie de catastro, que constituye un
documento estadístico administrativo.
La Iglesia, viendo la importancia de la estadística es que después del Concilio de Trento estableció la obligación de la
inscripción de nacimientos, matrimonio y defunciones.
8
A mediados del siglo XVII, gracias a Vito Seckendorff, y sobre todo de German Conring al que se le atribuye como fundador
de la Estadística era la descripción de los hechos notables de un estado. Conring perfeccionó y mejoró notablemente la
tendencia nueva, sistematizando los conocimientos y los datos. El mejor de sus seguidores fue Godofredo Achenwall, quien
consolidó definitivamente los postulados de esta nueva ciencia y también de haberle dado el nombre de "Estadística"; palabra
que etimológicamente deriva de la palabra "status", que significa estado o situación; este nombre ya antes había sido usado
en Italia, pero su definición todavía no estaba bien dada.
La Estadística pasó así a ser la descripción cuantitativa de las cosas notables de un estado. Von Scholer separó la teoría de la
estadística de la aplicación práctica de la misma. Todos ellos formaron parte de la tendencia de la Estadística Universitaria
Alemana, conocida como la Estadística Descriptiva.
John Graunt encabeza una tendencia opuesta, nacida en Inglaterra, la de los aritméticos políticos; conocida también como
Estadística Investigadora. Ellos buscaban fijar en números los fenómenos sociales y políticos cuyas leyes empíricas
buscaban. Para su tiempo esto fue atrevido, casi imposible; pero el mérito de ellos es de ser los primeros en buscar las leyes
cuantitativas que rigen la sociedad. De esta escuela surgen dos tendencias más:1. Tendencia Enciclopédico Matemática: Tuvo
su máximo desarrollo en Francia. Usó no sólo la matemática y el cálculo de probabilidades y lo más importante de ella es que
tuvo aplicación práctica en todas las ciencias y no sólo como los aritméticos políticos que la aplicaban a los fenómenos
políticos y sociales, sino también a campos jurídicos, electorales, meteorológicos, etc.
Adolfo Quetelet y A. Cournot son los representantes más insignes de esta tendencia. Quetelet, considerado por muchos el
fundador de la estadística moderna, hizo innumerables aportes; el más importante fue el de la metodología estadística,
sirviéndose del método sentado por él mismo, haciéndola así totalmente científica. Cournot por su parte hizo un valioso
aporte a la teoría de las probabilidades.
2. Tendencia Demográfica: Se desarrolló en Alemania y su máximo representante fue Juan Pedro Süssmilc; él hace el primer
tratado que verifica el movimiento de la población. Usa los postulados de Graunt aplicándolos a los fenómenos que se
refieren a la población y así nació la Demografía y fue Guillard quien le dio el nombre.
Gustavo Romelin separó a la Estadística Descriptiva en parte técnico-metodológica y parte aplicada. Teniendo en cuenta esto
sucede que hasta este punto existen:
A) Estadística Metodológica: Que es un método general de estudio adecuado para ciertos fenómenos. Su defensor fue
Cournot.
B) Estadística Social: Ciencia que estudia desde el punto de vista cuantitativo las leyes de la sociedad y en parte las de la
población. Su representante es Süssmilch.
C) Estadística Cuantitativa: estudia cuantitativamente los hechos salientes del estado. Sus representantes son Conring y
Achenwall.
Es por esta razón que la estadística se presenta como un poderoso auxiliar de las distintas ciencias y técnicas; al provocar en
éstas la investigación de las leyes de comportamiento de ciertas variables que intervienen en un fenómeno cuyo valor, gracias
a la Estadística han sido puestos de manifiesta .
Nuestros productos son de gran utilidad en una amplia variedad de aplicaciones. Su aplicabilidad se extiende a los siguientes
campos o áreas de estudio:
Psicología
Agricultura
Biotecnología
Comercio
Comunicaciones
Electrónica
Energía
Estadística
Fotografía
Geofísica y Geodesia
Geología
Imagen y sonido
Industria Farmacéutica
Industria Financiera
Industria Pesada
Industria Petrolífera
Industria Química
Informática
Ingeniería Aérea
Ingeniería Aeronáutica
Ingeniería Automovilística
Instrumentación
Matemáticas
Medicina
9
Meteorología
Servicios / Consumo
Tecnología de alimentos
OTROS CAMPOS DE APLICACION

 Organización y análisis de datos no procesados, con el fin de extraer el máximo de información útil.
 Establecimiento de relaciones de causa y efecto.
 Evaluación de la confiabilidad de las conclusiones.
 Supervisión de eventos, tendencias y procesos.
 Diseño de procedimientos eficientes para la obtención de datos.
 Predicción de variaciones en los indicadores clave.
OBJETO DE ESTADÍSTICA:
La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto.
La estadística se divide en 2 ramas principales:
Estadística descriptiva: Cuyo objetivo es examinar a todos los individuos de un conjunto.
Estadística inferencial: Por la que, mediante el estudio de una muestra se sacan conclusiones válidas para la totalidad.
POBLACIÓN Y MUESTRA: Se llama población al conjunto formado por todos los elementos cuyo conocimiento nos
interesa. A cada uno de los elementos se lo llama individuo.
Muestra es un subconjunto limitado extraído de una población, con objeto de reducir el campo de experiencias. Las
propiedades que obtengamos se harán extensivas a toda la población.
CARCACTERES: Para el conocimiento de una población estadística, deberemos analizar a cada uno de sus individuos (o a
cada individuo de una muestra). Pero ese análisis no puede ser exhaustivo; deberemos seleccionar uno o varios detalles
(caracteres) y ver cómo se manifiesta ese carácter en cada uno de los individuos. Por ejemplo, de una población de mazorcas
de maíz, los caracteres dignos de estudio pueden ser: color, número de granos, longitud, peso, etc.
Los caracteres pueden ser:
Cualitativos: que se presentan bajo varias cualidades no medibles. Ej.: color
Cuantitativos: cuando son medibles. Ej.: longitud de una mazorca, su peso, número de granos, etc.
Un carácter cuantitativo es discreto (o de variación discreta) cuando sólo puede tomar determinados valores. Es el caso del
número de granos de una mazorca. Y se llama continuo (o de variación continua) cuando puede tomar valores tan próximos
como se quiera (longitud, peso, etc.)
ESTADÍSTICA DESCRIPTIVA:
Esta rama de la estadística trata de describir y analizar un grupo dado sin sacar conclusiones para un grupo mayor. Trabaja en
poblaciones, no en muestras propiamente dichas.
Para esa descripción y análisis de los individuos, que son el objeto de la estadística descriptiva, esta utiliza el siguiente
método:
Selección de caracteres: Dignos de estudio.
Análisis de cada carácter. Este análisis consiste en:
 examinar cada individuo y anotar el valor de cada carácter.
 Establecer las clases de individuos que se desean distinguir respecto a ese carácter.
 Clasificar y contar los individuos incluidos en cada clase
 Calcular determinados valores numéricos (los parámetros estadísticos) a partir de los datos contenidos en las
distribuciones anteriores.
Cuando se pretende dar a conocer a un gran público los resultados de estos análisis, se suelen utilizar representaciones
gráficas de los datos tabulados en el apartado anterior.
ESTADÍSTICA INFERENCIAL:
Cuando hay problemas cuya resolución se nos torna:
Imposible debido a lo inmenso del problema (millones de individuos).
Posible, pero ruinoso.
Recurrimos a la estadística inferencial (diseño de experimentos, teoría de muestras, teoría de la estimación, etc...) para hallar
respuesta de los interrogantes.
Los datos recogidos deben ser organizados, tabulados y presentados para que su análisis e interpretación sean rápidos y
útiles. Por ejemplo, para estudiar e interpretar la distribución de las notas o calificaciones de un examen en una clase con 30
alumnos, primero se ordenan las notas en orden creciente: 3,0; 3,5; 4,3; 5,2; 6,1; 6,5; 6,5; 6,5; 6,8; 7,0; 7,2; 7,2; 7,3; 7,5; 7,5;
7,6; 7,7; 7,8; 7,8; 8,0; 8,3; 8,5; 8,8; 8,8; 9,0; 9,1; 9,6; 9,7; 10 y 10. Esta secuencia muestra, a primera vista, que la máxima
nota es un 10, y la mínima es un 3; el rango, diferencia entre la máxima y la mínima es 7.
10
En un diagrama de frecuencia acumulada, como el de la figura 1, las notas aparecen en el eje horizontal y el número de
alumnos en el eje vertical izquierdo, con el correspondiente porcentaje a la derecha. Cada punto representa el número total de
estudiantes que han obtenido una calificación menor o igual que el valor dado. Por ejemplo, el punto A corresponde a 7,2, y
según el eje vertical, hay 12 alumnos, o un 40%, con calificaciones menores o iguales que 7,2.
Para analizar las calificaciones obtenidas por 10 clases de 30 alumnos cada una en cuatro exámenes distintos (un total de
1.200 calificaciones), hay que tener en cuenta que la cantidad de datos es demasiado grande para representarlos como en la
figura 1. El estadístico tiene que separar los datos en grupos elegidos previamente denominados intervalos. Por ejemplo, se
pueden utilizar 10 intervalos para tabular las 1.200 calificaciones, que se muestran en la columna (a) de la tabla de
distribución de datos adjunta; el número de calificaciones por cada intervalo, llamado frecuencia del intervalo, se muestra en
la columna (c). Los números que definen el rango de un intervalo se denominan límites. Es conveniente elegir los límites de
manera que los rangos de todos los intervalos sean iguales y que los puntos medios sean números sencillos. Una calificación
de 8,7 se cuenta en el intervalo entre 8 y 9; una calificación igual a un límite de intervalo, como 9, se puede asignar a
cualquiera de los dos intervalos, aunque se debe hacer de la misma manera a lo largo de toda la muestra. La frecuencia
relativa, columna (d), es la proporción entre la frecuencia de un intervalo y el número total de datos. La frecuencia
acumulada, columna (e), es el número de estudiantes con calificaciones iguales o menores que el rango de cada intervalo
sucesivo. Así, el número de estudiantes con calificaciones menores o iguales a 3 se calcula sumando las frecuencias de la
columna (c) de los tres primeros intervalos, dando 53. La frecuencia acumulada relativa, columna (f), es el cociente entre la
frecuencia acumulada y el número total de notas.
Los datos de una tabla de distribución de frecuencias se pueden representar gráficamente utilizando un histograma o
diagrama de barras (como en la figura 2), o como un polígono de frecuencias acumuladas (como en la figura 3). El
histograma es una serie de rectángulos con bases iguales al rango de los intervalos y con área proporcional a sus frecuencias.
El polígono de la figura 3 se obtiene conectando los puntos medios de cada intervalo de un histograma de frecuencias
acumuladas con segmentos rectilíneos.
En los periódicos y otros medios de comunicación los datos se representan gráficamente utilizando símbolos de diferente
longitud o tamaño que representan las distintas frecuencias.
PARÁMETROS ESTADÍSTICOS:
Las tablas estadísticas son una forma organizada de dar toda (o casi toda) la información, todos los datos de que disponemos.
Con las gráficas estadísticas se pierde algo de información (mucho o poco, según los casos) pero el mensaje entre pos los
ojos, que es lo que se pretende.
En cualquiera de los dos casos, la cantidad de datos que se dan es excesiva para que sea operativo, para poder hacer
referencias concisas a esa distribución o comparaciones rápidas con otras distribuciones.
Esa es la razón de ser de los parámetros estadísticos, el resumir en un número un aspecto relevante de la distribución que
pueda dar una idea de la misma o compararla en ese aspecto con otras.
Hay muchos parámetros estadísticos. Suelen clasificarse en:
VALORES DE LA TENDENCIA CENTRAL

Una vez que los datos han sido reunidos y tabulados, comienza el análisis con el objeto de calcular un número único, que
represente o resuma todos los datos. Dado que por lo general la frecuencia de los intervalos centrales es mayor que el resto,
este número se suele denominar valor o medida de la tendencia central.
Sean x1, x2, …, xn los datos de un estudio estadístico. El valor utilizado más a menudo es la media aritmética o promedio
aritmético que se escribe ð, y que es igual a la suma de todos los valores dividida por n:
El símbolo ð, o sumatorio, denota la suma de todos los datos. Si las x se agrupan en k intervalos, con puntos medios m1, m2,
…, mk y frecuencias f1, f2, …, fk, la media aritmética viene dada por
donde i = 1, 2, …, k.
La mediana y la moda son otros dos valores de la tendencia central. Si las x se ordenan según sus valores numéricos, si n es
impar la mediana es la x que ocupa la posición central y si n es par la mediana es la media o promedio de las dos x centrales.
La moda es la x que aparece con mayor frecuencia. Si dos o más x aparecen con igual máxima frecuencia, se dice que el
conjunto de las x no tiene moda, o es bimodal, siendo la moda las dos x que aparecen con más frecuencia, o es trimodal, con
modas las tres x más frecuentes.
MEDIDAS DE LA DISPERSIÓN
Normalmente la estadística también se ocupa de la dispersión de la distribución, es decir, si los datos aparecen sobre todo
alrededor de la media o si están distribuidos por todo el rango. Una medida de la dispersión es la diferencia entre dos
percentiles, por lo general entre el 25 y el 75. El percentil p es un número tal que un p por ciento de los datos son menores o
iguales que p. En particular, los percentiles 25 y 75 se denominan cuartiles inferior y superior respectivamente. La
desviación típica es otra medida de la dispersión, pero más útil que los percentiles, pues está definida en términos aritméticos
como se explica a continuación. La desviación de un elemento del conjunto es su diferencia con respecto a la media; por
11
ejemplo, en la sucesión x1, x2, …, xn la desviación de x1 es x1 - ð, y el cuadrado de la desviación es (x1 - ð)2. La varianza es
la media del cuadrado de las desviaciones. Por último, la desviación típica, representada por la letra griega sigma (σ), es la
raíz cuadrada de la varianza, y se calcula de la siguiente manera:
Si la desviación típica es pequeña, los datos están agrupados cerca de la media; si es grande, están muy dispersos.
Medidas de posición: cuartiles, deciles, centiles. Señalan la situación de algunos valores importantes en la distribución
Medidas de asimetría: para señalar si la distribución está sesgada hacia uno u otro lado.
Medidas de apuntamiento: indican si la distribución es más o menos puntiaguda
CONCLUSIÓN
La Estadística es la ciencia que más aporta en la toma de decisiones en todos los ámbitos gerenciales. Desde el poder
ejecutivo hasta los “draft’s” deportivos, la Estadística juega su papel a la hora de hacer cualquier movimiento.
Las Estadística, por otro lado, si no se sabe manejar con cautela puede generar resultados falaces que podrían a su vez llevar
a la toma de decisiones erradas. Por consiguiente se recomienda un estudio pleno y científico de la materia a fin de que
quien utilice sus servicios pueda hacerlo de manera objetiva y con resultados satisfactorios.
Hoy en día es imposible pensar en instituciones que manejan ciertos volúmenes de datos e informaciones y que no utilicen
sus herramientas para verificación, planeación y seguimiento de políticas, estudios de factibilidades, etc.
INVESTIGACION ESTADISTICA
JUSTIFICACION: La sociedad moderna se encuentra en la llamada era de la información. La cantidad de datos a

disposición de la gente es tan grande, que se hace necesario estudiar parte de esta información disponible para tomar
determinada decisión.
12
No obstante ese muestreo es una situación delicada: para muchos de nosotros seria mejor no tener información y no saber de
ella, a tener información errada y pensar que es la correcta.
La especialidad del profesional estadístico es el resultado de una medida, es decir, el método y el proyecto de esa medida. Por
ejemplo: ¿Qué es lo que debe ser medido? ¿Cuáles preguntas deben formularse? ¿Cuál error se puede cometer? ¿Cuáles son
los costos, no solamente del proyecto si no del error causado por una toma de decisiones errada? ¿Cuál es el significado de
los resultados?
Los tres mayores problemas teóricos de un proyecto estadístico con base en una muestra, son los siguientes: Especificación,
proyectos, y evaluación.
La especificación consiste en definir el máximo error que puede ser cometido.
El proyecto consiste en obtener la confiabilidad deseada al menor costo posible-y utilizando las facilidades físicas y los
recursos humanos disponibles.
La evaluación consiste en verificar las diferencias entre los procedimientos utilizados para la comparación de los resultados.
PASOS PARA UNA INVESTIGACION ESTADISTICA
Paso 1. JUSTIFICACION
Desde el comienzo, se explican los motivos que justifican la investigación definiendo y delimitando el problema, el cual
debe estar formulado de manera clara y precisa.
Paso 2. FUNDAMENTACION TEORICA
Se examinan las diferentes corrientes teóricas y se decide cual será utilizada en la investigación, se describe la relación del
problema con la teoría vista y se muestra la relación de este problema con problemas semejantes.
Paso 3. OBJETIVOS DE LA INVESTIGACION
Los objetivos deben ser tomados directamente de los problemas que surgen del paso 2. Pueden ser divididos en :
Objetivos generales en lo que se define lo que se pretende lograr con la realización del trabajo.
Objetivos específicos aspectos determinados que contribuyen para alcanzar los objetivos generales.
Paso 4. FORMULACION DE LAS HIPOTESIS
Se establecen las hipótesis que serán formuladas, las cuales deben ser clararas y precisas. Se define estadísticamente el
problema, decidiendo cual es la información estadística es realmente necesaria. Se hace un listado de las diferentes decisiones
posibles y se analiza si estas dependen de los resultados de la investigación.
Paso5.DETALLE DEL PLAN DE TRABAJO ESTADISTICO
Se describe el plan de la investigación, destacándose la clase de estudio :
EXPLORATORIO, cuando no se tiene información sobre determinado asunto y se desea conocerlo.
DESCRIPTIVO, cuando se desea solamente describir las características de un determinado fenómeno.
EXPLICATIVO, cuando se desea analizar las consecuencias de un determinado problema.
También se escribe en este paso el estudio a realizar, así como también se especifican los estudios estadísticos que serán
utilizados en el análisis de las informaciones obtenidas.
Paso 6. ESPESIFICACION DE LA MUESTRA
Se debe definir el área donde se efectuara la investigación, la población que será investigada, la clase de muestra y su
tamaño, así como el tipo de muestreo que se utilizara.
Paso 7.PLANEACION DE LA RECOLECCION DE LOS DATOS
Se determinan la forma se colectaran los datos, si por entrevistas, cuestionarios u otro medio así como su frecuencia o hasta
cual época del año va a ser llevada a cabo. Debe hacerse un estudio de cuanta información necesaria ya esta disponible en
informes o publicaciones, teniéndose siempre en mente hacer la investigación de campo tan pequeña como sea posible, para
minimizar el error deseado.
Como instrumento definitivo para la recolección de datos, se estudian las opciones de los planes de muestreo, y se calculan
los costos aproximados para diversos grados de precisión. Se toma una decisión sobre el error que se puede aceptar y, si es
necesario, se revisan los paso anteriores.
Paso 8. PRUEBA PILOTO

Se realiza una prueba piloto que indicara cuan completa es la investigación, los efectos de los errores en las respuestas, las
diferencias resultantes de la recolección de los datos por diferentes encuestadores u observadores, y las diferencias en los
costos de los diferentes procedimientos de muestreo. Después se realiza la prueba piloto, se revisan el instrumento de
medición y las instrucciones que serán dadas a quienes realizan las encuestas.
13
Paso 9. INSTRUCCIONES A LOS ENTREVISTADORES Y A LOS OBSERVADORES
Debe prepararse un conjunto de instrucciones para cada etapa que se realice durante la observación estadística.
Paso 10.REALIZACION DE LA ENCUESTA
Se realiza la encuesta y se organizan los resultados : tablas, gráficos y medidas de la estadística descriptiva.
Paso 11. ANALISIS DE RESULTADO
Se pasa luego al tratamiento de los datos por intermedio de las pruebas estadísticas ,las cuales dependen de las hipótesis que
serán contrastadas.
Paso 12. DEFINICION DEL CRONOGRAMA Y DEL PRESUPUESTO
Se prepara un itinerario de trabajo, el cual debe incluir :
Planeaciòn de la investigación.
Elaboración de los instrumentos de análisis.
Prueba piloto .
Selección de la prueba piloto.
Elaboración definitiva del instrumento de análisis.
Selección y entrenamiento de los encuestadores.
Recolección de los datos.
Análisis estadístico.
Informe de la investigación.
Adicionalmente, se calculan los recursos humanos, materiales y financieros para la realización del trabajo.
UNIDAD I. ESTADISTICA DESCRIPTIVA.
OBJETIVO: Diferenciar, conocer y aplicar los conceptos fundamentales del análisis exploratorio de datos.
14
a) CONCEPTO.
¿Qué es la estadística descriptiva o para qué nos sirve?
Cuando necesitamos analizar un proceso cualquiera, es necesario tomar una muestra de datos del proceso en cuestión y a
partir de los mismos obtener sus características tales como la media, la mediana, la moda, la desviación estándar, el rango,
etc., también es necesario saber el tipo de distribución de probabilidad que tiene, así como también es necesario visualizar de
forma objetiva el comportamiento de los datos al ser graficados de diversas formas, todo lo anterior es posible gracias a la
estadística descriptiva.
¿Qué es una muestra? Es una parte de los datos del proceso que se desea analizar, la cuál debe de ser representativa del
proceso en cuanto al número de elementos que contiene y en cuanto a lo que está ocurriendo en el proceso, esto último se
logra tomando cada uno de los elementos de la muestra de forma aleatoria o totalmente al azar; para determinar el número de
elementos idóneo en la muestra se hace uso de la inferencia estadística, por el momento no nos ocuparemos de ello debido a
que esto se ve con detalle en cursos más avanzados de estadística.
El término estadística es ampliamente escuchado y pronunciado a diario desde diversos sectores activos de la sociedad. Sin
embargo, hay una gran diferencia entre el sentido del término cuando se utiliza en el lenguaje corriente y lo que estadística
significa como ciencia.
Debido a lo extenso y variado del campo cubierto por la estadística es difícil proponer una definición precisa del concepto.
No obstante, tácitamente todos los estadísticos están de acuerdo en clasificar la materia en dos tipos, cuales son la estadística
descriptiva y la estadística inferencial, las que desempeñan funciones distintas pero complementarias en el análisis
estadístico.
La mayor parte de La información estadística que aparece en los diarios, revistas, informes y demás publicaciones consiste en
datos resumidos y presentados en forma comprensible para el lector. Esos resúmenes de datos, que pueden ser tabulares,
gráficos o numéricos, se llaman estadísticas descriptivas.
En muchos casos se buscan los datos de un grupo de elementos: individuos, acciones, votantes, ama de casa, productos,
clientes, etc.. Debido al tiempo, al costo y a otras consideraciones, se reúnen datos sólo de una pequeña parte del grupo. Al
grupo con el mayor número posible de elementos en determinado estudio se le llama población, y al grupo con un menor
número de elementos se le llama muestra. Uno de los mayores aportes de la estadística es que los datos de la muestra pueden
emplearse para elaborar estimaciones y probar hipótesis acerca de las características de una población. A este proceso se le
denomina inferencia estadística.
Los datos se pueden clasificar en cualitativos o cuantitativos. Los cualitativos asignan etiquetas o nombres a las categorías de
artículos semejantes. Los cuantitativos indican cuánto o cuántos. El objetivo es presentar varios procedimientos tabulares y
gráficos que se usan con frecuencia para resumir datos cualitativos y cuantitativos. Los resúmenes tabulares y gráficos de
datos pueden verse en informes anuales, artículos periodísticos y estudios de investigación. Todos estamos familiarizados con
estos tipos de presentación y, en consecuencia, es importante comprender cómo se preparan y saber cómo interpretarlos.
Comenzaremos con los métodos tabulares y gráficos para resumir datos de una sola variable.
Luego presentaremos varias métodos numéricos de la estadística descriptiva, que proporcionan las alternativas para resumir
los datos. Comenzaremos con conjuntos de datos de una sola variable. Cuando datos como estos, por ejemplo edad, salario o
cosas por el estilo, se han obtenido de una muestra de n elementos, el conjunto de datos contiene n elementos, o valores de
los datos. Las medidas numéricas de localización y dispersión se calculan a partir de los n valores de los datos. Si hay más de
una variable , esas medidas numéricas se pueden calcular por separado para cada variable. En el caso de dos variables,
desarrollaremos también las medidas del grado de la relación entre las variables.
Hay varias medidas numéricas de localización, dispersión y asociación, que presentaremos. Si se calculan partiendo de datos
de una muestra, se llaman estadísticos de la muestra. Si se calculan a partir de datos de una población, entonces se denominan
parámetros poblacionales.
b) TRATAMIENTO PARA DATOS NO AGRUPADOS.
15
¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir,
tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y
a esto es a lo que se le llama tratamiento de datos no agrupados.
b1. Medidas de tendencia central. Se les llama medidas de tendencia central a la media aritmética, la mediana, la media
geométrica, la moda, etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente
en su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su valor.
1) Media aritmética (`x ). También se le conoce como promedio ya que es el promedio de las lecturas o mediciones
individuales que se tienen en la muestra, se determina con la fórmula siguiente:
n
 x i
x  i 1
n
donde:
`x = media aritmética
xi = dato i
n = número de datos en la muestra
Ejemplos:
1.Se han tomado como muestra las medidas de seis cables usados en un arnés para lavadora, las cuales son; 15.2 cm, 15.0,
15.1, 15.2, 15.1 y 15.0, determine su media aritmética.
Solución:
 15.2  15.0  15.1  15.2  15.1  15.0

x  15.1cm
6
2. Se toman varias muestras de cierto tipo de queso y se determina la cantidad de proteína por cada 100 gramos de queso,
encontrándose lo siguiente: 26.5 gramos, 24.8, 25.3, 30.5, 21.4, determine la cantidad promedio de proteína encontrada en la
muestra por cada 100 gramos de queso que se elabora.
Solución:
_
26.5  24.8  25.3  30.5  21.4
x  25.7 grs
5
3. Se hacen varias lecturas de una muestra que contiene cobre, las lecturas se hacen en un espectrofotómetro de absorción
atómica y son la siguientes: 12.3%, 12.28, 12.27, 12.3, 12.24, 15.01, determine la concentración promedio de Cu en la
muestra.
Solución:
_
12.3  12.28  12.27  12.3  12.24  15.01 76.4
x   12.73%Cu
6 6
Si observamos las lecturas del espectrofotómetro nos damos cuenta que el valor de 15.01% es un valor diferente al de las
lecturas anteriores, por lo que se descarta el valor ya que se considera un valor atípico, es decir un valor que es debido a
circunstancias especiales, en este caso puede ser que se deba al hecho de que se está descalibrando el aparato de absorción
atómica o simplemente que se ha equivocado el operador del aparato al tomar la lectura, por lo que la media se debe calcular
con las primeras cinco lecturas; como se muestra a continuación:
Solución:
_
12.3  12.28  12.27  12.3  12.24 61.39
x   12.278%Cu
5 5 y esta sería la media correcta
16
4. Si deseamos determinar la edad promedio de los estudiantes de una escuela de nivel superior al iniciar sus estudios,
suponga que se toman las edades de algunos de los alumnos de cierta clase y estas son las que siguen: 20, 18, 18, 19, 18, 19,
35, 20, 18, 18, 19.
Solución:
Luego, la media se determinará con solo 10 de las edades ya que es necesario descartar la edad de 35 años, que es un dato
atípico o un caso especial, por lo que;
_
20  18  18  19  18  19  20  18  18  19 187
x   18.7años
10 10
Nota: Cuando es necesario determinar aquellas medidas de tendencia central que hagan uso de todos los datos de la muestra
se recomienda descartar todos aquellos datos atípicos que se encuentren en la muestra o muestras tomadas.
2) Media geométrica (G). Es la raíz en enésima del producto de los valores de los elementos de la muestra, es usada
cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios factores a la vez, se
determina de la siguiente forma:
G  n x1 * x2 * ...* xn
Donde:
G = media geométrica
xi = dato i
Ejemplos:
1.Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4 oC, 12.8, 11.9, 13.6, determine la temperatura
promedio de este proceso.
Solución:
G=
4
13.4 x12.8 x11 .9 x13.6  4 27758.7968 = 12.9077 oC
2.Las siguientes temperaturas han sido tomadas de un proceso para fabricar queso chihuahua, 21.4 oC, 23.1, 20.2, 19.7, 21.0,
determine la temperatura promedio de este proceso.
Solución:
G=
5
21.4 x 23.1x 20.2 x19.7 x 21.0  5 4131070.852 = 21.048 oC
3) Media aritmética ponderada ( x w ). Esta media se usa cuando el peso que tiene cada uno de los datos de la muestra es
diferente, se calcula de la siguiente manera:
 wi xi
xw  i 1
k
 wi
i 1
Donde:
xw = media aritmética ponderada
xi = dato i
wi = peso del dato i
17
Ejemplo:
A continuación se mencionan las materias que Luis Pérez llevó en el primer semestre de Ingeniería Química, el número
de créditos y la calificación obtenida;
MATERIA NUMERO CREDITOS CALIFICACIÓN

Metodología de la investigación 8 90.5
Matemáticas I 10 100.0
Programación 8 81.0
Química 10 78.0
Dibujo 4 100.0
Economía 8 84.0
Determine la calificación promedio que obtuvo Luis Pérez en su primer semestre.
Solución:
( 8 x90.5 )  ( 10 x100.0 )  ( 8 x81.0 )  ( 10 x78.0 )  ( 4 x100 )  ( 8 x84.0 )

Xw 
8  10  8  10  4  8 =
724  1000  648  780  400  672 4224

   88.0
48 48
Nota: Sí comparamos este promedio con el que se obtiene usando simplemente la media aritmética, que es un 88.91, nos
damos cuenta de que este último es mayor, por no tomar en cuenta el peso o número de créditos que aporta cada materia a la
carrera que se estudia, el promedio de esta persona es menor al de la media aritmética debido a que obtiene una calificación
baja es Química que es una de las materias que aporta más créditos.
4) Media armónica (H). La media armónica se define como el recíproco del promedio de los recíprocos de cada uno de los
datos que se tienen en la muestra, y
se determina de la siguiente manera:
1 n
H  n
 n
1 / n1 / xi 1 / xi
i 1 i 1
Ejemplo: Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09
Solución:
5
H  
1 / 3.1  1 / 2.8  1 / 2.84  1 / 3.05  1 / 3.09
5 5
   2.9703
0.3226  0.3571  0.3521  0.3279  0.3236 1.6833
5) Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una
vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se presentan dos casos:
a. Cuando el número de datos en la muestra es impar.- En este caso después de ordenar los datos de la muestra en cuanto a su
magnitud, es decir de mayor a menor valor o de menor a mayor valor, se procede a localizar aquel dato que se encuentra justo
en el centro de los datos o en la parte central de los mismos, el valor de este dato será el que dé valor a la mediana.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman como muestra
siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.
18
Solución:
Ordenando los datos de menor a mayor valor;
11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5
Se observa que el dato 11.3 es el que queda en la parte central, por lo que este es el que dará valor a la mediana; entonces,
xmed = 11.3 cm.
b. Cuando el número de datos en la muestra es par.- En este caso después de ordenar los datos en cuanto a su magnitud,
observamos que en la parte central de los datos no se encuentra dato alguno, en este caso, la mediana tomará el valor del
promedio de dos datos; el que se encuentra antes de la parte central y el que se encuentra después de la parte central.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman como muestra
ocho circuitos y sus mediciones son:
11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, 11.4 cm.
Solución:
Ordenando los datos de mayor a menor valor,
11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11,1 cm.
Se observa que en la parte central de los datos no hay dato alguno por lo que la mediana se determina con el promedio de los
datos subrayados, entonces,
11 .3  11 .2
Xmed   11 .25cm
2
Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen los datos en cuanto a su magnitud, ya
que de no hacerlo, se incurriría en un grave error.
5) Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los
datos que se han obtenido en una muestra, la muestra de una población nos genera la distribución de los datos una vez que
estos se han graficado y en esta gráfica es posible observar la moda o modas de la misma, es por esto que una distribución de
datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más
de dos modas).
Ejemplos:
1. Determine la moda de los datos que se muestran a continuación, se refieren a la estatura de un grupo de jóvenes; 1.60m,
1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70, 1.93, 1.87, 1.85
Solución:
Estatura Frecuencia
1.60 1
1.65 1
1.70 5*
1.71 2
1.85 1
1.87 1
1.93 1
La tabla muestra la distribución de frecuencias de los datos o el número de veces que estos se repiten, la mayor frecuencia
que es 5 corresponde a una estatura de 1.70m, por lo que esta sería la moda.
Luego, xmod = 1.70m
2. Determine la moda de los siguientes datos que se refieren a la edad de alumnos de primer semestre del tecnológico de
Chihuahua, 18 años, 17, 19, 21, 19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35
Solución:
Edad Frecuencia
17 2
18 7*
19
19 8*
20 2
21 2
22 3
35 1
En este caso se observa que las edades que más frecuencia tienen son las de 18 y 19 años, por lo que se concluye que existen
dos modas,
Xmod1= 18 años , Xmod2= 19años
Hay que hacer notar que la frecuencia para ambas modas puede ser de igual magnitud o diferente, como en el caso que se
ilustra.
3. Medidas de Dispersión. Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante
determinar sus medidas de tendencia central así como también es básico el determinar que tan dispersos están los datos en la
muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que una excesiva
variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría de los casos.
1) Rango o recorrido. El rango es la diferencia entre el valor mayor y el valor menor encontrado en la muestra, también se le
denomina recorrido ya que nos dice entre que valores hace su recorrido la variable de interés; y se determina de la siguiente
manera:
R = VM – Vm
Donde:
R = rango o recorrido
VM = valor mayor en la muestra
Vm = valor menor en la muestra
Ejemplo:
1. Se han tomado como muestras las mediciones de la resistencia a la tensión de la soldadura usada para unir dos cables, estas
son: 78.5kg, 82.4, 87.3, 78.0, 90.0, 86.5, 77.9, 92.4, 75.9, determine su rango o recorrido.
Solución:
VM = 92.4 kg
Vm = 75.9 kg
R = VM – Vm = 92.4 – 75.9 = 16.5 kg
2. Se toman las mediciones de la cantidad de grasa de la leche en gramos por cada 100 ml de leche que entra a un proceso de
pasteurización, a continuación se enumeran; 14.85, 15.32, 12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el rango o
recorrido de la cantidad de grasa de la leche.
Solución:
VM = 17.61
Vm = 12.76
R = 17.61 – 12.76 = 4.85gramos
_
2) Desviación absoluta media ( d ). Esta medida de dispersión nos representa la diferencia absoluta promedio que existe
entre cada dato que se encuentra en la muestra y la media de los datos y se determina de la siguiente manera:
n _
_  xi  x
i 1
d
n
20
Donde:
xi = dato i
_
x = media aritmética de la muestra
Ejemplo:
1. Determine la desviación absoluta media de los siguientes datos que son las concentraciones de plomo de algunas muestras,
las que a continuación se enumeran: 18gr, 12, 21, 19, 16, 20, 22
Solución:
Para determinar la desviación absoluta media o promedio, lo primero que hay que hacer es calcular la media aritmética de los
datos de la muestra, la que es 128/7 =18.286, luego se procede a calcular el promedio de las diferencias absolutas entre cada
dato y la media calculada.
_ 18  18.286  12  18.286  .....  20  18.286  22  18.286

d 
7
_
0.286  6.286  2.714  0.714  2.286  1.714  3.714 17.714
d   2.5305gr
7 7
La interpretación de este resultado sería que el grado de alejamiento absoluto promedio de los datos con respecto a su
media es de 2.5305 gramos.
¿Por qué sacar el valor absoluto de las diferencias entre cada dato y la media aritmética? Si solo se hicieran diferencias
entre cada dato y la media aritmética, estas tendrían signos positivos y negativos ya que algunos datos son menores que la
media y otros son mayores que la media, luego al sumar las diferencias, con sus signos correspondientes, éstas se irían
anulando unas con otras y no sería posible medir leal grado de alejamiento promedio de los datos en la muestra.
3) Varianza o variancia (s2). Es el promedio de las diferencias elevadas al cuadrado entre cada valor que se tiene en la
_
muestra (xi) y la media aritmética ( x ) de los datos y se determina de la siguiente manera:


n

_ 2
 

i 1 
xi  x 

S 
2
n 1
Donde n es el número de datos en la muestra.

Ejemplo:
Los siguientes datos es la cantidad de glucosa en miligramos encontrada en muestras de sangre de algunos pacientes,
14.2, 12.1, 15.6, 18.1, 14.3, determine su varianza.
Solución:
Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho anteriormente.
 14.2  12.1  15.6  18.1  14.3 74.3
x   14.86mg
5 5
21
2 2 2
( 14.2  14.86 )  ( 12.1  14.86 )  ....  ( 14.3  14.86 )
s2  
5 1
0.4356  7.6176  0.5476  10.4976  0.3136 19.412 2

s2    4.853mg
4 4
Nota:
Dentro de la inferencia estadística se plantea la deferencia entre una variancia muestral s 2 y una poblacional, representada por
s2.
4) Desviación estándar (s). Es la desviación o diferencia promedio que existe entre cada dato de la muestra y la media
aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
2
s s
donde:
s2= varianza o variancia
Por tanto la desviación estándar de la muestra anterior sería;
2
4.853mg  2.2029mg
s=
La interpretación de este resultado sería, que la cantidad de glucosa encontrada en la muestra es en promedio de 14.86
miligramos y que la cantidad de glucosa en la muestra se aleja o dispersa en promedio 1.9704 mg alrededor de la media.
En este caso solo nos interesa conocer el significado de la desviación estándar, aunque es necesario decir que s es la
desviación de la muestra y que s es la desviación de la población, así como s 2 es la varianza de la muestra y s2 es la varianza
de la población.
C) TRATAMIENTO PARA DATOS AGRUPADOS.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las
características de la muestra y por consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se
han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos.
Pasos para agrupar datos.

a. Determinar el rango o recorrido de los datos.
Rango = Valor mayor – Valor menor
b. Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente tabla.
Tamaño de muestra o No. De datos Número de clases

Menos de 50 5a7
50 a 99 6 a 10
100 a 250 7 a 12
250 en adelante 10 a 20
22
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van
a agrupar los datos, existen otros para hacerlo.
a. Determinar la amplitud de clase para agrupar (C).
Rango
C
k
d. Formar clases y agrupar datos.

Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor
encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la
primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.
Ejemplo:
Los siguientes datos se refieren al diámetro en pulgadas de un engrane.
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00

6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15
a) Agrupe datos, considere k=6.

b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de probabilidad.
c) c) Obtenga: media, mediana, moda y desviación estándar.
Solución:
a) Agrupando datos;
1. R= VM - Vm = 7.25 – 6.00 = 1.25

2. k = 6
R 1.25
C   0.2083  0.21
3. k 6
4. Formando clases.
Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado en la muestra; luego,
LI LS Frecuencia Marca de Límite real Límite real Frecuencia Frecuencia

clase inferior superior relativa Relativa
acumulada
5.97 – 6.18 2 6.075 5.965 6.185 2/40 = 0.05 0.05
6.19 – 6.40 5 6.295 6.185 6.405 5/40=0.125 0.175
6.41 – 6.62 7 6.515 6.405 6.625 0.175 0.350
6.63 – 6.84 13 6.735 6.625 6.845 0.325 0.675
23 6.85 – 7.06 7 6.955 6.845 7.065 0.175 0.850
7.07 – 7.28 6 7.175 7.065 7.285 0.15 1.000
Total 40 1.000
b) Gráficas:
HISTOGRAMA
16 13
5.965 - 6.185
FRECUENCIA
11
7 7 6 6.185 - 6.405
5
6 6.405 - 6.625
2
6.625 - 6.845
1
6.845 - 7.065
-4 7.065 - 7.285
LIMITES REALES
POLIGONO DE FRECUENCIA
16
14
FRECUENCIA
12
10
8
6
4
2
0
5.635 5.855 6.075 6.295 6.515 6.735 6.955 7.175 7.395 7.615
MARCA DE CLASE
OJIVA "MENOR QUE" O CRECIENTE
1 1
FRECUENCIA RELATIVA
0.85
0.8
ACUMULADA
0.675
0.6
0.4
0.35
0.2 0.175
0.05
0 0
5.965 6.185 6.405 6.625 6.845 7.065 7.285
LIMITES REALES
24
DISTRIBUCION DE PROBABILIDAD
0.4
0.325
PROBABILIDAD
5.965 - 6.185
0.3
6.185 - 6.405
0.175 0.175
0.2 0.15 6.405 - 6.625
0.125
0.1 0.05
6.625 - 6.845
6.845 - 7.065
0 7.065 - 7.285
LIMITES REALES
a) Media ( x ).
 x * f i i
( 6.075 )( 2 )  ( 6.295 )( 5 )  ...  ( 7.175 )( 6 ) 12.15  31.475  ...  43.05
x i 1
  
n 40 40
268.52
 6.713 pu lg adas
= 40
Donde:
k = número de clases
xi = marca de clase i
fi = frecuencia de la clase i
k
fi 1
i 
n= número de datos en la muestra
b) Mediana (Xmed).
 n / 2  Fme  1  40 / 2  14 
Xmed  Li    A  6.625  
 fme  13 ( 0.22 )  6.7265
 
Donde:
Li = límite real inferior de la clase que contiene a la mediana
Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana
fme = frecuencia de la clase en donde se encuentra la mediana
A = amplitud real de la clase en donde se encuentra la mediana
A = LRS-LRI
LRS = límite real superior de la clase que contiene a la mediana
LRI = límite real inferior de la clase que contiene a la mediana
N = número de datos en la muestra
f) Moda (Xmod).
25
 d1   6 
X mod  Li    A  6.625   ( 0.22 )  6.735 pu lg adas
 d1  d 2  6  6
Donde:
Li = límite real inferior de la clase que contiene a la moda
fmo  fmo  1 13  7  6
d1 = =
fmo  fmo  1 13  7  6
d2 = =
fmo = frecuencia de la clase que contiene a la moda
fmo-1= frecuencia de la clase anterior a la que contiene a la moda
fmo+1= frecuencia de la clase posterior a la que contiene a la moda
A = amplitud real de la clase que contiene a la moda
A = LRS – LRI
LRS = límite real superior de la clase que contiene a la moda
LRI = límite real inferior de la clase que contiene a la moda
g) Desviación estándar (S).
k _ 2 k _ 2
 ( xi  x ) fi  ( xi  x ) fi
s i 1
 i 1
k
n 1
 fi  1
i 1
( 6.075  6.713 )2 ( 2 )  ( 6.295  6.713 )2 ( 5 )  ...  ( 7.175  6.713 )2 ( 6 )

 
40  1
0.814088  0.87362  ...  1.280664 3.65904
  0.3063 pu lg adas
= 39 39
Donde:
xi = marca de clase i
_
x = media aritmética
fi = frecuencia de la clase i
k
 fi  n
i 1 = número total de datos en la muestra
Presentamos a continuación algunas fórmulas indispensables en el cálculo de medidas de tendencia central y

variabilidad:
Medida Datos sin agrupar Datos agrupados

Media Aritmética: n
X i Y 
 y .n i i
X i 1 n
n
Desviaciones: Zi  X i  X Z i  Yi  Y
Mediana: Número impar de observaciones: Variable discreta:
 Y Y  n
3
.ni N j 1 
m3 
i
Me  X n 2 entonces Me  Y j
n 2
Cuando
Número par de Observaciones:
26
Xn  Xn n Y  Yj
1 N j 1  Me  j 1
Me  2 2
Si 2 entonces 2
2
Variable Continua:
n
N j 1 
Cuando 2 entonces Me  Y j1
n
N j 1 
Si 2 entonces
n
 N j 1
Me  Y j1  c. 2
nj
Moda: Valor de la variable que tenga mayor n j 1

frecuencia absoluta Md  Y j1  c.
n j 1  n j 1
Cuartiles: n
 N j 1
Q1  Y j1  c. 4
nj
Deciles: n
 N j 1
D1  Y j1  c. 10
nj
Percentiles: n
 N j 1
P1  Y j1  c. 100
nj
Varianza:
 X X  Y Y 
2 2
i i .ni
S 2
 S 2

n n
S2 
X i
2
X2 S2 
 Yi .ni
2
Y 2
n n
Desviación estándar:
S  S 2
S   S2
Coeficiente de S S
variación: CV  .100% CV  .100%
X Y
Puntaje típico o X X Y Y
estandarizado Z Z
S S
Asimetría: M1  M d
AS 
S
donde M1 es la media
Grado de asimetría: m3
g1 
S3
 Y Y 
3
i .ni
m3 
siendo n
Curtosis: m4
g2 
S4
27
 Y Y 
4
i .ni
m4 
donde n
EJERCICIOS PARA RESOLVER:
1) En el restaurante el Chamaco, se usó un cuestionario para conocer la opinión de sus clientes sobre el servicio, la calidad de
los alimentos, los cocteles, los precios y el ambiente del restaurante. Cada característica se valora en una escala de notable
(O), muy bueno (V), bueno (G), mediano (A) y malo (P). Aplique la estadística descriptiva para resumir los siguientes datos,
acerca de la calidad del alimento. ¿Qué impresión tiene usted de las calificaciones de calidad de los alimentos en el
restaurante?
G O V G A O V O V G O V A
V O P V O G A O O O G O V
V A G O V P V O O G O O V
O G A O V O O G V A G A p
2) Se pidió a los alumnos del Colegio de Administración de Empresas, de una universidad privada, llenar un cuestionario de
evaluación del curso al final del mismo. Consiste en una diversidad de preguntas cuyas respuestas se clasifican en cinco
categorías. Una de las preguntas es: en comparación con otros cursos que has estudiado, ¿Cuál es la calidad general de éste?
Mala Regular Buena Muy buena Excelente
28
En una muestra de 60 alumnos que terminaron un curso de estadística empresarial durante el primer trimestre de 2004
obtuvieron la siguiente respuestas. Para facilitar el procesamiento de los resultados del cuestionario en computadora se usó
una escala numérica en la que 1= Mala, 2 =Regular, 3 = Buena , 4 = Muy buena y 5 = Excelente.
3 4 4 5 1 5 3 4 5 2 4 5 3 4 4
4 5 5 4 1 4 5 4 2 5 4 2 4 4 4
5 5 3 4 5 5 2 4 3 4 5 4 3 5 4
4 3 5 4 5 4 3 5 3 4 4 3 5 3 3
a. Comente por qué éstos son datos cualitativos.

b. Elabore una distribución de frecuencias y una distribución de frecuencias relativas de los datos.
c. Tras un resumen de los datos en forma de gráfica de barras y de diagrama de pastel.
d. Con base en sus resúmenes, haga comentarios sobre la evaluación general del curso por parte de los alumnos.
3). Los promedios de calificaciones de 50 alumnos de la carrera de Sistemas son las siguientes:
2.21 3.01 2.68 2.68 2.74 2.60 1.76 2.77 2.46 2.49
2.89 2.19 3.11 2.93 2.38 2.76 2.93 2.55 2.10 2.41
3.53 3.22 2.34 3.30 2.59 2.18 2.87 2.71 2.80 2.63
3.26 3.67 1.78 2.46 4.29 4.39 4.56 4.23 4.65 3.18
2.47 1.23 2.56 3.76 3.98 4.15 4.78 1.67 3.75 3.46
a. Elabore con ella una distribución de frecuencias relativas y

b. Una distribución de frecuencias relativas acumuladas para los datos.
c. Trace un histograma para los datos.
4). Un departamento de producción aplica un procedimiento de muestreo para verificar la calidad de artículos bien
elaborados. Para ello, recurre a la siguiente regla de decisión en una estación de inspección: si una muestra de 14 artículos
tiene varianza mayor que 0.005, se debe parar la línea de producción y efectuar las reparaciones necesarias. Suponga que
acaban de reunirse los siguientes datos:
3.43 3.45 3.43 3.48 3.52 3.50 3.39
3.48 3.41 3.38 3.49 3.45 3.51 3.50
¿Debe detenerse la producción? ¿Por qué?
5) Los siguientes tiempos fueron registrados por corredores de cuarto de milla y de la milla, de un equipo universitario de
pista. (Tiempos en minutos)
Tiempos en el cuarto de milla: 0.92 0.98 1.04 0.90 0.99

Tiempos en la milla: 4.52 4.35 4.60 4.70 4.50
Después de ver esta muestra de tiempos, uno de los entrenadores comentó que los corredores de cuarto de milla corrían con
más consistencia. Emplee la desviación estándar y el coeficiente de variación para resumir la variabilidad en los datos. ¿El
coeficiente de variación indica que es cierta la afirmación del entrenador?
6) Millones de colombianos se levantan cada mañana y trabajan en sus propias casas. Se sugiere que el uso creciente de
computadoras es una de las razones por la que las personas pueden trabajar en empresas caseras. A continuación vemos una
muestra de datos sobre las edades de esas personas.
22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29
15 18 25 14 18 19 21 17 25 32
39 46 58 54 56 45 49 47 36 39
a. Calcule la media y la moda.
29
b. La mediana de la edad de la población de todos los adultos es 35.1 años. (Según la oficina del Censo). Use la mediana de
la edad de los datos anteriores para comentar si los trabajadores en casa tienden a ser más jóvenes o más viejos que la
población de todos los adultos.
c. Calcule el primer y el tercer cuartil.
d. Calcule e interprete el 32% percentil.
7) Los datos que siguen representan la cantidad de automóviles que llegan a una caseta de cobro durante intervalos de 10
minutos cada uno. Calcule la media, mediana, moda, el primer cuartil y el tercer cuartil para estos datos.
26 26 58 24 22 22 15 33 19 27
21 18 16 20 34 24 27 30 31 33
8) En una prueba de rendimiento y consumo de gasolina se probaron 13 vehículos, durante 300 millas, en condiciones de
tránsito en ciudad y en el campo; de lo anterior se obtuvieron los siguientes datos en millas por galón.
Ciudad: 16.2 16.7 15.9 14.4 13.2 15.3 16.8 16.0 16.1 15.3 15.2 15.3 16.2
Campo: 20.6 19.4 18.3 18.6 19.2 17.4 17.2 18.6 19.0 21.1 19.4 18.5 18.7
Para llegar a una conclusión sobre la diferencia de rendimiento en la ciudad y en el campo use la media, la mediana y la
moda.
9). Determine la media y la desviación estándar de las siguientes millas por galón obtenidas en 50 corridas de prueba
realizadas en avenidas urbanas con un automóvil de tamaño mediano.
19.7 21.5 22.5 22.2 22.6 34.6 43.6 46.9 26.4 37.9
21.9 20.5 19.3 19.9 21.7 32.5 43.7 43.6 27.8 45.1
22.8 23.2 21.4 20.8 19.4 41.8 40.6 42.7 28.9 35.8
22.0 23.0 21.1 20.9 21.3 40.3 42.3 47.9 26.6 30.8
17.4 24.6 17.8 25.9 30.5 39.5 45.8 46.8 34.7 33.7
10). Los siguientes son los números de torsiones que se requirieron para cortar 20 barras de aleación forjada: 33, 24, 39, 48,
26, 35, 38, 54, 23, 34, 29, 32, 43, 45, 43, 27, 25, 19, 32 y 27. Determine, a) la media y b)la mediana.
11). Los siguientes son los números de los minutos durante los cuales una persona debió esperar el autobús hacia su trabajo
en 15 días laborales: 10, 0, 13, 9, 5, 10, 2, 10, 3, 8, 6, 17, 2, 10 y 15. Determine, a) la media, b) la mediana, c) la moda.
12).Lassiguientes son medidas de las resistencias de la resistencia a rompimiento (en onzas) de una
muestra de 60 hilos de lino.
32.5 15.2 35.4 21.3 28.4 26.9 34.6 29.3 24.5 31.0
21.2 28.3 27.1 25.0 32.7 29.5 30.2 23.9 23.0 26.4
27.3 33.7 29.4 21.9 29.3 17.3 29.0 36.8 29.2 23.5
20.6 29.5 21.8 37.5 33.5 29.6 26.8 28.7 34.8 18.6
25.4 34.1 27.5 29.6 22.2 22.7 31.3 33.2 37.0 28.3
36.9 24.6 28.9 24.8 28.1 25.4 34.5 23.6 38.4 24.0
a) Agrupe los datos en 7 clases, b) obtenga media, mediana, moda y desviación estándar, c)obtenga histograma y polígono de
frecuencias, ojiva menor que y distribución de probabilidad.
13). Un estudio realizado a 50 jóvenes de la ciudad de Ibagué sobre el numero de refrescos Hidratantes que consumen por
semana arrojo la siguiente información :
1 2 3 4 5 0 6 0 0 8 8 9 9 10 10
2 3 4 5 5 6 6 7 7 8 9 9 9 10 10
5 6 6 0 7 8 9 1 2 3 4 5 6 12 11
4 3 2 3 3 6 0 4 5 5 6 7 7 12 11
a. Construir la distribución de frecuencias de la variable Xi

b. Realizar un análisis de la tabla
c. Construya una grafica ni ,Ni, construya un pictograma, un grafico de tallo y hoja.
d. Hallar la media aritmética ,la mediana ,la moda , la media geométrica , la madia armónica.
30
e. Hallar la varianza , desviación estándar, desviación media , desviación mediana ,coeficiente de variación, coeficiente de
sesgo, coeficiente de kurtosis.
14). Un estudio realizado a 50 empleados de la fabrica de cementos Diamante sobre el peso en Kilogramos arrojo la
siguiente información:
55.3 55.4 58.3 70.1 75.3 80.1 85.2 90.1 94.4 63.5
56.3 56.5 59.4 71.4 76.2 81.3 86.3 91.2 94.5 64.5
56.7 60.1 72.3 77.6 82.4 87.2 92.5 94.6 65.3 60.3
57.8 60.5 73.5 78.2 83.5 88.7 93.1 61.3 67.8 61.4
62.5 63.9 74.8 79.5 84.7 89.5 94.3 62.5 95.3 62.7
a. Construir la distribución de frecuencias de la variable Yi
b. Realizar un análisis de la tabla.
c. Construya una grafica de ni , Ni ,un pictograma y un diagrama de tallo
d. Hallar la media aritmética ,la mediana ,la moda , la media geométrica , la varianza , la desviación estándar, el coeficiente
de variación
e. Hallar la varianza , desviación estándar, desviación media , desviación mediana ,coeficiente de variación, coeficiente de
sesgo, coeficiente de kurtosis.
15). Se tiene una distribución de 6 intervalos de amplitud A = 10 constante de la cual se sabe:

n = 150 , n3 = n4 =30, n2= n5= n1+5 , n1= n6
X5 =50 quinta marca de clase
Se pide calcular la varianza, desviación estándar desviación media, coeficiente de variación, desviación mediana.
16). A los trabajadores de una empresa el próximo año, el salario mensual les será aumentado en 22.3% , más un subsidio
por transporte de $ 25.000 . La empresa tiene 300 trabajadores que ganan en promedio $ 350.000 con un coeficiente de
variación de 0.25%.
Hallar:
a) Cuál será la variación de los salarios el próximo año?
b) Cuál será el valor total de la nómina del próximo año?
17). En cierta región la distribución de predios por extensión hay una media de 35.4 hectáreas y una desviación típica de
19.33 hectáreas, mientras que la distribución por canon de arrendamiento tiene una media de $ 380.000 y una desviación de
$ 35.000. ¿cuál de las dos distribuciones tiene mayor variabilidad?
18). En un conjunto de n valores de X se sabe que:

Xi2 = 1360 Xi = 40 ns2 = 1280
Hallar los n valores
19). Hallar el coeficiente de variación de dos números cuya media aritmética es 5 y su media geométrica es 4 .
20). La medida de tres números es 8, su mediana es 8, y su varianza es 16. Hallar los números.
21) Se toma una muestra de 20 estudiantes matriculados en estadística y se les pregunta por el número de horas que
emplearon en estudiar la asignatura en la semana anterior al examen final:
12 7 4 16 21 9 3 11 14 10 6 10 11 9 7 6 10 9 8 15
a) Hallar la media muestral.
b) Hallar la mediana muestral.
c) Hallar la varianza muestral y la desviación típica.
22) Se somete a los 40 estudiantes de una clase a una encuesta para evaluar al profesor, según una escala que va de 1 (malo)
hasta 5 (excelente). Los resultados se recogen en la siguiente tabla.
PUNTUACIÓN NÚMERO DE ESTUDIANTES

1 1
2 7
3 15
31 4 10
5 7
a) Hallar la media.
b) Hallar la mediana de estas puntuaciones.
c) Hallar la varianza y la desviación típica de esta población.
23) Se toma una muestra de 25 estudiantes. La tabla siguiente recoge la cantidad de tiempo empleado por cada uno de los
miembros de dicha muestra en preparar un examen.
TIEMPO DE
ESTUDIO (HORAS) 0-4 4-8 8-12 12-16 16-20
NUMERODE
ESTUDIANTES 3 7 8 5 2
a) Dibujar el histograma.
b) Hallar las frecuencias relativas.
c) Hallar las frecuencias relativas acumuladas y dibujar el histograma correspondiente.
d) Estimar la media muestral.
e) Estimar la desviación típica muestral
f) ¿En qué clase está la mediana muestral?
g) ¿Cuál es la clase modal?
24). Se ha realizado una encuesta en 30 hogares en la que se les pregunta el nº de individuos que conviven en el domicilio
habitualmente. Las respuestas obtenidas han sido las siguientes: 1
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes
acumuladas.
b) ¿Qué proporción de hogares está compuesto por tres o menos personas? ¿Qué proporción de individuos vive en hogares
con tres o menos miembros?
c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribución de frecuencias y represente el
histograma correspondiente.
25) Tenemos la siguiente información sobre el gasto semanal en ocio de un grupo de estudiantes universitarios.
NIVEL DE GASTO (miles) Nº DE JÓVENES

0- 5 4
5- 10 11
10 - 15 16
15- 20 22
20- 25 8
25- 30 6
a) Calcule la distribución de frecuencias de la variable y las densidades de frecuencias. b) Dibuje el histograma de
frecuencias.
c) Dibuje el polígono de frecuencias acumuladas.
d) ¿Qué proporción de jóvenes gastan en ocio más de 20 semanales?
26) En un estudio sobre consumo de gasolina en una gran ciudad se eligió una muestra de 100 vehículos y se observó el
número de litros que consumían en un día, obteniéndose la siguiente distribución de frecuencias.
Nº de litros Nº de automóviles
1- 7 4
32
7 - 10 8
10 - 12 35
12 - 14 30
14 - 18 20
18 - 25 3
a) Calcule la distribución de frecuencias, obteniendo, además, la amplitud de cada intervalo así como sus respectivas marcas
de clase y las densidades de frecuencia.
b) Represente gráficamente la distribución de frecuencias mediante un histograma.
c) ¿Qué porcentaje de automóviles consumen entre 12 y 18 litros al día?
27) Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes resultados:
PLAZAS Nº DE HOTELES
0 - 10 25
10 - 30 50
30 - 60 55
60- 100 20
a) Represente gráficamente esta distribución de frecuencias mediante un histograma.

b) ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas?
c) ¿Cuántos hoteles tienen treinta o menos plazas?
d) Calcule las marcas de clase de cada intervalo.
e) ¿Cuál es la proporción de hoteles que disponen de entre 15 y 50 plazas? ¿Qué hipótesis hace para este último cálculo?
28) Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número de empleados que hay
en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido:
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15, 14, 12, 11 11, 11, 12, 12, 12, 15, 13, 14, 16,
15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes
acumuladas.
b) ¿Qué proporción de sucursales tiene más de 15 empleados?
c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes.
d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribución de frecuencias y represente su
histograma y su polígono de frecuencias acumuladas.
e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las densidades de frecuencia
de cada intervalo y represente el histograma correspondiente.
29) Una determinada cartera de valores ha pasado en 16 años de tener un valor de $1000.000.000 a un valor de $4.728
000.000. Halle la tasa media anual acumulativa de crecimiento.
30) Una persona invirtió $300000000 durante diez años, con una rentabilidad media del 5,9% a interés compuesto. Los tres
primeros años obtuvo un interés del 5,4% y los tres siguientes del 6,4%. Suponiendo que en los cuatro últimos años se aplicó
el mismo tipo de interés, ¿cuál fue la rentabilidad anual en los últimos 4 años?
31) El gasto de dos grupos de familias durante un cierto período de tiempo ha sido el siguiente:
GRUPO A GRUPO B
Gasto (1000 de$) Nº de familias Gasto(1000 de $) Nº de familias
10 14 8 10
12 16 10 20
14 20 11 25
16 15 13 20
18 18 15 10
20 17 18 10
20 5
Determine cuál de los dos grupos es más homogéneo respecto a su gasto, con explicación de los pasos aplicados y de los
resultados obtenidos.
32). Se ha realizado un estudio entre 100 mujeres mayores de 15 años y el número de hijos de las mismas. El resultado ha
sido:
Xi: Nº hijos ni: Nº mujeres
0 13
1 20
33
2 25
3 20
4 11
5 7
6 4
Se pide:
a) Calcular el número promedio de hijos, la mediana y la moda.
b) Calcular los cuartiles y el decil 7.
c) Analizar la dispersión de la distribución, interpretando los resultados.
d) Analizar la forma de la distribución calculando los coeficientes correspondientes. Comente los resultados.
33).La siguiente distribución expresa el número de coches vendidos durante una semana por cada uno de los 50
concesionarios que una determinada firma tiene en Ibagué:
xi: número de ni: número
coches vendidos concesionarios
1 5
3 12
4 20
6 8
10 5
Se pide:
a) Media aritmética, mediana y moda. ¿Qué puede decir de la asimetría de la distribución
con estos datos?
b) Desviación típica, coeficiente de variación de Pearson. Interprete los valores calculados.
c) Coeficientes de asimetría de Pearson y Fisher. Comente los resultados.
34). Sea la distribución referida a beneficios anuales de 38 empresas de Cali:

Beneficio Nº
(Miles €) empresas
230 - 280 5
280 - 330 7
330 - 580 14
580 - 630 9
630 - 780 3
Se pide:
a) Calcular el beneficio medio de estas 38 empresas madrileñas.
b) ¿Cuál es el beneficio mayor de la mitad de las empresas más modestas?
c) Determinar el beneficio más frecuente.
d) Estudiar la dispersión de esta distribución a partir del recorrido intercuartílico, desviación típica y coeficiente de variación
de Pearson. Interpretar los resultados obtenidos.
e) Estudiar la forma de esta distribución. Comentar el resultado.
35) La distribución del importe de las facturas por reparación de carrocería de una muestra de 80
vehículos en un taller, viene dada por la tabla siguiente:
Importe (€) Nº vehículos

0 - 60 10
60 - 80 20
80 - 120 40
120 - 240 10
Se pide:
a) Calcular el importe medio. Estudiar la representatividad de esta media.
b) Calcular el importe mediano y el importe más frecuente.
c) Calcular el tercer decil. ¿Qué interpretación tiene?
d) ¿Cuál es el importe máximo pagado por las 60 reparaciones más baratas?
e) Estudiar la asimetría a partir del coeficiente de asimetría de Fisher.
34
36) La distribución de salarios pagados diariamente en una cadena de pizzerías a sus repartidores es la
siguiente:
Salarios (€) Nº empleados

10-16 14
16-22 22
22-28 31
28-34 23
34-40 10
a) ¿Puede considerarse representativo del conjunto de salarios el salario medio? ¿Porqué?

b) El horario no es único. Sabiendo que el número medio de horas trabajadas es de 6 horas y
su desviación típica es de 2.5 horas, deduzca si los horarios tienen una distribución más o
menos homogénea que los salarios de esta empresa.
37) Establezca, con base estadística, en cuál de las siguientes empresas el salario está repartido de
forma más equitativa.
Empresa A Empresa B
nº de personas salario percibido (€) nº de personas salario percibido (€)
15 800 10 800
20 1000 30 1000
30 1200 35 1200
20 1500 24 1500
15 7500 1 7500
¿Qué conclusiones puede obtener del análisis de las curvas de Lorenz correspondientes?
38) Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de la
siguiente forma:
Nº de acciones Nº de accionistas
0 - 20 1030
20- 60 380
60 - 100 180
100- 500 50
500-1000 10
Se pide:
a) Hallar el número medio de acciones por accionista y su desviación típica.
b) Hallar la mediana.
c) Comente, con base estadística, el grado de concentración de las acciones.
d) ¿Qué porcentaje del total de acciones poseen los accionistas mayoritarios? (accionistas
mayoritarios son aquellos que poseen más de 500 acciones)
e) ¿Qué porcentaje de los accionistas minoritarios posee el 20% del total de acciones?
39) En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos de €. La
ocupación del aparcamiento durante la semana es la siguiente:
Tiempo de estacionamiento (min.) número de vehículos
0 - 60 1240
60 - 120 3575
120- 180 746
180- 240 327
240- 360 218
360- 1440 44
Se pide:
a) Obtener el tiempo medio de estacionamiento, el más frecuente y la mediana.
b) ¿A partir de qué cantidad de tiempo un vehículo está estacionado más que el 85% de los
vehículos?
c) Calcular los ingresos totales, el ingreso medio y el más frecuente.
d) La empresa arrendataria del servicio está estudiando modificar la tarifa existente de la siguiente manera: a todos los
vehículos se les cobrará 50 céntimos de € por entrar y 1,1 céntimos de € por cada minuto que tengan su coche dentro del
35
aparcamiento. Bajo esta suposición, y con los datos de que dispone, ¿qué alternativa resultaría más ventajosa para la
empresa? Razonar la respuesta.
40) El testamento de un hombre de negocios lega 2.500 euros a su familia repartiéndose de la siguiente forma. A su cónyuge
le asigna el doble que a su hijo primogénito y a éste el doble que a cada uno de sus otros dos hermanos.
a) Considerando que cada heredero ha de aplicar un impuesto de sucesiones proporcional del 20%. ¿Cuáles serán los índices
de Gini en los dos casos: antes de pagar los impuestos y después de haberlo hecho? ¿Cuál de las distribuciones es más
equitativa?
b) Si a cada heredero se le aplicara un impuesto fijo de 125 euros, ¿cómo se vería afectado el índice de Gini original?
41 ) Se conocen los siguientes momentos de las distribuciones de frecuencias de las variables X e Y:
Variable X Variable Y
m1 = 2.6 m1 =4,8
m2= 1,16 m2= 4,64
m3= 0,756 m3= -6,048
m4= 3,6704 m4=58,7264
Se pide:
a) ¿Mediante qué cambio de origen y/o escala se puede obtener la variable Y a partir de la
variable X?
b) ¿Cuánto valdría m1 para la variable X? ¿Y para la variable Y?
c) ¿Qué podría decir de la asimetría de las variables X e Y?
42) Sea (xi, ni) una distribución para la que la media aritmética vale 4, la moda toma el valor 5, la varianza es 1,2 y N=30.
Determine cuánto valdrán esos mismos valores para la distribución (xi+10 ; ni).
43) El volumen de ventas de una empresa de telefonía en el año 2007 se reparte de la siguiente manera:
Dentro de la telefonía móvil fue de 7,51 millones de euros, mientras que la media en el sector fue de 6,61 millones de euros
y la varianza de 86,5. En el caso de la empresa de telefonía fija, las ventas fueron de 8,41 millones de euros, siendo la media
en su sector de 7,2 millones de euros y la varianza de 117,79. ¿En cuál de los dos sectores está mejor situada la empresa en
cuanto a su volumen de ventas? Razone la respuesta. ¿En qué unidades vendrá medida la varianza?
44) En un club de fútbol hay equipos que juegan en 3 categorías. Hay un 10% de jugadores que juegan en primera división,
un 30% en segunda y un 60% en tercera división. Se sabe que en la temporada 2007-08 el sueldo medio para los jugadores
de primera división fue de 500.000 euros al año, el de segunda división 300.000 € al año y para los de tercera 175.000 € al
año.
a) ¿Cuál fue el sueldo medio de los jugadores de todo el club?
b) Para la temporada 2008-09 se ha mantenido la plantilla de los trabajadores, pero se han negociado incrementos salariales
distintos para cada categoría. Se conocen sólo algunos aspectos de dicha negociación. El salario medio para el conjunto de la
empresa será exactamente de 250.000 € anuales. El incremento previsto para los de primera división será del 10%, y para los
de segunda un 8%. Tras conocer esta información los jugadores de tercera división deciden convocar una huelga indefinida
en tanto en cuanto no se revisen los incrementos salariales pactados ya que se consideran claramente desfavorecidos. Según
la información de que dispone ¿Estaría de acuerdo con la actitud de dichos jugadores? Justifique su respuesta.
45). Una empresa donde los salarios tienen un promedio de $450.000 . se solicita un reajuste mediante la siguiente fórmula:
Yi = (1.54 Xi + 85000 ) – Cuota sindical Cuota sindical : 3.5 %
La empresa acoge este arreglo pero quitándole a los salarios un 7.5% y
sumándole $50.000 para subsidio para becas
a. Calcule el nuevo salario promedio de hombres y mujeres si el salario promedio de hombres y mujeres antes del reajuste
era $ 550.000 y $ 350.000 respectivamente.
b. Con base en estos datos que porcentaje de hombres y mujeres empleadas en la compañía
c. Si la nómina cuesta $ 22.500.000 entonces cuántos empleados en total tiene la empresa?
46) Una alumna de primer curso de Economía, tras los exámenes de febrero, quiere saber en qué asignatura de las cursadas
en el primer cuatrimestre ocupa una mejor posición relativa según la nota obtenida. Para satisfacer su curiosidad dispone de
la siguiente información:
Determine en qué asignatura está situada en una mejor posición relativa.
36
Nota obtenida Nota media de
Asignaturas Desviación típica de las
por la alumna la asignatura
notas de la asignatura
Estadística 7,0 6,0
1,2
6,5 6,0
Matemáticas 1,7
6,0 5,0
Tª Económica 2,0
7,2 7,0
Contabilidad 1,4
8,5 7,5
Derecho Civil 2,1
9,0 8,0
Historia 1,3
Económica
37
38

Historia y Desarrollo de La Estadistica Tutoria 2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Historia y Desarrollo de La Estadistica Tutoria 2

Uploaded by

Copyright:

Available Formats

Historia de la Estadística

ETAPAS DE DESARROLLO DE LA ESTADÍSTICA:

1.- Primera Fase: Los Censos:

2.- Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:

3.- Tercera Fase: Estadística y Cálculo de Probabilidades:

Errores Estadísticos Comunes

3. Datos individuales y datos estadísticos

4. Estructura del dato

Variable Oficio Nivel de instrucción Cantidad de piezas Frecuencia cardiaca

Categoría o valor Electricista Secundaria completa 32 70

Unidad de medida ------------- ------------ Diente Pulsaciones por minuto

OTROS CAMPOS DE APLICACION

VALORES DE LA TENDENCIA CENTRAL

Medidas de apuntamiento: indican si la distribución es más o menos puntiaguda

JUSTIFICACION: La sociedad moderna se encuentra en la llamada era de la información. La cantidad de datos a

PASOS PARA UNA INVESTIGACION ESTADISTICA

Paso 8. PRUEBA PILOTO

UNIDAD I. ESTADISTICA DESCRIPTIVA.

b) TRATAMIENTO PARA DATOS NO AGRUPADOS.

 15.2  15.0  15.1  15.2  15.1  15.0

MATERIA NUMERO CREDITOS CALIFICACIÓN

( 8 x90.5 )  ( 10 x100.0 )  ( 8 x81.0 )  ( 10 x78.0 )  ( 4 x100 )  ( 8 x84.0 )

724  1000  648  780  400  672 4224

xmed = 11.3 cm.

Luego, xmod = 1.70m

Xmod1= 18 años , Xmod2= 19años

_ 18  18.286  12  18.286  .....  20  18.286  22  18.286

muestra (xi) y la media aritmética ( x ) de los datos y se determina de la siguiente manera:

Donde n es el número de datos en la muestra.

0.4356  7.6176  0.5476  10.4976  0.3136 19.412 2

C) TRATAMIENTO PARA DATOS AGRUPADOS.

Pasos para agrupar datos.

Rango = Valor mayor – Valor menor

Tamaño de muestra o No. De datos Número de clases

a. Determinar la amplitud de clase para agrupar (C).

d. Formar clases y agrupar datos.

6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00

a) Agrupe datos, considere k=6.

1. R= VM - Vm = 7.25 – 6.00 = 1.25

LI LS Frecuencia Marca de Límite real Límite real Frecuencia Frecuencia

OJIVA "MENOR QUE" O CRECIENTE

g) Desviación estándar (S).

( 6.075  6.713 )2 ( 2 )  ( 6.295  6.713 )2 ( 5 )  ...  ( 7.175  6.713 )2 ( 6 )

Presentamos a continuación algunas fórmulas indispensables en el cálculo de medidas de tendencia central y

Medida Datos sin agrupar Datos agrupados

Moda: Valor de la variable que tenga mayor n j 1

EJERCICIOS PARA RESOLVER:

a. Comente por qué éstos son datos cualitativos.

a. Elabore con ella una distribución de frecuencias relativas y

Tiempos en el cuarto de milla: 0.92 0.98 1.04 0.90 0.99

a. Calcule la media y la moda.

a. Construir la distribución de frecuencias de la variable Xi

15). Se tiene una distribución de 6 intervalos de amplitud A = 10 constante de la cual se sabe:

X5 =50 quinta marca de clase

18). En un conjunto de n valores de X se sabe que:

PUNTUACIÓN NÚMERO DE ESTUDIANTES

NIVEL DE GASTO (miles) Nº DE JÓVENES

a) Represente gráficamente esta distribución de frecuencias mediante un histograma.

34). Sea la distribución referida a beneficios anuales de 38 empresas de Cali:

Importe (€) Nº vehículos

Salarios (€) Nº empleados

a) ¿Puede considerarse representativo del conjunto de salarios el salario medio? ¿Porqué?

41 ) Se conocen los siguientes momentos de las distribuciones de frecuencias de las variables X e Y:

You might also like