You are on page 1of 108

Estadística

Aplicada
Conceptos y Ejercicios
a través de Excel

César Pérez
César Pérez lópez
Instituto de Estudios Fiscales (lEF)
Universidad Complutense de Madrid

Estadística
Aplicada
Conceptos y ejercicios
a través de Excel
Estadística Aplicada. Conceptos y Ejercicios a través de Excel

César Pérez l6pez

ISBN: 978-84-1545-205-8
IBERGARCETA PUBLICACIONES, S.L., Madrid 2012

Edición: l.'
Impresión: J.'
N," de páginas: 584
Formato: 17 x 24 cm

Materia CDU: Ciencia Estadística. Teoría de la estadística. 311

Reservados los derechos para todos los países de lengua española. De conformidad con lo dispuesto en el artículo 270 y siguien-
tes del código penal vigente, podrán ser castigados con penas de-multa y privación de libertad quienes reprodujeren o plagiaren,
en todo o en parte, una obra Iiteraría, artistica o científica fijada en cualquier tipo de soporte sin la preceptiva autorización. Nin-
guna parte de esta publicación, incluido el diseño de la cubierta, puede ser reproducida, almacenada o trasmitida de ninguna forma,
ni por ningún medio, sea éste electrónico, químico, mecánico, electro-óptico, grabación, fotocopia o cualquier otro, sin la previa
autorización escrita por parte de la editoríal. .

Dirijase a CEDRO (Centro Español de Derechos Reprográficos), www.cedro.org, si necesita fotocopiar o escanear algún fragmento
de esta obra.

COPYRIGHT © 2011 IBERGARCETA PUBLICACIONES, S.L.


info@garceta.es

Estadística Aplicada. Conceptos y Ejercicios a través de Excel

César Pérez l6pez


UNNERSiDAD NACIONAL DEL ALTIPLANO • PUNO
La edición, La impresión B¡~1I0TECA CEfJTRAL
AdEA DE If'iGENliERIAS
Ol: 227/2013
ISBN: 978-84-1545-205-8 Fecha Ingreso: "'1- O B - 2.0 {1f
Deposito Legal: M-9129-2012
Imagen de cubierta: © Krasser - Fotolia.com
N° 79;H14
Impresión: Print House, marca registrada de CopIar, S.A.

IMPRESO EN ESPAÑA - PRlNTED IN SPAIN

Nota sobre enlaces a páginas web ajenas: Este libro puede incluir referencias a sitios web gestionados por terceros y ajenos
a IBERGARCETA PUBLICACIONES, S.L., que se incluyen sólo con finalidad informativa, IBERGARCETA PUBLICACIO-
NES, S.L., no asume ningún tipo de responsabilidad por los daños y perjuicios derivados del uso de los datos personales que pueda
hacer un tercero encargado del mantenimiento de las páginas web ajenas a IBERGARCETA PUBLICACIONES, S.L., y del fun-
cionamiento, accesibilidad y mantenimiento de los sitios web no gestionados por IBERGARCETA PUBLICACIONES, S.L.,
directamente. Las referencias se proporcionan en el estado en que se encuentran en el momento de publicación sin garantías, expre-
sas o implícitas, sobre la información que se proporcione en ellas.
A quienes más quiero

Uaiv••.• iNlI ••• iN., ••• AaipIIn.


Unidad de e_m,,, htrtnwn5.1

Inv••••••••. ?~~ ....Ah ..$?!.,?'


Dependencla .(;3.. .-. ~y , .
CONTENIDO

Capítulo 1. Excel y la estadística. Entorno de trabajo 1

Introducción................................................................................................ 1
Estadística a través de Excel... ;...... 1
Entorno de Exce12010. Libros y hojas de cálculo 3
Introducción de datos y fórmulas 5
Series de datos. Autocompletar 9
Fórmulas...................................................................................................... 14
Barra de fórmulas :....................................... 15
Rellenar una hoja mediante una fórmula.................................................. 15
Operadores................................................................................................... 16
Orden de los operadores y preferencia de los operadores en las fórmulas.... 17
Tipos de operadores.................................................................................. 18
Fórmulas matriciales 19
Paleta de fórmulas........ 20
Rangos con nombre 20
Vinculación de libros................................................................................... 21
Crear una fórmula para calcular datos en otra hoja o en otro libro .. 21
Vínculo con otra hoja de cálculo en el mismo libro 22
Vínculo a una hoja de cálculo en otro libro.............................................. 22
Mostrar fórmulas y valores en una hoja de cálculo 23
Funciones de hoja de cálculo....................................................................... 24
Funciones anidadas dentro de funciones.... 25
Categorías de funciones en Excel 2010 26
Complementos en Excel y la Estadística..................................................... 30

Capítulo 2. Variables estadísticas y distribuciones de frecuencias........... 33

Variables estadísticas................................................................................... 33
Distribuciones de frecuencias y su finalidad 34
Interpretar las distribuciones de frecuencias 35
Formalizar las distribuciones de frecuencias............................................... 36
Representar distribuciones de frecuencias................................................... 38
Representaciones para variables cualitativas: diagramas de rectángulos,
diagramas de sectores y pictogramas.................................................... 39
Representaciones para variables cuantitativas sin agrupar: diagramas
de barras, en escalera y polígonos de frecuencias 41
Representaciones para variables cuantitativas agrupadas: histogramas
y polígono s de frecuencias simples y acumulados 42
Gráficos en Excel........................................................................................ 45
Excel y las distribuciones de frecuencias 49
r
VIII CONTENIDO

La función FRECUENCIA de Excel... 49


Distribuciones de frecuencias e histogramas con herramientas de
análisis de Excel. 51
Ejercicios resueltos...................................................................................... 54
Ejercicios propuestos................................................................................... 72

Capítulo 3. Medidas de posición, dispersión y forma................................ 75

Expresión cuantitativa de las distribuciones................................................ 75


Medidas de posición: media, mediana, moda, cuantiles, percentiles y momentos.. 75
Medidas de dispersión 81
Medidas de forma........................................................................................ 84
Análisis exploratorio de datos 87
Gráfico de simetría 88
Gráfico normal de probabilidad...... 89
Funciones de Excel para medidas de posición, dispersión y forma. 90
Medidas de posición, dispersión y forma con herramientas de análisis 98
Ejercicios resueltos 100
Ejercicios propuestos................................................................................... 121

Capítulo 4. Variable n-dimensional. Correlación y regresión. Tablas de


contingencia................................................................................................ 123

Distribuciones bidimensionales de frecuencias 123


Tabla de correlación, distribuciones marginales y distribuciones condicionadas. 123
Covarianza.. 126
Variables independientes............................................................................. 127
Coeficiente de correlación lineal entre dos variables. Regresión simple
mínimo cuadrática 128
Regresión parabólica 130
Regresión polinómica.................................................................................. 130
Regresión hiperbólica, potencial y exponencial.......................................... 131
Coeficiente de correlación por rangos 131
Distribuciones de más de dos dimensiones. Matriz de covarianzas y
matriz de correlaciones............................................................................ 132
Variables cualitativas: tablas de contingencia y distribuciones
marginales y condicionadas..................................................................... 134
Independencia y asociación de variables cualitativas: coeficientes 136
Funciones de Excel para correlación y regresión simple 139
Excel y los ajustes por regresión polinómica, logarítmica, exponencial
y potencial...... 148
Excel y la correlación múltiple con herramientas de análisis. 151
Correlación y matriz de correlaciones..................................................... 151
Covarianza y matriz de covarianzas 153
ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL IX

Excel y las tablas de contingencia mediante tablas dinámicas............. ....... 154


Excel y las tablas de contingencia para variables cualitativas................. 155
Excel y las tablas de contingencia para dos variables, una cualitativa
y otra cuantitativa 158
Excel y las tablas de contingencia para más de dos variables. 159
Excel y los contrastes de asociación e independencia. 161
Ejercicios resueltos...................................................................................... 166
Ejercicios propuestos................................................................................... 201

Capítulo 5. Números índices y medidas de concentración........................ 203

Números índices simples.................................................... 203


Números índices complejos no ponderados 204
Números índices complejos de precios no ponderados 206
Números índices complejos ponderados 207
Números índices complejos de precios ponderados 208
Números índices ponderados cuánticos o de producción...... 209
Propiedades de los números índices....... 210
Índices en cadena................................... 211
Cambio de base y enlaces de números índices............. 212
Deflactación de series estadísticas............................................................... 213
Participación y repercusión.... 213
Índices oficiales 214
Tasas de variación 217
Medidas de concentración 218
Índice de concentración de Gini .. 219
Curva de concentración de Lorentz 220
Ejercicios resueltos...................................................................................... 220
Ejercicios propuestos................................................................................... 241

Capítulo 6. Probabilidad y variables aleatorias discretas y continuas ..... 245

Concepto de probabilidad: Regla de Laplace 245


Probabilidad condicionada e independencia: teorema de Bayes 245
Variable aleatoria discreta y distribución de probabilidad de tipo discreto.... 247
Distribuciones discretas de una y dos dimensiones: características 248
Distribuciones binomial, de Poisson, geométrica e hipergeométrica 251
Distribución multinomial 253
Distribución hipergeométrica generalizada.......................... 254
Distribución uniforme discreta 255
Excel y las distribuciones discretas 255
Variables aleatorias continuas 258
Caracteristicas de las distribuciones continuas.......................................... 260
Variables aleatorias continuas bidimensionales. Independencia 260
Distribuciones continuas relevantes: normal, exponencial, X2, T, F, etc. 262
X CONTENIDO

Desigualdad de Tchebichev 266


Teorema central del límite y teorema de Moivre 266
Excel y las distribuciones continuas................................................................. 267
Ejercicios resueltos 270
Ejercicios propuestos 295

Capítulo 7. Estimación paramétrica e intervalos de confianza 297

Estimación paramétrica....... 297


Estimación puntual 299
Comportamiento asintótico de la media y varianza muestrales 301
La media y la varianza en el muestreo 302
Distribuciones en el muestreo de una población normal................................. 302
Distribuciones en el muestreo de la diferencia de medias y cociente de
varianzas en poblaciones normales 304
Estimación por intervalos 305
Intervalos de confianza para parámetros de poblaciones normales. 306
Intervalo de confianza para el parámetro p de una distribución binomial....... 307
Intervalo de confianza para el parámetro 'A de una distribución de Poisson 307
Intervalos de confianza para comparar poblaciones normales 309
Intervalo de confianza para la diferencia de parámetros Pi y P2 de dos
distribuciones binomiales 310
La función INTERV ALO.CONFIANZA de Excel......................................... 310
Intervalos de confianza en Excel con herramientas de análisis.... 311
Ejercicios resueltos 313
Ejercicios propuestos 329

Capítulo 8. Contrastes de hipótesis 331

Introducción a los contrastes de hipótesis 331


Fases para realizar un contraste de hipótesis 333
El concepto de p-valor 335
Relación entre intervalos de confianza y contrastes de hipótesis 336
Contrastes de hipótesis para poblaciones normales 337
Contrastes para los parámetros de las variables binomial y Poisson............... 338
Comparación de dos poblaciones normales con datos apareados.................... 339
Contrastes no paramétricos............................................................................... 342
Contrastes de independencia y asociación: contrastes del coeficiente
de correlación y medidas de asociación 342
Contraste chi-cuadrado de independencia........................................................ 344
Contrastes múltiples de homogeneidad: test de la X2 346
Contrastes de la bondad de ajuste: test de la chi-cuadrado 346
Contraste de Kolmogorov-Smimov de la bondad de ajuste 348
Contraste de normalidad de Shapiro y Wilks................................................... 350
ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL XI

Contrastes de normalidad de asimetría, curtosis y larque-Bera....................... 350


Contrastes de aleatoriedad: test de rachas y test de DanieL............................ 352
Funciones de Excel para el trabajo con contrastes de hipótesis............. 353
Contrastes de hipótesis mediante herramientas de análisis.............................. 354
Contraste T para diferencias de medias en poblaciones normales
suponiendo varianzas iguales y desconocidas 355
Contraste T para diferencias de medias suponiendo varianzas desiguales y
desconocidas................................................................................... 357
Contraste Z para diferencias de medias suponiendo varianzas conocidas ... 358
Contraste T para diferencias de medias en muestras pareadas con varianzas
desiguales y desconocidas 359
Contraste F para igualdad de varianzas 360
Ejercicios resueltos 362
Ejercicios propuestos 387

Capítulo 9. Análisis de la varianza 389

Modelos del análisis de la varianza y la covarianza 389


Modelo ANOV A con un solo factor. Efectos fijos y aleatorios 391
Modelo ANOVA con dos factores. Efectos fijos y mixtos 396
Modelo en bloques aleatorizados 402
Modelo ANOVA con tres factores 403
Modelo en cuadrado latino........ 404
Modelos ANCOV A de la covarianza simple :............................. 404
Modelo con un factor y un covariante........ 405
Modelo con dos factores y un covariante.... 405
Modelo con dos factores y dos covariantes 406
Excel y los modelos del análisis de la varianza............ 406
Análisis de la varianza unifactorial 406
Análisis de la varianza de dos factores con una muestra por grupo 408
Análisis de la varianza de dos factores con varias muestras por grupo... 410
Ejercicios resueltos...................................................................................... 412
Ejercicios propuestos................................................................................... 431

Capítulo 10. Modelo lineal de regresión múltiple..................................... 433

Modelo de regresión lineal múltiple............................................................ 433


Estimación del modelo lineal de regresión múltiple 434
Estimación del modelo, contrastes e intervalos de confianza a través
del cálculo matricial 435
Análisis de la varianza................................................................................. 437
Predicciones................... 440
Análisis de los residuos............................................................................... 441
Funciones de Excel para regresión múltiple................................................ 442
Excel y la regresión múltiple con herramientas de análisis.. 449
r

XII CONTENIDO

Ejercicios resueltos... 454


Ejercicios propuestos................................................................................... 497

Capítulo 11. Series temporales. Predicciones............................................ 499

Descomposición clásica de una serie temporal.. 499


Análisis de la tendencia de una serie temporal: métodos del ajuste analítico,
medias móviles y diferencias................................................................... 500
Variaciones estacionales: métodos de desestacionalización de la tendencia,
medias móviles y diferencias estacionales 504
Variaciones cíclicas 507
Predicción y suavizado de series temporales............................................... 509
Suavizado por medias móviles 509
Suavizado lineal de HoIL.. 510
Suavizado exponencial de Brown 510
Suavizado estacional de Winters 511
Excel y el análisis de la tendencia............................................................... 512
Medias móviles mediante líneas de tendencia.......... 514
Medias móviles mediante herramientas de análisis 515
Suavizado exponencial en Excel con herramientas de análisis 517
Ejercicios resueltos 519
Ejercicios propuestos................................................................................... 552

Capítulo 12. Programación lineal y optimizacián: Solver 555

Optimización de funciones y programación lineal con Solver.................... 555


Cuadro de diálogo Parámetros de Solver 559
Cuadro de diálogo Resultados de Solver...... 560
Resolución de sistemas de ecuaciones mediante Solver.............................. 561
Optimización y modelos de programación lineal con Solver...................... 562
Ejercicios resueltos 564
Ejercicios propuestos................................................................................... 572
CAPÍTULO 1

,
EXCEL y LA ESTADISTICA.
ENTORNO DE TRABAJO

INTRODUCCIÓN
La estadística es una materia en alza, en una época en la que los datos son un
activo muy importante y el análisis cuantitativo tiene aplicaciones muy relevantes en
diferentes campos de la ciencia como la economía, las finanzas, la ingeniería, la
matemática en general, la sociología, la psicología, la biología, la medicina, etc. Es
clave para empezar a trabajar en estadística, sea cual sea el campo en que se aplique,
la comprensión de los propios conceptos estadísticos, para posteriormente realizar la
operatoria matemática necesaria para desarrollarlos a través del software, que facilita
obtener los resultados de los procedimientos estadísticos de forma rápida y con
menos errores que cuando las operaciones se realizaban manualmente.

Este libro trata los temas elementales de la estadística desde una óptica
aplicada, pero a la vez formal. Se presentan coincenzudamente los conceptos,
intentando que sean inteligibles para lectores con formación diversa (ciencias, letras,
etc.) Las técnicas estadísticas se describen en lenguaje asequible, y se elimina el
problema de la operatoria tediosa matemática utilizando un programa tan sencillo y
disponible para todos como es Excel. Los capítulos se complementan con ejercicios
resueltos totalmente, tanto con su operatoria matemática habitual, como con el apoyo
del software, con la finalidad de facilitar al lector la comprensión de los conceptos.
También se proponen ejercicios cuya solución se aporta al lector en archivos Excel
disponibles en la página web de la editorial.

ESTADÍSTICA A TRAVÉS DE EXCEL


Excel es una plataforma de cálculo muy completa y dinámica. A través de
sus fórmulas y funciones predefinidas es posible tratar la mayoría de los temas del
campo estadístico, como pueden ser la estadística descriptiva, variables aleatorias
discretas y continuas, tablas de frecuencias para variables unidimensionales y
bidimensionales, independencia y relación entre variables, regresión y correlación,
variables cualitativas, tablas de contingencia y números índices.
2 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Asimismo, es posible trabajar con temas de cálculo de probabilidades como


las distribuciones de frecuencias, tanto discretas como continuas, leyes de
probabilidad, funciones de densidad, funciones de distribución, valores críticos y
otras características. También es posible abordar contenidos de estadística
matemática, como muestreo, intervalos de confianza, contrastes de hipótesis y
estimación paramétríca y no paramétrica. Excel permite asimismo el trabajo con
modelos estadísticos cuantitativos típicos como los modelos de regresión múltiple,
los modelos del análisis de la varianza, modelos de series temporales, modelos de
fiabilidad, etc.

Excel es también adecuado para trabajar en otras materias más específicas


como el control estadístico de calidad, análisis de datos, etc.

Excel implementa la mayoría de su capacidad a través de funciones


predefinidas de diferentes categorías entre las que se encuentran las funciones
estadísticas. Para ver las funciones de las distintas categorías, se hace c1ic sobre el
icono Insertar función ¡;. (Figura 1-1) de la barra de fórmulas (estando situados con
el cursor sobre una celda de la hoja que no contiene ya una fórmula).

Se obtiene la Figura 1-2, en cuyo cuadro Seleccionar una categoría se puede


elegir cualquiera de ellas, presentándose todas las funciones de cada categoría en el
cuadro Nombre de lafunción.

Se observa que una de las categorías es la relativa a funciones Estadísticas.


Elegida esta categoría, en el campo Nombre de la función de la Figura 1-2 vemos la
relación de funciones estadísticas que implementa Excel.

Fórmur",

Pegar <1
Po rte p"p... r.
04

A
1
2

Figura 1-1
CAPíTULO 1: EXCEL y LA ESTADíSTICA. ENTORNO DE TRABAJO 3

Insertar nción
ley

~uscar una función:


Estriba una breve descripción de lo que desea hacer y, a
continuación, haga dic en Ir
[ I[ 1

O seleccionar una g;tegoría: Estadísticas ..•.


Usadas recientemente .•.
Seleccionar una función: Todo ~
MEDIA.ACOTADA Financiera .•.
MEDIA.APJ-10 Fecha y hora
MEDIA.GEOM
MEDIANA
MIN
. .
r'latemáticas v triaonométricas

Búsqueda y referencia
~
D
MINA Base de datos
r"lODA.UNO Texto .•..
Lógica
COEF.DE.CORREl(matriz1; Información
Devuelve el coeficiente de ea Inaeniería .•..

Ayuda sobre esta función


I Aceptar
1I Cancelar
1

FIgura 1-2

Por otra parte, Excel también implementa determinados complementos para


ampliar el campo de trabajo en diferentes áreas. Uno de estos complementos lo
constituyen las Herramientas para análisis que se insertan en el grupo Análisis de la
ficha Datos de la cinta de opciones de Excel. Al final de este capítulo se muestra la
forma de utilizar estos complementos en Excel.

También existen otras herramientas adicionales como Solver, que permiten


trabajar en temas estadísticos como la programación lineal, optimización, etc.

ENTORNO DE EXCEL 2010. LffiROS y HOJAS DE CÁLCULO

Al iniciar Excel 2010 se observa su nuevo entorno de trabajo (Figura 1-3).


Destacan la Cinta de opciones con sus fichas y sus grupos de opciones en cada ficha,
la barra de herramientas de acceso rápido y la barra de estado con los botones de
visualización y el Zoom.

La Cinta de opciones presenta fichas orientadas a tareas que contienen


grupos lógicos de comandos (opciones). Se ha diseñado para encontrar fácilmente
los comandos necesarios para realizar tareas que antes estaban ocultos en complejos
menú s y barras de herramientas, y que ahora se agrupan de modo lógico en las fichas
Inicio, Insertar, Diseño de página, Fórmulas, Datos, Revisar y Vista.
4 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

En determinados grupos de las fichas de la Cinta de opciones aparecen


iniciadores de cuadros de diálogo, que son pequeños iconos que se sitúan en la parte
inferior izquierda del grupo y que abren cuadros de diálogo. Por ejemplo, el grupo
Fuente de la ficha Inicio en la Figura 1-3 presenta a su derecha un iniciador que abre
el cuadro de diálogo Formato de celdas con su pestaña Fuente seleccionada.

La Barra de herramientas de acceso rápido aparece de forma


predeterminada en la parte superior izquierda de la ventana de Excel (Figura 1-3) y
proporciona acceso rápido a herramientas que se utilizan con frecuencia.

Ficha
. Opción Grupo

,.
-.--c

l
o

Figura 1-3

La unidad de información en Excel es la Celda, cuya finalidad es alojar los


datos de Excel. Las celdas pueden contener números, texto, fórmulas, funciones, etc.

Una Hoja de cálculo u Hoja de trabajo (abreviadamente Hoja) es un


conjunto de celdas distribuidas en filas y columnas. Las hojas se utilizan para
introducir, mostrar y analizar datos. Si se crea un gráfico, éste podrá colocarse en la
hoja de cálculo con sus datos correspondientes o en una hoja de gráfico.

Un Libro de trabajo (abreviadamente Libro) es un conjunto de hojas


diferentes, que nonnalrnente están relacionadas entre sí. El libro corresponde al
concepto de archivo. Excel nombra por defecto las hojas del mismo libro como Hoja],
Hoja 2, etcétera. Los nombres de las distintas hojas del mismo libro aparecen en
etiquetas en la parte inferior de la ventana de la hoja de cálculo (Figura 1-3). Para
moverse de una hoja a otra, haga clic en las etiquetas de las hojas. En la línea superior
de la pantalla de entrada en Excel 2010 con todos sus elementos, tenemos la Barra del
título del libro y los botones de Windows.
CAPíTULO 1: EXCEl y LA ESTADíSTICA. ENTORNO DE TRABAJO 5

El título del libro es por defecto Libro 1, mientras no se guarde como archivo y
se le dé otro nombre. Los botones de Windows, que aparecen a la derecha de la barra
de título, se utilizan, respectivamente, para minimizar, maximizar y cerrar el libro de
Excel activo (libro de trabajo).

Pueden introducirse y modificarse los datos en varias hojas de cálculo del


mismo libro y pueden ejecutarse cálculos basándose en los datos de las distintas
hojas de cálculo del mismo libro simultáneamente.

El libro de trabajo se corresponde con el concepto de fichero o archivo de


datos de Excel, de modo que cuando se guarda el fichero actual, realmente se están
guardando todas las hojas del libro de trabajo actual en el fichero especificado. Un
libro de trabajo puede contener, además de una o más hojas de cálculo, una o varias
hojas de gráficos cuyo contenido puede ser cualquier tipo de gráfico representativo
de los datos contenidos en la hoja.

Los libros de trabajo ayudan a organizar los proyectos y a guardar los objetos
que estén relacionados entre sí en un mismo lugar. Excel permite dar nombre a las hojas
de cálculo, añadir nuevas hojas y eliminar hojas vacías o no utilizadas. Finalmente, cada
ventana de un libro de trabajo contiene barras de desplazamiento que se pueden utilizar
para pasar de una hoja de cálculo a la siguiente o para hacer desplazamientos de un lugar
a otro dentro de la hoja de cálculo activa.

Introducción de datos y fórmulas


Un dato se introduce en una celda seleccionando con el ratón o con el teclado
la celda donde se desea introducir el valor, tecleando el dato y pulsando Enter. Al
introducir el dato, éste aparecerá en la celda seleccionada y en la barra de fórmulas,
que se encuentra encima de la hoja de cálculo (Figura 1-4). La barra de fórmulas
hace las veces de espacio de edición. Si se comete algún error al introducir algún
dato muy largo, se podrá pulsar sobre la barra de fórmulas y utilizar el puntero de
inserción para localizar el error cometido y corregirlo, sin necesidad de escribir toda
la entrada otra vez (lo que aumentaría la posibilidad de cometer un nuevo error).
También se puede pulsar dos veces sobre la celda activa y mover el punto de
inserción dentro de la celda para editar la entrada.

Inicio roserter Fo

15,,613
o

Figura 1-4
6 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

A la izquierda de la barra de fórmulas se encuentra el botón Cancelar,


que sirve para descartar de la barra de fórmulas una entrada no deseada (si aún no se
ha aceptado pulsando Enter), y un botón Aceptar, ':J, que hay que pulsar para aceptar
o «introducir» una entrada que ya se ha comprobado.

Un valor numérico puede ser un entero (como 32), un número decimal (como
499,95), una fracción entera (como 10 3/4), o un número en notación científica
(como 4,09 E+ 13). En los números, se pueden utilizar símbolos matemáticos, como
el símbolo de suma (+), el de resta (-), el de tanto por ciento (%), fracciones (1) y
exponenciales (E). Asimismo, es posible utilizar el símbolo de dólar ($). Si se
introduce un número demasiado grande como para ser presentado en una celda, Excel
mostrará el número en notación científica o mostrará ####### en la celda, para
advertirle de que necesita incrementar el ancho de la misma.

De todos modos, Excel siempre guarda internamente el número que se ha


introducido, y este valor subyacente se podrá ver en la barra de fórmulas cuando la
celda esté activa. Por defecto, los valores numéricos son siempre alineados a la
derecha de la celda.

Cuando se introduce más de un número, después de haber introducido el


primero se pueden utilizar las teclas de flecha (o teclas de dirección) para desplazarse a
una nueva celda e introducir el siguiente número. Por ejemplo, si se escribe un número y
se pulsa la tecla de flecha hacia abajo, el puntero de celda se desplazará una línea hacia
abajo. Las teclas de flecha hacia la izquierda, hacia arriba y hacia la derecha hacen que
se mueva el puntero una celda a la izquierda, hacia arriba y hacia la derecha,
respectivamente.

En Microsoft Excel, un número puede tener sólo los siguientes caracteres: O


1 2345 67 8 9 + - ( ) , / $ % . E e. Por otra parte, Excel ignora los signos más (+) a
la izquierda, y trata a los puntos como separadores de miles oseparadores decimales
(igualmente las comas). Todas las demás combinaciones de números y caracteres no
numéricos son consideradas texto. Para evitar introducir una fracción como fecha,
coloque un cero (O) delante de cada fracción; por ejemplo, escriba O 1/2. Delante de
los números negativos, sitúe un signo menos (-), o bien encierre los números entre
paréntesis ( ). Dentro de una celda, todos los números se alinean a la derecha por
defecto (si no se produce la alineación al pulsar Enter o TAB, el número está mal
escrito).

Para cambiar la alineación, seleccione la celda o celdas que contienen los números
a cambiar. En la ficha Inicio haga clic en la flecha situada a la derecha de Número y en la
pantalla Formato de celdas elija la ficha Alineación y, a continuación, seleccione las
opciones que desee (Figura 1-5). El formato de número aplicado a una celda determinará el
modo en que Excel presentará los números en una hoja de cálculo.
CAPíTULO 1: EXCEl y lA ESTADíSTICA. ENTORNO DE TRABAJO 7

Si escribe un número en una celda que tiene formato de número General, Excel
podrá aplicarle un formato de número diferente; por ejemplo, si escribe 14,73 $, Excel
aplicará un formato de moneda. Para cambiar el formato de número, seleccione las celdas
que contengan los números y, a continuación, en la ficha Número podrá seleccionar una
categoría y un formato (Figura 1-6).

~~:

~"'""~"~;;l~·

'Ii~
~fI

±:

F~--
e~decJnaIes:12
''''''
HM. rJ!,ls.Mseparadordemiles(.)
Por~~]e
IFrKÓÓn
'lCie!'1tib

I~
Two

'1
De: do!retm a il~da
I
orecdón dellextD:
ICoo~X'" H '1
'---- __

"'.-ala preser.tlIóónde
.1
.c.J L-
ntrnerO$ en general. Para dar formatrl a ",ab-~IIlOt'le!ilflOS1JI:ia,
~
fom\atosóe
~yo:r.tabidad.

Figura 1-5 Figura 1-6

En las celdas que tengan predeterminado el formato de número General, Excel


presentará los números como enteros (789) o fracciones decimales (7,89), o bien en
notación científica (7,89E+08) en caso de que el número sea más largo que el ancho de
la celda. El formato General presenta hasta un máximo de 11 dígitos, incluyendo un
separador decimal y caracteres tales como "E" y "+". Para utilizar números con más de
11 dígitos, podrá aplicar un formato de número científico integrado (notación
exponencial), o bien un formato de número personalizado. Independientemente del
número de dígitos presentados, Excel guarda números con una precisión de hasta 15
dígitos. Si un número contiene más de 15 dígitos significativos, Excel convertirá los
dígitos adicionales en ceros (O). También almacena los números como datos numéricos
aun cuando se utilice la pantalla Formato de celdas para aplicar el formato Texto a las
celdas que contienen los números. Para que Excel interprete los números como parte de
un texto, primero debe aplicarse el formato Texto a las celdas vacías y, a continuación,
introducir los números. Si ya se han introducido los números, aplique el formato Texto
a las celdas, haga clic en cada una de las celdas, presione F2, y por último presione
Enter e introduzca de nuevo los datos.

Para introducir texto en una celda, seleccione la celda donde desea


almacenar el texto, introduzca el texto (si quiere que un número, una fecha o una
hora se almacene en formato texto, deberá hacerlo preceder de una comilla simple), y
pulse Enter o TAB, o bien seleccione una nueva celda para introducir un nuevo
texto.
8 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Para introducir una fecha o una hora en la hoja de cálculo, se puede utilizar
cualquiera de los formatos de fecha y hora predefmidos, de manera que sea posible dar
formato al valor con la Formato de celdas. Para introducir una fecha o una hora,
seleccione la celda donde desea almacenarla, introduzca la fecha o la hora en uno de los
formatos válidos y pulse Enter o TAB, o seleccione una nueva celda para introducir otro
valor.

Para introducir una hora según el horario de 12 horas, escriba un espacio y, a


continuación, a o p detrás de la hora (por ejemplo, 9:00 p.); de lo contrario, Microsoft
Excel introducirá la hora como a.m. Para introducir la fecha del día actual, presione
CTRL+; (punto y coma). Para poner la hora actual, presione CTRL+MAYÚS+: (dos
puntos).

En la tabla siguiente se muestran los formatos de hora y fecha más comunes


en Excel, y en la Figura 1-7 se muestra un ejemplo de cada uno.

Formato Patrón Eiemplo


Fecha mldlaa 10/1/99
Fecha d-rnmm-aa 1-0ct-99
Fecha d-rnmm 1-0ct
Fecha mmm-aa Oct-99
Hora h:mmAMIPM 10:15 am
Hora h:mm:ss AMlPM 10:15:30 pm
Hora h:mm 22:15
Hora h:mm:ss 22:15:30
Hora mm:ss.O 15:30.3
Combinación Mldlyy h:m 10/1/99 22: 15

A B C D E l.
1

J
..2- Fechas ___ .. Horas Combinado
3 ._--_~.
4 10101/1999 I 101D1/199922:15
.
10:15 a.m.
5 10-ene-99 10:15:00
6 10-ene 15:00,0
7
8
ene-99 10:15 p.m,
"':;:

I
9
,. < • "\Ho·al¡~2..I J.!J L.
I . 'A<' f~..t1f1
Figura 1-7

Para escribir números con un separador de decimales fijo, haga c1ic en Archivo
--+ Opciones. Pulse en Avanzadas y, a continuación, en Opciones de edición, active la
casilla de verificación Insertar automáticamente un punto decimal (Figura 1-8). En el
cuadro Posiciones decimales, escriba un número positivo para los dígitos situados a la
derecha del separador de decimales o un número negativo para los situados a la izquierda
del separador. Por ejemplo, si escribe 3 en el cuadro Posiciones decimales y,
posteriormente, 2834 en la celda, el valor será 2,834.
CAPíTULO 1: EXCEl y LA ESTADíSTICA. ENTORNO DE TRABAJO 9

Si escribe -3 en el cuadro Posiciones decimales y, a continuación, 283, el valor


será 283000. En la hoja de cálculo, haga c1ic en una celda y escriba el número deseado.
Esto no afectará a los datos que haya indicado en las celdas antes de seleccionar la
opción Número fijo de decimales. Para anular temporalmente la opción Número fijo de
decimales, especifique un separador de decimales al escribir el número. Se pueden elegir
los caracteres para separar decimales y miles con las opciones Usar separado res del
sistema, Separadores de decimales y Separadores de miles de la Figura 1-8.

Opciones de Ixcel

G~neral
~ Opciones avanzadas para trabajar con Excel.
FOfmula~

Revisión

~ Después de presionar Entrar, mo.ver seltCCiO!D

Idioma
Dirección: IH2Icia abajo l.}
Fil Insetter eutcméttramente un punto 4fcimal
Avanzadas
I'--------~ ~_~ fosieiones dtdmale~
Pencneüzer cinta de cpncnes ~ Perm.ltir arrastrar~ colocar el controlador de rellene y las celdas

Barra de herramientas de acceso. rápido


Yl Mensaje de alerta antes de reemplazar cercas
~ Permrtir ~ditar directamente en JiU celdas
Complementos Extendfrformalos de rangos de datos y fórm!.llas
~ Habilitar la inserción automática de porcentajes
Centro de confianza
~ !::1abilítar Autocompleti5r para veteres de: celda
~ Hacer ¡oom al usar la rueca de InttlliMouse
~ Avisar al vsueno cuando haya una operación gue requiere mucho tiempo
Cuando este número de: celdas (en miluj se:vean a!edadar. ¡33.554 tnl
~ Usar stparadore~ de:! ststema
Separa20r de dtomales; D
Separecor de: mile:s: D
Movimie:nto del cursen
@ lógico
e Yisual
Cortar,cop;. y ~ar

Fi] MOluar botón Opciones de: P"tgado al pegar contenido


~ Mostrar Qotone:s de: opciones de: msercón
~ Cortar, copiar 1:ordenar Objetos junto con celdas principale-s

Tamaooy caüded de ta imagen lfIJ libro! I.~I

Figura 1-8

Series de datos. Autocompletar


Excel facilita la tarea de introducir datos en la hoja de cálculo, permitiendo que un
rango de celdas se pueda llenar con un mismo valor o con una secuencia de valores,
denominada serie. Esta característica ahorra tiempo a la hora de introducir números o
fechas en un informe. Por ejemplo, se puede repetir el mismo precio en varios
productos dentro de un informe, o crear números que se incrementen de una manera
previsible. Es posible rellenar varios tipos de series seleccionando celdas y
arrastrando el controlador de relleno, o bien vía menú.
10 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Al arrastrar el controlador de relleno (Fill Handle) de una celda, se puede


copiar el contenido de una celda en otras celdas de la misma fila o columna.

Para copiar datos dentro de una misma fila o columna, seleccione las celdas
que contengan los datos que desee copiar (Figura 1-9), arrastre el controlador de
relleno sobre las celdas que desee rellenar (Figura 1-10) y, a continuación, suelte el
botón del ratón. De este modo, reemplazará los valores o las fórmulas existentes en
las celdas que rellene y se copiará el formato (Figura 1-11).

F1 F1
F wÍ F
1 1 1 1
2 2 2 2
3 3. 3 3
4 4 4
5 -t-:
+ 5 5
6 6 6
7 7 1-
)
S
9
8
9
si]
..9. _9
.o .0-'

Figura 1-9 Figura 1-11

Si una selección contiene números, fechas o un período de tiempo, se podrá


extender la serie de forma automática. Para ello, seleccione la primera celda del
rango que desee rellenar e introduzca el valor inicial de la serie. Para incrementar la
serie en una determinada cifra, seleccione la siguiente celda del rango e introduzca el
elemento siguiente de la serie (Figura 1-12). La diferencia entre los dos elementos
iniciales determinará la cifra de incremento de la serie. A continuación, seleccione la
celda o las celdas que contengan los valores iniciales de la serie (Figura 1-13) y
arrastre el controlador de relleno sobre el rango que desee rellenar (Figura 1-14).
Para rellenar en orden ascendente, arrastre hacia abajo (Figura 1-15) o hacia la
derecha. Para rellenar en orden descendente, arrastre hacia arriba o hacia la izquierda.

G G G __ 1 G ~
1 5 1 5 5
2 B 2 8.
¡-:~Hl?'-- ~
3
4
5
it
5
3
4
5
11
14
17
6 6 6 20.
7 7 7
B 8

Figura 1-12 Figura 1-13 Figura 1-14 Figura 1-15

También es posible especificar el tipo de serie de relleno utilizando el botón


secundario del ratón para arrastrar el controlador de relleno sobre el rango y después
hacer c1ic en el comando adecuado del menú contextual de la Figura 1-16. Por ejemplo,
si el valor inicial es la fecha ENE-2002, haga c1ic en Rellenar meses para obtener la
serie FEB-2002, MAR-2002, etc. También puede hacer c1ic en Rellenar años para
obtener la serie ENE-2003, ENE-2004, etc.
CAPíTULO 1: EXCEl y lA ESTADíSTICA. ENTORNO DE TRABAJO 11

x
Pe~ar
~.
<:1 : Fu:,nte Alin~:ción ¡ Nú~ero ¡ Ert~loS

portepenetes Ti I I
A2
A D E
1
_.
__l.__
...
_L
- I--=-_~+
2. ene-02
1i-=3'-J..._.....:..;f e;;.;;b;..;-0;;:;2
"--
4 ~.

5 O !::opiar celdas

~er¡e de relleno
~ ~
O Rellenar formatos: sólo
g 1-------:1
9 O Rellenar sin f.Qrmato
la O Rellenar Qías

11 O< ReJlen-ªr días de la semana


12 O Rellenar meses

,!3 •• >1 Ho'a O BeJlenar años

Promedio: ene-02 Recuento: 2

Figura 1-16

Para rellenar celdas con una serie específica de datos (progresiones


aritméticas, geométricas, etc.), se tendrá en cuenta 10 siguiente:

• En la ficha Inicio, en el grupo Modificación, haga c1ic en Rellenar y, a


continuación, en Series (Figura 1-17).

• En Tipo (Figura 1-18), haga c1ic en una de las opciones siguientes:

o En Lineal para obtener una serie en Filas o Columnas que se calcula


agregando el valor del cuadro Incremento a cada valor de celda hasta
llegar al Límite. Se obtiene la serie de la Figura 1-19.

o En Geométrica para crear una serie que se calcula multiplicando el


valor del cuadro Incremento por cada valor de celda.

o En Cronolágica para crear una serie que rellena valores de fecha


incrementalmente por el valor del cuadro Incremento y que depende
de la unidad definida en Unidad de tiempo.

o En Autorrellenar para obtener una serie que produce los rrusmos


resultados que arrastrar el controlador de relleno.
12 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

La función Autorrellenar se puede suprimir manteniendo presionada la tecla


CTRL mientras se arrastra el controlador de relleno de una selección de dos o más
celdas. Los valores seleccionados se copian en las celdas adyacentes y Excel no
extiende una serie.

Ubrol - Microsoft Excel

101do Inseffilr Diseño de pagina Datos aeeaer Vista .szrceet

(allbri •. 11 •. A- A"
General •. __ ~ Formato ,ondidonal •. ~""Jmertar. 1:. W
1!iJ •. % 000 ~DarfOfma1ocomotabla" Si"Eliminar" ; •. Z
~ Eshlos de celda'" I!l Pcrmetc • !lr.:riI::---OH~'~-"-l!.~jO~---'
Estilos Cerdas i¡[!l
11l=====o::B=2==¡==.=(~===~====================l' EilH.d •• rribe
r=~A~~ __ ~~~~C~ __ ~D~ __ ~~~~~ G~~ __ ~H~ __ ~ __ ~~
Qtras hO)!l.

~tlies...

ustc

Figura 1-17

o F G H
o \ E

I
Topo WdMde_

~~al
C) ~ometr¡ca
@Fe<ha
iJ Día leborabte
~l
.-~ .._.~ --+
o C,o.noIóoia ,..,.~ I+--
4!
---+-____ --i
!f) AutD(rell=o- Año
7
Drondencia
'aaemento, ¡r::"'------'I t.irn~lID! 10
A="', 1 i canc"",

Figura 1-18 Figura 1-19

También es posible rellenar una serie para una tendencia lineal de ajuste.
Para ello, seleccione al menos dos celdas que contengan los valores iniciales de la
tendencia (para aumentar la precisión de la serie, seleccione valores iniciales
adicionales), y arrastre el controlador de relleno en la dirección que desea rellenar
con valores superiores o inferiores; por ejemplo, si los valores iniciales seleccionados
en las celdas C 1:E 1 son 3, 5 Y 8, arrastre el controlador de relleno hacia la derecha
para rellenar con valores superiores, o hacia la izquierda para rellenar con valores
inferiores. Para controlar manualmente la creación de la serie, utilice la pantalla
Series de la Figura 1-20 para fijar la tendencia lineal.
CAPíTULO 1: EXCEl y lA ESTADíSTICA. ENTORNO DE TRABAJO 13

Series

Series en "reo Unidad de tiempo

@ Blos @ Llneol @Fecha


O !;;oIumnos <B §eomébica Día laborable
([) CrQf101ógic:a Mes
Auto{reJlenar Año

EJrendend.

~cr~m: ~'D~ ~~'~~=·~·~::~'~======~I


I! J
Aceptar Cancel ••r

Figura 1-20
Por otra parte, también se puede rellenar una serie para una tendencia
geométrica. Para ello, seleccione al menos dos celdas que contengan los valores
iniciales de la tendencia, presione el botón secundario del ratón y arrastre el controlador
de relleno en la dirección que desea rellenar con valores superiores o inferiores; por
ejemplo, si los valores iniciales seleccionados en las celdas B2:C2 son 3 y 6, arrastre el
controlador de relleno hacia la derecha para rellenar con valores superiores o hacia la
izquierda para rellenar con valores inferiores. Suelte el botón del ratón y haga c1ic en
Tendencia geométrica en el menú contextual. Para controlar manualmente la creación
de la serie, utilice la opción Geométrica de la pantalla Series (Figura 1-20).
Si no desea que las entradas que escriba se completen automáticamente, puede
desactivar esta opción. Para ello, haga c1ic en Archivo ----)-Opciones. Para activar o
desactivar la finalización automática de valores de celda, haga c1ic en Avanzadas y, a
continuación, bajo Opciones de edición, active o desactive la casilla de verificación
Habilitar Autocompletar para valores de celda (Figura 1-21). Excel completará las
entradas sólo cuando el punto de inserción esté al fmal del contenido de la celda activa.
Excel basa la lista de entradas posibles de Autocompletar en la columna que contiene la
celda activa. Las entradas que se repiten en una fila no se completan automáticamente.
Opciones de Ixcel

'1 General
~ Opciones avanzadas para trabajar con Exce!.
1 Fórmulas

Rwslon Opciones de edi<ión

Guardar !1J Después de presionar Entrar, mover selección

Idioma
DIrección! ! Hacia abajo [ ..,. J
tEJ Insertar autcméticemente un punto gecimal
I Avan:ad.3s fosiciones deCImales.: ~
renenatízar cinta de opciones ~ Permitir arrastrar X (OIOCDrel controlador de rettenc y las celdas

Barra de herramientas de acceso rapido


ri! Mensaje de alerta antes de reemplazar celdas
~ Permitir tditar directamente en las celdas
Complementos ~ Extender formatos de rangos de datos y fórmulas
~ Habilitar la inserción automática de porcentajes
Centro de confianza
~ ,tlabilitar Autocomp!etar para valores de celda

Aceptar 1 I Cancelar 1

Figura 1-21
14 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

FÓRMULAS
Las fórmulas se sitúan en las celdas de la hoja de cálculo y suelen ser
ecuaciones matemáticas precedidas de un signo igual que hallan nuevos valores a
partir de otros situados en las celdas de la hoja o que generan sus propios valores
nuevos. Por ejemplo, se puede utilizar una fórmula para calcular el coste total de un
producto sumando su precio, los impuestos y el coste del transporte. Las fórmulas
contienen números, operadores matemáticos, referencias a celdas y ecuaciones ya
creadas que se denominan funciones. Una de las grandes características de Excel es
la numerosa colección de potentes funciones que pone a su disposición. Para
introducir una fórmula simple en una celda de la hoja de cálculo, se tendrán en
cuenta los siguientes pasos:

• Haga clic en la celda en que desee introducir la fórmula.

• Escriba un signo igual (=), con lo que inmediatamente aparece la barra de


fórmulas de la parte superior de la Figura 1-22. (Si hace clic en el icono Pegar
funcián ¡;. en la barra de fórmulas, Microsoft Excel insertará un signo igual en
la celda).

• Introduzca la fórmula. A medida que se escribe la fórmula en la celda,


también aparece en la parte derecha de la barra de fórmulas (Figura 1-22).

• Presione ENTRAR.

Barra de fórmulas

I'~ I g rI!'J. • l. librol· Microsoft Exc.'

• ln¡d I Inse Dlsf Fón Dat· Revi I Vist 1 Acr< < a: O t::l @ ~

Ú ;.
Pegar
1 ~_
Fuente
I i;'
Alineación
.'V~ L~
Número Estilos
l~
Celdas
L:~:
partapap'l~ r;¡ i . I I . l' Modificar

A B e D E =
mf~"':~'-i~'----'-=P-R-OM-E-D")'P-jjA2:A81---
•!t-
si
----
- IPROMEDIO(númerol;
-- ..-....---
[número2]; •..) 1-
1
T
==1
l~. ~~

6 T
I~ • > >Ii Hola! ÁHoía2 Hoia3 ~Il~ ! UII r ~
Modificar 111m Ib!l~ .~ílQ~ \: ~4~ "" ._

Figura 1-22
CAPíTULO 1: EXCEl y LA ESTADíSTICA. ENTORNO DE TRABAJO 15

Barra de fórmulas

Se trata de una barra situada en la parte superior de la ventana de Excel (Figura


1-22) que se utiliza para introducir o modificar los valores o las fórmulas de las celdas
(o los gráficos). La barra de fórmulas muestra en todo momento el valor constante o la
fórmula almacenada en la celda activa. Se puede mostrar u ocultar la barra de fórmulas
haciendo clic en la opción Barra defórmulas del menú Vista (Figura 1-23).

El botón SUMA .•. ,situado a la izquierda de la barra de fórmulas en la


Figura 1-22 (siempre y cuando estemos escribiendo una fórmula), despliega una lista
de funciones al presionar sobre 3, que pueden ser seleccionadas para formar parte de
una fórmula en la celda activa haciendo clic con el ratón sobre ellas (Figura 1-24).

El botón X cancela la introducción o modificación del dato que se ha estado


escribiendo en la celda. El botón = acepta el dato que se ha estado escribiendo en la
celda, añadiéndolo a la hoja de cálculo activa. El cuadro =SUMA(D8:D14) muestra la
fórmula situada en cualquier celda de la hoja al colocamos sobre esa celda. También
este cuadro va mostrando una fórmula a medida que se escribe sobre una celda.

Librol - Mícrosoft Excel SUMA


SUMA e o
PROMEDIO
Datos Revisar -00

'--------{ ~IIPERVINCUlO

~ Barra de fórmulas
CONTAR
MAX
SENO
-I +

~ Titules Zoom 100% Ampliar ISUMAR.SI


selección ' PAGO
DESVEST Hoa3
ar Zoom bM~á~sf~un~c~;o~ne~s~"'
-b================~
Figura 1-23 Figura 1-24

Una vez que se ha escrito una fórmula en una celda y se pulsa ENTRAR, en
dicha celda aparece el resultado de la fórmula y ya no la propia fórmula. Para volver a
ver la fórmula situada en una celda, habrá que situarse sobre ella, con lo que la fórmula
que contiene aparecerá en la parte derecha de la barra de fórmulas (Figura 1-25).

Al ~ ~.~ Ix] =SUMA(DS:D14}

A B e D I

1 I 7!__ , -
2 1 I
Figura 1-25

Rellenar una hoja mediante una fórmula


Es posible rellenar un rango de una hoja de cálculo de Excel de forma
rápida utilizando una fórmula. El proceso que se tendrá en cuenta es el siguiente:
16 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

• Seleccione la primera celda del rango que desea rellenar y especifique la


fórmula de inicio de la serie.

• Con la celda que contiene la fórmula para el inicio seleccionada (Figura 1-


26), arrastre el controlador de relleno sobre el rango que desee rellenar (Figura
1-27).

• Se reemplazarán los valores o las fórmulas existentes en las celdas que rellene.

• Si desea borrar el contenido de un rango de celdas, selecciónelo y arrastre el


controlador de relleno de nuevo sobre el rango.

Al • l- ¡;,J ;SUMA{Bl:El)

A e D

1 c==Y! 4 .~ ~__ .

!j
-
5
_6 _
4 7

Figura 1-26 Figura 1-27

OPERADORES
Una fórmula es una ecuación que realiza operaciones con los datos de una hoja
de cálculo. Las fórmulas pueden realizar operaciones matemáticas, como suma y
multiplicación, o pueden comparar los valores de una hoja de cálculo o combinar texto.
Las fórmulas pueden hacer referencia a otras celdas en la misma hoja de cálculo, a celdas
en otras hojas de cálculo del mismo libro o a celdas en hojas de otros libros. En el
siguiente ejemplo (Figura 1-28), se suma el valor de la celda B4 y 25 y, a continuación,
el resultado se divide entre la suma de los valores de las celdas D5, E5 YF5.
Referencia de celda
Constante numérica

I 1,
= (B4 +25)/SU MA(D5 :F5)
I Funci~n de la hoja de cálculo

~ferencia del rango


I Operador de división
I Operador de suma

Figura 1-28

Las fórmulas calculan los valores en un orden específico. Las fórmulas de


Microsoft Excel siempre comienzan por un signo igual (=). El signo igual le indica a
Excel que los caracteres siguientes constituyen una fórmula. Detrás del signo igual
están los elementos que se van a calcular (los operandos), que están separados por
operadores de cálculo. Excel calcula la fórmula de izquierda a derecha, según el
orden específico de cada operador de la fórmula. El orden de los operadores se puede
cambiar mediante paréntesis.
CAPíTULO 1: EXCEl y lA ESTADíSTICA. ENTORNO DE TRABAJO 17

En el siguiente ejemplo: =(B4+25)/SUMA(D5:F5), los paréntesis que rodean


la primera parte de la fórmula indican a Excel que calcule B4+25 primero y, después,
divida el resultado de la suma de los valores de las celdas D5, E5 y F5.

Orden de los operandos y preferencia de los operadores en las fórmulas


La estructura o el orden de los elementos de una fórmula determinan el
resultado fmal del cálculo. Las fórmulas en Microsoft Excel siguen una sintaxis
específica, u orden, que incluye un signo igual (=) seguido de los elementos que van a
calcularse (los operando s), que están separados por operadores de cálculo. Cada
operando puede ser un valor que no cambie (un valor constante), una referencia de celda
o de rango, un rótulo, un nombre o una función de la hoja de cálculo. )

Excel realiza las operaciones de izquierda a derecha, siguiendo el orden de


precedencia de los operadores, comenzando por el signo igual (=).

Puede controlar el orden en que se ejecutará el cálculo utilizando paréntesis


para agrupar las operaciones que deben realizarse en primer lugar; por ejemplo, la
siguiente fórmula: =5+2*3, da un resultado de 11 porque Excel calcula la
multiplicación antes que la suma. La fórmula multiplica 2 por 3 y, a continuación,
suma 5 al resultado. Por el contrario, si se utilizan paréntesis para cambiar la sintaxis:
=(5+2)*3, Excel sumará 5 y 2 y, a continuación, multiplica el resultado por 3,
obteniéndose 21.

Si se combinan varios operadores en una única fórmula, Microsoft Excel


ejecutará las operaciones en el orden que se indica en la tabla que se muestra a
continuación. Si una fórmula contiene operadores con el mismo orden de precedencia
(por ejemplo, si una fórmula contiene un operador de multiplicación y otro de
división), Excel evaluará los operadores de izquierda a derecha. Para cambiar el
orden de evaluación, escriba entre paréntesis la parte de la fórmula que se calculará
en primer lugar.

Operador Descripción
: (dos puntos)
(un espacio) Operadores de referencia
, (coma)
- Negación (como en -/)
% Porcentaje
" Exponente
*y/ Multiplicación y división
+ y- Suma y resta
& Conecta dos cadenas de texto (concatenación)
= < > <= >= <> Comparación
18 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Tipos de operadores

Los operadores especifican el tipo de cálculo que se desea realizar con los
elementos de una fórmula. Microsoft Excel incluye cuatro tipos diferentes de
operadores de cálculo: aritmético, comparación, texto y referencia.

Operadores aritméticos. Para ejecutar las operaciones matemáticas básicas


como suma, resta o multiplicación, combinar números y generar resultados
numéricos, utilice los siguientes operadores aritméticos:

Operador aritmético Significado Ejemplo


+ (signo más) Suma 3+3
Resta 3-1
- (signo menos)
Negación -1
* (asterisco) Multiplicación 3*3
/ (barra oblicua) División 3/3

% (signo de porcentaje) Porcentaje 20%

" (acento circunflejo) Exponente 3"2 (el mismo que 3*3)

Operadores de comparacion. Se pueden comparar dos valores con los


siguientes operadores. Al comparar dos valores con estos operadores, el resultado es
un valor lógico, bien VERDADERO, bien FALSO.

Operador de comparación Significado Ejemplo


= (igual) Igual a AI=BI
> (mayor que) Mayor que AI>BI
< (menor que) Menor que AI<BI
>= (mayor o igual que) Mayor o igual que AI>=BI
<= (menor o igual que) Menor o igual que AI<=BI
<> (distinto) Distinto de AI<>BI

Operador de concatenación de texto. Utilice el signo "&" para unir o


concatenar una o varias cadenas de texto con el fin de generar un solo elemento de
texto.

Operador de texto Significado Ejemplo


Conecta o concatena dos valores
"Viento" & "norte" genera "Viento del
& ("y" comercial) para generar un valor de texto
norte"
continuo
CAPíTULO 1: EXCEl y LA ESTADíSTICA. ENTORNO DE TRABAJO 19

Operadores de referencia. Combinan rangos de celdas para los cálculos con


los siguientes operadores:

Operador de
Significado Ejemplo
referencia
Operador de rango que genera una
: (dos puntos) referencia a todas las celdas entre dos B5:B15
referencias, éstas incluidas
Operador de unión que combina varias
, (coma) SUMA(B5:B 15,D5:D 15)
referencias en una sola

Fórmulas matriciales

Las fórmulas matriciales actúan en dos o más conjuntos de valores


denominados argumentos matriciales. Cada argumento matricial tiene el mismo
número de filas y de columnas. Las fórmulas matriciales se crean del mismo modo
que las demás fórmulas, excepto que para ejecutarlas se debe presionar la
combinación de teclas CTRL+MAYÚS+ENTRAR. La hoja de cálculo de la Figura 1-
29 muestra el cálculo de la inversa de una matriz. Los pasos que se tendrán en
cuenta para introducir una fórmula matricial son los siguientes:

• Si la fórmula matricial devuelve un único resultado, haga clic en la celda en


que desee introducirlo (por ejemplo, para el cálculo de un determinante). Si
la fórmula matricial devuelve varios resultados (por ejemplo, la inversa de
una matriz), seleccione el rango de celdas en que desee introducirlo.

• Escriba la fórmula matricial.

• Presione CTRL+MAYÚS+ENTRAR.

SUMA T (- X ../ fx ~ =MINVERSA(B3:05)

A B f
C o E F I G H
.2c
.2,
[~- r-
I
1 _. __ ~] ___ - I=MINVERSA(B3:0S l J
12
~ i-- - -- -

·1 ·3
~6 -

Figura 1-29

Después de introducir una fórmula matricial, Microsoft Excel inserta de


forma automática la fórmula entre llaves ({}) y ofrece el resultado (Figura 1-30).
20 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

!f;]¡ Q lI!) •. N,,, ,,;, librol - MkrosoftExcel

1.~!!!!!!!!,.,"--,-I~~~~~_~~~:.~~~~~_~ .. ~~~!~"
::.r; ~
~~~~_~~_.~fVifll'

~ ~ .'¡Z
I~ '-
q r,:i
biij ~
¡w¡¡ ~ Numv,""n.
¡;¡ Ol9anaar todo .......l ¡¡j..
E;Jl TI'I
~
Normal d~::a ~ Mo~trar Zoom 100% s:~~~~ ~ Inmovilizar" ::J zl3 G;;:r::~:j!:\,;~~~~f.. Ma;rO!

Vist.!i5ce neee Zoom Ventana Maoos

¡. {=MINVERSA(B3:D5)J
o E G H

2
3 1 2 3 -~12t 0.08666667 -o, OS
4 12 O 6 0,2 -0,03333333 -0,2
a 5 -l. -3_ 2..... 0.24 -0,00566667 0,16
6
7
1'1,1 M I~
.
necceme. 9 Suma: 0..246666667 ª'D ~ 10Cñi. &- @

Figura 1-30

Paleta de fórmulas
La paleta de fórmulas es un asistente que ayuda a la introducción de funciones
y fórmulas en la hoja de cálculo. Estando situados en una ceda blanca, se obtiene la
paleta de fórmulas haciendo c1ic en .r en la barra de fórmulas y seleccionando la
función adecuada en el cuadro Seleccionar una función. Estando situados en una celda
que ya contiene una fórmula, se obtiene la paleta de fórmulas haciendo c1ic en '" en la
barra de fórmulas, lo que permitirá la modificación de la citada fórmula.

Rangos con nombre


La opción Asignar nombre a un rango del grupo Nombres definidos de la ficha
Fórmulas (Figura 1-31) permite definir nombres para rangos con la fmalidad de
aplicarlos posteriormente. Para asignar nombre a un rango, elegimos Definir nombre y
en la pantalla Nombre nuevo situamos el nombre, el ámbito y la referencia del nuevo
rango (Figura 1-32). Al pulsar Aceptar, se memoriza el nombre. Posteriormente, ya se
puede utilizar en fórmulas (Figuras 1-33 y 1-34)_ La opción Aplicar nombres permitirá
utilizar cualquier nombre de rango previamente creado (Figura 1-35).

Librol

Datos Revíser V

SigllilJ nombre~

~ Qef[nirnombre..,
Adminrstrador ----'1;
de nombres I
No~m~b-r~ES~tl7a~~in~¡~d-o-;--~~--~
Figura 1-31
CAPiTULO 1: EXCEL y LA ESTADiSTICA. ENTORNO DE TRABAJO 21

Nombre ncevo K l K I
NomIxe:

~~.11I 1,-----.~6U·--
Ál'nWto:

:~~=0=·='====~1=~~1~~1~ ~~:r=~2~*n-o~m-b-re~1
1
CQmef"lt.erio:

J Ir 11-----'-81-----11 7 14_
.1
I 9 8 ~
H.Ket.eferendaa: 1=1*1=0)0='
l='SI<S2=.='SK$5====¡¡~¡;;;¡""_1 9 18.,.=
I Ac..- l! Cancd... 1 ~
I
Figura 1-32 Figura 1-33 Figura 1-34

Aplicar nombres. 1'Y1~


Aplicar nombres:
A
B
m:m!*ª

(fl] Omitir tiRO de referencíe (relativa o absoluta)

[Sl] U~r nombres de filas y-columnas 1 Qpdones »

[ Aceptar ) I Cancelar

Figura 1-35

VINCULACIÓN DE LIBROS
Pueden compartirse los datos almacenados en hojas de cálculo y libros
diferentes mediante la utilización de vínculos o de referencias externas. La vinculación
resulta especialmente útil cuando no conviene conservar grandes modelos de hoja de
cálculo en el mismo libro.

Crear una fórmula para calcular datos en otra hoja o en otro libro
Si se establece un vínculo con un libro nuevo, guárdelo antes de crear el vínculo.
Los pasos que se tendrán en cuenta para crear tal fórmula son los siguientes:

• En el libro que va a contener la fórmula, seleccione la celda en que desee


introducir la referencia externa.

• Si crea una nueva fórmula, escriba un signo igual (=). Si se introduce la


referencia externa en otro lugar de la fórmula, escriba el operador que desee
que preceda a la referencia externa.
22 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

• Si desea crear un vínculo con otra hoja de cálculo en el libro activo, haga clic
en la hoja de cálculo que contenga las celdas que desee vincular. Si desea
crear un vínculo con una hoja de cálculo de otro libro, haga clic en el libro
que contenga las celdas que desee vincular.

• Seleccione las celdas que desee vincular.

• Complete la fórmula. Una vez introducida la fórmula, presione ENTRAR.

Vínculo con otra hoja de cálculo en él mismo libro


En el siguiente ejemplo (Figura 1-36), la función de la hoja de cálculo
PROMEDIO calcula el valor promedio del rango B I:B 1O en la hoja de cálculo
denominada Mercadotecnia del mismo libro.

¡NOmbrede la hola de calculo


..----L--., ~erenda a una celda o a un rango de celdas de la hola

= PROMEDIO(Mercadotecnía!B 1:B10)

I Separa la referenda de la hola


y la referencia de las celdas
Observe que el nombre de la hoja de cálculo y un signo de exclamación (!) preceden a
la referencia al rango,

Figura 1-36

Vínculo a una hoja de cálculo en otro libro


No sólo se pueden crear vínculos entre diferentes hojas de cálculo, sino que
también se pueden crear jerarquías de libros vinculados; por ejemplo, un grupo de
oficinas de ventas hace un seguimiento de los datos en libros individuales; a
continuación, los datos se integran en un libro que resume los datos por distritos, que se
integran a su vez en un libro que resume los datos a escala regional.

Excel muestra las fórmulas que contienen vínculos a otros libros de dos maneras,
dependiendo de si el libro de origen (el que proporciona datos a una fórmula) está abierto o
cerrado. Cuando el libro de origen está abierto, el vínculo incluye el nombre del libro entre
corchetes, seguido por el nombre de la hoja de cálculo, un signo de exclamación ( ! ) Y las
celdas de las que depende la fórmula. Cuando el libro de origen está cerrado, el vínculo
incluye toda la ruta de acceso en el nombre del libro (Figura 1-37).

=SUMA(C:\informes\[presupuesto xls]Anual'!C1 O:C25)


El libro de origen de esta fórmula no está abierto, de modo que el vínculo
incluye toda la ruta de acceso. Si Presupuesto.xls estuviera abierto, la
fórmula aparecería de la siguiente manera, =SUMA([Presupuesto.xls]Anual!
C10,C25).

Figura 1-37
CAPíTULO 1: EXCEL y lA ESTADíSTICA. ENTORNO DE TRABAJO 23

Nota: Cuando se modifican las celdas que proporcionan datos a un vínculo,


Excel actualiza automáticamente el vínculo sólo si el libro que contiene el vínculo está
abierto. Si vincula varios libros, asegúrese de actualizar los libros dependientes al
actualizar o cambiar los valores en los libros de origen.

Si un libro dependiente está abierto cuando se cambian los datos en el libro de


origen, Excel actualizará automáticamente el libro dependiente. Si éste no está abierto, se
podrán actualizar manualmente los vínculos. Además, si el nombre de la otra hoja de
cálculo o del otro libro contiene caracteres no alfabéticos, se deberá poner el nombre (o
la ruta de acceso) entre comillas sencillas.

MOSTRAR FÓRMULAS Y VALORES EN UNA HOJA DE


CÁLCULO
Cuando construimos una hoja de cálculo, por defecto se ven, tanto los valores
íntroducidos directamente en ella, como los valores resultantes de la aplicación de
fórmulas. Sin embargo, es posible ver en una hoja de cálculo todas sus fórmulas. Para ello,
haga clic en Archivo --f Opciones y en Avanzadas en el grupo Mostrar opciones para esta
hoja señale la casilla Mostrar fórmulas en celdas en lugar de los resultados calculados
(Figura 1-38).

También se puede cambiar entre presentar las fórmulas y sus valores en una
hoja de cálculo, de forma rápida, presionando CTRL+' (comilla simple izquierda). En
las Figuras 1-39 y 1-40 se ve la misma hoja en modo fórmulas y en modo valores.

Alternativamente, se puede hacer clic en el icono Mostrar fórmulas ~ del


grupo A uditoria de fórmulas de la ficha Fórmulas.
Opciones d~ Ex~1

Genere! Mos'''''opOones.,... esta hojao ~=-H...:o:.:.jAl'-- J,.I·-,1


Fórmulas ~ Mostr!f eocebezaccs de fila y columna
~ Mostrar fórmulas en celdas en IU9ar de los resultados carcuteees
Re..,lSIón
[El Mostrar la hoja de derecha a izquierda
Guardar [J Mostrar saltos Qt página

Idioma
rl] Mostrar un sero en celdas que tienen un valor cero
o MQstrar símbolos de esquema si se aplica un ~squema
Avanzadas rtJ Mostrar líneas de d~is¡ón

Personalizar cinta de opoones ~olor de cuadrícula ~

Barra de benarmentas de acceso eaeree


Fórmu!H

Complementos
~ Habilitar cércutcs mutttcrccesc
Centro de confianza Número de procesos de calculo
@ Usar todos los .2roceslldor~5 ee este eculpo: 2
e Manual 11 ~

[] Peemrur tJt(U(10n de tvnccnes ~U defmld-as por el IJSIJano en un cluster de calculo(D

I 4 L
Tipo de dústert
,. .•. 1 , ODOOnts...
.;;;
,Aceptar J i Cancelar I

Figura 1-38
24 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

116

A e D D
"7¡
2 P 1 2 3
~:P r...; ··············2+ 3
3 .Q 4 8 12
1~3+}Q--~l=--~~----~8'----ll~1
------ - 15'----19-
4 R 6 15 19 4 ,R
5
6
7 =SU~JB?:D2) __ 7
8 =SUMA.(B3:D3)_ 8

Figura 1-39 Figura 1-40

FUNCIONES DE HOJA DE CÁLCULO

Microsoft . Excel contiene muchas fórmulas predefinidas o integradas,


denominadas funciones. Las funciones pueden utilizarse para ejecutar operaciones simples
o complejas. La función que se usa con más frecuencia es la función SUMA, que se utiliza
para sumar los números de un rango de celdas (Figura 1-41).

" __ ---"_Fu_n_ci..,ó,n
de la hoja de cálculo
=SUMA(D5:F5)
~ferenda del rango

Figura 1-41

Las fórmulas pueden contener como elementos funciones de hoja de cálculo; es


decir, pueden contener subfórmulas predefmidas que realizan cálculos sencillos o
complejos. Para introducir una fórmula que contenga una función, puede escribirse su
sintaxis directamente en la barra de fórmulas, o si no se conoce la sintaxis, se tendrán en
cuenta los siguientes pasos:

• Haga c1ic en la celda en que desee introducir la fórmula y escriba el signo


igual (=).

• Para iniciar la fórmula con la función a partir de una paleta, haga c1ic en J;;..
en la barra de fórmulas.

• También puede hacer c1ic en la flecha hacia abajo que aparece junto al
cuadro Funciones SUMA

• Haga c1ic en la función que desee agregar a la fórmula. Si la función no


aparece en la lista, haga c1ic en Más funciones para obtener una lista de las
funciones adicionales.
CAPiTULO 1: EXCEL y lA ESTADiSTICA. ENTORNO DE TRABAJO 25

• Introduzca los argumentos en la paleta que define la función y pulse Aceptar.

• Se puede seguir editando la fórmula en la barra de fórmulas. Una vez


completa, presione ENTRAR.

Ya sabemos que las funciones son fórmulas predefmidas que ejecutan cálculos
utilizando valores específicos, denominados argumentos, en un orden determinado o
estructura; por ejemplo, la función SUMA agrega valores o rangos de celdas y la función
PAGO calcula los pagos de un préstamo basándose en un tipo de interés, la duración del
préstamo y su importe principal. .

Argumentos. Los argumentos pueden ser números, texto, valores lógicos, como
VERDADERO o FALSO, matrices, valores de error, como #N/A o referencias de celda. El
argumento que se designe deberá generar un valor válido para el mismo. Los argumentos
pueden ser también constantes, fórmulas u otras funciones.

Estructura. La estructura de una función (Figura 1-42) comienza por el nombre de


la función, seguido de un paréntesis de apertura, los argumentos de la función separados
por comas y un paréntesis de cierre. Si la función inicia una fórmula, escriba un signo igual
(=) delante del nombre de la función. A medida que se cree una fórmula que contenga una
función, la paleta de fórmulas facilitará ayuda.

Signo igual (si la función está al principio de una fórmula)


Nombre de la función

I I I
=SUMA(Al0;B5:B10;50;37)
,Argumentos

' I La's c~m as se para n un lo s argum en tos


I Los paréntesis encierran argumentos

Figura 1-42

Funciones anidadas dentro de funciones


En algunos casos, puede que tenga que utilizar una función como uno de los
argumentos de otra función; por ejemplo, la fórmula en la Figura 1-43 utiliza una función
PROMEDIO anidada Y compara el resultado con el valor ~O.

I Funciones anidadas
I ¡ I
, I

=SI(PROME DIO(F2: F5»50;SUMA(G2:G5);0)


Figura 1-43

Cuando se utiliza una función anidada como argumento, deberá devolver el


mismo tipo de valor que el que utilice el argumento; por ejemplo, si el argumento
devuelve un valor VERDADERO o FALSO, la función anidada deberá devolver
VERDADERO o FALSO.
26 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Si éste no es el caso, Microsoft Excel mostrará el valor de error #¡VALOR! Una


fórmula puede contener como máximo siete niveles de funciones anidadas. Si la Función B
se utiliza como argumento de la Función A, la Función B es una función de segundo nivel;
por ejemplo, la función PROMEDIO y la función SUMA de la Figura 1-43 son ambas
funciones de segundo nivel porque son argumentos de la función SI. Una función anidada
dentro de la función PROMEDIO será una función de tercer nivel, etc.

Se puede utilizar la Paleta de fórmulas para anidar funciones como argumentos;


por ejemplo, en la Figura 1-44, se puede anidar la función SUMA en la función SI
haciendo clic en el cuadro de edición Valor_si_verdadero, haciendo clic en la flecha abajo
del cuadro Funciones de la barra de fórmulas y, fmaImente, haciendo clic en SUMA.

Paso 1: para anidar la función SUMA en el argumento


valor_sLverdadero de la función SI, primero haga cílc
en el cuadro de edición del argumento.
Paso 2: haga clic en la flecha y seleccione SUMA
en la lista. Aparecerá la paleta de la fórmula SUMA.
Introduzca los argumentos de la función SUMA.
Paso 3: haga clic en SI en la barra de
fórmulas para volver a la paleta de la
fórmula SI.
~' X" =1 =SI(PROMEDlO(F2:F5»50)
51

=
Devuelve un único valor si una condición especificada se evalúa como VERDADERO
y otro valor si se evalúa como FALSO.
Prueba_lógica es cualquier valor o expresión que pueda evaluarse
como VERDADERO o FAlSO,

Resultado de la fórmula = Aceptar I """S~celar


Figura 1-44

Para cambiar de una función a otra en la Paleta de fórmulas, haga clic en el


nombre de la función en la barra de fórmulas; por ejemplo, para cambiar el rango de la
función PROMEDIO de la Figura 1-44, haga clic en PROMEDIO en la barra de fórmulas.

Categorías defunciones en Excel2010


Excel 2010 contempla gran variedad de funciones predefinidas. Estas
funciones suelen clasificarse en distintos grupos según su funcionalidad y contenido.
Los grupos de funciones son los siguientes: Funciones de base de datos, Funciones
de fecha y hora, Funciones de ingeniería, Funciones financieras, Funciones de
información, Funciones lógicas, Funciones de búsqueda y referencia, Funciones
matemáticas y trigonométricas, Funciones estadísticas, Funciones de texto y
Funciones definidas por el usuario. En este libro nos ocuparemos especialmente de
las funciones financieras.
CAPíTULO f EXCEl y LA ESTADíSTICA. ENTORNO DE TRABAJO 27

Para ver las funciones de las distintas categorías, se hace cIic sobre el icono
r. de la barra de fórmulas (estando situados sobre una celda de la hoja que no
contiene ya una fórmula) para obtener la Figura 1-45, en cuyo cuadro Seleccionar una
categoría se puede elegir cualquiera de ellas, presentándose todas las funciones de cada
categoría en el cuadro Nombre de lafunción.

Insertar función

~scar una fundón:

EscrDa 1.I1a breve descripción de lo QUe desea hacer y, a


continuadón, haga de en Ir

o selecdcner una gltegoría: Base de datos


bu~sa~da-s-re-d~.n~re-m-~~re-----J~
Seleccionar una Dmdón: Todo
~'~'
~.~·~iiiiliiiiiiliiiiiilii.Finandera
BDCUENTA Fecha y hora
BDDESVEST Maremáticas y trigonométricas
BDDESVESTP Estadísticas
BDElClRAER
BDMAX
BDMIN
BDCOKTARA(base_de_d
~=
Búsoueda v referenoe

Informadón
CUenta el número de celdas Definida oor el usuario
~f-------'
~ loiumna) de los
registros de la base de datos que cump¡en las condídones espedncadas.

Ayuda scobre esta funcóo Aceoter II Cancelar

Figura 1-45
Si hacemos cIic con el ratón sobre cualquier función del cuadro Nombre de la
función, se obtendrá la paleta de la función con su sintaxis. En la Figura 1-46 se
presenta la paleta de la función BDCONT ARA con sus argumentos para rellenar. Una
vez completados los argumentos, se obtiene el resultado en el campo Resultado de la
fórmula situado en la parte inferior de la paleta. Al pulsar Aceptar, la fórmula y su
resultado se insertan en la celda activa de la hoja de cálculo.

Argumentos de función

BDCONTAAA

Base_de_datos
Nombre_eJe_campo

Criterios
jl========~~~iil
I
1
= referencia
[@]
[~J =-
=- nÚlltetO

Cuenta el número de celdas que no están en blanco en el aart1pO {columna} de los registros de le base de datos que
an¡pIen las conOOones escecñcades.

Sase_de_datos es el rango de celdas que CClrflXXle la lista o base de datos. lJna base de
datos es una Sst5 de datos re1ationados.

Resultado de la fórmula ~

Acoplar 1I Cancelar

Figura 1-46
28 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Otra forma alternativa para ver y utilizar las funciones de Excel 2010 es utilizar
los distintos tipos de funciones que aparecen en el grupo Biblioteca de funciones de la
ficha Fórmulas (Figura 1-49). Los tipos de funciones más utilizadas en modelos
fmancieros son las funciones fmancieras (Figura 1-47), las funciones estadísticas (Figura
1-48), las funciones matemáticas y trigonométricas (Figura 1-50), las funciones de
búsqueda y referencia (Figura 1-51), las funciones de fecha y hora (Figura 1-52), las
funciones de texto (Figura 1-53) y las funciones lógicas (Figura 1-54).

Librol • Microsaft'

Insertar Diseño de página Diseño de pagina 1 fórmutas I Datos- Revü!.f__ Vi_,tt_.__ _1


AI._ro_l>a_t
({4 S-thqueda y referencia ... s"'" ~ Busqueday referencia-' tJ :t9Asignar nombre
Matemáticasytrigonométricas" Ji' UlJIáM en le fo,,,,
y hora .• iD I>~sfuoaones ~J A:~~:~~ é!' Creardesde la sel
'" de '~ tmdrsticas ---;] COEf.oE.CORREl
Ix 801 Ingen¡ería " I
)~
CDEFlOENTE.AIlMETRlA
e r. C~bo
COEflOENTE.Rl
J Informaáón
CUPON.DlAS.U
2
-- bu ~omp,!ibilid.d > :
CONTAR

L .3:--
O CDNTARBlANCO
CUPON.DIAS.Ll
-3 CDNTAR,S!
CUPON.FECHAU
CONTAR51.CONJUNTO
CU.PON.FECHA.Ll
CDNTARA
CUPON.NUM
CDVARlANCE.P
oe
CDVARlANZA.M
ooe
DURAOON CRECJMJEmO

OURAOON.MOoIF CUARlll.EXC

OVS CUARlll.lllC

Im.ACUM CURTOSIS

INT.ACUM.V DESVEST.M

lNT.EFEaIVO DESVEST.P

IIIT.PAGO.DlR DESVESTA
I
¡'"
, Insertar {undón ... DESVESlPA

Ix Insertar !unción",

Figura 1-47 Figura 1-48

Inicio Insertar Datos

fx L Autosuma
g.e ctente s >
..•. ? Lógicas ..•.

'rexto > Matemáticas y trigonométricas ..•.

~,~~~~~ ~ Financie-ras ..•..~ Fecha y hora ..•. f:DI Más funciones .•.
Bibljoteca de funciones

Figura 1-49
CAPiTULO 1: EXCEl y lA ESTADiSTICA. ENTORNO DE TRABAJO 29

Ir:ucio J~~rtar Dts ••i\,o d~ p.i9<fl<l 1 fÓffllUlilS I o.tos _

j fi 1: AutosumiJ ~ tÓ9/US· et. 8úsqueda"')' re1uenda ~ -I!'.. E Auto.iuma ~ ~ LÓglCAJo - BusqUl!!dll '1 rd'erencta ~

1 X' ~ seoentes ~ , Tl!:ldo ~ íl Materolllt.¡cas ytnoonom.eüius • [~e~r &)- Recientes ~ teec • I AAfAS
1, ::n~~:~ • Firnu'f(\e:ras· et FechO! }',hclr.! 'O'. AB5 C;1 fun<:i6f'1 ~ fl".nder.~" ~~t'ti'¡aY'I'<l(Hlt·1
¡ 8ibliN«:tI-Gefu ACOS 1'1 6Jbhote~ de fUI
BUSCAR

comaDIR
K7 -~/;r ACOS'H i .7 COLUMNA
A e AGREG.C..R A e COLUMNAS
AlfATORIO
CotJSUlTAH
AlEATO!UO.fNTRf 1,
CON5ULTAV
ASENO
..y, .
-1 DESREF
ASE»oH
DIREcaON
ATAN
A.TAN2

¡
AlA


COQEtfTE

I
::'RW<CULO
IMPORTARDATOSDrNAMlCOS

INDlCf

-1 m=o INDlRfOO

::SPONER t
I~ :~rt.,
[

!un"ón !:'... In"rt,,!""."on . J


Figura 1-50 Figura 1-51

fÓrmutu. Datos

K7 AÑO
CONCATEI'lAR
A OlA
2 2

~ 3 DERECHA

.
OlA.LAB.INTl 3 3,-
4 5 4
Er'KONlltAR
6
5 2 HAI.LAR
~ 5
.s, IGUAL
2

7 0ÍA5360
7 IZQUIERDA
8
8
9 lARGO
s
•0
10
II
11
12 fIN.MES
12 MEO
,.
13 FRACAÑO
13
1.•
MINUSC

15
16 15
NOMPROPlO
17 16
17 RECOFnAR.
18
rs NUM.DE,sEMANA
18 REEMPtAZAR ..::¡
20
2
>9
20
j f· JI:'\SII'".' {un.c~on.p

Figura 1-52 Figura 1-53


r.lill Li:;I .., - • 1;
rrncro insertar Diseño de páglJ;~

fx :E AutoSUMl<l - :~ Lógicas ••. ~ BúsQ

•. sae cte rrte s > FALSO

~~~~~';6~
., Financieras - NO

o
K7
SI

SIERROR

VERDAOE.RO

ro s ert.er funCi6n .. ,

Figura 1-54
Al hacer clic sobre cualquier función de Excel de las especificadas en las
Figuras anteriores, se inserta la sintaxis de la función en la celda seleccionada
actualmente y aparece la paleta de fórmulas para introducir sus argumentos.
30 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

COMPLEMENTOS EN EXCEL y LA ESTADÍSTICA


Como ya habíamos anticipado al principio del capítulo, Excel 2010 dispone
de complementos adicionales (Herramientas para análisis, Solver, etc.) que pueden
cargarse después de la instalación del programa y que incorporan funcionalidades
adicionales para el trabajo en estadística. Para cargar o descargar un complemento
de Excel, se tendrán en cuenta los pasos siguientes:

• Haga clic en el Archivo y, a continuación, pulse en Opciones.

• En la Figura 1-55 haga clic en la categoría Complementos de panel izquierdo.

• En el cuadro Administrar (Figura 1-55), haga clic en Complementos de Excel


y, a continuación, en Ir.

• En el cuadro Complementos disponibles (Figura 1-56), active la casilla de


verificación situada junto al complemento que desea cargar y, luego, haga clic
en Aceptar. Si el complemento que desea utilizar no aparece en la lista del
cuadro Complementos disponibles, haga clic en Examinar y, a continuación,
busque el complemento. Los complementos que no están disponibles en el
equipo se pueden descargar de Descargas en Office Online.
Opciones de Excel

General
~ Vea y administre los complementos de Microsoft Office.
Fórmula~

Complem~tos
--
Gwrdar
,
f Nombrt'"
iCompiementosoe a~ activ.s
Ubicación Tipo
-
Idioma
1 Acrobat PDFMaterOffice (OM Addin (;\.,O''¡OfMar.er\Offlce\POFMOfflceAddin,dll Complemento (OM
AVilozadas
1 Complementos de apti(~ inactiv.l5
Personalizar cinta de Op(lOIl~S : Contenido invisible C:\. .. \Mi(!'o~oft Office\Officel4\OfFRHD.Dtl Inspector de documento
] Datos XMl pencnetaaecs C:\. •.\Microsoft Office\OffICe.14\OFFRHD.Oll inspector de dorumento
Bllfta de herrllmumtas de acceso rilpldo i Encabezados y pies de página C\. ..\Microsoft Office\Office14\OfFRHO.Oll Inspector de documento
!Fe(ha~111
I Complementos ~Filas y columnas ocultas
(:\. ..S\microsoft sh;,red\Smart TaO\MOFLOLl
C:\. ••\MlcrOSOft Office\Offitt14\OFFRHD.Oll
Acdón
Inspector de documente
; Herramientas P/HI! análisis C:\' ..\Office14\library\Analysis\ANAlYS32.Xll Complemento de Euel
(entro de ccotenze Complemento de jxce!
Herramlentes plIra "málisis • VBA C:\. •.ffice14\library\AnaJysls\ATNBAEN..xLAM
j Herremrentes para el furo C:\' ..ffice\Officel4\library\EUROTOOL.XLAM Complemento de Eue!
¡ Hojas de cétcutc ocultas C:\. ..\Microsoft Office\Offtce14\OFFRHO.Oll Inspector de documente
¡ Microsoft Adlons gane 3 Paquete de expansión XMl
¡ Solver (:\. ..\OOicd4\library\SOL VER\SotvtR.XLAM Complemento de jxcet

!Cofnpkmento:s rdationarlos (OU ckx.urnent()1:


i C~os no reianonados CM QO{u.mentos

Ic~::=:::!::=..."':.,~::::--
Complemento: Accbet PDFMaku otnce (OM Addin
Editor; Adobe Systems, lncorporated
Compatibilidad: No hay informadon disponible sobre compatibilidad
UbicadOn= C\Program Files\Adobt crobat 9,O\POFMaker\Otfice\PDFMOfticeAddin.dlJ

Oescripdón: Acrobat PDFMaktr Offict COM A.ddin

Figura 1-55
CAPíTULO 1: EXCEl y lA ESTADíSTICA. ENTORNO DE TRABAJO 31

Complementos

ComPlementos disponibles:

~ Herr errsentes para análisis - VBA


~ Herramientas para el ec-c
.1 I
I
1 Aceptar

Cancelar
~Solver

I ~am¡nar.,.

I Aulomotizaóón ... I

Herramientas para análisis


Propordona herramientas de aná~sis de datos para análisis
estadístico y
de ilQeniería.

Figura 1-56

• Si el complemento no está instalado actualmente en el equipo, haga dic en Sí


para instalarlo. Siga las instrucciones de instalación.

• Para descargar un complemento de Excel, en el cuadro Complementos


disponibles, desactive la casilla de verificación situada junto al complemento
que desee descargar y, a continuación, haga clic en Aceptar.

• Para quitar el complemento de la cinta de opciones, reinicie Excel. Si se


descarga o se quita un complemento de la cinta de opciones, éste no se eliminará
del equipo. Para eliminar un complemento del equipo, deberá desinstalarlo.

• Para desinstalar un complemento, salga de todos los programas y utilice


Agregar o quitar programas en el Panel de control de Windows.

Una vez instalados los complementos, aparecen disponibles en el grupo


Análisis de la ficha Datos de Excel (Figura 1-57).

l1t!lcl ~ Mkroscftfui!f

lnWtl! OHm~dt~Ok.'la fOm~ DalDI: a. G c:: ii

@ ("\
c:J..Jj
").
;...J;J
I~
.L~
i§jCoo_n"
Pt"~!S6
!I ~
.biI
1\"'-""
'{¡.'~*rU~{)f f""~
!S.:!!E5il
'iiIS e
¡r. tm
.1 ~
.~ .~
~ Ltil
!:'E" -""""""'"
¡;¡~ ~ ?.SolP.t

:!~
O.:~ ~~~t f~::s. '::=~J A~~ f:ttlt~f~tK U O,ótlUr rll-JO '.Y ArnIUdu {~;::s CI.~~~i :~~~~~ Co.'tioltdar~~I ~ ~»~ ~Ubto-dl

Obt(.M{'GMIlSutw\~; (Pt'l(\!!'Qnt; OJ¡f(nalyfllll1 t!tttMl1imatOtdJtM AniJ¡{i~

" H o

Figura 1-57
CAPÍTULO 2

VARIABLES ESTADÍSTICAS y
DISTRIBUCIONES DE
FRECUENCIAS

VARIABLES ESTADÍSTICAS
En el trabajo estadístico la información se recoge en variables. Estas variables se
organizan de forma ordenada y se almacenan en ficheros. Posteriormente será posible
operar con estas variables y aplicar funciones a las mismas para realizar las
transformaciones y los análisis estadísticos que se desee. Las variables pueden contener
datos numéricos (variables cuantitativas) y datos categóricos no cuantificables numéricamente
(variables cualitativas). El sexo, la profesión y el lugar de origen serían variables cualitativas.
La estatura y la edad serían ejemplos de variables cuantitativas.
Las variables cuantitativas pueden ser discretas y continuas.
Una variable es discreta cuando toma una cantidad finita o numerable de valores
aislados, es decir, entre cada dos valores consecutivos no se puede intercalar ningún otro
valor de la variable. El número de hijos, el número de parados y el número de caras
obtenido al lanzar tres monedas al aire serían ejemplos de variables cuantitativas discretas.
Una variable es continua cuando toma una infinidad no numerable de
valores, es decir, entre cada dos valores cualesquiera siempre existen infinitos valores
de la variable. La fuerza fisica, la longitud y el peso serían ejemplos de variables
cuantitativas continuas.
Las variables cualitativas suelen c1asificarse, según la naturaleza de los datos
categóricos que representan, en variables nominales y variables ordinales.
Las variables nominales describen las categorías directamente por su
contenido, por ejemplo, las categorías de la variable cualitativa sexo son varón y
mujer. A veces suelen asignarse por comodidad códigos numéricos a las distintas
categorías de una variable cualitativa nominal, por ejemplo, varón=l y hembra=2, en
cuyo caso hay que resaltar que dichos códigos siguen siendo variables cualitativas no
tratables numéricamente.
34 ESTADíSTICA APLICADA. CONCEPTOS y EJERCICIOS A TRAVÉS DE EXCEL

Las variables ordinales describen las categorías por el orden que ocupan, por
ejemplo, los valores (categorías) de la variable cualitativa "satisfacción en el trabajo"
pueden ordenarse en "satisfación baja" (valores entre O y 10 según una determinada
escala de puntuación que varía entre O y 30), "satisfación media" (valores entre 10 y
20) Y "satisfacción alta" (valores entre 30 y 40).
Las variables cuantitativas suelen clasificarse en variables ratio, que toman
valores numéricos puntuales, y variables por intervalos, en las cuales se agrupan los
valores numéricos en intervalos convenientes con vistas a facilitar el trabajo.

DISTRIBUCIONES DE FRECUENCIAS Y SU FINALIDAD


Cuando se analiza una característica medida por una variable cualquiera
resultado de un determinado proceso (de producción, de medida, económico, fmanciero,
sociológico, médico, biológico, demográfico, etc.), los datos que obtenemos siempre
están dispersos y nunca tienen un único valor constante. Una vez que sabemos que los
datos relativos a las distintas características van a estar dispersos, nos surge el problema
de detectar el patrón en la variabilidad de los datos. Para ayudar a esta tarea existen
herramientas estadísticas básicas como las distribuciones de frecuencias y los
histogramas, así como técnicas sencillas de análisis exploratorio de datos.
Cuando los datos están dispersos, la dispersión sigue un cierto patrón.
Inicialmente los datos no nos dicen nada por sí mismos, pero si los dividimos en
clases o celdas ordenadamente, puede aclararse la forma de su dispersión, es decir,
puede aclararse la forma de cómo están distribuidos. Esta forma de la distribución de
los datos inherente a su variabilidad se denomina distribución de frecuencias.
Normalmente es posible ver la forma general de una distribución si se recogen
cien o más valores y se prepara convenientemente una tabla de frecuencias con diez o
veinte clases. Pero la distribución se puede ver aún con mayor claridad en forma de
representación gráfica mediante un histograma de frecuencias. El histograma es una
representación visual de los datos en la que pueden observarse más fácilmente tres
propiedades esenciales de una distribución como son: forma, tendencia central o
acumulación y dispersión o variabilidad. De esta forma, el histograma da una idea del
proceso, lo que un simple examen de los datos tabulados no hace.
Hay muchos métodos para construir histogramas. Cuando los datos son
numerosos, es muy útil reunidos en clases y se recomienda utilizar entre 4 y 20
clases (o celdas). A menudo conviene elegir un número total de clases igual
aproximadamente a la raíz cuadrada del tamaño de la muestra. Las clases deben tener
amplitud uniforme y se construye la primera de ellas comenzando con un límite
inferior sólo un poco menor que el valor más pequeño de los datos. Se construye la
última clase finalizando con un límite superior sólo un poco mayor que el valor más
grande de los datos. Para realizar el histograma se marcan las clases sobre el eje de
abscisas, y sobre cada clase se levanta un rectángulo de altura proporcional al número de
observaciones de la variable (frecuencia absoluta) que caen en la clase.
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 35

El agrupamiento de los datos en clases condensa los datos originales, lo que


da como resultado una pérdida de algo de detalle. Así, cuando el número de
observaciones es relativamente pequeño, o cuando las observaciones sólo toman
pocos valores, puede construirse el histograma a partir de la distribución de
frecuencias de los datos sin agrupar, dando lugar a los diagramas de barras.

Las distribuciones de frecuencias son la herramienta más sencilla y más


utilizada y eficaz cuando estamos rodeados de montones de datos, que no nos dicen
nada si no hacemos más que enumerarlos. Al expresar estos datos en forma de una
distribución de frecuencias, ya nos proporcionan diversas ideas. Puesto que las
distribuciones de frecuencias se utilizan muy a menudo, es necesario conocer la
finalidad de las mismas y su interpretación y uso.

El fin principal de la preparación de una distribución de frecuencias es,


usualmente, uno de los siguientes:

• Dejar bien visible la distribución de la variable estudiada e identificar su


forma.

• Analizar, controlar y mostrar las capacidades de los procesos de los que


derivan sus datos, tanto cualitativa como cuantitativamente.

• Ayudar a determinar el promedio, la desviación estándar, los coeficientes de


asimetria y curtosis, así como otras medidas características de una distribución.

• Probar a qué tipo de distribución matemática se puede acoplar


estadísticamente la distribución empírica de los datos relativos a la variable
estudiada.

INTERPRETAR LAS DISTRIBUCIONES DE FRECUENCIAS


Las distribuciones de frecuencias facilitan que todo el mundo vea y comprenda
intuitivamente la forma de los valores de la variable que representa. Sin embargo hay
que prestar atención a la interpretación de las distribuciones. Cuando se miran las
distribuciones de frecuencias, se tiene que prestar atención a los puntos siguientes:

• ¿Está el promedio de la distribución en una posición adecuada?

• ¿Cómo es la dispersión de la distribución respecto al promedio?

• ¿Cuál es la relación entre valores tales como la desviación estándar, el valor


medio, el rango, etc?
36 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

• ¿Hay algunos huecos, como dientes que faltan, o subidas o bajadas


repentinas como las púas de un peine, en la distribución?

• ¿Hay algunos puntos aislados fuera del cuerpo principal de la distribución?

• ¿Son aceptables los valores máximo y mínimo de la distribución?

• ¿Es asimétrica la distribución, con un extremo mucho más largo que el otro,
o bien es simétrica?

• ¿Tiene aspecto de acantilado la parte izquierda o la derecha de la


distribución?

• ¿Tiene más de un pico la distribución?

• ¿Es demasiado agudo o demasiado chato el pico de la distribución?

FORMALIZAR LAS DISTRIBUCIONES DE FRECUENCIAS


Dada la importancia de las distribuciones de frecuencias, derivada de que en todo
proceso real hay un momento en el que nos encontramos con un conjunto de datos
sobre las variables a tratar, es de gran importancia formalizar el camino de recogida,
ordenación y presentación de los datos que, en la mayoría de las ocasiones, aparecerán
dispuestos en tablas de frecuencias de simple o doble entrada que servirán para analizar
las distribuciones de las variables. Dada una variable X con valores XI, X2, •.. , XN aparece
una serie de conceptos generales que se mencionan a continuación.

• Frecuencia absoluta ni: Se denomina frecuencia absoluta del valor x¡ de la


variable X, el número de veces ni que se repite ese valor.

• Frecuencia relativa ¡;: Se denomina frecuencia relativa del valor x¡ de la


variable X la relación por cociente entre el número de veces que aparece el
valor x, y el número total de valores de la variable (N). O sea,¡;=n/N.

• Frecuencia absoluta acumulada Ni: Se denomina frecuencia absoluta


acumulada del valor x¡ a la suma de las frecuencias absolutas de los valores
de la variable X anteriores o iguales a x..

• Frecuencia relativa acumulada F; Es la frecuencia absoluta acumulada


dividida por el número total de valores de la variable. Su valor es Fi=N/N.
De todas estas definiciones se extraen inmediatamente las siguientes deducciones:

• La suma de las frecuencias absolutas sin acumular es igual al número total de


elementos Cini=N).
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 37

• La última frecuencia relativa acumulada coincide con el total de elementos (N).

• La suma de todas las frecuencias relativas sin acumular es igual a 1 (Ij;= 1).

• La última frecuencia relativa acumulada es la unidad.

Al conjunto de valores que ha tomado una variable, junto con sus frecuencias, se
le denomina distribución de frecuencias de la característica o variable. Para que una
distribución de frecuencias quede determinada es necesario conocer todos los valores de
la variable y uno cualquiera de los conceptos de frecuencia que acabamos de definir,
ya que el paso de uno a otro es inmediato. Además, según la forma en que se
presenten los valores de la variable será posible distinguir dos tipos de distribuciones
de frecuencias:

• Las que no están agrupadas en intervalos, que surgen cuando la información


se dispone asociando a cada valor o categoría de la variable su respectiva
frecuencia.

• Aquellas cuyos valores observados generalmente aparecen agrupados en


intervalos o clases [L¡, L¡-I] debido al elevado número de observaciones, y,
por tanto, las frecuencias correspondientes a cada intervalo se obtienen
sumando las de los respectivos valores de la variable que contiene.

Cuando se trabaja con distribuciones agrupadas por intervalos o clases es


necesario que las frecuencias observadas se asignen de alguna forma a los puntos del
intervalo. Se podrá optar por suponer que los valores de"! intervalo se distribuyen
uniformemente a lo largo de él o por considerar como representativo de todos los
puntos del intervalo un único valor, por ejemplo, el punto medio del mismo, que
denominaremos marca de clase (Xi) y que, en consecuencia, se obtendrá mediante
X;= (L¡-1 + L¡)/2. Aunque la agrupación de valores tiene la ventaja de simplificar el
manejo de la información, presenta en cambio un importante inconveniente
consistente en la pérdida, en mayor o menor medida, de una parte de dicha
información. La distribución de frecuencias de una variable suele presentarse
ordenadamente mediante la tabla de frecuencias siguiente:

1¡ Xi n¡ ¡; N¡ F¡

[Lo,L¡l X1 n¡ {¡=n¡/N Ns=n, F¡=N¡/N


[L¡, L2] X2 n2 fi=n2/N N2=n¡+n2 F2=N2/N
rL2, L31 X3 n3 f3=n3/N N3=n¡+n2+n3 F2=N3/N

rLk-¡' t,1 Xk nk fk=n¡/N Ni=ni+ ...+ni=N Fk=NI.IN=1


In¡=N I¡;=1
38 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

En cuanto al número de intervalos k a considerar puede tenerse en cuenta la


fórmula de Sturges (K=E[3/2+log(N)/log(2)]), o también tomar K=~N.

REPRESENTAR DISTRIBUCIONES DE FRECUENCIAS


El objetivo esencial de las representaciones gráficas de las distribuciones de
frecuencias es obtener una idea general sobre sus propiedades en un simple vistazo.
Observando un histograma de frecuencias podemos deducir si la variable se
aproxima a la normalidad o si es simétrica, así como otras propiedades que
posteriormente pueden ser analizadas de modo formal utilizando contrastes u otras
herramientas adecuadas.

A la hora de representar distribuciones de frecuencias será necesario tener


presente en primer lugar si la variable es cualitativa o cuantitativa. En segundo lugar,
y ya dentro de las variables cuantitativas, habrá que tener presente si la distribución
es agrupada o no agrupada. Teniendo en cuenta estas características de la variable
cuya distribución de frecuencias se representa podemos clasificar los gráficos como
SIgue:

Histograma de frecuencias
Datos agrupados Polígono de frecuencias
{
Polígono de frecuencias acumuladas
Cuantitativas
Diagrama de barras
Diagrama escalonado
Variables Datos sin agrupar
Polígono de frecuencias
Polígono de frecuencias acumuladas

Diagramas de sectores
Cualitativas Diagramas de rectángulos
{
Pictogramas
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 39

Representaciones para variables cualitativas: diagramas de


rectángulos, diagramas de sectores y pictogramas
Los diagramas de rectángulos se construyen asignando a cada modalidad de
la variable cualitativa un rectángulo con altura igual (o proporcional) a su frecuencia
absoluta n¡ y con base constante.

Como ejemplo, en la Figura 2-1 se presenta un diagrama de rectángulos que


representa los activos según las distintas modalidades de la variable rama de
actividad. Sobre cada rectángulo se presenta la frecuencia absoluta n¡ en miles de
activos de la correspondiente rama de actividad. Sobre el eje de abscisas se presentan
las propias ramas de actividad y sobre el eje de ordenadas se presentan diferentes
valores de las frecuencias absolutas por intervalos que sirven como referencia para
situar la altura de cada rectángulo.

ACTIVO S POR RAMAS DE ACTIVIDAD

3700,3 '3437,8
4(}OO
3000 2454,8

2000 1096,3
1388,3 IOACTlVosl
1000
O+-~--~~~ __-L~~~~ __ ~~~L-~~ __ ~~~ __ ~~

Ag:ricu fiur,a, Fabrües otrlliS


caza y pesca servicios

Figura 2-1

Los diagramas de sectores (o de pastel) constituyen el tipo de gráfico más


utilizado para representar distribuciones de frecuencias de variables cualitativas. La
variable se representa en un círculo cuyas porciones (sectores circulares) tienen un
área proporcional a las frecuencias absolutas de las modalidades de la variable. Para
realizar el gráfico (Figura 2-3) basta con asignar a cada modalidad de la variable un
sector circular cuyo ángulo central sea proporcional a la frecuencia absoluta de la
modalidad. Matemáticamente, el ángulo central a¡ de la modalidad i-ésima cuya
frecuencia absoluta es n¡ puede expresarse como sigue:

a = kn ~ a¡ = k = Ia¡
1 1 n.
1
"n. = 360N ~
~ 1
a. = 360 n. = 360!i = 360¡;.
1 N 1 N 1

Los cálculos necesarios para nuestro ejemplo se presentan en la tabla de la


Figura 2-2.
40 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

ACTIVOS
RAMA (n¡) ti= n/N a,= 360fi
Agricultura, caza y pesca 3706,3 0,29 104,79
Fabriles 3437,8 0,27 97,20
Construcción 1096,3 0,09 31,00
Comercio 1388,3 0,11 39,25
Transporte 648,7 0,05 18,34
Otros servicios 2454,8 0,19 69,41
N= 12732,2
Figura 2-2

ACTIVOS POR RAMAS DE ACTIVIDAD

o Agricultura, caza. y pesca


Agricultura, caza
y pesca 11Fabriles
Transporte _
o Construcción

Comerdo oComercio
11Transporte
o Otros servicios

Figura 2-3

Otra forma habitual de construir gráficos de sectores consiste en asignar al


sector circular relativo a la modalidad i-ésima un porcentaje igual al tanto por ciento
que representa su frecuencia absoluta n, sobre la frecuencia total N = ¿ni.
Matemáticamente, la expresión del porcentaje Pi relativo a la modalidad i-ésima se
expresa como sigue:

P, = 1003. = 100/¡
N

La Figura 2-4 muestra el gráfico de sectores anterior con porcentajes.

ACTIVOS POR RAMAS DE ACTIVIDAD

o Agricultura, caza y pesca


19%
_----,r--_ 11Fabriles
5%~ __ ~
o Construcción
o Comercio
• Transporte
27%
o Otros servicios

Figura 2-4
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 41

Representaciones para variables cuantitativas sin agrupar:


diagramas de barras, en escalera y polígonos de frecuencias
Los diagramas de barras para variables cuantitativas sin agrupar se construyen
situando sobre el eje de abscisas los valores de la variable y sobre el eje de ordenadas los
valores de sus frecuencias absolutas. Como ejemplo, consideramos la variable
cuantitativa sin agrupar X cuya tabla de frecuencias se muestra en la Figura 2-5.

Xi ni Ni ¡; Fi
Xl 1 1 0,1 0,1
X2 2 3 0,2 0,3
X3 1 4 0,1 0,4
X4 3 7 0,3 0,7
X5 3 10 0,3 1
Figura 2-5
La Figura 2-6 muestra el diagrama de barras asociado a la variable.
ni

3,5

2,5 - (
t=::
2 - 1-

1,5 - f-

- 1-

o.s

O
~~
X1 X2
H~ X3 X4
-

X5
1-

Figura 2-6
Los diagramas en escalera para variables cuantitativas sin agrupar se
construyen situando sobre el eje de abscisas los valores de la variable y sobre el eje
de ordenadas los valores de sus frecuencias absolutas acumuladas Ni (Figura 2-7).

'"
10

8 1-
r--
e - f-

n-
- 1-

f----- - f-

o n
X1 X3 X"" X5

Figura 2-7
42 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Ambas representaciones de diagramas de barras y diagramas en escalera


pueden hacerse también utilizando frecuencias relativas en vez de frecuencias
absolutas en el eje de ordenadas.
Para construir el polígono de frecuencias se unen los puntos (Xi,n¡) tal y
como se observa en la Figura 2-8. También pueden unirse los puntos (Xi,ji). Por
último, para construir el polígono de frecuencias acumuladas se unen los puntos
(Xi,N¡) según se observa en la Figura 2-9. También pueden unirse los puntos (Xi,F¡).

ni NI

3,5 12
3 1{}
2,5
I -:
/ 8
/
2
r>. / l-+-nd 6 I • Nil
1,5
,/
1

0,5
/ ~I 4

2
~
./---
O o
X1 X2 X3 X4 X5 X1 X2 X3 X4 X5

Figura 2-8 Figura 2-9


Como ejemplo, en la Figura 2-1 se presenta un diagrama de rectángulos que
representa los activos según las distintas modalidades de la variable rama de
actividad. Sobre cada rectángulo se presenta la frecuencia absoluta n¡ en miles de
activos de la correspondiente rama de actividad. Sobre el eje de abscisas se presentan
las propias ramas de actividad y sobre el eje de ordenadas se presentan diferentes
valores de las frecuencias absolutas por intervalos que sirven como referencia para
situar la altura de cada rectángulo.

Representaciones para variables cuantitativas agrupadas:


histogramas y polígonos de frecuencias simples y acumulados
Los histogramas de frecuencias para variables cuantitativas agrupadas en intervalos
se construyen levantando sobre cada intervalo un rectángulo de área proporcional a
la frecuencia absoluta correspondiente de dicho intervalo. Hay que tener muy
presente que si los intervalos son de amplitud constante, las alturas de los
rectángulos serán iguales a las frecuencias absolutas respectivas (las áreas dependen
sólo de las alturas porque las bases de los rectángulos son iguales). Si las amplitudes
de los intervalos son desiguales, las alturas de los rectángulos (densidades de
frecuencia) deben calcularse dividiendo la frecuencia absoluta por la amplitud del
intervalo.
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 43

Si llamamos d¡ a la altura del intervalo i-ésimo, e¡ a su longitud (amplitud) y


n, a sus frecuencias absolutas, la densidad de frecuencia d¡ vendrá dada por d, = n¡/ e;
La tabla siguiente resume los valores necesarios para construir el histograma de
frecuencias, que como ya sabemos, consta de rectángulos cuyas bases sobre el eje de
abscisas son los intervalos I¡, y cuyas alturas son las densidades de frecuencia di.

Intervalo Marca Frecuencia Frecuencia F. absoluta Amplitud Densidad


de clase absoluta relativa acumulada (longitud)
I¡ X¡ n¡ f¡ N¡ e¡ d= n¡/ C¡

Lo,L¡ X¡ n¡ ¡ N¡ c¡ d¡
L¡,Ll Xl nl 1 Nl Cl dl
Ll,L3 X3 n3 3 N3 C3 d3
. . .
. .
Lk_¡'Lk1 Xk nk fk n, Ck dk

Como ejemplo, consideramos la variable cuantitativa X con valores


agrupados en intervalos cuya tabla de frecuencias es la siguiente:

X¡ n¡ N¡ e¡ d= n¡/c¡
D,3) 10 10 2 S
r3,S) 20 30 2 10
rS,10) 10 40 S 2
rlO,20) 30 70 10 3
r20,SOl 30 100 30 1

La Figura 2-10 muestra el histograma de frecuencias asociado a la variable X.


di
1
o
9
8
7
6
r-r-r-
5
4
3 I
2 I
1 I I I
o 1 3 10 20 50 Xi
Figura 2-10

En ocasiones suele sustituirse el histograma por el polígono de frecuencias


simple, gráfico que se forma al unir los puntos medios de cada intervalo X¡ (marcas
de clase) a una altura proporcional a la frecuencia (para intervalos iguales) o a la
densidad de frecuencia (intervalos desiguales).
44 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

La union de estos puntos (x, ni) o (x, di) forma una línea quebrada
rectilínea que al prolongarla por los extremos corta al eje X (esta prolongación suele
hacerse hasta los puntos medios de las categorías inferior y superior inmediatos que
corresponden a la clase de frecuencia cero). De esta forma, el área que queda por
debajo del polígono de frecuencias es igual al área contenida dentro del
correspondiente histograma. Este gráfico permite comparar las distribuciones de
varios grupos observando las áreas donde coinciden o se separan.

Otro instrumento gráfico esencial para representar una distribución de


frecuencias es el polígono de frecuencias acumuladas, que se utiliza cuando se
trabaja con frecuencias absolutas o relativas acumuladas y que se construye
levantando en el extremo superior de cada intervalo de clase una ordenada igual a la
frecuencia acumulada correspondiente y uniendo a continuación dichas ordenadas.

Los puntos que se unen serán (Li+l, Ni). La primera ordenada se une al
extremo inferior del primer intervalo prolongándose el polígono desde este punto
hacia la izquierda sobre el eje X, y prolongándose también el polígono a partir de la
ordenada del extremo superior del último intervalo con una paralela al eje de
abscisas. De esta forma, la ordenada correspondiente a cada valor de la variable X
mide el número de observaciones para las cuales la variable toma valores menores o
iguales que la abscisa (concepto que aproxima la función de distribución de la
variable X).

La Figura 2-11 muestra el polígono de frecuencias simple relativo a la variable X.

d,

10

6
5
4
3
2
1
O 3 5 O 20
Figura 2-11

La Figura 2-12 muestra el polígono de frecuencias acumulado relativo a la


variable X.
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 45

100
90
80
70
60
50

30 /

~L-~-' ~~ ~~ ~~ __~~~~
O 3 5 10 20 50 X;
Figura 2-12

GRÁFICOS EN EXCEL
La forma más habitual de crear un gráfico en Excel consiste en seleccionar
los datos para la construcción del gráfico en la hoja de cálculo y utilizar el tipo de
gráfico que se quiera crear del grupo Gráficos de la ficha Insertar (Figura 2-13) en la
que hemos seleccionado el tipo Línea (gráficos de líneas). También se pueden
utilizar los tipos Columna (Figura 2-14), Barra (Figura 2-15), Circular (Figura 2-
16), Area (Figura 2-17), Dispersión (Figura 2-18) y Otros gráficos (Figura 2-19). Es
posible ver todos los tipos de gráfico disponibles haciendo c1ic en la opción Todos los
tipos de gráfico cualquier Figura anterior. Se obtiene la Figura 2-20.

1 •. Librol - Mícro,oft Excel

üíseño de. p-.áglna Férmuías Dato s nevtsar Vísta Acrobat

@formas'r lói línea


~Sm~rtArt ¡¡;: Columna
T-abla Tabla lmagen
dinamic.a .•. ~+I·
'M t\r1rnigrnfKos

Iodos los tipos de gráfico ...

Figura 2-13
46 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

i=i==H ==r=1tL~~ ~ ~

WCónico
-r---.--¡-¡
-.
+
~~-~~
-+---1- ~
Barra en"3:::-D,,:::::::::::,,,:

~__ ~~¡

~~
Ptrámide
~ EJ[t;J[§
~~~~~~~-
iÜJ Iodos los tipos de gráfico...
-=-t=-- Jtj'[bj~
Iodos tos-tipos de gráfico...

Figura 2-14 Figura 2-15

i=i=======ri ~ ~ ~
E F

~
GráftcO circular 3D

§~ ------
Iodos los tipos de gráfico ...

Figura 2-16 Figura 2-17

F==E ==F ==lG [Q IT&J ~


[[g][8]-----
db I Iodos los tipos- de gráfico ...

Figura 2-18
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 47

I=i===E==F ===r====G =;====llli2J0~~


mm
I-t-----+----+-----¡:--I,~perficie

=-~'-_.- r----+--I~
MUlO~==~
~
1I

f-j_ .. __._- •._._ __ .¡_ _ .. -+-- ~

~ja~

[¡]~
~a_1 ~ _

~~~
di Iodos los tipos de gráfico ...

Figura 2-19

~= I~~~
,~:: llBE~Bl~lf!Q=~·=
~~~~~~~~~~~~~~
':;==--====================-======:111
::::-Ir~~~~~~
~~
.•n ••• ..,6,) ~

~= ~~~~5J~
~~n[lj~eJ
1r!J~~~~
I ~EJ WJJ'ltdfi

Figura 2-20

Si utilizamos el gráfico de tipo Línea del grupo Gráficos de la ficha Insertar


(Figura 2-13) se representa el gráfico de líneas correspondiente al grafo (t, Z) de las
dos variables t y Z (Figura 2-21).
48 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Al situar el ratón sobre cualquier zona del gráfico, se observa que aparece la
nueva barra de Herramientas de gráficos (parte superior derecha de la Figura 2-21)
que contiene las tres fichas Diseño, Presentación y Formato que permiten la edición
de un gráfico ya existente. La ficha Diseño permite cambiar el tipo de gráfico, los
datos del mismo, los diseños a utilizar, los estilos y la ubicación. La ficha
Presentación (Figura 2-22) permite trabajar con el área del gráfico, etiquetas, títulos,
ejes, fondos, líneas de tendencia y todos los elementos habituales que componen un
gráfico. La ficha Formato (Figura 2-23) permite trabajar con estilos de forma, estilos
de W ord Art, así como con el tamaño y la organización del gráfico.

librol - MicrosoftE:xcel

ímcc lnstrtar Dis~ño ce p3.qlna formulas natos Revisa' Vista Acrobaf

-
- J
110

100 - ~
80
/ ¡.-
---l-
_._-
Í----
--

60
-:
/ -e-e-r
--
"
-z
---
."
zo
/' 1
--
---
-
~ -- -
o
1 Z , • 5 6 7
• 9 10
--
H - HOla3 Y:):
" "
Figura 2-21

r;J 'Q .,.. libro!· Microsoftb:ct!

TnkiO lnmbr

Árudttrmdct ~lhe<l"I· ~
~ ApUrar farmilla lit seíecoén ' ~.A Balfill aHfnCtnttl e aescencemes ~

~Rf5Ílbltcer ~a haw comcidirel Hlllo l unea oe


tflld!nri3·~Balfaldee!JOr~
Pro¡:¡rtd;¡cdes
.•

Figura 2-22

lntóo lnserter DlSfflOdt ~gnu formulas Datos Revisar Vista

- --- - - taRflltnOdtfOrma? Trilrfad&,"ltt- ~Alineor·

EJ EJ EJ ~
Áf!a del gráfico
t] !!2 (m
~Aohcarformato
•• Rffiabltctr J)am recer
a ~ selffÓÓn
(OlflCl(!U tf tsftto __ __ ~
~C.nlom,d"_·
Efutosdtformas""
~
!'---
lA _
~ émisr ¡tB~.,.
~ Pan~ de stle<oon
.d A~var
(t Girar
~
~!...Z.7(m

Stk{oonac:.J~1 fstilo~dtA'DrdM Or9AA~r tamañ.O'

Figura 2-23
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 49

EXCEL y LAS DISTRIBUCIONES DE FRECUENCIAS

Excel permite trabajar con distribuciones de frecuencias por dos vías


distintas. Por un lado, aporta la función FRECUENCIA, disponible desde las
primeras versiones del programa. Por otro lado, el complemento de Análisis de datos
incorpora la opción Histograma, que permite hallar distribuciones de frecuencias para
variables aleatorias cuantitativas y representarlas mediante los correspondientes
histogramas de frecuencias.

La/unción FRECUENCIA de Excel

La función FRECUENCIA de Excel calcula las frecuencias absolutas de los


valores de una variable en un rango de intervalos o grupos cuyos extremos se
conocen. Debe introducirse como una fórmula de matrices, debido a que
FRECUENCIA devuelve una matriz. Su sintaxis es la siguiente:
')

FRECUENCIA (datos;grupos)

El argumento datos es una matriz de un conjunto de valores o una referencia a


un conjunto de valores xi, X2, ... , x; cuyas frecuencias se desea calcular (columna DATOS
de la Figura 2-24). El argumento grupos es una matriz de intervalos o una referencia a
extremos superiores de intervalos L¡, L2, ... , Lk dentro de los cuales desea agrupar los
valores del argumento datos (columna INTERVALOS de la Figura 2-15). L¡, L2, ... , L;
representan los intervalos (-oo,L¡], (L¡,L2], .•. , (Lk-¡, Lk], (Lh (0). Si grupos no contiene
ningún valor, FRECUENCIA devolverá el número de elementos contenido en datos.

La función FRECUENCIA se introduce como una fórmula matricial después de


seleccionar un rango de celdas adyacentes en las que se desea que aparezca el resultado
de la distribución (Figura 2-24).

FRECUENCIA ~ X.J fx =FRECUENCIA(A2-A10;B2-B5)


A B C D 1 •
1 DATOS INTERVALOS RESULTADO I -
2 79 70 -FRECUENCIA(.A2:A10;B2:B51
f--3=-t- __ ---=::;85 C+- 7=-.::9+---
__ -I I FRECUENCIA(datos; grupos) I -
4 78 89
5 85
6 50
7 81
8 95
-b 88

-Hi-----~-l======== -======:=:---------t-
10 97 ~

1~~\Hoial/Hoia2 IHoia3/ 1.1 1 ..- - .1


Figura 2-24
50 ESTADíSTICA APLICADA CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

El número de elementos de la matriz devuelta supera en una unidad el número


de elementos del argumento grupos. El elemento adicional de la matriz devuelta ofrece
la suma de todos los valores superiores al mayor intervalo. Por ejemplo, al sumar tres
rangos de valores (intervalos) introducidos en tres celdas, asegúrese de introducir
FRECUENCIA en cuatro celdas para los resultados. La celda adicional devuelve el
número de valores en grupos que sean superiores al valor del tercer intervalo.

La función FRECUENCIA pasa por alto celdas en blanco y texto. Las


fórmulas que devuelven matrices deben introducirse como fórmulas matriciales. Por
lo tanto, para hallar la distribución de frecuencias es necesario pulsar
MA YÚSCULAS+CONTROL+Enter una vez introducida la fórmula (Figura 2-25).

D2 fx {=FRECUENCIA(A2A10;B2B5)}
D
'-T i5AT0~-----tiÑTERVA~OS I C ~RESULTADO
2 7~ m
2
4
5
6
78
SS
50
r¡------BTt--------t------t-----------------------t---
89 4
2
.
rs--------9Sr--------------
9I Sr- -------il------i-----------------r--:
101 97
111
I:,~~'
"-'--.d.=. =.::;,,~:-H:-:-o-:--al~::HO=-a2=:;::I.::;:::HO=ía-:::,3=/~===::::!===.-h-:.] ~-=--=--=--=--=--=-~-=--=';-I ,-=--
--;,:::- ;·,--r~-;:f
Figura 2-25
Por otra parte, dentro de las categorías de funciones de Excel tenemos la
relativa a Estadísticas, cuya orientación es la estadística general. Ya sabemos que para
ver las funciones de las distintas categorías se hace clic sobre el icono Insertar función,
f. , de la barra de fórmulas, o se elige la opción Insertar función del grupo Biblioteca
de funciones del menú Fórmulas (Figura 2-26), con lo que se obtiene la Figura 2-27,
en cuyo cuadro Seleccionar una categoría se puede elegir cualquiera de ellas,
presentándose todas las funciones de la categoría elegida (Estadísticas) en el cuadro
Seleccionar una función. -

? lógKaS 9
Escriba una breve descripción de lo que desea hacer Y. a Ir
continuactón, MQ<!II die en Ir
Usadas reoememerrte 9 :e.. Texto -
O seleccionar l.K\a ,-ate~ia: r.IEst:::.-:;:doS=t~::-as:----'--
Insertar
función Ptnanrteras .•. er Fecha y hora - íf3...
Seleccionar lXWlI función:
Todas
Financier~ -
.••
a.nnctece de tendones

lnsertal función (Mayús+F3)


~~iT~:;'i~ico.XY ~~~~~t~~a
y trigonométr t---- ..!..l.::<
ESTlMACION.LlNEAL •••
E,dita la fórmula de la ce-lda actual ~~J~~:CION.LOGARITMIC" ~~~~u;ed~;~=ferencia
setecoonanco las tuncrones y ecntendc tos _ Texto
argumentos. GAMMA.LN L6gicas
InForm<!lcién
~ PresIOne fl ~ra obtener ayuda. FRECUEf'fCIA(datO$;grupc:l DeFinidas por el usuario _
cekote la trecoercte con la Ilnoeniería .•.. rOf19Ode
valores y devuelve Lna matriz vertiC"" uc numeros con mas de un elemento
que grupos.

I Aceo'''' Cancel.!!!r

Figura 2-26 Figura 2-27


CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 51

Si en el cuadro Seleccionar una función hacemos c1ic con el ratón sobre la


función FRECUENCIA (Figura 2-28), se obtendrá la Paleta de la función con su
sintaxis (Figura 2-29). Una vez completados los argumentos, se obtiene el resultado en
la parte inferior derecha del argumento grupos. Al pulsar Aceptar, la fórmula y su
resultado se insertan en la celda activa de la hoja de cálculo.

Escriba una breve descripción de lo Que desea hacer y a


J Ir
continuación, haga die en Ir

I
o seleccionaruna ~ategoría: Estad;sti~as
Seleccionar una Eunción:
ESTIMACION .LINEAL
ESTIMACION.LOGARITMICA
FISHER

GAMMA.LN
INTERSECCION.EJE
INTERVALO. CONFIANZA
FRECUENClA(datos;grupos)
Calcula la frecuenda con la que ocurre un valor dentro de un rango de
valores y devuelve una matriz vertical de números con más de un elemento
que grupos.

Ayuda sobre esta función

Figura 2-28

"!<' = {79\85\78\8S\SO\81 \

Grupos IS2:65 = {70\79\89\O}

= {1\2\4\2}
Calcula la frecuencia con la que ocurre un valor dentro de un rango de valores y devuelve una matriz
vertical de números con más de un elemento que grupos.

Datos es una matriz, o una referencia} de un conjunto de valores de los


cuales se desea contar frecueodes. Se omiten espacios en blanco y
texto,

Resultado de la fórmula = 1

Ayuda sobre esta función Aceptar Cancelar

Figura 2-29

Distribuciones de frecuencias e histogramas con herramientas


de análisis de Excel
En el capítulo anterior se ha visto que Microsoft Excel proporciona un
conjunto de herramientas para el análisis de los datos (denominado herramientas
para análisis) que podrán utilizar para el desarrollo de análisis estadísticos o
técnicos complejos.
52 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Para utilizar la lista de herramientas de análisis estadístico avanzado disponibles, se


selecciona la opción Análisis de datos en el grupo Análisis de la ficha Datos (Figura 2-30),
con 10que se obtiene el cuadro Funciones para análisis de la Figura 2-31.

~. _ '"'i

~ :. .:.::J.I'
: "'1 ~ : 9 Anflskd!dalO
-" ':: ?SGiftl
retc.ee Qu.i4r YJlidaoon Consolidar AN!tslS ¡!.grupcy Dt'-l!1~· SIó"btGtal
cclll!tm! dupladO! ee eeres- (!i· ~ •

t:!epnu1rtasatc.r.;jS ~ _

_ @RJmm
FmlcruflpMlHI:JU:1fl'n»¡ayuda,

Figura 2-30

Aceptar
Análisis de varianza de un factor
Análisis de varianza de dos Factores con varias muestras por grupo Cancelar
Análisis de vertenze de dos factores con una sola muestra por grupo
Coeficiente de correlación
AY\l.da
Covarienza
Estadística descriptiva
Suavización exponencial
Prueba F para varianzas de dos muestras
Análisis de Fourier

Figura 2-31

En el campo Funciones para análisis del cuadro Análisis de datos de la


Figura 2-31, se observa la función Histograma. Esta herramienta de análisis
estadístico calcula las frecuencias individuales y acumulativas de variables situadas en
rangos de celdas de datos dados, genera tablas de frecuencias y representa histogramas.

Su pantalla de entrada se presenta en la Figura 2-32. En el cuadro Rango de


entrada introduzca la referencia del rango de celdas correspondiente a los datos que
desee analizar. En el cuadro Rango clases (opcional) introduzca el rango de celdas
que definan los extremos de los intervalos de clase. Estos valores deberán estar en
orden ascendente. Todos los valores por debajo del primer valor de clase formarán la
clase inferior, y los valores por encima del último valor de clase formarán la clase
superior. Si se omite el rango de clase, Microsoft Excel creará un conjunto de clases
distribuidas igualmente entre los valores mínimo y máximo de los datos.

Se activa la casilla Rótulos si la primera fila y la primera columna del rango


de entrada contienen rótulos. Esta casilla de verificación estará des activada si el
rango de entrada carece de rótulos, en cuyo caso Microsoft Excel generará los
rótulos de datos correspondientes para la tabla de resultados.
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 53

l!!f~~~~~~&J~
rEntrada
Rango de entrada: JISgm." I Aceptar
1
Rango de clases: I$B$2:$B$4 M
Cancelar
I
r Rótulos AY\lda I
rOpciones de salida

lo Rango de ~alida: j$E$! ~


r En una boja nueva: 1
r En un libro nuevo
r Pª-reto (Histograma ordenado)
P' Eorcentaje acumulado
¡;; <;;rear gráfico

Figura 2-32

En cuanto a las opciones de Salida de la Figura 2-32, en el cuadro Rango de


salida, introduzca la referencia correspondiente a la celda superior izquierda de la
tabla de resultados. Microsoft Excel determinará el tamaño del área de resultados y
mostrará un mensaje si la tabla de resultados reemplaza los datos existentes.

Haga clic en la opción En una hoja nueva para insertar una hoja nueva en el
libro actual y pegar los resultados comenzando por la celda Al de la nueva hoja de
cálculo. Para asignar un nombre a la nueva hoja de cálculo, escríbalo en el cuadro.

Pulse en la opción En un libro nuevo para crear un nuevo libro y pegar los
resultados en una hoja nueva del libro creado.

Active la casilla Pareto (Histograma ordenado) para presentar los datos en


orden de frecuencia descendente en la tabla de resultados. Si esta casilla está
desactivada, Microsoft Excel presentará los datos en orden ascendente, y omitirá las
tres columnas situadas más a la derecha que contienen los datos ordenados.

Active la casilla Porcentaje acumulado para generar una columna de tabla


de resultados con porcentajes acumulados y para incluir una línea de porcentaje
acumulado en el gráfico de histograma. Desactívela para omitir los porcentajes
acumulados.

Active la casilla Crear gráfico para generar un gráfico de histograma


incrustado con la tabla de resultados.

En la Figura 2-33 se muestra la salida correspondiente al Histograma de la


variable Datos, con extremos de intervalos de clase dados por la columna Intervalos
para el cuadro de diálogo Histograma de la Figura 2-32.
54 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

A B e D E F G H r:¡
1 DATOS INTERVALOS Clase i Frecuencia % acumulado 1

+~~::-~-==I
5
===i¡"=={=::i===:~!¡===i:=~j-:~i~=~-===::¡:"=::J
85 y mayor ... 2 100,00%1 I
6 50
7 81
8 95
9 88
I-fa 97
r.7----- - -··-----+-----'~---'I__---l---·--l-------+-----·---- -+------··--1 /
/

~---~~----~--~~----~----~----~----~-I
~-- Histograma
13
14
15
16
.~ 6
ii 4
~ 2
f r-1-n ~n-
"__
~'I I n
-+150,00%
100,00%
50,00%
I=Frecuencia 1
1--- % acumulado 11---1-----1
17
18
t:O ,00% 1----1-----1
70 79 89 Y mayor ...
19
20 Clase
22
21 L-¡- -,---.- -,- --,- ---,'- __ --j •

Hoia3

Figura 2-33

EJERCICIOS RESUELTOS
~
Ejercicio l. Los alumnos de último curso de Bachillerato de un Instituto eligen
carrera según los datos de la tabla siguiente:

CARRERA MEDICINA DERECHO CIENCIAS LETRAS INEF OTRAS


ALUMNOS 250 176 127 314 103 30

Construir la distribución de frecuencias adecuada para la variable carrera elegida


por los alumnos y realizar los gráficos pertinentes que la representen.

Dado que se trata de una variable cualitativa, podemos comenzar realizando su


representación mediante un diagrama de rectángulos, que se construye asignando a cada
modalidad de la variable cualitativa un rectángulo con altura igual (o proporcional) a su
frecuencia absoluta ni Y con base constante. La tabla de frecuencias relativa a la variable se
presenta a continuación. Las fórmulas de Excel que la generan se ven en la Figura 2-33a.

ALUMNOS
CARRERA (ni) ti= n/N a,= 360t;
Medicina 250 0,25 90
Derecho 176 0,176 63,36
Ciencias 127 0,127 45,72
Letras 314 0,314 113,04
INEF 103 0,103 37,08
Otras 30 0,03 10,8
N=1000 1 360
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 55

A 8 C l
1 CARRERA ALUMNOS (ni) fi =~/N ai = 360j,·'
2 Medicina 250 =82/$8$8 =360"C2
3 Derecho 176 -83/$8$8 -360"C3
4 Ciencias 127 =84/$8$8 -360"C4
5 letras 314 =85/$8$8 -360*C5
6 INEF 103 =86/$8$8 =360*C6
7 Otras 30 ~ -87/$8$8 -360"C7
8 =SUMA(82:87) =88/$8$8 =360"C8

Figura 2-33a

El diagrama de barras se construye seleccionando la columna ni de la tabla,


haciendo clic en el tipo de gráfico Columna agrupada del grupo Gráficos de la ficha
Insertar (Figura 2-34). Se obtiene el gráfico de barras de la Figura 2-35.

ESTUOIANTES POR CARRERAS

H18

Figura 2-34 Figura 2-35

También podría realizarse la representación de la distribución de frecuencias de


nuestra variable cualitativa mediante el diagrama de sectores con porcentajes de la
Figura 2-36. Los porcentajes relativos a cada carrera se calculan mediante lOO/¡y los
ángulos centrales de cada sector se calculan mediante 360fi. Excel realiza esta Figura si
elegimos el tipo de gráfico Circular 3D en el grupo Gráficos de la ficha Insertar.

ESTUDIANTES POR CARRERAS

INEF OTRAS MEDICINA o MEDICINA I


10% 3% 25% •• DERECHO

o CIENCIAS I1
lETRAS o lETRAS
31% mECHa
IIINEF
CIENCIAS 18%
13% O OTRAS

Figura 2-36
56 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Ejercicio 2. En una clínica se han re'gistrado durante un mesrasToñgitudes' en metros


que los niños andan el primer día que comienzan a caminar, obteniéndose los
siguientes resultados:

Número de metros 1 2 3 4 5 6 7 8
Número de niños 2 6 10 5 10 3 2 2

Construir la distribución de frecuencias adecuada para la variable longitud y realiz


los gráficospertinel!te:Lque la,repres~!1ten~._

Dado que se trata de una variable cuantitativa con valores sin agrupar, podemos
comenzar realizando su representación mediante un diagrama de barras situando sobre
el eje de abscisas los valores de la variable X; y sobre el eje de ordenadas los valores
de sus frecuencias absolutas ni. Asimismo, si sobre el eje de ordenadas situamos las
frecuencias absolutas acumuladas Ni, obtenemos el diagrama de barras acumuladas.
También son interesantes el polígono de frecuencias y el polígono de frecuencias
acumuladas. La tabla de frecuencias relativa a la variable se presenta a continuación:

X; ni N¡ fi F¡
1 2 2 0,05 0,05
2 6 8 0,15 0,2
3 10 18 0,25 0,45
4 5 23 0,125 0,575
5 10 33 0,25 0,825
6 3 36 0,075 0,9
7 2 38 0,05 0,95
8 2 40 0,05 1

La tabla de frecuencias relativa a la variable puede realizarse con Excel partiendo


de las variables X; y ni e introduciendo las fórmulas como se indica en la Figura 2-37.

A I B I C j O I
1 Xi lni iNifi iFi
2 1 i2 =B2 ~ I=D2
1- ::-t: ------+:: 1I,6:----------'-=-=B=-3+-:C-=-2 ----¡=B3/$C$9
3 2 fí2:i-.¡:§2
73 [10 l=.::::.B4:...+.::..C3=----\r,...:=B=-:¡~/$.::..:C$~9~·
-+-i=.:::..D~4+::E=_i3
5 4 [5=B5+C4 r:B5/$C$9 I=D5+E4

Figura 2-37
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 57

Realmente sólo hay que introducir las fórmulas de las celdas C2, D2, C3 y D3 y
arrastrar hacia abajo hasta el final de las columnas las celdas D2 y D3. La hoja de Excel
resultante con los datos muestra la distribución de frecuencias (Figura 2-38).

A B e D I E
1 Xi [ni Ni ti IFi
2 1 2 2 0,051 0,05
3 2 6 8 0,151 0,2
4 3 10 18 0,25 0,45
5 41 5 23 0,125, 0,575
6 51 10 33 0,251 0,825
7· 6! 3 36 0,0751 0,9
8 71 2 38 0,05! 0,95
9 81 2 40 0,051 1
Figura 2-38

Para crear el diagrama de barras comenzamos seleccionando las celdas que


contienen los datos que desea presentar en el gráfico de barras (Figura 2-39). Si desea que
los rótulos de fila o columna aparezcan en el gráfico, incluya en la selección las celdas que
los contienen. A continuación, se selecciona la opción Columna del grupo Gráficos del
menú Insertar y se hace clic en el subtipo Columna agrupada como se indica en la Figura
2-40. Se obtiene el diagrama de barras de la Figura 2-41.

! A I B e 1 D E Insertar I Diseño ce página Fórmufas Datos Re


1 Xi ni Ni fi Fi
~3 ---- 1
2 6
2 2r
81
0,05
0,15
0,05
0,2
{gf [][j1
uD
=1{]' ..:=...
~~~
Imagen
4
5
3
4
10
5 ___
18,
23r __
0,25
~~1--~75
0,45
ir
Imagenes
prectseñaoas.
Formas
. SmartArt Cf.ll~rnna li'~fa Circ

IlustraCIones
6 5 10 33---- 0,25 0,825 Columna en 2-0

·L ,t;-J
J~lliJ
7 6 3 36 0,075 0,9
8 7 2 38r 0,05 0,95
9 8 2 . 40 0,05 1
B I
e D

Figura 2-39 Figura 2-40

A B I e o E F G H 1
1 Xi i INi fi Fi
2 1 2 2 0.05 0,05
3 2 6 8 0.15 0,2
-4- 3 10

4 f----- .5
4 5
ni
~7 6
10

.4- --------87 ---'2. 2 12


9
10
10
11
12
13
14
!
[


. 8

6
--
~'-
{S
16
17
18
19
20 I
i
I
4

O II
1 2
-
-

3
-
-

4
-

5
--n 6
II II
7 8
f---- L
21
Figura 2-41
-
58 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Para crear el diagrama de barras acumuladas, comenzamos seleccionando las


celdas que contienen los datos que desea presentar en el gráfico, que ahora son los de la
columna M (frecuencias absolutas acumuladas). Siguiendo los mismos pasos del caso
anterior, se obtiene el diagrama de barras acumuladas de la Figura 2-42.

A I 8 e D 1 E 1 F 1 G H 1 1 1
1 Xi ni [Ni fi ,Fi 1 1 1
2 11 2 2 0.051 0.051 1 ! I
3 2 6 8
4 3 10 18 - Ni
5 4 5 23
6 5 10 33
7 6 3 45
36
2 38 40
1+ I-----~ --- r-
9 8 2 40 35 f--
f-f¡) -- I -
r-- r-- !--

'"
30

~.
1--------

12
25
--
f-- f-- '--
13 20 ,- f-- f-- -
r-14- ~-"-,."--~- 15 - - f-- r--"'-
1------- -----
~
~17
10
5 -n- - -
- -
r--
f--
r--
f--
-
-
r-r-t
18 O
19
20
1 2 3 4
. 5 6 7 8

FIgura 2-42

También se puede construir el polígono de frecuencias. Para ello, se unen los


puntos (X¡,n¡),seleccionándolos previamente en la hoja, eligiendo la opción Dispersión del
grupo Gráficos del menú Insertar y haciendo clic en el subtipo Dispersión con líneas
rectas y marcadores como se indica en la Figura 2-43. Se obtiene el diagrama de barras de
la Figura 2-44.

A
Tabla Tabla imagen formas SmartArt Columna línea Circular Barra Area Cuadro E
:.=:.::="--~ ___.de texto+ p
~
dinamita..
__ ~T.~b~"~5
__ -=__~~~~~~ ~==~~== G~r~.f~I(O~5 ~~o~~n~
,-- __
_

Al Xi
A B D E ¡ F
1 Xi ni Ni fi
2_:::::: --- --2 _ •••• ~>~

sr
y
2 1 0.05,_
3 2 6 0,151 --1-
4 3 10 18 0,25
5 4 5 23r 0,125
-- 33"--
6 5 10 0,25 Dispersión con líneas. rectas y marcadores
7 6 3 36f 0.075
38"--- Compara pares de valores,
8 7 2 =+-- 0,95
0.05 _
9 8 2. ___ 40=- 0.05t-- 1 lJtHícelo cuando haya pocos puntos de datos
10' ----;-- ----- ---l-----l---- _ en el orden del eje x ytcs datos representen
valores separados.
11
Figura 2-43
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 59

A B e I o I E I F I G I H I
e: I I I
1 Xi .ni Ni '" •
2 1 2 ni
3 2 6
4 3 10
5 4 12
5
6 5 10
10
7
8
6
7
3
2 8 1\ /\
9 8 2
/ \ / \
-.
10 • 6 I--nil
l

11
/ V \
12 4
13
14 2
/
15
16 O
17 O 2 4 6 8 10
18 .
Figura 2-44

Por último, también puede construirse el polígono de frecuencias acumuladas


uniendo los puntos (X¡,N¡), previa selección de los mismos en la hoja de cálculo y
utilizando las opciones gráficas del caso anterior, es decir, eligiendo la opción
Dispersión del grupo Gráficos del menú Insertar y haciendo clic en el subtipo Dispersión
con líneas rectas y marcadores. Se obtiene el polígono de frecuencias acumuladas de la
Figura 2-45.

A B e o I E I F I G I H I I I
1 Xi ni lNi •
2 1 2 2 Ni

+
5
1------ 2
3
4
6
------ ---18B
10
5 23
45

6
7
5
6
10
3
33
36
40
35
J/
--------
B 7 2 38 30
9 B 2 40 25
/
10 I 20 / I--Nil
11
15 / ,
12 -_ ... _- 10
/
13
14 5 /
15 +'"
O
16
O 2 4 6 8 10
17
FIgura 2-45
60 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Ejercicio 3. Las puntuaciones obtenidas por 100 opositores en el último ejercicio se


presentan en el cuadro siguiente:

7 3 2 4 5 1 8 6 1 5
3 2 4 9 8 1 O 2 4 1
2 5 6 5 4 7 1 3 O 5
8 6 3 4 O 10 2 5 7 4
O 2 1 5 6 4 3 5 2 3
9 7 3 4 3 5 7 4 6 5
6 1 O 5 7 8 5 2 3 10
4 6 2 1 1 2 6 7 4 5
4 7 6 3 5 O 2 8 2 7
8 5 2 7 1 4 6 3 5 6
1. Construir la distribución de frecuencias adecuada para las puntuaciones.
2. Hallar el porcentaje de alumnos que aprobó la oposición.
3. Hallar el porcentaje de alumnos que sacaron notas superiores a 6.
4. Si sólo hay 20 plazas ¿En qué nota hay que situar el aprobado?
5. Realizar las representaciones gráficas de la distribución adecuadas para este
problema,

Para construir la distribución de frecuencias de la variable aleatoria X que


representa las distintas calificaciones, tabulamos los datos haciendo un recuento de
los opositores que obtienen cada calificación (frecuencias absolutas de cada
calificación) y derivando el resto de las columnas de la tabla de frecuencias tal y
como se indica a continuación:

Xi ni fi = n./N Ni F¡=N¡/N
O 6 0,06 6 0,06
1 10 0,1 16 0,16
2 13 0,13 29 0,29
3 11 0,11 40 0,4
4 13 0,13 53 0,53
5 16 0,16 69 0,69
6 11 0,11 80 0,8
7 10 0,1 90 0,9
8 6 0,06 96 0,96
9 2 0,02 98 0,98
10 2 0,02 100 1
N= 100 Ifi= 1
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 61

La tabla de frecuencias anterior puede construirse a partir de las fórmulas de


la Figura 2-46. No olvidemos que las fórmulas de las celdas C3, D3 y E3 se arrastran
hacia abajo hasta la fila 12.

A I B i C I o I E
1 X ¡ni í=n¡/N N¡ IF¡~N¡/N
2 O 6 ~-B2I$B$13 6 0,06
3 1 10 =B3I$B$13 -02+B3 -E2+C3
4 2 13 =B4/$B$13 =03+B4 =E3+C4
5 3 11 -B5I$B$13 -04+B5 -E4+C5
6 4 ,13 =B6/$B$13 =05+B6 ,-E5+C6
7 5 16 I=B7/$B$13 -06+B7 ;-E6+C7
8 6 ru -B8/$B$13 1-07+B8 ,-E7+C8
9 7 .m =B9/$B$13 =08+B9 '-E8+C9
10 8 6 :=Bl 0/$B$13 . ,=09+Bl0 =E9+Cl0
11 9 2 ,-Bll/$B$13 .-010+811 '-El0+Cll
12 10 2 =B12/$B$13 =011+B12 =Ell+C12
13 --SUMArB2B121 "i=BÜ/$B$~ I
FIgura 2-46

Puesto que las frecuencias relativas pueden interpretarse como el peso


relativo de cada valor en la distribución, el porcentaje de alumnos que aprobó la
oposición (o sea, que obtuvieron un 5) será la frecuencia relativa correspondiente al
valor 5 de la variable, es decir, el 16 por ciento (0,16).

Puesto que las frecuencias absolutas acumuladas correspondientes a un valor


dado de la variable pueden interpretarse como el número de valores iguales o
inferiores a ese valor dado, resulta que para el valor 6 de la variable hay 80
opositores que obtuvieron una calificación inferior o igual a 6. Por lo tanto habrá 20
opositores (100-80=20) que han obtenido una calificación superior a 6. Este
resultado quiere decir que en caso de haber sólo 20 plazas, la nota mínima para
superar la oposición hay que situarla por encima del 6. Es decir, superarán la
oposición los alumnos que obtengan más de un 6.

Dado que estamos ante una variable cuantitativa con datos sin agrupar
podemos representada mediante el diagrama de barras o mediante el polígono de
frecuencias (Figura 2-47) obtenidos mediante los mismos pasos del ejercicio anterior.

El diagrama de barras y el polígono de frecuencias suelen ofrecer


información sobre la simetría y la normalidad de la distribución. En este caso vemos
que estas representaciones no se desvían demasiado de una campana de Gauss, 10 que
indica que puede admitirse la normalidad de los datos. En cuanto a la simetría se
observa que la parte izquierda de la distribución aglomera más frecuencia, por 10 que
podría haber una asimetría débil en esa dirección. No obstante, podría admitirse
también la simetría, al igual que la normalidad con un margen de error no muy
elevado.
62 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

¡ A B e o E F G H I J K
1 iXi ITI í~n¡lN N¡ Fi.N¡/N
2
3
_-_ _-
+6
._------ .... .. ____ o

7
8
9 c------7
'10 8 o o •..........

i#1-,8 ---- --
13

~1
1001

ni
.
ni

18 18

f-14t 16 16
~20 ,. ;,
14
r-.
/\
-g

e-- ea c/-' \ \....


J1- 12

f-
i ....•
12
/ V -
~ 10
~
~ 10
I 01 \ I-+-nil'
~24 8- r- 8
\.
/
'25,- f-
1
6
of m -\
f26 r- -;;; 4
ry
'28
~
:fF
O
f- <1
1 11 I
-
2
O
\

l-3Q
1-::7
1 2 3 • 5 6 7 8 9 10 11

Figura 2-47
1 2 3 4 5 6
. 7 8 9 10 11

Este problema puede resolverse con Excel de una forma alternativa más
rápida utilizando las herramientas para análisis. Para ello, introducimos los datos en
una sola columna de nombre X en la hoja de cálculo, seleccionamos la opción
Análisis de datos del grupo Análisis de la ficha Datos (Figura 2-48) y en la pantalla
Análisis de datos elegimos Histograma (Figura 2-49). Pulsamos Aceptar y
rellenamos la pantalla Histograma, tal y como se indica en la Figura 2-50. En el campo
Rango de entrada se introduce el rango en el que se sitúan los datos de la variable. En el
campo Rango de clases se sitúa el rango que ocupa la columna de los extremos
superiores de los intervalos de clase. En el campo Rango de salida se sitúa el rango que
ocupará la tabla de frecuencias, pero basta con situar sólo el extremo superior izquierdo
de dicho rango. Además, señalamos la opción Gráfico para obtener el histograma de
frecuencias absolutas. Al pulsar Aceptar se obtiene la Figura 2-51, que presenta la
distribución de frecuencias de la variable y el histograma pedidos.

Figura 2-48
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 63

Análisis de datos

Eundones para anáJisis


Aceptar
Anáüsis de varlanza de dos factores con una sola muestra por grupo
J
Coefiáente de correlaáón
Covarianza
Cancelar I
Estadística descriptiva
Suavizadón exponendal
Prueba F para varianzas de dos muestras
Análisis de Fourier
a AY!,!da .1

Media móvil
Generación de números eleetoríos

Figura 2-49

Histograma

Entrada
Rango de ~ntrada: I$A$1:$A$101
Aceptar

cancelar
Ra[!Qo de dases:
AY!,!da
Eil &ótulos
Opáones de salida

@ Rango de ~alida:
~ En una !loja nueva:

í~ En un [ibro nuevo

El Pª,"eto (Histograma ordenado)


E1lt~f~~~ji~~Ci:iii_üi~ªC;.1
Eil Q"ear gráfico

Figura 2-50

A B e D G A K
Clase Frecuencia
I

--·1
O 6

2
10
13 lB
Histograma
I
I
5 4 3 11 I 16
I
6 4 13 14

7
8, 8
------ 5
6
16
11
-~ .
.• 12
"~ 10
f
,,1 6 7
s
10
..!! B
6
~~ ~-- 6 4 • frecuencia
9 2 2
12j

13
14
15
3
2
4
y mayor... 2 O
(> '\. '\. ." ~
"
1> '\ 'b

~.
~;.0"
...
f
I
I
das e
16'
1
18 O

Figura 2-51
64 ESTADíSTICA APLICADA. CONCEPTOS y EJERCICIOS A TRAVÉS DE EXCEL

Si en la Figura 2-50 señalamos adicionalmente la opcion Porcentaje


acumulado (Figura 2-52), obtenemos sobre la misma gráfica, el histograma de
frecuencias y el polígono acuI?ulado de frecuencias (Figura 2-53).

Histograma l'i,l~
~
Entrada = Aceptar
Rango de ~ntrada: ~;(!II ~
Cancelar
RallilO de dases:
~
Ay!!da
~ Rótulos

Opáones de salida

@ Rango de ~Iida: 1$C$1 ~


e En una noja nueva: 1 1
En un pbro nuevo

U Pªrero (Histograma ordenado)


~ eorcentaje acumulado
~ Q"ear gráfico

Figura 2-52

!~ ínirio Insertar Ojs~ño de pagIna Fórmulas 1 Datos t Resiser Vi~ta

,,~~
.~
trn
~~::s:D;:~e~~~ef~:~t~~
L:J
~'j"1>¡
in ffi
(~~~~t~:5
TaJ
UO
A~u:!r:ar
I!l Ccnenones

t;;j
PrDp[tGdu
Edttaf in!ulos
~¡~
¡ il Ordenar
T 1\aomr
fiJtlo
~I/o!,..•• pn""
j¡ Aval1Zi!das
Tato
~
do a-§
(olumnas duplicados de datos
~
y,l'
~• ..lI!Ii
'"
en Quitar Validación Consolióar Análisis
e
..

I
T

Obttner datos enerncs (cne-XiortM i Ordena: y filttar t Herrami!-otas de datos


-
N23 ·é ¡xl
A B e o E F G H I J K
-1 X Clase Frecuencia
--¡
% acumulado -~

~J 7 O 6,00%
3 j
3 1
-
10
6
],6,00%_
-- Histograma
4 2 . 2 13 29,00% 18 120,00%
5

~
4
5
1
-
3
4
5
11
13
16
4O,00~
53,00%
69,00% -512
16
14

~
r-- 100,00%

80,00%

8 8 6 11 80,00%
glO 60,00%
- -- v 8
}O,oo% !6
L~
9 6 7 10 40,00%
- - _Frecuenda

iii 1 8 6 96/00% 4
20,00% acumulado

12
5
3
- --- 9
y mayor".
2
2
~8,00%
1~,00%
-
2
O
o ,.¡ •...
III
., 0,00%
••••• %
~
- er
13 2
N
'" LO
'" '"
-
14 4
15 9
- - ~.

16
-
8
- - Clase

17 ,
Figura 2-53
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 65

Ejercicio 4. Consideramos la variable X definida como el consumo de combustible en


litros a los 1000 kilómetros de los automóviles de una determinada marca. Los valores
para X son los siguientes:

43,1 36,1 32,8 39,4 36,1 19,9 19,4 20,2 19,2 20,5 20,2 25,1 20,5 19,4 20,6
20,8 18,6 18,1 19,2 17,7 18,1 17,5 30 27,5 27,2 30,9 21,1 23,2 23,8 23,9
20,3 17 21,6 16,2 31,5 29,5 21,5 19,8 22,3 20,2 20,6 17 17,6 16,5 18,2
16,9 15,5 19,2 18,5 31,9 34,1 35,7 27,4 25,4 23 27,2 23,9 34,2 34,5 31,8
37,3 28,4 28,8 26,8 33,5 41,5 38,1 32,1 37,2 28 26,4 24,3 19,1 34,3 29,8
31,3 37 32,2 46,6 27,9 40,8 44,3 43,4 36,4 30,4 44,6 40,9 33,8 29,8 32,7
23,7 35 23,6 32,4 27,2 26,6 25,8 23,5 30 39,1 39 35,1 32,3 37 37,7
34,1 34,7 34,4 29,9 33 34,5 33,7 32,4 32,9 31,6 28,1 30,7 25,4 24,2 22,4
26,6 20,2 17,6 28 27 34 31 29 27 24 23 36 37 31 38
36 36 36 34 38 32 38 25 38 26 22 32 36 27 27
44 32 28 31

Con esta información elaborar la tabla de frecuencias asociada a los datos y estudiar
la posible normalidad y simetría de la distribución del consumo de combustible.

Observamos que tenemos 154 valores sobre el consumo de los automóviles


que inicialmente no aportan mucha información. Evidentemente hay una variabilidad
en el consumo de los automóviles, sin embargo es muy dificil detectar qué patrón
sigue dicha variabilidad para determinar mejor la estructura de los datos. En primer
lugar será conveniente realizar una ordenación de los datos según su magnitud, es
decir, una tabla de frecuencias, que aportará algo de luz sobre la distribución de
frecuencias subyacente.

Como se trata de una variable cuantitativa con 154 valores comprendidos


entre 13 y 49, será necesario agrupados en intervalos o clases. Para ello tomamos 12
intervalos de igual anchura (12 es un entero que aproxima bien la raíz cuadrada de N
= 154). La anchura de los intervalos será (49 - 13)/12 = 3.

Para hallar las frecuencias absolutas por clases, se utiliza la función


FRECUENCIA de Excel con la sintaxis que se observa en la Figura 2-54, previa
introducción de los datos de la variable (X;) y de la columna de extremos superiores
de los intervalos (menos el último). Hay que tener en cuenta el rango seleccionado
para escribir la fórmula y que hay que pulsar Mayus+Contro/+Enter para ejecutada.
Se obtiene la Figura 2-55.

Conocidas las frecuencias absolutas, ya podemos construir la tabla de


frecuencias tal y como se ha hecho en los ejercicios anteriores (Figura 2-56).
66 ESTADíSTICA APLICADA ..CONCEPTOS y EJERCICIOS A TRAVÉS DE EXCEL

"''''''''10 ',-
A
X",.
B
-FRECUENCIA(A2:A155;B2:B13)
C D
A B ! e 1 o
E 1 Xi :ni
!
1 Xi
43,1 16: i 1
2 43,1 16 -FRECUENCIA(A2:A155;8c
813 ~3 --36,1 -14"
~~ 19 __ 19' i
-4- 32.8 22 4 32,8 22 í 22
t ~:~~
+__ ~6 --36,1
39,4 251
281
I 15
22
+~
~ __
19.91--_-c'31~-_1
---'i~S7---1
19.2.__ 401-- __ .._1
-
-
7
8
19,9
19,4
31
34'
16
22
20.2 22
*
..g. .2O.5
20.2
Jl .._.:2§,1t---_-"
g
46 -
9
10-
.21-
19.2
205
371
40'
431
--11
3
~--·-~S'¡I----+---+·--------
....
-'--·· g -------25-i
20.2 --.- --_._--,~-~
46. --
16 20.6 13 1
_lLL__ 2O.8_ 14 20,5
18T 18,6 1~ 1~4
Figura 2-54 Figura 2-55

Al B CiD 1 E F I G
1 Xi í lni 'fi-ni/N Ni IFi-Ni/N
2 43,1 i 16 1i 0,00649351 11 0,00649351
3 36,11 19 14 0.09090909 15 0,0974026
~ 32,8 22 22 0,14285714 37 0,24025974
~ 39,4 25 15 0,0974026, 52 0.33766234
6 36,1 28 22 0,14285714 74. 0,48051948
7 19,9 31 16 0,1038961 90' 0.58441558
8 19,4, 34 . 22, O,14285714r 112. 0,7272727
~ __ .~.2.' __ 3~ : 22J.JL14285714 r 134.t-º,87.º1~987
..!9- 1~~ .._40 _. .1._ _ _1 2¡g,0724~l:l.!?U
.. ~5. g,~4_!!?5844

i=lU1==~·j~~=---===~=·I·=:::==-:=:·~jrg:g~~:==:mrK:$~1~
Figura 2-56
A continuación, se presenta la distribución de frecuencias tal y como es
habitual utilizando los intervalos, las marcas de clase (puntos medios de los
intervalos) y las frecuencias.

Intervalo Límite Límite Marca n¡ ¡; = n./N N¡ F¡= n;lN


inferior superior de clase
1 13,0 16,0 14,5 1 0,0065 1 0,0065
2 16,0 19,0 17,5 14 0,0909 15 0,0974
3 19,0 22,0 20,5 22 0,1429 37 0,2403
"1
4 22,0 25,0 23,5 15 0,0974 52 0,3377
5 25,0 28,0 26,5 22 0,1429 74 0,4805
6 28,0 31,0 29,5 -16 0,1039 90 0,5844
7 31,0 34,0 32,5 22 0,1429 112 0,7273
8 34,0 37,0 35,5 22 0,1429 134 0,8701
9 37,0 40,0 38,5 11 0,0714 145 0,9416
10 40,0 43,0 41,5 3 0,0195 148 0,9610
11 43,0 46,0 44,5 5 0,0325 153 0,9935
12 46,0 49,0 47,5 1 0,0065 154 1,0000
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 67

La siguiente tarea es la construcción del histograma de frecuencias. Para ello,


seleccionamos la opción Análisis de datos del grupo Análisis de la ficha Datos y en
la pantalla Análisis de datos elegimos Histograma (Figura 2-57). Pulsamos Aceptar
y rellenamos la pantalla Histograma, tal y como se indica en la Figura 2-58. En el
campo Rango de entrada se introduce el rango en el que se sitúan los datos de la
variable. En el campo Rango de clases se sitúa el rango que ocupa la columna de los
extremos superiores de los intervalos de clase. En el campo Rango de salida se sitúa el
rango que ocupará la tabla de frecuencias, pero basta con situar sólo el extremo superior
izquierdo de dicho rango. Además, señalamos la opción Gráfico para obtener el
histograma de frecuencias absolutas. Al pulsar Aceptar se obtiene la Figura 2-59, que
presenta la distribución de frecuencias de la variable y el histograma pedidos.

fu:rixles para aMsis r::::::::l Ü!'XfiMLmwM


,-".-,---,--:---------....,~
Anáis~ de var~nza de un fact(J •
Arillsis de var~a de dos fact(Je\ (00varias rooestras ~!.1lIJO
Arláisisde varianza de dos fact(Je\ (00l.Ila saa rooestra ~!.1lIJO
Coefderte de ((Jre!aOOn
J Cirreia'

, .• ~,
I
I
Ra[No de clases:

Oaótulos

O~nes de salida
1$8$2:$8$12 ['!SI

CO'Iarianza ~ o Rongo de ,.ida: 1 $0$16 ~,

Eltaásti:a~a O En una ttoia nueva: I :


SuaIiz.IDle~ O En un tOro nuevo

Prueba F para varianzas de dos rooestras O P~reto (Histograma ordenado)


1InáIs~de Fcaier O e.orcentaje acumulMo
I Ii.~ • l!2]~reo!!lrgr¡§fico

Figura 2-57 Figura 2-58


I
I I
I Clase Frecuencia I Histograma
16 1
,,
19 14
25
c--' 22 22 -
25 15 20
28! 22 15
31'
'----:¡sr- 10
I o Frecuencia I
341 22
37!
40
22
11
5
o ~n n
"lb <O- ~ 'll' ~ -
43
46
3
5 Clase
'*'
IV mayor. .. : 1
, I
. . -,--- I

Figura 2-59
Se observa que la distribución subyacente que modela los datos sobre la
variable consumo de los automóviles es aproximadamente simétrica y ajustable a forma
de campana, lo que permite pensar en la existencia de normalidad y simetría en la
distribución de X. Vemos así que el histograma da una idea clara de la distribución de
la variable, incluyendo un modelo probabilístico para su modelación, en este caso la
distribución normal. El simple examen de los datos tabulados inicialmente no aportaba
información alguna, sin embargo su graficación da luz al proceso.
68 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Ejercicio 5. Los valores relativos al número de empresas y trabajadores en una


determinada región son los siguientes:
Trabajadores N° de empresas
0-100 25
100-200 37
200-300 12
400-500 22
500-600 21
600-700 13
700-800 5
800-900 3
900-1000 2
1. Construir la distribución de frecuencias adecuada a los datos.
2. Hallar el número de empresas con más de 300 trabajadores.
3. Hallar el porcentaje de empresas con más de 100 trabajadores y menos de 400.

La distribución de frecuencias se construye como sigue:

Intervalo Límite Límite Marca n¡ f¡ = n¡ N¡ F¡=N¡IN


inferior superior de clase IN
1 O 100 50 25 0,1786 25 0,1786
2 100 200 150 37 0,2643 62 0,4429
3 200 400 250 12 0,0857 74 0,5286
4 400 500 450 22 0,1571 96 0,6857
5 500 600 550 21 0,1500 117 0,8357
6 600 700 650 13 0,0929 130 0,9286
7 700 800 750 5 0,0357 135 0,9643
8 800 900 850 3 0,0214 138 0,9857
9 900 1000 950 2 0,0143 140 1,0000
N= 140

'1 Si observamos la columna de frecuencias absolutas acumuladas N¡ de la tabla


constatamos que la frecuencia absoluta acumulada hasta empresas con 300
trabajadores es de 74, lo que quiere decir que con más de 300 trabajadores existen
144 - 74 = 66 empresas.
Si observamos la columna de frecuencias relativas acumuladas F¡ de la tabla,
tenemos que el porcentaje de empresas con 400 trabajadores o menos es 0,5286
(52,86%), es decir, el mismo que el correspondiente a 300 trabajadores o menos (no
se registraron empresas con un número de trabajadores comprendidos entre 300 y
400). Por otra parte, el porcentaje de empresas con 100 trabajadores o menos es de
0,1786 (17,86%), lo que indica que con más de 100 y menos de 400 tenemos 0,5286
- 0,1786 = 0,35 (35%).
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 69

Para construir la distribución de frecuencias de los trabajadores mediante


Microsoft Excel, tabulamos los datos (intervalos y frecuencias absolutas) y
derivamos el resto de las columnas de la tabla de frecuencias tal y como se indica en
la hoja Excel de la Figura 2-60, que se deriva de las fórmulas de la hoja de la Figura
2-61. No olvidemos que las fórmulas de las celdas F3, G3 Y H3 se arrastran hacia
abajo hasta la fila 10.

e , ,
A B D E F I G H I
1 Intervalo
_ .. __ ... _-_ .....
límite superior límite inferior Marca de clase __ ~l ___ f. =n,1N 1 N, F, =N,IN
- ----------=- ----- -- ----- .. --
'2 1 O 100 50 25 O,17857143r------- -25"0:17857143
3 2 100, 200 150 37 0,26428571í 62' 0,44285714
4 3 200 400 300 121 0,08571429 74 0,52857143
5 4 400 500 450 22 0,15714286 96 0,68571429
6 5 500 600 550 21 O,15i 117, 0,83571429
7 6 600, 700 650 13 O,09285714 ¡ 130 0,92857143
8 71 7001 800 750 5 0,035714291 135 0,96428571
9 8, 8001 900 850 3 0,02142857, 138 O,98571429!
10 9 900 1000 950 2 0,014285711 140 l'
11 I 140 I
FIgura 2-60

A 1 B CID I E 1 F 1 G 1 H
1 lntsrvalo Límite superior límite inferior Marca de clase I I 11; I í- =n¡lN I N¡ F¡=N¡lN
2 1 O -- 100 -t=,(I3~- 25 ¡=E2I$E$11 =E2 ---i:'-~~WL-
3 2 ;100 200 =(B3+C3)12 37 '-E3I$E$ll f=E3+G2 =G3I$E$ll
4 3 1200 400 1=(B4+C4)12 12 l'-E4/$E$11 =E4+G3 :=G4/$E$11
.i. 1400 122 =E5I$E$ll -E5+G4 ,=G5I$E$ll
-=1§~0_-- __-r(B5+C~~ª_
S ~- 500 600 ,= B6+CS 21 --1 =ES/$E$ll r=E6+G5 =G6I$E$ll
7 S 600 700 - 7+C~ 13 -E7/$E$11 -E7+G6 =G7I$E$11
8 7 ?OO OOJ ,= 18+C8 5 =E8/$E$ll i=E8+G7 =G8I$E$ll
9 ,8 OOJ sn - 19+C9 3 =E9/$E$11 -E9+G8 '=G9I$E$ll
1019 900 11000 = 10+Cl 0)/2 2 =E10/$E$11 =El0+G9 =G10/$E$11
11 I ! I :-SUMA(E2El0) I
Figura 2-61

Ejercicio 6. La encuesta de población activa elaborada por el INE referente al 4°


trimestre de 1970 presenta para el número de activos por ramas los siguientes datos:

RAMA DE ACTIVIDAD MILES DE ACTIVOS

Agricultura, caza y pesca 3706,3


Fabriles 3437,8
Construcción 1096,3
Comercio 1388,3
Transporte 648,7
Otros servicios 2454,8

a) Realizar un gráfico de sectores con porcentajes del número de activos por ramas.
b) Realizar el gy:áfico con las etiquetas de las ramas de actividad sobre los sectores.
70 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Comenzamos introduciendo los datos en dos columnas de la hoja de cálculo. A


continuación, elegimos el tipo de gráfico Circular Gráfico 2D en el grupo Gráficos de
la ficha Insertar (Figura 2-62). Obtenemos el gráfico de sectores de la Figura 2-63. Con
el gráfico seleccionado, al hacer clic en Diseño 1 del grupo Diseños de gráfico de la
ficha Diseño en Herramientas de gráfico se obtiene el gráfico de sectores con
porcentajes y etiquetas en los sectores (Figura 2-64). Si elegimos el tipo de gráfico
Circular Seccionado 3D en el grupo Gráficos de la ficha Insertar, se obtiene el gráfico
de sectores tridimensional con sectores seccionados de la Figura 2-65.

Diseño de págiOB Fnrmulas

Imagen Imágenes Formas SmartArt


predlseñadas
. ~W:;neL __ .c.JL,~-...~.

AdVertencia de sequrídad Sé ha deshabílítedo la actualización automática d

Al Ix RAMA

A C
1 RAMA ACTIVOS
~ Agricultura. caza y pesca 3706.3
3 Fabriles 3437,8
4 Construcción 1096.3. +-__ --1
5' Comercio 1388,3. ,_+- ·1
~ Transporte 64BJ
7 Otros servicios 2454.8.
8(
Figura 2-62

2 Gráfico
A B C D E F G
1 RAMA CTlVOS +--
2 Agricultura. caza y pesca 3706.3 . __ +-__ --'- _+_
~;l~~~;;;~cción - - - ~~~~:~ ····i¡;::=============!!.:.!:============:;,;¡¡·¡
5 Comercio 1388.3
ACTIVOS
6 Transporte 648.7
J.. Otros servicios --- --2454.S

11 ~
13
--1= .! ---t"
• Agricultura,

• Fabriles

• Construcción
caza y pesca

-14 -1,
• Comercio

~~ ~. ~l
-- -+-
• Transp-Orte

• Otros servicios
18 ¡.

ih'
2ft ~- -l

Figura 2-63
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 71

ACTIVOS

-+--
o
1
2 Transporte

3 5%

4
5
6
7
8 ~-j
9
O -t=. 9%

Figura 2-64
nsertar

Tabla "ebla Imagen Imaqenes Formas S it1.Art Columna Lmea Circular Barra Afea Dispersión otros Hipervlnculo Cued
dinamica ..•. predi.señadas ..- -'9"'rafICOS'O' de t
Ta-b!3S JlustradonfS Gráfico 20 li rnccrcs

~ Advertencia de seguridad 5, h. d•• h.bilit.~ actu.lizaciónautomáticad ~

3 Gráfico ~
A 8 D__ 1~81
l~l~RAMA~I~~:::~~::::::=;~c~n~v~o~s~~~~~'_--~~----~~
e
H

2 Agri,,-ul!<Jra,~za y~ ~6,3
3 Fabriles 3437 8
-
4 Construcción
ComerCio---
- ----1 --' --~;~=-=;;=-=l~
1096,3
--1388,3
1; Tr~orte 1__ -==-64~8~,7~1
~7 Otros servicios 2454.8 ~ Iodos los tipos de gráf"ico ..,

!~-
12
t -= I • Agrj-cultura,-caza y pesca

• Febnles
13
14 • Construcción
151-----
• Comer-cio

• Transporte

m--
• Otros servicios

~------------l-----'---

Figura 2-65
72 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EX<;:EL

EJERCICIOS PROPUESTOS
Ejercicio 1. Los valores de los pesos en miligramos de 80 hembrillas producidas por
una máquina son los siguientes:

7,33 7,32 7,34 7,40 7,28 7,29 7,35 7,33 7,34 7,28
7,31 7,35 7,32 7,33 7,33 7,36 7,32 7,31 7,35 7,36
7,26 7,39 7,29 7,32 7,34 7,30 7,34 7,32 7,39 7,30
7,33 7,33 7,35 7,34 7,33 7,36 7,33 7,35 7,31 7,33
7,37 7,38 7,38 7,33 7,35 7,30 7,31 7,33 7,35 7,33
7,27 7,33 7,32 7,31 7,34 7,32 7,34 7,32 7,31 7,36
7,30 7,37 7,33 7,32 7,31 7,33 7,32 7,30 7,29 7,38
7,33 7,35 7,32 7,33 7,32 7,34 7,32 7,34 7,32 7,33

1. Construir la distribución de frecuencias adecuada a los datos.


2. Construir el histograma de frecuencias absolutas.
3. Construir el polígono de frecuencias relativas acumuladas.
4. Comprobar la normalidad de los datos.

Ejercicio 2. Se han medido los diámetros de 50 tomillos y se han obtenido los


resultados siguientes en milímetros:

32,1 31,0 32,6 30,0 32,8 31,4 32,0 30,0 30,1 31,8
34,0 31,7 33,0 31,0 32,3 32,6 32,0 31,4 30,2 32,0
33,0 31,4 32,4 31,6 32,7 34,0 33,2 33,1 33,7 31,0
31,8 33,0 32,3 31,4 32,4 31,4 34,0 33,4 32,7 32,3
32,2 33,1 34,2 31,3 29,6 32,7 33,0 31,4 32,6 33,0

l. Elaborar la tabla de frecuencias adecuadamente para la variable diámetro.


2. Construir el histograma de frecuencias absolutas.
3. ¿Se puede intuir si los datos provienen de UIía distribución normal?
4. Estudiar la simetría de la distribución.

Ejercicio 3. Sea una variable X, que presenta los valores {xl,x2,x3,x4,x5} con
frecuencias absolutas n.=L, n2=2, n3=8, n4=5 Y ns=6.

a) Construir la tabla de frecuencias absolutas de X.


a) Representar la variable X>mediante un diagrama de barras horizontales.
b) Representar la variable X mediante un diagrama de barras verticales.
d) Construir la tabla de frecuencias relativas de X y el histograma correspondiente.
d) Representar la variable X mediante un diagrama de barras verticales con la línea
base situada a la altura del punto 4.
CAPíTULO 2: VARIABLES ESTADíSTICAS Y DISTRIBUCIONES DE FRECUENCIAS 73

Ejercicio 4. Se considera el nivel de inflación por Comunidades Autónomas en una


determinada fecha obteniéndose los siguientes valores según código de Comunidad
Autónoma (de 1 a 17):

CA Valor CA Valor

1 1 2 1
3 1 4 1
:
5 2 6 2
7 2 8 2
9 3 10 3
11 3 12 3
13 4 14 4
15 4 16 4
17 4

Representar la variable inflación mediante los gráficos estadísticos más adecuados


para comparar el nivel de inflación en cada Comunidad.
CAPÍTULO 3

,
MEDIDAS DE POSICION,
DISPERSIÓN y FORMA

EXPRESIÓN CUANTITATIVA DE LAS DISTRIBUCIONES


En el capítulo anterior se han defmido los conceptos básicos en el estudio de una
distribución de frecuencias de una variable. En el presente capítulo estudiaremos las
distintas formas de resumir dichas distribuciones mediante medidas de posición (o de
centralización), teniendo presente el error cometido en el resumen mediante las
correspondientes medidas de dispersión. A su vez, analizaremos la forma de la
distribución mediante las medidas de forma. El histograma de frecuencias ya nos daba
una representación visual de las tres propiedades más importantes de los datos
muestrales relativos a variables: la forma de su distribución, su tendencia central y su
dispersión. Ahora se trata de cuantificar estos conceptos.

Por otra parte, también en este capítulo se tratan las técnicas de análisis
exploratorio de datos, que amplían la información ofrecida por las medidas de
concentración, dispersión y forma de una distribución. Mediante las técnicas de
análisis exploratorio se estudian exhaustivamente las distribuciones de frecuencias y
se detectan las posibles anomalías que presentan las observaciones.

MEDIDAS DE POSICIÓN: MEDIA, MEDIANA, MODA,


CUANTILES, PERCENTILES y MOMENTOS
La finalidad de las medidas de posición es encontrar unos valores que sinteticen
las distribuciones de frecuencias. En vez de manejar todos los datos sobre las características
o variables, tarea que puede ser pesada, podemos caracterizar su distribución de frecuencias
mediante algunos valores numéricos, eligiendo como resumen de los datos un valor central
alrededor del cual se encuentran distribuidos los valores de la variable. El valor de la
variable elegido para representar a una distribución se llama promedio o medida de
posición, y es un valor representativo de todos los valores que toma la variable. Debe
hallarse entre el mayor y el menor valor de la variable.
76 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Pero estas medidas de posición de una distribución de frecuencias han de


cumplir determinadas condiciones para que sean verdaderamente representativas de la
variable a la que resumen. Toda síntesis de una distribución se considerará como
operativa si intervienen en su determinación todos y cada uno de los valores de la
distribución, siendo única para cada distribución de frecuencias, y siendo siempre
calculable y de fácil obtención. A continuación, se hace una relación de las medidas de
posición más comunes utilizadas en estadística.

Media aritmética: Se defme como la suma de todos los valores de la distribución


dividida por el número total de datos. La expresión matemática que representa la media
aritmética coincide con el momento de primer orden respecto al origen. Pero esto sólo es
válido en el supuesto más sencillo, en el que los datos de la variable están sin agrupar.
En el caso de que tuviésemos una distribución con datos agrupados en intervalos, los
valores individuales de la variable serían desconocidos y, por tanto, no podríamos
utilizar la fórmula anterior. En este supuesto, los datos estarán agrupados en clases, y se
postula la hipótesis de que el punto medio del intervalo de clase (marca de clase)
representa adecuadamente el valor medio de dicha clase, por lo que aplicariamos la
fórmula original de la media simple para dichos valores. En el caso de que la variable
presente valores anormalmente extremos, éstos pueden distorsionar la media aritmética,
haciéndola incluso poco representativa. A los estadísticos que no son afectados por los
valores extremos de la muestra, se les denomina estadísticos robustos. La media no es un
estadístico robusto. Como veremos posteriormente, este inconveniente no lo posee la
mediana. Si la distribución de frecuencias es (x¡,n¡),siendo x¡ los valores de la variable o
las marcas de clase, y siendo n¡ las frecuencias absolutas, la media aritmética, que
representaremos por X, se defme como sigue:

Media aritmética ponderada: Caso particular de la media aritmética, que aparece


cuando se otorga a cada valor de la variable x, una ponderación o peso W¡, distinto de
la frecuencia o repetición ni. En este caso, no todos los valores de la distribución
intervienen con el mismo peso en el cálculo de la media. La cuantía de dichos pesos
define la importancia de cada valor de la distribución en el cálculo de la media. Si la
distribución de frecuencias es (x¡,n¡,w;), siendo x, los valores de la variable o las
marcas de clase, n¡ las frecuencias absolutas, y W¡ los pesos o ponderaciones, la media
aritmética ponderada, que representaremos como W, se define como sigue:
k

¿x¡n¡w¡
¡=l
W = -'-'k:----
¿n¡w¡
¡=l
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 77

Media geométrica: Sea una distribución de frecuencias (x¡,n¡). La media geométrica,


que representaremos como G, se define como la raíz N-ésima del producto de los N
valores de la distribución.

G -- ~ XlnI X2n2 ... Xk


nk

El empleo más frecuente de la media geométrica es el de promediar variables


tales como porcentajes, tasas, números índices, etc.; es decir, se usa en los casos en los
que se supone que la variable presenta variaciones acumulativas. Además, cuando la
variable toma al menos un valor X¡ = 0, entonces G se anula, y si la variable toma valores
negativos se pueden presentar una gama de casos particulares en los que tampoco queda
determinada debido al problema de las raíces de índice par de números negativos.

Media armónica: Sea una distribución de frecuencias (x¡,n¡). La media armónica, que
representaremos como H, se define como sigue:

Obsérvese que la inversa de la media armónica es la media aritmética de los


inversos de los valores de la variable. No es aconsejable en distribuciones de
variables con valores pequeños. Se suele utilizar para promediar variables tales como
productividades, velocidades, tiempos, rendimientos, tipos de cambio, etc.

Media cuadrática: Sea una distribución de frecuencias (x¡,n¡). La media cuadrática,


que representaremos como C, se define como sigue:

C=
N
La media cuadrática es la raíz cuadrada de la media aritmética de los
cuadrados de los valores de la variable.

Mediana: Se define como mediana el valor de la distribución, suponiendo que ésta


esté ordenada de menor a mayor, que deja a su izquierda y a su derecha la misma
frecuencia de observaciones, es decir, el valor de la variable que ocupa el lugar
central, supuesto un número impar de datos. Si el número de datos fuese par, puede
decirse que hay dos valores medianos, y se toma como mediana la media aritmética
entre ellos. También se podría definir la mediana como aquel valor de la distribución
cuya frecuencia absoluta acumulada es N!2 (N=¿ni). Para distribuciones agrupadas
en intervalos, y suponiendo que todos los valores comprendidos dentro del intervalo
mediano [L¡-l, L¡] se encuentran distribuidos uniformemente a lo largo de él, puede
calcularse la mediana, Me, mediante la expresión:
78 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

dónde M-I <NI2<N¡ Y [L¡-l, L¡] es el intervalo siguiente al que contiene a NI2, siendo
C¡su amplitud.

Como ventaja de la mediana tenemos que no influyen en ella los valores


extremos (estadístico robusto). La mediana tiene gran utilidad en los gráficos de
control de procesos.

Moda: La moda es el valor de la variable que más veces se repite, y en consecuencia,


en una distribución de frecuencias, es el valor de la variable que viene afectado por la
máxima frecuencia de la distribución. En distribuciones no agrupadas en intervalos,
se observa la columna de las frecuencias absolutas, y el valor de la distribución al
que corresponde la mayor frecuencia será la moda. A veces aparecen distribuciones
de variables con más de una moda (bimodales, trimodales, etc.), e incluso
distribuciones de frecuencias que presentan una moda absoluta y una relativa.

En distribuciones agrupadas en intervalos de la misma amplitud, realmente


no tendremos un valor modal, sino un intervalo modal (el intervalo que presenta la
mayor frecuencia [L¡-l, L;]). Podemos tomar como valor modal el extremo inferior
del intervalo (Mo = L¡-l) o el extremo superior (Mo = L¡), o bien hacer que la moda
sea igual a la marca de clase del intervalo modal (Mo = x¡). En caso de que todos los
valores del intervalo modal estén distribuidos uniformemente dentro de él, la moda
estará más cerca de aquel intervalo contiguo cuya frecuencia sea mayor, siendo las
distancias de la moda, Mo, a los intervalos contiguos inversamente proporcionales a
las frecuencias de dichos intervalos. La moda puede calcularse mediante la expresión:

Para intervalos de distinta amplitud, realmente las densidades de frecuencias


nos dan el número de valores que hay en cada unidad de intervalo para cada
intervalo. La mayor densidad de frecuencia, ahora sí, nos determina el intervalo
modal [L¡_¡, L;], calculándose la moda mediante la expresión:

M¿ = L. 1 +
a.;
1+ c. con d=ti/c,
1- d.; + d¡+l 1

Cabe señalar que la moda es la medida más representativa en caso de


distribuciones de variables en escala nominal.
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 79

Esto es debido a que las distribuciones de este tipo presentan datos no


susceptibles de ordenación, de tal forma que para estas distribuciones no es posible
realizar operaciones elementales con sus observaciones. La moda se emplea sobre
todo cuando los valores de la variable presentan una gran concentración hacia un
valor determinado. Sólo se utilizará en distribuciones de gran frecuencia total.

Cuantiles: Se definen los cuantiles de orden k como los valores de la distribución,


suponiendo que ésta esté ordenada de menor a mayor, que la dividen en k partes con
la misma frecuencia de observaciones. Por lo tanto, existirán r=k-l cuantiles de
orden k. El primer cuantil de orden k deja a su izquierda la fracción l/k de frecuencia
de observaciones. El segundo cuantil de orden k deja a su izquierda la fracción 2/k de
frecuencia de observaciones. El r-ésimo cuantil de orden k deja a su izquierda la
fracción r/k (1 OOr/k por ciento) de frecuencia de observaciones, y a su derecha deja
la fracción l-r/k (1OO(k-r)/k por ciento) de frecuencia de observaciones. El r-ésimo
cuantil de orden k suele designarse como Qr.k.

Para el caso más general, en que la distribución esté agrupada en intervalos,


el r-ésimo cuantil de orden k tomará el valor:

donde Ni., <rtl/k=N, y [L¡-l, L¡] es el intervalo siguiente al que contiene a rN/k,
siendo C¡ su amplitud.

Para k=4 y r= 1,2,3, tendremos los 3 cuartiles. Para k= 1O y r= 1,2, ...,9,


tendremos los 9 deciles, y para k=lOO y r=1,2, ...,99, tendremos los 99 percentiles.
Los cuartiles son, por tanto, los tres valores de la distribución que la dividen en 4
partes iguales, es decir, en 4 intervalos dentro de cada cual está incluido el 25% de
los valores de la distribución. Los deciles son los 9 puntos que dividen la
distribución en 10 partes, tales que dentro de cada una está incluido el 10% de los
valores de la distribución. Los percentiles son los 99 puntos que dividen la
distribución en 100 partes, tales que dentro de cada una está incluido el 1% de los
valores de la distribución.

Para distribuciones sin agrupar en intervalos, el primer cuartil, Ql,4, es el valor de


la distribución que ocupa el lugar N/4; el segundo cuartil, Q2,4, es el valor de la distribución
que ocupa el lugar 2N/4; el tercer cuartil, Q3,4, es el valor de la distribución que ocupa el
lugar 3N/4; el r-ésimo decil, Qr,IO, es el valor de la distribución que ocupa el lugar rNIlO
(r=I,2, ...,9); y el r-ésimo percentil, Qr,IOO, es el valor de la distribución que ocupa el lugar
rN/IOO (r= 1,2, ... ,99).
80 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Momentos potenciales: Entre los valores que caracterizan una distribución de frecuencias,
tenemos los momentos potenciales. Dos distribuciones que tienen sus momentos iguales
son iguales, y serán más parecidas cuanto más próximos sean sus momentos. Los
momentos suelen considerarse respecto del origen y respecto de la media.

El momento de orden r respecto del origen se define como:


1 k
a, =- ¿x~n;
N ;~J

El momento de orden r respecto de la media se define como:


1 k
m
r
=-
N
¿(x
;=1 J
-xrn I

Existe una fórmula general que relaciona el momento de orden r centrado en


la media m; y los momentos centrados en el origen a., ar_¡, ... , al:

m r =a r _[r)a 2
1 r-Ja J +[r)a
2 r-2a J _···+(_I)rar J

Se observa que el momento de orden 1 centrado en el origen al coincide con


la media aritmética de la distribución, y el momento de orden 2 centrado en la media
mi coincide con la varianza de la distribución.

Relación entre promedios y fórmula de Foster: Se demuestra que para una misma
distribución de frecuencias (xiJ ni) se verifica que Media armónica :s Media geométrica :s
Media aritmética, es decir:

H~G~X
Para relacionar todos los promedios tenemos la fórmula de Foster, que dice que la
Media de orden m tiene la siguiente expresión:

de modo que como casos particulares de la fórmula de Foster se obtienen la media


armónica, la media geométrica, la media aritmética y la media cuadrática haciendo m = -1,
m = 0, m = 1 Ym = 2 respectivamente. Podemos escribir entonces que:

M(_l) =H, M(Q) =G, M(l) =X, M(2) =c

l
CAPíTULO 3: MEDIDAS DE POSICIÓN, DISPERSiÓN Y FORMA 81

La relación entre promedios puede ampliarse introduciendo la media cuadrática


e como sigue:
H::;,G::;,X::;,C

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión permiten calcular la representatividad de una
medida de posición, para lo cual será preciso cuantificar la distancia de los diferentes
valores de la distribución respecto a dicha medida. A tal distancia es a lo que, en
términos estadísticos, denominaremos variabilidad o dispersión de la distribución. Las
medidas de dispersión tienen como finalidad estudiar hasta qué punto, para una
determinada distribución de frecuencias, las medidas de tendencia central o de posición
son representativas como síntesis de toda la información de la distribución. Medir la
representatividad de una medida de posición equivale a cuantificar la separación de los
valores de la distribución respecto a dicha medida. Por ejemplo, si queremos estudiar en
qué grado una media aritmética nos marca una tendencia central generalizable del
comportamiento de todos los elementos del conjunto estudiado, tendremos que fijamos
en la separación o desviación de cada valor respecto a la media. Si todos los valores
están cercanos al valor medio, éste será representativo de ellos.

A la mayor o menor separación de los valores de una distribución respecto


de otro, que se pretende que sea su síntesis, se le llama dispersión o variabilidad.
Será, pues, tanto más representativa la media aritmética de una variable cuanto más
agrupados en tomo a ella estén los valores promediados; por el contrario, será tanto
más rechazable, por no ser representativa, cuanta mayor dispersión exista de los
valores de la variable respecto a la media.
Resulta pues necesario para completar la información que pueda deducirse
de una medida de posición o centralización, acompañarIa de uno o varios
coeficientes que nos midan el grado de dispersión de la distribución de la variable
respecto de esa medida de centralización. Estos coeficientes son los que llamamos
medidas de dispersión. Inicialmente, se distingue entre medidas de dispersión
absolutas y relativas, entendiéndose por relativas las que no dependen de las
unidades de medida. Posteriormente, se clasifican las medidas absolutas y relativas
según sean medidas referidas a promedios o no lo sean.

Entre las medidas de dispersión absolutas no referidas a promedios tenemos el


recorrido, o diferencia entre el mayor valor y el menor valor de una distribución, y el
recorrido intercuartilico, o diferencia existente entre el tercer cuartil y el primero.
Entre las medidas de dispersión relativas no referidas a promedios tenemos el
coeficiente de apertura, o cociente entre el mayor valor y el menor valor de una
distribución, y el recorrido relativo, o cociente entre el recorrido y la media, así
como el recorrido semintercuartilico, o cociente entre el recorrido intercuartílico y la
suma del primer y tercer cuartil.
82 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Entre las medidas de dispersión absolutas referidas a promedios tenemos las


desviaciones medias, la varianza y la desviación típica. Estas medidas de dispersión
involucran a los promedios, y permiten medir el error que cometemos utilizando el
promedio en cuestión como resumen de los datos. Como medida de dispersión más
simple relativa a la medida de posición P, podríamos considerar las desviaciones de
cada valor al promedio y promediar estas desviaciones, es decir, considerar el valor
D = L (x,P)n/N, i=l...k. Pero esto, que sería lo primero que se nos ocurriría, tiene
como grave inconveniente las posibles compensaciones de las desviaciones positivas
con las negativas al efectuar la suma, pudiendo obtenerse una medida pequeña siendo
la dispersión grande. Para solucionar este inconveniente se consideran los valores
absolutos de las desviaciones, o bien se elevan éstas al cuadrado. A continuación, se
definen las medidas de dispersión más interesantes, entre las que tenemos:

Desviaciones medias: Para medir la eficacia de la media se considera la desviación


media respecto de la media aritmética, que se define como la media aritmética de los
valores absolutos de las diferencias entre los valores de la variable y la media
aritmética, y cuya expresión es la siguiente:
1 k
o; =-¿IX -xl j ni
N i=1

Para medir la eficacia de la mediana, Me, suele considerarse la desviación


media respecto de la mediana, que se define como la media aritmética de los valores
absolutos de las diferencias entre los valores de la variable y la mediana, y cuya
expresión es la siguiente:

Varianza, cuasivarianza, desviación típica y error estándar: De todas las medidas de


dispersión absolutas respecto a la media aritmética, la varianza y su raíz cuadrada (la
desviación típica), son las más importantes. Si en vez de considerar los valores
absolutos de las desviaciones respecto del promedio consideramos sus cuadrados,
surge una nueva medida de dispersión denominada varianza, y que definimos como
la media aritmética de los cuadrados de las desviaciones de los valores de la variable
a la media aritmética, es decir, el momento de segundo orden respecto a la media
aritmética. Se define mediante la expresión:

(J
2=N
1 ~(
L...- x j -
-)2 n¡
x
¡~l

Como propiedades más importantes de la varianza tenemos que nunca puede


ser negativa, que es igual al momento de segundo orden respecto al origen menos el
de primer orden elevado al cuadrado, que si en la distribución de frecuencias
sumamos a todos los valores de la variable una constante la varianza no varía (un
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 83

cambio de origen en la variable no afecta a la varianza), y que al multiplicar los


valores de una distribución de frecuencias por una constante k la varianza queda
multiplicada por el cuadrado de la constante.
Así como las desviaciones medias vienen expresadas en las mismas unidades
de medida que la distribución, la varianza no, ya que vendrá dada en las unidades co-
rrespondientes, pero elevadas al cuadrado. Esto dificulta su interpretación, y hace
necesario definir la desviación típica o desviación estándar. La desviación típica es la
raíz cuadrada, con signo positivo, de la varianza, con lo que su expresion será:
./

Al ser la raíz cuadrada de la varianza, vendrá expresada en las mismas


unidades de medida que la distribución, lo cual la hace más apta como medida de
dispersión.

Un estadístico muy utilizado como medida de dispersión, sobre todo debido


a sus propiedades muestrales, es la cuasivarianza, cuya expresión es:
1 k
S2 =--~:CX -x)2n
N -1 i=1 J I

También se considera la cuasidesviación típica, cuya expresión es:

Otro estadístico muy utilizado como medida de dispersión, también por sus
propiedades muestrales, es el error estándar, cuyo valor es e=S/vh.
Siempre se cumple que DMe < Dm < a:
Entre las medidas de dispersión absolutas referentes a promedios, podríamos
haber definido también la desviación media respecto a la moda y las desviaciones
cuadráticas respecto a la mediana y a la moda, que vienen dadas en las mismas
unidades de medida que la distribución, y que marcan la representatividad de los
promedios con los que se relacionan.
Entre las medidas de dispersión relativas (valores adimensionales que no se ven
afectados por las unidades de medida y que siempre se concretan en forma de cociente)
utilizadas para comparar medidas de posición o promedios, tenemos el índice de
dispersión respecto a la mediana y el coeficiente de variación de Pearson.

Coeficiente de variación de Pearson: Se usa para resolver el problema de


comparación de medias aritméticas de varias distribuciones que pueden venir, en
general, en unidades diferentes.
84 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Se define como la relación por cociente entre la desviación típica y la media


aritmética (V = a- / x). Evidentemente, a menor coeficiente de variación (V), mejor es
la media. Observamos que al efectuar el cociente eliminamos las unidades, y por
tanto V es adimensionaL Por otra parte, V representa el número de veces que a-
contiene a x, y está claro que cuanto mayor sea V más veces contendrá a- a x,
luego,
relativamente, a mayor valor de V menor representatividad de x. Este coeficiente
también se suele expresar en tantos por ciento como V = 100 (a- / x).
Como tanto en el cálculo de a- como en el cálculo de x han intervenido todos
los valores de la distribución, V presenta la garantía, frente a otros coeficientes, de que
utiliza toda la información de la distribución. La cota inferior de V es cero, y el único
caso problemático se presenta cuando X = O, lo que haría que V tendiera a infinito.
Índice de dispersión respecto a la mediana: Se usa para resolver el problema de
comparación de medianas de varias distribuciones, que pueden venir, en general, en
unidades diferentes. Se define como la relación por cociente entre la desviación
media respecto de la mediana y la mediana aritmética VMe = D Me / Me.
Evidentemente, a menor índice de dispersión mejor es la mediana.

MEDIDAS DE FORMA
Una vez iniciado el análisis estadístico de sintetización de la información, para
lo cual hemos estudiado las medidas de posición y dispersión de la distribución de una
variable, necesitamos conocer más sobre el comportamiento de la misma. No podemos
basar nuestras conclusiones únicamente en expresiones que vengan dadas en términos de
medidas de posición y dispersión. Si bien intentamos globalizar el comportamiento del
colectivo que sea objeto de nuestro estudio, para lo cual las medidas de posición son
nuestro mejor instrumento, no debemos proceder a una interpretación que implique un
comportamiento de todos los elementos del colectivo uniformemente constante e igual a
la medida de posición en cuestión con un error dado por la correspondiente medida de
dispersión. Este error o disparidad se hace más ostensible al analizar la representación
gráfica de la distribución. Pues bien, las medidas de forma de una distribución se basan
en su representación gráfica, sin llegar a realizar la misma.

Las medidas de forma se clasifican en medidas de asimetría y medidas de


curtosis o apuntamiento.
Las medidas de asimetría tienen como finalidad el elaborar un indicador que
permita establecer el grado de simetría (o asimetría) que presenta una distribución, sin
necesidad de llevar a cabo su representación gráfica. Supongamos que hemos representado
gráficamente una distribución de frecuencias. Si trazamos una perpendicular al eje de
abscisas por X y tomamos esta perpendicular como eje de simetría, diremos que una
distribución es simétrica si existe el mismo número de valores a ambos lados de dicho eje,
equidistantes de X dos a dos, y tales que cada par de valores equidistantes de X tengan la
misma frecuencia. En caso contrario, las distribuciones serán asimétricas.
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 85

Las medidas de curtosis estudian la distribución de frecuencias en la zona


central de la misma. La mayor o menor concentración de frecuencias alrededor de la
media y en la zona central de la distribución dará lugar a una distribución más o
menos apuntada. Por esta razón, a las medidas de curtosis se les llama también de
apuntamiento o concentración central. Las medidas de curtosis se aplican a
distribuciones campaniformes, es decir, unimodales simétricas o con ligera asimetría.
Para estudiar la curtosis de una distribución es necesario definir previamente una
distribución tipo, que vamos a tomar como modelo de referencia. Esta distribución es
la normal, que corresponde a fenómenos muy corrientes en la naturaleza, y cuya
representación gráfica es una campana de Gauss.
Tomando la normal como referencia, diremos que una distribución puede ser
más apuntada que la normal (es decir, leptocúrtica), o menos apuntada (es decir,
platicúrtica). A la distribución normal, desde el punto de vista de la curtosis, se le
llama mesocúrtica. Con la curtosis se estudia la deformación, en sentido vertical,
respecto a la normal,de una distribución. A continuación, se definen las medidas de
asimetría más comunes, entre las que destacan las siguientes:
Coeficiente de asimetría de Fisher: Ahora se intenta buscar una medida que recoja la
simetría o asimetría de una distribución. Si la distribución es simétrica, el eje de
simetría de su representación gráfica será una recta paralela al eje de ordenadas, que
pasa por el punto cuya abscisa es la media aritmética. Por ello, cuando la distribución es
asimétrica, referiremos los valores de la distribución a este promedio. Si una
distribución es simétrica, existe el mismo número de valores a la derecha que a la
izquierda de x, y por tanto el mismo número de desviaciones con signo positivo que
con signo negativo, siendo la suma de desviaciones positivas igual a la suma de las
negativas. Podemos partir, pues, de las desviaciones (xIx) elevadas a una potencia
impar para no perder los signos de las desviaciones. Lo más sencillo sería tomar como
medida de asimetría el promedio de estas desviaciones, elevadas a la potencia impar
más simple (que es tres); es decir, tomaríamos como medida de asimetría el momento
de orden tres centrado en la media. Pero, de hacer esto, esta medida vendría expresada
en las mismas unidades que las de la variable pero elevadas al cubo, por lo que no es
invariante ante un cambio de escala.
Para conseguir un indicador adimensional, debemos dividir la expresion
anterior por una cantidad que venga en sus mismas unidades de medida. Esta
cantidad es el cubo de la desviación típica. De este modo obtenemos el coeficiente de
asimetría de R. A. Fisher, cuya expresión es:
86 ESTADIsTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Si gi=O, la distribución es simétrica; si g¡>O, la distribución es asimétrica


positiva (a derechas); y si g¡<O, la distribución es asimétrica negativa (a izquierdas).
La distribución es asimétrica a derechas o positiva cuando la suma de las
desviaciones positivas de sus valores respecto de la media es mayor que la suma de
las desviaciones con signo negativo (la gráfica de la distribución tiene más densidad
a la derecha de la media). En caso contrario, la distribución es asimétrica a la
izquierda o negativa.

Coeficiente de asimetría de Fisher estandarizado: Para N> 150, el coeficiente de


asimetría es asintóticamente normal de media cero y varianza 6/N. Este hecho nos
lleva a considerar el coeficiente de asimetría estandarizado, cuya expresión es:

gs= g
gl

Este coeficiente es asintóticamente normal (0,1).

Coeficiente de asimetría de Pearson: Karl Pearson propuso para distribuciones


campaniformes, unimodales y moderadamente asimétricas, el coeficiente definido como
Ap = (x - Mo) /0; donde Mo es la moda. Como en una distribución campaniforme
simétrica x = Mo = Me, si la distribución es asimétrica positiva o a derechas, x se
desplaza a la derecha de la moda, y por tanto, x -
Mo > O. En el caso de distribución
asimétrica negativa, la media se sitúa por debajo de Mo, por lo que el valor x - Mo <
O. La desviación típica que aparece en el denominador no modifica el signo de la
diferencia x- Mo, y sirve para eliminar las unidades de medida de dicha diferencia.
Así tendremos que si Ap = O la distribución es simétrica, si Ap>O la distribución es
asimétrica positiva, y si Ap<O la distribución es asimétrica negativa. También
Pearson comprobó empíricamente para este tipo de distribuciones que se cumple
3(x - Me) zx - Mo (la mediana siempre se sitúa entre la media y la moda en las
distribuciones moderadamente asimétricas). Por esta razón, algunos autores utilizan
como coeficiente de asimetría de Pearson el valor Ap z 3( x-
Me) / a:

Coeficiente de asimetría de Bowley: Está basado en la posición de los cuartiles y la


mediana, y viene dado por la expresión Ab = (C3 + CI - 2Me) / (C3 + CI). Se
cumple que si Ab=O la distribución es simétrica, si Ab>O la distribución es asimétrica
positiva, y si Ab<O la distribución es asimétrica negativa. Cl y C3 son el primer y
tercer cuartil respectivamente.

Coeficiente absoluto de asimetría: Está basado también en la posición de los


cuartiles y la mediana, y viene dado por la expresión:

A = [(C3 -C2) -(C2 -CI)] / S = (C3 + CI -2C2) / S = C3 + CI -2Me /S


CAPíTULO 3: MEDIDAS DE POSICiÓN. DISPERSiÓN Y FORMA 87

°
Si A = la distribución es simétrica, si A>O la distribución es asimétrica
positiva, y si A<O la distribución es asimétrica negativa. C1, C2 y C3 son los
cuartiles de la distribución.

Una vez presentadas las medidas de asimetría, a continuación se definen las


medidas de curtosis más comunes, entre las que destacan las siguientes:

Coeficiente de curtosis: En la distribución normal, se verifica que m¿ = 30'"4, siendo


m« el momento de orden 4 respecto a la media, y O'" la desviación típica. '-Si
consideramos la expresión g2 = m4/'0'"4 - 3, su valor será cero para la distribución
normal. Por ello, como coeficiente de apuntamiento o curtosis se utiliza la expresión:
1 k
- í)x j -x)4ni

g
_ m4 3_
2 ----;7 - - (1- í)x
N i=1
k

-x)2ni
)2 -
3

j
N i=1

Una distribución es mesocúrtica (apuntamiento igual al de la normal) cuando


l = 0, es leptocúrtica (apuntamiento mayor que el de la normal) si > 0, y es l
platicúrtica (apuntamiento menor que el de la normal) si < O. l
Coeficiente de curtosis estandarizado: Para N> 150, el coeficiente de curtosis es
asintóticamente normal de media cero y varianza 24/N. Este hecho nos lleva a
considerar el coeficente de curtosis estandarizado, cuya expresión es:

Este coeficiente es asintóticamente normal (0,1).

ANÁLISIS EXPLORATORIO DE DATOS


Los estadísticos descriptivos más habitualmente utilizados han sido la media
y la desviación típica. Sin embargo, el uso automático de estos índices no es muy
aconsejable. La media y la desviación típica son índices convenientes sólo cuando la
distribución de datos es aproximadamente normal o, al menos simétrica y unimodal.
Pero las variables objeto de estudio no siempre cumplen estos requisitos. Por lo tanto
es necesario un examen a fondo de la estructura de los datos.
Actualmente se utilizan las novedosas técnicas del análisis exploratorio de
datos, mediante las cuales se pueden analizar los datos exhaustivamente y detectar las
posibles anomalías que presentan las observaciones. J. W. Tuckey ha sido uno de los
pioneros en la introducción de este tipo de análisis.
88 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Se recomienda iniciar un análisis con gráficos que permitan visualizar su


estructura. Por ejemplo, para datos cuantitativos es aconsejable comenzar con el
histograma de frecuencias. El paso siguiente suele ser examinar la posible presencia
de valores atípicos (outliers) en el conjunto de datos. Para ello, suelen utilizarse los
propios histogramas u otros tipos de gráficos más avanzados como los gráficos de
caja y bigote o histogramas digitales (gráficos de tallo y hojas).

Las técnicas de análisis exploratorio de datos amplían la información


ofrecida por las medidas de concentración, dispersión y forma de una distribución.
Mediante las técnicas de análisis exploratorio se estudian exhaustivamente las
distribuciones de frecuencias y se detectan las posibles anomalías que presentan las
observaciones, su simetría y su grado de normalidad.

GRÁFICO DE SIMETRÍA
El gráfico de simetría (Figura 3-1) es una herramienta que permite analizar
visualmente el grado de simetría de una variable. En el eje de abscisas se representan
las distancias de los valores de la variable a la mediana que quedan por debajo de ella, y
en el eje de ordenadas se representan las distancias de los valores de la variable a la
mediana que quedan por encima de ella. Si la simetría fuese perfecta, el conjunto de
puntos resultante sería la diagonal principal. Mientras más se aproxime la gráfica a la
diagonal más simetría existirá en la distribución de la variable.

Para el ejemplo de la variable X, variable definida por el número de litros


consumidos por los automóviles cada 1000 kilómetros que venimos considerando
durante todo el capítulo, tenemos el gráfico de simetría siguiente:

Gráfico de Simetría
<=
:soUa 18

15
S
oS 12
•..
oU
.D 9
o
6
'"<=
-¡:l 3

o
:s'" o 3 6 9 12 15 18
dístancia bajo la medíana
Figura 3-1

Para la variable X, se observa un buen grado de simetría, ya que los puntos


de la gráfica se ajustan bien a la diagonal.

Los pasos prácticos para elaborar el gráfico de simetría son los siguientes:
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 89

l. Se calcula la mediana de la variable (en nuestro caso 28,9).

2. Se ordenan los valores de la variable de mayor a menor (orden descendente).

3. Se calculan las diferencias d¡ entre los valores de la variable ordenados y la


mediana.

4. Se toman los valores pOSItIVOSde di ordenados de menor a mayor y se les


denomina Pi- Estos valores serán las distancias sobre la mediana.

5. Se toman los valores negativos de di ordenados de menor a mayor y se les


denomina ni. Estos valores cambiados de signo serán las distancias bajo la
mediana.

6. Se grafican los puntos de coordenadas (-ni, Pi)'

GRÁFICO NORMAL DE PROBABILIDAD

Los gráficos normales de probabilidad (Figura 3-2) sirven para determinar si un


conjunto de datos dado se ajusta razonablemente a una distribución normal. El gráfico
normal de probabilidad presenta en el eje de abscisas los valores de la variable (Xi), y en
el eje de ordenadas las frecuencias relativas acumuladas de dichos valores (F¡). La
normalidad de los datos será perfecta cuando el gráfico de los puntos (Xi, F¡) resulte ser
una línea recta situada sobre la diagonal del primer cuadrante. Las diferencias que
existan entre el gráfico de probabilidad y la línea recta marcarán la regla de decisión para
aceptar o no la normalidad del conjunto de datos dado.

Gráfico de Probabilidad Normal


99.9
99
=-~--~~~----~--~
95
80
50
20
5
1
0.1 =--~_~~_~~ ~ __ -=
15 25 35 45 55

Figura 3-2

Se observa que la variable X se ajusta bastante bien a una normal, ya que los
puntos de la gráfica se aproximan bastante a la diagonal.
90 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

FUNCIONES DE EXCEL PARA MEDIDAS DE POSICIÓN,


DISPERSIÓN Y FORMA
Excel dispone de una amplia gama de funciones que permiten calcular
medidas de posición (media, mediana, etc.), medidas de dispersión (varianza,
desviación típica, etc.), medidas de asimetría y curtosis, coeficientes de correlación y
muchos otros conceptos. Ya sabemos que para ver las funciones de la categoría
Estadísticas, se hace clic sobre el icono Insertar función ¡;. de la barra de fórmulas
(o se elige la opción Insertar función del grupo Biblioteca de funciones de la ficha
Fórmulas), con lo que se obtiene la Figura 3-3, en cuyo cuadro Seleccionar una
categoría se elige Estadísticas, presentándose todas las funciones de dicha categoría
elegida en el cuadro Seleccionar una función (Figura 3-4).
Si en el cuadro Seleccionar una función hacemos clic con el ratón sobre una
función (por ejemplo, la función CONTAR), se obtendrá la paleta de la función con
su sintaxis (Figura 3-5). Una vez completados los argumentos, se obtiene el
resultado en la parte inferior de la paleta.
Al pulsar Aceptar, la fórmula y su resultado se insertan en la celda activa de
la hoja de cálculo.

~ar ~ Función:

Escriba una breve desceccco de lo Que desea hacer v, a Escribe una breve descepoón de \o que desea hacer y J a Ir
continuación, haga die en Ir corelnueoón, haga elie en Ir
O seleccionar une tategoría: I
r¡uC-s.-d:-as-,-ecC-;e-ntC-e-me-nC-t.-C-I"'~ O seleccionar una ~ateQorla: r:¡E...,st-ad;:-isC-tic-as----3-~-¡
Usadas recientemente
Seleccionar LIVJ [unción: Todas Seleccionar una [unciÓn:
Fmncieras
BINQM.CRIT
PROMEDIOA Peche y hora COEF.DE.CORREl
SUMA Malte~ticas ti COEFICIENTE.ASIMETRIA
CONTAR.SI COEFICIENTE.R2
FRECUENCIA Búsqueda y referencia
COEF.QE.CORREl
COMBINAT
Base de datos
Texto ¿g~i:::~iANCO ~
PROMEDIO(númerol;nú i~?~~~:Ción CONTAR(refljrer2.; ... )
Devuelve el promedio (media Definidas or el usuario'" los cuales Cuenta el número de celdas Que contienen números y los números Que hay
pueden ser números, nombres, matrices, o re erencies Que contencen en ~ lista de argumentos.
números.

Avuda sobre- esta funciÓn I Acept er Cancelar Ayuda sobre erta funciÓn Aceptar _1 Cancelar

Figura 3-3 Figura 3-4


•••• lll1l1fj~(3il-2~
.~,IlIlIlt!ml!!!illI!i~III1.III![I 1 X A
B
------------t
I
,CONTAR
Re"
__ o

f¡*~*~~~~~~~~~~~~~j¡fl~ -
---

{2,O,O}
¡- .--------~"l

Ref21

I~cu-e-nt-a-el-nume-'-,-o-de-ce-Id-.s-Q-ue-co-nt-ie~nen--nu-'
me-m-S-Y-Ios-num-'
5j _
-e-m~s-Q-u-e-ha-Y~e-n-:-I~-. -de-",~ou-m-e-nt-os-.-- I TI ~
8 í 1
Refl: refl;ref2; ... son de 1 a 30 arr;Jumentos Que pueden contener o "g--r---- 2
hacer rere-encre e distintos tipos de datos, pero sólo se cuentan los
números. 10 3 !
-1'------;2-f------j
12 ---- 4
13 1
Resuttado de te fórmula - 1
_1~4~----~5+----~
I~ -=1~---~
L ~A:Y~Yd~.~S:ob~,.~e:s~tª~f~Yn:c~ió~n ~A=c=e=Pt=a'==~=c=.=n=ce=la=,~1
16, 3

Figura 3-5 Figura 3-6


CAPiTULO 3: MEDIDAS DE POSICiÓN. DISPERSiÓN Y FORMA 91

A continuación, se presenta una relación de funciones de Excel para medidas de


centralización, dispersión y forma, acompañadas de un ejemplo referido a la variable X
de la hoja de cálculo de la Figura 3-6, cuyos valores ocupan el rango A2:A16. El
argumento numvar indica variable numérica.

CONTAR(numvar) Halla el total de observaciones no desaparecidas


CONTAR(A2:A16) de la variable numérica numvar. Sólo cuenta
celdas con números, o celdas con fechas "
traducibles a números. No cuenta celdas con
texto, valores de error o blancas.
CONTARSI(rango,criterio) Cuenta las celdas en el rango dado que coinciden
CONTAR(A2:A16, ">2") con el criterio especificado.
CONTARA (numvar) Halla el total de observaciones no blancas de la
CONTARA (A2:A16) variable numvar.
CONTAR.BLANCO(rango) Halla el total de celdas en blanco en el rango
CONTAR.BLANCO(A2:A16) especificado.
SUMA (numvar) Halla la suma de la observaciones de numvar.
SUMA (A2:A 16)
PROMEDIO(numvar) Halla la media aritmética de numvar. Si numvar
PROMEDIO(A2:A16) contiene texto, valores lógicos o celdas vacías,
esos valores se pasan por alto; sin embargo, se
incluyen las celdas cuyo valor sea O.
PROMEDIOA(numvar) Halla la media aritmética de numvar. Si numvar
PROMEDIOA (A2:A 16) tiene texto o celdas vacías, esos valores se pasan
a O; los valores lógicos verdaderos se pasan a 1, y
los falsos a O.
MEDIA.GEOM (numvar) Halla la media geométrica de numvar. Si numvar
MEDIAGEOM(A2:A16) tiene texto, valores lógicos o celdas vacías, esos
valores se pasan por alto; pero se incluirán las
celdas con valor O.
MEDIA.ARMO (numvar) Halla la media armónica de numvar. Si numvar
MEDIA.ARMO(A2:A16) tiene texto, valores lógicos o celdas vacías, se
pasan por alto; pero se incluirán las celdas con el
valor O.
MEDIA.ACOTADA(nvar, p) Halla la media aritmética de nvar después de
MEDIA.ACOTADA(A2:A12;O, eliminar elporcentaje (P) inferior y superior de los
2) puntos de datos. Puede utilizar esta funcián cuando
desee excluir del análisis los valores extremos.
MEDIANA (numvar) Halla la mediana de numvar. Si numvar contiene
MEDIANA (A2:A 16) texto, valores lógicos o celdas vacías, esos
valores se pasan por alto; sin embargo, se
incluirán las celdas con el valor O.
92 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

MODA (numvar) Halla la moda de numvar. Si numvar contiene


MODA(A2:A16) texto, valores lógicos o celdas vacías, esos
valores se pasan por alto; sin embargo, se
incluirán las celdas con el valor O.
MIN(numvar) Halla el mínimo de las observaciones no
MIN(A2:A16) desaparecidas de la variable numérica numvar. Sólo
cuenta celdas con números ofichas traducibles a
números. No se usa para celdas con texto o valores de
error.
MINA (numvar) Halla el mínimo de las observaciones no blancas de la
MINA (A2:A 16) variable numérica numvar, considerando celdas con
texto, valores de error o logicos.
MAX(numvar) Halla el máximo de las observaciones no
MAX(A2:A16) desaparecidas de la variable numérica numvar.
Sólo cuenta celdas con números o fechas
traducibles a números. No se usa para celdas con
texto o valores de error.
MAXA(numvar) Halla el máximo de las observaciones no blancas
MAXA(A2:A16) de la variable numérica numvar, considerando
celdas con texto, valores de error o logicos.
PERCENTIL(numvar,n) Halla el enésimo percentil de numvar.
PERCENTIL(A2:A12;O,75)
CUAR TIL (num var,n) Halla el enésimo cuartil de numvar. Si n=O se
CUARTIL(A2:A12; 1) tiene el mínimo, si n= 1 se tiene el primer cuartil
(percentiI25), si n=2 se tiene la mediana
(percentil50), si n=3 se tiene el tercer cuartil
(percentil 75), y si n=4 se tiene el máximo.
VAR(numvar) Halla la cuasivarianza de numvar. Se pasan por
VAR(A2:A16) alto los valores lógicos, como VERDADERO y
FALSO, y el texto. Si los valores lógicos y el texto
no se deben pasar por alto, utilice la función de
hoja de cálculo VARA.
VARA (numvar) Halla la cuasivarianza de numvar. Se permiten los
VARA (A2:A 16) valores lógicos, como VERDADERO (se le asocia el
valor 1), FALSO Y el texto (se les asocia el valor O).
VARP(numvar) Halla la varianza de numvar. Se pasan por alto
VARP(A2:A16) los valores lógicos, como VERDADERO y
FALSO, y el texto. Si los valores lógicos y el texto
no se deben pasar por alto, utilice la función de
hoja de cálculo VARA.
VARPA(numvar) Halla la varianza de numvar. Se permiten los valores
VARPA (A2:A 16) lógicos, como VERDADERO (se le asocia el valor 1)
y FALSO, y el texto (se les asocia el valor O).
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 93

DESVEST(numvar) Halla la cuasidesviacion típica de numvar. Se


DESVEST(A2:A16) pasan por alto los valores lógicos, como
VERDADERO y FALSO, y el texto. Si los valores
lógicos y el texto no se deben pasar por alto,
utilice lafuncián de hoja de cálculo DESVESTA.
DESVESTA(numvar) Halla la cuasidesviacián típica de numvar. Se
DESVESTA (A2:A 16) permiten los valores lógicos, como VERDADERO
(se le asocia el valor 1) y FALSO, Y el texto (se les
asocia el valor O).
DESVESTP(numvar) Halla la desviación típica de numvar. Se pasan
DESVESP(A2:A16) por alto los valores lógicos, como VERDADERO
y FALSO, y el texto. Si los valores lógicos y el
texto no se deben pasar por alto, utilice la función
de hoja de cálculo DESVESTA.
Halla la desviación típica de numvar. Se permiten
DESVESTPA(numvar) los valores lógicos, como VERDADERO (se le
DESVESTPA(A2:A16) asocia el valor 1) y FALSO, Y el texto (se les
asocia el valor O).
DESVIA2(numvar) Devuelve la suma de los cuadrados de las
DESVIA2(A2:A16) desviaciones de los puntos de numvar respecto de
su media.
~)Xi _X)2
DESVPROM(numvar) Devuelve el promedio de las desviaciones
DESVPROM(A2:A16) absolutas de la media de los puntos de numvar
(desviación media).

! ~]Xi -xl
n
COEFICIENTEASIMETRIA Halla el coeficiente de asimetría de numvar. Si
(numvar) numvar contiene texto, valores lógicos o celdas
COEFICIENTE.ASlMETRlA vacías, esos valores se pasan por alto; sin
(A2:A16) embargo, se incluirán las celdas con el valor O.
CURTOSIS(numvar) Halla el coeficiente de curtosis de numvar. Si
CURTOSIS(A2:A16) numvar contiene texto, valores lógicos o celdas
vacías, esos valores se pasan por alto; sin
embargo, se incluirán las celdas con el valor.
KESIMO.MENOR(numvar) Halla el valor que ocupa el lugar k de menor a
K.ESIMo.MENOR(A2:A16) mayor en numvar.
KESIMO.MAYOR(numvar) Halla el valor que ocupa el lugar k de mayor a
K.ESIMo.MA YOR(A2:A16) menor en numvar.
FISHER(a) Halla la transformación de Fisher de a
FISHER(O, 567) (-1 <a<l); es decir, calcula (ln/l +a)/ln(J -a))/2.
94 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

NORMALIZACION(m,a,b) Estandariza el número m según a y b; es decir, al


NORMALIZA CIÓN(1 O) valor de m se le resta la media (a) y se divide el
resultado por la desviación típica (b).
PERMUTACIONES (m,n) Permutaciones sin repetición de m elementos
PERMUTA CIONES(1 0,2) tomados de n en n.
p. = n!
k,n (n - k)!

Estas funciones de estadística descriptiva pueden escribirse directamente


sobre las celdas de la hoja de cálculo de igual modo que cualquier otra fórmula.

La Figura 3-7 presenta varias funciones de cálculo de medidas de


concentración, dispersión y forma situadas en las celdas de la hoja de cálculo, y
referidas a los valores de la variable X que ocupa la primera columna de la hoja. La
Figura 3-8 presenta los resultados de las fórmulas cuando no se encuentra activada la
casilla Fórmulas.

A.S e D ~~~A __ ~~S~~. ~C~~L- __ ~D ~F.


1
2l3!
Ix
:MEDIAAAITM8ICA ¡=PROME¡¡IO~:A16)
1 !X
2 :
I 3
i
IMEDIAAAITMÉTICA i
--J
2,733333333J
310-: VARIANZA =VAAP(A2A16) 31 01 IVAAIANZA , 4,3288888891
'9DESVlACION TIPICA =DESVESTP A2A16) 4 ¡ 9: 'DES~ACION TIPICAI 2,000598205:
i.. 2 'PRIMERCUAATIL =CUARll A2A16;1 5: 21 ¡PRIMER CUARllL i 1,51
~
~3MEDIANA =MED~ .. __ =H'----31-----.MEDIANA: 21
7 2 MODA . =MOD~l6) 7 2 MODA -~ - 3'
8 1 COEF.ASIM~ -;coEFICIENTE~RAi6f 8 el. COEF.ASIMETR[.I, I 1.833344003
9 2 COEF.CURTOSIS =CURTOSIS A2:Al 9 2, COEF.CURTOSIS I 4,68641!E48
10 3 CUASIVAAIANZA =VAA(A2:Al6) 10 3 CUASIVAAIANZA 4,638ll5Bl
11'2 MEDIAGEOMETRICA'=MEOIAGEOM(M:A16) 111 2 MEDIAGEOMÉTRIC.... 2,370C0J926
12'4 MEDiAAAM~"=MEDiAAAMO~) 12! 41 MEDIAAAMONICA' 1,961371719¡
13 1 .SU~. =SU~l _ 13 1 !SUMAc;;;;-~---i --,,-4.1!-
14 5__"_'fP~8g~.NnL7?_,-PERC~NTIL((A2",16);O,75L __ ._0 olL'::::-:-::::-5F __ oo.¡p~RCENnL75. o.J.}
15 1-+-+t.1J~IMil_.o .oo.,:~I~(A2!\16Lo_.~ .... .. ..1..5 ._1 MI~It.10 . oo
... ....~.~¡i
~~~_MAXM~O~ __----;=~A2A16) __ ~~ • ~ ---A- -jMAXMO,.
" •••• Ho·~~l~ §~~Hoja3/~-J<I §
Figura 3-7 Figura 3-8

A continuación, para algunas funciones se presenta su paleta (Figuras 3-11 a


3-17), omitiéndose dicha presentación para las paletas de funciones muy similares en
su sintaxis. Recordamos que para obtener la paleta de una función, se sitúa el cursor
en la celda en que desee introducir la fórmula, se hace c1ic en ~ y se elige la función
deseada con doble c1ic sobre ella en el cuadro Insertar función (Figura 3-9). Si en el
campo O seleccionar una categoría se sitúa Todas (Figura 3-10), podremos elegir
paleta para todas las funciones de Excel. Luego, se rellenan los elementos de la
paleta y al hacer c1ic en Aceptar se inserta el resultado de la fórmula en la celda de la
hoja de cálculo.
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 95

Insertar función

§uscar una función:

l",.grei.gi.'"",ª ..,.$i;g,W,
o sesecoceer una t.ate-goria: [USadas recientemente El
$elea:ionar una función:
INT.ACUM

;:~~ 8:_···
PAGOPRIN
PAGO,INT.ENTRE
PAGO
OVS
COEFlCIEJfTLAS1:r-1ETRIA(númcrol;núm,ero2;-)
Devuelve el sesgo de una distribución: lJI'la cara~zación del orado de a~tria
de lX\a distribución alrededor de su media.

Ayuda sobre esta funoón I AceDia< II cancela< I


Figura 3-9

CC1IIJUNTOCUBO

CONTAR. BlANCO
CONTAR.S!
CQNTAR.SJ.CONlLM'"O
CONTARA
CQNVE<TIR
CorITAR(valorl,-vaJor2;-)
Cuenta el númeTo de celdas de un rango Que contienen números.

Ayuda sobre esta función Aceptar I ce-cee- I


Figura 3-10

Refl IA2:AI6 {3\O\9\2\3\2\1 \2\3\2


Ref21

= 15
Cuenta el número de celdas que contienen números y los números que hay en la lista de argumentos.

Refl: refl;ref2; ... son de 1 a 30 argumentos que pueden contener o


hacer referencia a distintos tipos de datos, pero sólo se cuentan los
números.

Resultado de la fórmula = 15

Ayuda sobre esta función ~(j:~ptar Cancelar

Figura 3-11
96 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

Rango 1A2:AI6 {3\O\9\2\3\2\1 \2\3\2

Criterio 1">2" ">2"

=7

Cuenta las celdas en el rango Que coinciden con la condición dada.

Criterio es la condición en forma de número expresión o texto que


¡

determina qué celdas deben contarse.

Resultado de la fórmula = 7

Ayuda sobre esta función Aceptar Cancelar

Figura 3-12

Númerol 1A2:A161 ~ ~ ~ = {3\D\9\2\3\2\1\2\3\2


Número2j r ------"'=-"'-==--"==---:5j'""

Suma todos los números en un rango de cekíes.

Número!: númerol;número2; ... son de 1 él 30 números que se desea sumar.


Los valores lógicos y el texto se omiten en las celdas, incluso si están
escritos como argumentos.

Resultedo de la fórmula - 41

Ayuda sobre esta función Aceptar Cancelar

Figura 3-13

{3\O\9\2\3\2\1 \2\3\2

= 2,733333333

Devuelve el promedio (media aritmética) de los argumentos, los cuales pueden ser números, nombres,
matrices ~ o referencias que contengan números,

Número1: número 1;númeroz: ... son entre 1 y 30 argumentos numéricos de los


que se desea obtener el promedio.

Resultado de la fórmula = 2,733333333

Ayuda $obre esta función Aceptar Cancelar

Figura 3-14
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 97

MEDIA. ACOTADA
Matriz IA2:AI6 ]i {3\0\9\2\3\2\1 \2\3\2
Porcentaje IrO-,2-----"'---="-=-=--=---~=c."" 0,2

"""2,461538462
Devuelve la media de la porción interior de un conjunto de velores -de datos.

Porcentaje es el número fraccionaría de puntos de datos que se excluyen del


extremo superior e inferior del conjunto de datos.
'(

Resultado de la fórmula = 2,461538462

Avuda sobre esta función Aceptar_ Cancelar

Figura 3-15

MEDIANA
Númerol IA2:A16 {3\0\9\2\3\2\1 \2\3\2
Número2j r ---------''----::~=.
=2
Devuelve la mediana o el número central de un conjunto de números,

Número1: númeroljnúmero2j." son de 1 a 30 números, nombres, matrices o


referencias que contienen números, para los cuales desea obtener la
mediana.

Resultado de la fórmula = 2

Ayuda sobre esta función Aceptar Cancelar

Figura 3-16

Matriz IA2:AI6 ~
1( jeO,-=7=-S---'"--"-----"-----..itl'"

Devuelve el percentil k-éslmc de los valores de un rango.

K es el valor del percentil entre O y 1 inclusive.


1

Resultado de la fórmula = 3

Avuda sobre esta función Aceptar Cancelar

Figura 3-17
98 ESTADisTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

MEDIDAS DE POSICIÓN, DISPERSIÓN Y FORMA CON


HERRAMIENTAS DE ANÁLISIS
Podemos utilizar las herramientas de análisis estadístico avanzado para
calcular medidas de posición, dispersión y forma, seleccionando la opción Análisis
de datos en el menú Herramientas, y eligiendo la opción Estadística descriptiva en
el cuadro Funciones para análisis de la Figura 3-18.

EtnQones
Análisis de
para anáisis
varianza de un factor
I Aceptar I
Análisis de varianza de dos factores con varias muestras por grupo - Cancelar I
Análisis de varianza de dos factores con una sola muestra por grupo
Coeficiente
Covarianza
de correlación ¡i Awda I
Suavización exponerctel e
Prueba F para varianzas de dos muestras
Análisis de Fourier
Histograma
.:J
Figura 3-18

Al hacer clic en Aceptar, se obtiene la pantalla Estadística descriptiva de la


Figura 3-19, cuyos campos tienen las siguientes funcionalidades:

Rango de entrada: introduzca la referencia de celda correspondiente al rango de


datos que desee analizar. La referencia deberá contener dos o más rangos adyacentes
organizados en columnas o filas.

Agrupado por: haga clic en el botón Filas o Columnas para indicar si los datos del
rango de entrada están organizados en filas o en columnas.

Rótulos en la primera fila y rótulos en la primera columna: si la primera fila del rango
de entrada contiene rótulos, active la casilla de verificación Rótulos en la primera fila.
Si los rótulos están en la primera columna del rango de entrada, active la casilla de
verificación Rótulos en la primera columna. Esta casilla de verificación estará
desactivada si el rango de entrada carece de rótulos; Microsoft Excel generará los
rótulos de datos correspondientes para la tabla de resultados.

Nivel de confianza para la media: active esta casilla si desea incluir una fila
correspondiente al nivel de confianza de la media en la tabla de resultados. En el
cuadro, escriba el nivel de confianza que desee utilizar. Por ejemplo, un valor de
95% calculará el nivel de confianza de la media con un nivel de importancia del 5%.

Késimo mayor: active esta casilla si desea incluir una fila correspondiente al valor k-
ésimo mayor de cada rango de datos en la tabla de resultados. En el cuadro, escriba
el número que va a utilizarse para k. Si escribe 1, esta fila contendrá el máximo del
conjunto de datos.
CAPíTULO 3: MEDIDAS DE POSICiÓN, DISPERSiÓN Y FORMA 99

Késimo menor: active esta casilla si desea incluir una fila correspondiente al valor k-
ésimo menor de cada rango de datos en la tabla de resultados. En el cuadro, escriba
el número que va a utilizarse para k. Si escribe 1, esta fila contendrá el mínimo del
conjunto de datos. .

Rango de salida: introduzca la referencia correspondiente a la celda superior


izquierda de la tabla de resultados. Esta herramienta genera dos columnas de
información por cada conjunto de datos. La columna de la izquierda contiene los
rótulos de estadística, y la columna de la derecha contiene las estadísticas. Excel
escribirá una tabla de estadísticas de dos columnas por cada columna o fila del rango
de entrada, dependiendo de la opción que se haya seleccionado en el cuadro
Agrupado por.
En una hoja nueva: haga clic en esta opción para insertar una hoja nueva en el libro
actual y pegar los resultados comenzando por la celda Al de la nueva hoja de
cálculo. Para darle un nombre a la nueva hoja de cálculo, escríbalo en el cuadro.
En un libro nuevo: haga clic en esta opción para crear un nuevo libro y pegar los
resultados en una hoja nueva del libro creado.
Resumen de estadísticas: seleccione esta opción si desea que Excel genere un campo
en la tabla de resultados por cada una de las siguientes variables estadísticas: media,
error típico (de la media), mediana, moda, desviación estándar, varianza, curtosis,
coeficiente de asimetría, rango, mínimo, máximo, suma, cuenta, mayor (#), menor
(#) y nivel de confianza.
Al pulsar Aceptar en la Figura 3-19, se obtiene la Figura 3-20 con todos los
estadísticos, incluido el radio del intervalo de confianza para la media de la variable,
suponiendo normalidad con o desconocida (última celda). El intervalo de confianza
para la media viene definido por x
± tn.!,al2 (S/J¡), siendo S la cuasivarianza muestral
y tn./,al2 el valor de la abscisa de una T de Student con n=I grados de libertad que deja a
su derecha aJ2 de área.

=,e-.~~=.J~1:5!~~~.~",.,
Opciones de

C. Rango de ~Iida:
j~~=::-
.,,~,.~
--
..~._.,.'--~C"'_"'._'-~
sal¡da-'"'"---~;::::::::==~;:;-i
I$E$2'"
__ -9 Va;ianzadeiamuesifa'4,98901098901~L'
-10 Curt-t,-s¡-s'-·····-··-----·---·-------
11 Coeficiente de asimetria
12 Ran o
4,38143569640397
1,81942135308622
9
-+-f---'.-,. ~~-
":J":
I
1

r En una!:!ojanueva: J 13 Mínimo O
r" En un ~bronuevo 14 Máximo 9

P' Resumen de eseeeseees ~~ ~~:~a .'f~7-------+--- ..


r;;rYiveldeconf~nz~paralamedia: ~% 17 Ma:,:or(2)----- 5--

: ::::::: ::::: ""1:1c---- ~ .~l:;t~~)co-nfi-,.a.-~,-~(!J5'O%L


.~;-.2-.¡j9-6-47-
..42-.e-.1ª-
..84-.3--.-.- t-f---..---..··
•.••
I_.-_.._-~~_--=
..~_._._._. _.,_-.__..__.-_-_
.._.. ?i.,,'j·::;:~==::]~==:=:=:=a=:Br
Figura 3-19 Figura 3-20
100 ESTADíSTICA APLICADA. CONCEPTOS Y EJERCICIOS A TRAVÉS DE EXCEL

EJERCICIOS RESUELTOS
Ejercicio 1. La distribución de los costes salariales de los 100 000 empleados de una
multinacional se presenta en la tabla siguiente:

Salarios N° de Empleados
0- 15000 2145
15000 - 20000 1520
20000 - 25000 840
25000 - 30000 955
30000 - 35000 1110
35000 - 40000 2342
40000 - 50000 610
50000 - 100000 328
100000 - 300000 150

Calcular el salario medio por trabajador, el salario más frecuente y el salario tal que
la mitad de los restantes sea inferior a él. Calcular también el primer cuartil salarial y
el percentil 75.

La tabla siguiente contiene los elementos relativos a la distribución de


frecuencias de la variable salario (X) necesarios para realizar los cálculos pedidos en
el problema.

L¡.¡ L¡ n¡ Marcas =X¡ x¡*n¡ N¡ e¡ d¡« nvc¡


O 15000 2145 7500 16087500 2145 15000 0,143
15000 20000 1520 17500 26600000 3665 5000 0,304
20000 25000 840 22500 18900000 4505 5000 0,168
25000 30000 955 27500 26262500 5460 5000 0,191
30000 35000 1110 32500 36075000 6570 5000 0,222
35000 40000 2342 37500 87825000 8912 5000 0,4684
40000 50000 610 45000 27450000 9522 10000 0,061
50000 100000 328 75000 24600000 9850 50000 0,00656
100000 300000 150 200000 30000000 10000 200000 0,00075
10000 293800000

La Figura 3-21 muestra la distribución de frecuencias de los costes salariales


(variable X) en una tabla Excel que ha sido obtenida a partir de las fórmulas de la
Figura 3-22.

You might also like