You are on page 1of 25

1

Manual de R y R Comander

1. Instalacin e introduccin a R R Commander

1.1. Introduccin
R es un lenguaje de programacin especialmente indicado para el anlisis estadstico. A diferencia de la
mayora de los programas que solemos utilizar en nuestros computadores, que tienen interfaces tipo
ventana, R es manejado a travs de una consola en la que se introduce cdigo propio de su lenguaje para
obtener los resultados deseados.
R fue inicialmente diseado por Robert Gentleman Ross Ihaka, miembros del Departamento de Estadstica
de la Universidad de Auckland, en Nueva Zelanda. Sin embargo, una de las grandes ventajas de R es que hoy
en da es, en realidad, fruto del esfuerzo de miles de personas en todo el mundo que colaboran en su
desarrollo.
Por otra parte, R se considera la versin libre de otro programa propietario, llamado S S -Plus, desarrollado
por los Laboratorios Bell. Aunque las diferencias entre R S son importantes, la mayor a del cdigo escrito
para S funciona en R sin modificaciones.
El cdigo de R est disponible como software libre bajo las condiciones de la licencia GNU-GPL, puede ser
instalado tanto en sistemas operativos tipo Windows como en Linux Mac OS X.
La pgina principal desde la que se puede acceder tanto a los archivos necesarios para su instalacin como al
resto de recursos del proyecto R es
http://www.r-project.org


1.2. Instalacin de R
Vamos a explicar aqu como se realiza la instalacin en Windows. La descarga del archivo de instalacin se
realiza desde
http://www.r-project.org
2
En dicha pgina debemos elegir la instalacin en Windows, posteriormente la descarga de base y,
finalmente, el archivo de instalacin. En el momento del inicio de la edicin de esta gua la ltima versin
era la 3.0.2. Es recomendable elegir siempre la ltima versin disponible, incluso actualizar la versin que
tenemos instalada si surge una posterior. Con respecto a posibles problemas de incompatibilidades entre
versiones.

La instalacin en si con el archivo ejecutable es trivial. Tan solo hay que continuar con las opciones que la
instalacin proporciona por defecto. Una vez concluida la instalacin, podemos ejecutar el programa desde
cualquiera de los iconos que nos genera.

1.3. La consola el editor de R
Lo primero que nos aparece es una ventana, tambin llamada consola, donde podemos manejar R mediante
la introduccin de cdigo. Por ejemplo, podemos escribir 2+2 en ella, pulsando Intro, lo que nos devolver
en la misma consola el valor 4.
Sin embargo, esta no es la manera ms eficiente de trabajar en R. A poco que estemos realizando un trabajo
de mediana complejidad, ser muy til manejar todas las entradas que solicitemos a R en un entorno donde
podamos corregirlas, retocarlas, repetirlas, guardarlas para continuar el trabajo en otro momento, etc. Esta
es la funcin del editor de R.
La utilidad de un script guion de trabajo radica en que podemos modificar nuestras lneas de cdigo con
comodidad guardarlas para el futuro. Para ello, utilizaremos la opci n Guardar Guardar como del men
Archivo de la consola. Evidentemente, despus podremos recuperar el script previamente guardado
mediante la opcin Abrir script

del mismo men.

1.4. Instalacin e introduccin a R Commander
R Commander es una interfaz tipo ventana que cubre la mayor parte de los anlisis estadsticos ms
habituales en unos mens desplegables a los que estamos bastante acostumbrados, ya que la mayora de los
programas que utilizamos en cualquier sistema operativo son de este tipo. Podemos decir que es una
manera de manejar R sin necesidad de aprender su cdigo casi nada de l , lo cual lo hace muy prctico
cuando se est aprendiendo a usarlo.
3
Adems, una de las funcionalidades que podramos destacar como ms afortunadas de R Commander es
que, a pesar de que permite estos atajos mediante sus mens para no utilizar el cdigo de R, escribe el
cdigo de las operaciones realizadas en una ventana de sintaxis ventana de instrucciones, de manera que
siempre lo veremos en la pantalla podremos, poco a poco, ir aprendindolo, casi sin darnos cuenta.
1.
La instalacin de R Commander se realiza en 4 sencillos pasos:
En la consola de R seleccionamos
2.
Paquetes Instalar paquete(s).
Nos saldr una ventana solicitando un mirror desde el que descargar los paquetes, de entre los cuales
elegimos obviamente, Colombia, aunque se puede elegir otro cualquiera de los mirror
3.
disponibles.
Se abrir una ventana donde aparecen todos los paquetes disponibles para R. Seleccionamos, en
principio, el paquete Rcmdr, aunque necesitaremos tambin los plugins adicionales llamados
RcmdrPlugin. HH
4.
RcmdrPlugin. IPSUR.
A continuacin, cargamos R Commander, introduciendo el siguiente cdigo en la consola de R: library
(Rcmdr) o seleccionando en la consola R paquetes cargar paquete. Esta primera vez que cargamos R
Commander nos pedir la instalacin de otros paquetes necesarios: debemos autorizarlo, eligiendo la
opcin, que aparece por defecto, de descarga desde CRAN. No debemos extraarnos si tarda unos
minutos en descargar e instalar estos otros paquetes.
1.
Una vez cargado R Commander veremos una ventana en la cual podemos distinguir 4 partes:
El men de ventanas desplegables, con las opciones Fichero, Editar, Datos, ...
2.
Es un men de ventanas con entradas bastante intuitivas, que no requieren conocimientos de R, pero
s de Estadstica.
La ventana de instrucciones.
Cada vez que ejecutemos alguna accin del men, R Commander traducir dicha accin a cdigo de R
lo escribir en esta ventana. Como debamos, eso permite ir aprendiendo este cdigo y, adems,
facilita la posibilidad de volver a ejecutar la misma accin una ligera variante de la misma retocando
el cdigo, sin tener que volver a utilizar el men.
Por otra parte, esta ventana de instrucciones es equivalente al editor de R. Por ejemplo, podemos
escribir 2+2, clicar en el botn de ejecutar (equivalente a F5 Control+R)

obteniendo el resultado.

3. La ventana de resultados.
Si hemos realizado ese sencillo ejemplo en la ventana de instrucciones, habremos visto que el
resultado aparece en esta ventana. En general, cualquier resultado de R Commander ser mostrado
aqu.
4
4. La ventana de mensajes.
Es la ms inferior de todas aparece ligeramente sombreada. Sirve para que R Commander nos
informe de cualquier aspecto, especialmente de errores cometidos.
Para finalizar esta breve introduccin a R Commander, queremos comentar que los paquetes
adicionales (plugins) que hemos instalado junto con R Commander son complementos que diversos
autores de contenidos de R han ido poniendo a disposicin de la comunidad de usuarios de R. Cada
uno de ellos tiene una funcionalidad concreta, pero la prctica nos hace recomendar que, en lo
sucesivo, los carguemos todos sin excepcin. Al hacerlo algunas opciones de anlisis de los mens
desplegables de R Commander cambiaran. Decir por ltimo que para cargar estos plugins se debe
elegir en el men de R Commander Herramientas Cargar plugins de R Commander
seleccionarlos. Se pedir reinicializar R Commander, tras lo cual todos ellos estn disponibles.

Nota: Si se cierra Rcommander (sin cerrar R) para volver a cargarlo se debe ejecutar la instruccin
Commander() en la consola de R.

2. Preliminares sobre el lenguaje de R
2.1.

Introduccin
Este captulo pretende ofrecer una descripcin de algunas cuestiones relativas al lenguaje de R que
resultaran de inters en el resto del documento. Podran parecer a un lector que se inicie en R desde aqu
demasiado complejas, a un lector que ya haya manejado R previamente, demasiado simples.
2.2.
Tambin describimos el uso de la ayuda, lo que facilita informacin til sobre las funciones el lenguaje de
R.

Algunos tipos de objetos de R
En el lenguaje de R, los elementos u objetos que se vayan definiendo, bien por nosotros mismos, bien como
resultado del programa, pueden deben ser distinguidos para su uso correcto. Por ejemplo, una matriz, por
su propia definicin, es una coleccin de nmeros configurados en filas columnas, t odas ellas de la misma
longitud. Sin embargo, en ocasiones es necesario reunir nmeros en vectores estos en alg n objeto,
5
cuando no todos ellos tienen la misma dimensin: esto es posible en un tipo especial de objeto llamado
lista. Desde luego, una lista no es una matriz, luego, aunque nos sirva para meter en ella vectores de
dimensiones distintas, no admite las operaciones matriciales habituales, por ejemplo.

No se pretende ser exhaustivo en la descripcin de los tipos de objeto de R. Tan solo se van a describir los
que se cree que son ms utilizados en el contexto de un manual como este. Concretamente, se va a hablar
de:

Vectores.

Matrices.
Hojas de datos.

Se hace nfasis en que otros tipos de objetos, como las listas, las variables indexadas (arrays), las funciones
los modelos, son tambin muy importantes.

2.2.1. Vectores
Un vector en R puede contener una coleccin de nmeros de caracteres no numricos. Para definir un
vector, por ejemplo, el vector x = (1, 3, 5), usaramos la orden x<-c(1,3,5)
Observemos que es la funcin de concatenacin c() la que construye el vector.
Tambin es posible definir un vector de nmeros consecutivos, por ejemplo, el vector (1, 2, 3, 4, 5) mediante
x<-1:5
De forma ms general, la funcin seq() permite definir secuencias desde un inicio hasta un fin con una
determinada separacin entre ellos. Por ejemplo,
y<-seq

(-3,3,0.5)

proporciona
[1] -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0
Tambin es til la funcin rep() para definir vectores como repeticin de otros vectores. Por ejemplo,
(0,100) devolvera un vector de 100 ceros. tambin, rep(1:3,3) devolvera
[1] 1 2 3 1 2 3 1 2 3
6
Si queremos saber la longitud de un vector, usaremos length(). Por ejemplo, length(y) nos devolverla el valor
13.
No hay problema en que un vector, en vez de incluir nmeros, incluya caracteres, siempre que estos estn
entre comillas. Por ejemplo, podramos definir el vector
genero<-c("Mujer","Hombre")

2.2.2. Matrices
Una matriz se define mediante la funcin matrix () a la que hay que especificar sus elementos su
dimensin y se debe tener en cuenta que por defecto introduce sus elementos por columnas.
Por ejemplo, para definir la matriz:


lo haramos usando
matriz<-matrix(c(1,2,3,4,5,6,7,8,9),3,3)
Las dimensiones (nmero de filas columnas) de la matriz pueden obtenerse mediante la funcin dim(). Por
ejemplo, dim(matriz) proporcionara el valor .
Por otra parte, tanto para vectores como para matrices, funcionan las operaciones suma diferencia sin ms
complicaciones.
En el caso del producto, sin embargo, hay que clarificar que, por ejemplo, matriz * matriz devuelve la
multiplicacin elemento a elemento, mientras que matriz %*% matriz

s devuelve el producto matricial.


2.3. Funciones ms comunes en R

En esta seccin se destacan algunas funciones de R que sern usadas en el resto del documento. Por
ejemplo:
sum() proporciona la suma de los elementos del argumento. As, si x = (1, 3, 5), sum(x) dara el valor 9.
7
cumsum() proporciona un vector con la suma acumulada del vector argumento. Por ejemplo,
teniendo en cuenta que x = (1, 3, 5), cumsum(x) dara

[1] 1 4 9
rowSums() colSums()

suman, por filas por columnas, respectivamente, los datos de una hoja de
datos.
prod() cumprod() son el equivalente a sum() cumsum()

para el producto.
sqrt()

es la funcin raz cuadrada.
log()

es la funcin logaritmo natural neperiano.
log10() es el logaritmo en base 10

.
exp()

es la funcin exponencial.
max() min()

proporcionan el mximo el mnimo del argumento (habitualmente, un vector).
sort ()

proporciona la ordenacin de un vector de menor a mayor.
2.4. La ayuda de R
Si se desea obtener ayuda sobre el uso de alguna funcin cuyo nombre conocemos, podemos utilizar la
ayuda de R simplemente antecediendo el nombre de esa funcin con un signo de interrogacin.
Por ejemplo, ?sort abrir una ventana de nuestro explorador con todos los detalles sobre el uso de esa
funcin, incluyendo interesantes ejemplos.
Pero, qu ocurre si se necesita ayuda sobre un aspecto del que desconocemos qu funcin nos lo facilita?
Supongamos, por ejemplo, que se desea saber cmo se realiza la descomposicin de Choleski de una
matriz. En ese caso, si no se sabe qu funcin facilita esa descomposicin, se escribe ??choleski. Eso abrir
una ventana de R con todas las funciones que incluyen la palabra Choleski en su ayuda.
Si se quiere ayuda concreta sobre esta funcin, solo se ejecuta ?Choleski. Sin embargo, la funcin Choleski()
se encuentra dentro del paquete Matrix, por lo que se tiene que cargar este paquete antes de pedir la
ayuda. Las instrucciones seran:

library(Matrix)
?Choleski
8

Un ltimo paso en la bsqueda de ayuda. Qu ocurre si se necesita ayuda sobre algo que est en una
funcin de un paquete que no est instalado? Se debe tener en cuenta que, al instalar R tan solo se
incorpora una mnima parte de los paquetes que el proyecto CRAN tiene, gracias a la colaboracin de los
miles de desarrolladores de R, as que, si no encontramos ayuda en los paquetes instalados por defecto,
puede que aun as, exista un paquete en CRAN donde haya algo al respecto.


3. Manejo de datos

3.1. Introduccin de datos nuevos

3.1.1. La hoja de datos
Vamos a ponernos en una situacin general en la que tenemos informacin sobre n individuos, informacin
que se refiere a k variables. En ese caso, la forma en que en Estadstica se organiza toda esta informacin es
una matriz de dimensiones n k, donde cada fila representa un individuo caso cada columna representa
una variable dato.
Por ejemplo, consideremos que tenemos la puntuacin en una prueba escrita (x) en una prueba oral (y), de
una muestra de 10 personas. Su matriz de datos es la siguiente:

161 159
203 206
235 241
176 163
201 197
188 193
228 209
211 189
191 169
178 201



3.1.2. Introduccin de una hoja de datos en R Commander
Para introducir los datos de las dos pruebas en R Commander elegimos Nuevo conjunto de datos del men
Datos. Eso abre el editor de datos que, en primer lugar, nos pedir un nombre para la matriz de datos
(ahora hemos elegido Pruebas) a continuaci n abrir una ventana con casillas parecida a una hoja de
9
clculo de Excel. En esta hoja debemos introducir los datos con la misma estructura que tiene la matriz de
datos que acabamos de escribir, con los individuos en las filas las dos variables en dos columnas.
Una vez introducidos los datos, debemos nombrar las variables, es decir, las columnas, con nombres
sencillos que nos recuerden a que variable corresponde cada columna. Para ello clicamos con el ratn sobre
la parte superior de cada columna, donde R Commander nombra por defecto las variables como var1, var2,
etc. escribimos otros nombres m s acordes con nuestros datos
.
En este caso nombramos las variables
como escrita oral

.











Para terminar, cerramos la ventana del editor de datos. En ese momento, R habr almacenado los datos
introducidos convirtindolos en lo que R Commander llama el conjunto de datos. Observen que justo
encima de la ventana de instrucciones aparece ahora una pestaa informativa que pone Conjunto de datos:
Prueba. Esta ventana especifica que, en efecto, el conjunto de datos activo en este momento es el que
nosotros hemos llamado Prueba.
Finalmente, podemos retocar estos datos pulsando la pestaa Editar conjunto de datos que hay justo sobre
la ventana de instrucciones simplemente visualizarlos pulsando la pestaa Visualizar conjunto de datos.
Como comentario final, debemos advertir que por problemas con el lenguaje de programacin en el que
est diseado R R Commander, es frecuente que al abrir cerrar el editor de datos, el programa se
10
bloquee, por lo que recomendamos hacerlo solo cuando sea imprescindible. Adems, tambin es
recomendable cerrar la ventana del editor, evitando dejarla minimizada.

3.1.3. Almacenamiento de un conjunto de datos en R Commander
Para guardar una hoja de datos en R Commander, seleccionamos en el men Datos la opcin Conjunto de
datos active y, dentro de esta, Guardar el conjunto de datos activo (Figura 3.2). A continuacin nos pedir
un nombre un directorio donde almacenar el fichero, cuya extensin por defecto ser .rda.

Si posteriormente queremos cargar estos datos, no tenemos ms que usar la opcin del men Datos
Cargar conjunto de datos buscar el archivo correspondiente mediante la ventana del explorador que se
abre.













11






3.1.4. Datos faltantes
Qu ocurre si, por alguna razn, nos falta el dato de una variable referida a un individuo concreto? Eso se
conoce en Estadstica como dato faltante o missing data.

Para R es muy fcil identificar esos datos cuando los introducimos a mano: basta con dejar esa casilla vaca,
en cuyo caso el editor de datos escribir en ella NA, acrnimo de Not Available. Si estamos trabajando con
cdigo, el caracter para un dato faltante es tambin NA. Por ejemplo, si tengo un vector de 5 datos el
tercero de ellos es un dato faltante, debera escribir, por ejemplo, c(3,2,NA,2,8).

3.2. Importar datos
Hay que decir que introducir datos a mano puede convertirse en una tarea muy pesada si el nmero de casos
de variables es alto. Hoy en da, por otra parte, es bastante comn tener los datos almacenados en algn
tipo de formato electrnico la clave del xito para aprovechar estos recursos no tener que introd ucir los
datos manualmente radica en hacer que nuestro programa estadstico, en este caso R, lea estos datos.

Los formatos de archivo ms habituales en los que nos podemos encontrar unos datos son, en primer lugar,
los archivos tipo texto (con extensin .txt) y, en segundo lugar, los archivos de Microsoft Excel(con extensin
.xls). Existen otros muchos formatos, pero casi siempre son convertibles a estos dos tipos.
3.2.1. Importar datos de tipo texto
Los archivos de tipo texto que contienen datos suelen tener una estructura en la que los individuos estn en
filas distintas las variables est n sep aradas por algn tipo de caracter, tales como comas, tabulaciones,
espacios u otros.
Adems, es posible que la primera fila contenga los nombres de las variables, por ltimo, tambin es
necesario fijarse en cmo estn especificados los decimales, si los hay.

Los aspectos que deben tenerse en cuenta a la hora de importar datos son:

el hecho de que el archivo incluya los nombres de las variables.
el caracter que separa las variables.
12
el caracter que distingue los decimales.
Vamos a ver como se hace mediante un ejemplo. En el archivo promedio.txt aparecen datos relativos al
promedio de los estudiantes de una universidad, discriminados por estrato, tiempo en horas semanales
dedicadas a estudiar, edad y si trabaja o no. Si abrimos este fichero con el bloc de notas, tiene el aspecto
que aparece a continuacin. En ella podemos ver que, en efecto, se excluye el nombre de las variables,
adems, los decimales estn separados por puntos y el caracter que separa las variables es el espacio.


Mediante R Commander
Nos vamos a la opcin del men

Datos Importar datos desde archivo de texto portapapeles...




13


Se abre una ventana como la que se muestra a continuacin, en la que debemos elegir las opciones del
archivo

Importa_ texto.txt:

Nombre: Por ejemplo,

Datos.

Nombre de las variables en el fichero: desactivado.

Indicador de valores ausentes: lo dejamos en blanco.

Separador de campos: espacios.
Caractr decimal: punto.
Como vemos, se puede escoger entre buscar los datos dentro de un archivo de nuestro disco duro
(sistemade archivo local) bien desde el portapapeles. En el primer caso, se abre una ventana del
explorador para que encontremos el archivo lo seleccionamos. Ahora el conjunto de datos activo es Datos.
Si lo deseamos, podemos guardar este conjunto de datos activo con formato .rda() para que la prxima vez
no tengamos que importarlo de nuevo

.









14

3.2.2. Importar archivos de tipo Excel
Mediante R Commander

En el caso de los archivos tipo Excel, R Commander no necesita que le digamos nada, ya que detecta
automticamente los nombres de las variables si estn presentes. No obstante, estos no deben incluir
caracteres extraos, deben estar todos los nombres de todas las variables ninguno; en cualquier otro
caso, la importacin podra ser invalida.
Nos vamos a la opcin del men Datos Importar datos datos Excel, Access dBase..., eligiendo
despus el archivo a travs de la ventana del explorador.

Por ejemplo, el archivo universidad.xls contiene para cada estudiante universitario 6 variables, que
consisten en el valor de la matricula VMATRI, el promedio PROM, el nmero de horas semanales que
dedican a estudiar por fuera de clase HORAS, el estrato socioeconmico ESTRATO, si trabajan o no TRAB y la
facultad a la que pertenecen FAC. Los datos se encuentran en la Hoja1, por lo tanto la debemos seleccionar.







3.4
.
Re
15
3.3. Codificacin de variables


Re codificar una variable consiste en construir una nueva variable mediante la transformacin de los valores
de otra variable. Esta re codificacin es bastante til en muchas aplicaciones, como iremos viendo. En esta
seccin vamos a ver un par de ejemplos que nos ayudaran a ver cul es el procedimiento a seguir.
Re codificacin de una variable numrica
El archivo universidad.xls contiene para cada estudiante universitario 6 variables, que consisten en el valor
de la matricula VMATRI, el promedio PROM, el nmero de horas semanales que dedican a estudiar por
fuera de clase HORAS, el estrato socioeconmico ESTRATO, si trabajan o no TRAB y la facultad a la que
pertenecen FAC, la variable ESTRATO tiene como niveles (1, 2, 3, 4, 5, 6), pero deseamos realizar un anlisis
para comparar los estratos bajos (1, 2, 3), con los estratos altos (4, 5, 6), por lo que tenemos que crear una
nueva variable que llamaremos RESTRATO con niveles (bajo, alto), re codificando la variable ESTRATO.
Para realizar esta re codificacin realizamos los siguientes pasos: DatosModificar variable de conjunto de
datos activoRecodificar variables

1.
ya estn incluidas las entradas necesarias para nuestra recodificacin:
2.
La variable a recodificar: ESTRATO.
3.
El nombre de la nueva variable: RESTRATO.
4.
Las condiciones que determinan la recodificacin. para especificar todos los nmeros entre un valor a
otro valor b se debe poner a : b. Por otra parte, como queremos que los nuevos valores sean
caracteres (bajo, alto), deben escribirse entre comillas, luego colocamos 1:3="bajo" 4:6="alto".
La opcin Convertir cada nueva variable en factor se deja activada para que la variable re codificada
sea considerada como un factor.
16







Al visualizar los datos obtenemos lo siguiente:










3.4. Almacenamiento de instrucciones resultados

Mediante R Commander
Vamos a ejemplificarlo con el ejemplo que antes hemos trabajado sobre el archivo universidad.xls.
Debemos importarlo de nuevo crear la variable RESTRATO.
17
A continuacin seleccionamos en el men Fichero Guardar las instrucciones. Nos pedir el nombre la
ruta donde guardar el fichero de instrucciones, que tendr extensin .R. Una buena idea para nombrar los
ficheros de instrucciones, es ponerles como nombre la fecha del da, por ejemplo, 10_09_13. No es
necesario escribir la extensin (pero tampoco la borremos): lo har el propio programa. Podemos
debemos seguir guardando las instrucciones con posterioridad, eligiendo de nuevo Guardar las
instrucciones, pero ya no nos pedir de nuevo un nombre, a no ser que elijamos

Guardar las instrucciones
como.








4. Estadstica descriptiva
4.1. Calculo de medidas de posicin, dispersin forma
Mediante R Commander
Las medidas de posicin, dispersin forma ms comunes, media, mediana, percentiles, desviacin tpica
coeficiente de asimetra, se hallan en la opcin del men

Estadsticos Resmenes Conjunto de datos
activo



18


Al seleccionar esta opcin nos muestra un resumen de cada una de las variables
disponibles en el conjunto de datos, como se muestra a continuacin, es importante resaltar
que al pedirle al programa que realice un resmen el desconoce la naturaleza de los
datos, porque si bien distingue de datos numricos y alfanumricos, el investigador debe
distingir entre los tipos de variables con los que cuenta la base de datos para realizar
futuras interpretaciones de los resultados.
Para obtener medidas descriptivas de alguna(s) variable(s) en especial procedemos de la
siguiente manera:





En la pesataa Datos se selecciona la variable de inters, se puede discriminar adems la
informacin por grupos, al seleccionar esta opcin aparecen las variables que son de tipo
categrico y por las cuales es posible realizar un anlisis discriminado por grupos.
Estadsticos Resmenes Resmenes numricos. Al dar click en esta opcin nos
aparece una ventana como se muestra a continuacin, en la cual debemos seleccionar la(s) variable(s) de
inters:
19
En la pestaa Estadsticos se pueden seleccionar los resmenes numricos que
necesitamos como media, desviacin estndar, cuantiles, entre otros.







A modo de ejemplo, vamos a obtener estas medidas para la variable VMATRI discriminada por la variable
RESTRATO la cual fue re codificada en la seccin anterior. Los resultados son los siguientes:
Aqu, mean se refiere a la media, sd a la raz de la varianza muestral, IQR

es el rango intercuartil, el
percentil 0 es el valor mnimo de la variable, el percentil 50, como ya sabemos, es la mediana el percentil
100 es el valor mximo de la variable.
20
4.2. Distribuciones de frecuencias
Las variables de tipo cualitativo, no pueden ser resumidas mediante las medidas numricas antes
mencionadas. Para este tipo de variables el resumen ms conveniente es, simplemente, su distribucin de
frecuencias.

Mediante R Commander
Para obtener la distribucin de frecuencias de una varias variables de un conjunto de datos medi ante R
Commander elegimos la opcin





Estadsticos Resmenes Distribucin de frecuencias.
En la ventana emergente elegimos las variables que queremos analizar, la tabla aparece en la ventana de
resultados, incluyendo las frecuencias absolutas relativas.
4.3. Diagrama de barras diagrama de sectores
No obstante, asumiendo el dicho una imagen vale ms que mil palabras,

sabemos que existen dos formas
de plasmar en un grfico la distribucin de frecuencias de una variable cualitativa discreta con pocos
valores: el diagrama de barras el diagrama de sectores.
21
4.3.1. Diagrama de barras para variables cualitativas

En R Commander este tipo de grficos estn en la opcin










Grficas Grfica de barras.

La ventana de entrada aparece en la siguiente figura.






En esta ventana hemos solicitado un anlisis de la variable FAC. Es muy importante tener en cuenta que
solo pueden representarse variables cualitativas de tipo factor.
La funcin barplot()
El grfico obtenido con los pasos anteriores es el que se muestra en la siguiente figura, este grfico contiene
las frecuencias absolutas para cada categora,
nos permite obtener la distribucin de barras mediante cdigo. Aqu tenemos
posibilidad de controlar ms cosas.


22
4.3.2. Diagrama de sectores o de pastel para variables cualitativas

Para realizar un diagrama de sectores o de pastel mediante R Commander elegiremos la opcin









Graficas
Diagrama de sectores.





La ventana emergente solo permite elegir una variable cualitativa. De nuevo es muy importante tener en
cuenta que solo pueden representarse variables cualitativas de tipo factor. El diagrama correspondiente al
tipo de facultad es el siguiente:








23
4.4. Histograma para variables continuas.
Como ya sabemos, los diagramas de barras sectores no son adecuados para datos de variables continuas.
Frente a estas representaciones, el histograma aparece como la alternativa vlida, ya que obliga a agrupar
los valores en intervalos cuya frecuencia si es relevante.
Para realizar un histograma con R Commander elegimos

Grficas Histograma.










La ventana de entrada permite elegir solo una variable para cada anlisis (pestaa Datos), el nmero de
intervalos del histograma la escala de este: frecuencias absolutas, porcentajes densidades (pesta a
Opciones).
24
En el caso de la variable VMATRI

hemos seleccionado histogramas con escala en frecuencias el Nmero de
clases con la opcin <auto> (Por defecto, asigna el nmero de intervalos por el conocido mtodo de
Sturges.). El grfico obtenido se muestra a continuacin:






4.5 Diagrama de caja alambre y bigote (Boxplot)

4.5.1. Grafica por grupos
En este caso vamos a realizar un boxplot (diagrama de caja), el cual es un grfico, basado en cuartiles,
mediante el cual se visualiza un conjunto de datos. Este proporciona una visin general de la simetra de la
distribucin de los datos.

Mediante R Commander

Vamos a obtener el diagrama de caja de la variable VMATRI discriminado por RESTRATO, para observar el
comportamiento del valor de la matrcula discriminada por tipo de estrato (alto, bajo). Para ello, elegimos la
opcin Grficas Diagrama de caja.






25








Las dos ventanas de entradas son muy parecidas: en ellas tenemos que elegir la variable que queremos
analizar existen dos opciones muy interesantes: Grfica por grupos y en la pestaa Opciones se encuentra
identificar datos atpicos. Inicialmente realizaremos un Boxplot discriminando por grupos, para elegir esta
opcin damos click en la opcin Grfica por grupos y seleccionamos la variable categrica por la cual
queremos discriminar el anlisis.


El diagrama de caja para la variable VMATRI discriminada por RESTRATO es:

You might also like