Professional Documents
Culture Documents
Práctica nº 1
Una empresa agroquímica dispone de tres plantas de fabricación en las que se producen compues-
tos químicos para la elaboración de fertilizantes. La mayor parte de la producción se dedica a dos
compuestos que se combinan para producir un fertilizante comercial. Como medida de calidad de la
producción, cada mes se toma una muestra del fertilizante producido, que se aplica a una parcela
de terreno y se evalúa la acumulación de nitratos en plantas de crecimiento rápido cultivadas en
dicha parcela. La empresa lleva un registro mensual en el que para cada mes se anotan los valores
de las siguientes variables:
fabrica: Las tres fábricas están situadas, respectivamente, en León, Burgos y Zaragoza.
año: año en que se realiza la observación (se han tomado datos en los años 2005 a 2009).
mes: mes en que se realiza la observación.
temp: temperatura media mensual (en el exterior de la fábrica).
numdias: número de días en que la fábrica ha estado operativa durante ese mes.
consumo: consumo eléctrico mensual (en Mw) de la fábrica.
pureza1: pureza (medida en %) del compuesto 1.
pureza2: pureza (medida en %) del compuesto 2.
prod1: producción mensual (en Tm) del compuesto 1.
prod2: producción mensual (en Tm) del compuesto 2.
nitrato: nivel de acumulación de nitrato. Esta variable toma los valores “bajo”, “medio” y “alto” (un
nivel más bajo significa un fertilizante de mayor calidad).
Para la realización de esta práctica, cada alumno o grupo de alumnos (hasta 3) dispondrá de un
archivo de datos propio, al que puede acceder:
1
A través de Rcommander: es preciso instalar previamente un plugin para Rcommander. Para
ello, arrancar R e introducir en la línea de comandos la siguiente instrucción:
> source(”http://dl.dropbox.com/u/7610774/Rcmdr/installPlugin.R”)
Una vez hecho ésto, ejecutar library(RcmdrPlugin.MeiULPGC) (o, si se usa RStudio, pin-
char en el paquete RcmdrPlugin.MeiULPGC en la lista de paquetes). Se abrirá la ventana de
Rcommander que ahora incluye un nuevo menú Practicas MEI-ULPGC. En este menú hay que
seleccionar la práctica 1 e introducir el DNI del alumno. Se descargará el conjunto de datos
fertilquim que puede activarse pinchando en el botón <No hay conjunto de datos activo>
En ambos casos, se guardará un archivo con los datos en la carpeta de usuario (usualmente “Mis
Documentos” ) con el nombre fertilquim NNNNNNNN.csv donde NNNNNNNN es el número del
DNI proporcionado. Se recomienda que el alumno guarde este archivo en un pendrive o otro dispo-
sitivo de almacenamiento para su posible uso posterior1 .
Utilizando estos datos el alumno deberá responder a las cuestiones que se enuncian seguidamente.
Para ello deberá utilizar el programa R a través del Front-End Rstudio. Se recomienda que todos los
comandos empleados en esta práctica se guarden en un archivo script. Es conveniente que dicho
script sea conservado por el alumno en su pendrive para futura referencia.
IMPORTANTE: Para rellenar este formulario puede utilizarse alguno de los siguientes progra-
mas:
Mac OSX: Vista Previa (viene instalado por defecto en todos los Mac).
Linux: En Linux puede utilizarse Okular. Puede instalarse desde el Centro de Software o
mediante sudo apt-get install okular. También es posible instalar bajo Wine la versión 4.3 de
Foxit Reader (http://www.oldapps.com/foxit_reader.php?old_foxit_reader=21)
1
En ese caso el archivo puede leerse mediante el comando read.table(file=”carpeta con el archivo/fertilquim -
NNNNNNNN.csv”,header=T,sep=”;”,dec=”,”).
2
Incluir a continuación el número de DNI de los alumnos que participan en la realización esta práctica:
¡MUY IMPORTANTE!: El primer DNI debe coincidir con el utilizado para la generación de los
datos.
3. Construye una tabla de frecuencias cruzadas absolutas de la variable fabrica frente a ni-
trato. Rellena la siguiente tabla:
Frecuencias absolutas
baja media alta
León 3 15 42
Burgos 4 17 39
Zaragoza 5 16 39
Nº total observaciones
12 48 120
por columna
4. Calcula el consumo eléctrico medio mensual. Calcula también la mediana, la desviación típi-
ca, el valor máximo, el mínimo y los percentiles 5 y 95 de esta variable.
Media: 258.4743 Valor máximo: 320.8
Mediana: 255.315 Valor mínimo: 208.12
Varianza: 795.2373 Percentil 5: 213.4580
Desviación Tip: 28.19995 Percentil 95: 311.3915
3
5. Construye la matriz de correlaciones de las variables numdias, temp, pureza1, pureza2,
prod1, prod2 y consumo. Con los valores obtenidos completa la siguiente tabla:
Correlación
pureza2 prod1 0.30347685
prod2 temp -0.096657569
numdias prod1 -0.03765317
consumo prod1 -0.19542329
pureza1 pureza2 0.042275800
prod1 pureza2 0.303476849
temp pureza1 -0.16014422