You are on page 1of 9

Ecologa

Agosto de Austral
2008 18:223-231. Agosto 2008
USO DEL PROGRAMA ESTADSTICO R 223
Debate
Asociacin Argentina de Ecologa

Por qu comprar un programa estadstico si existe R?

CHRISTIAN SALAS *

School of Forestry and Environmental Studies, Yale University, USA.


Departamento de Ciencias Forestales, Universidad de La Frontera, Temuco, Chile.

RESUMEN. La estadstica es una ciencia aliada a la investigacin cientfica. Los cientficos que trabajan
en ecologa, recursos naturales e ingeniera comnmente emplean programas de computacin para
realizar anlisis estadsticos. En este trabajo se revisan brevemente dos de los programas estadsticos
ms usados en estudios ecolgicos, SPSS y SAS, y se comparan con el software estadstico R. Sobre
la base de este anlisis, se propone el uso de R en ciencias ecolgicas e ingeniera en Latinoamrica
y en pases del tercer mundo en general, porque ofrece el uso gratuito de un software de primer
nivel, as como tambin un mayor control de los anlisis conducidos, extensa documentacin, y
un ambiente de programacin desarrollado para aplicaciones estadsticas y con capacidad para
ser empleado en otras reas cuantitativas de diversas disciplinas.

[Palabras clave: estadstica, computacin, ecologa estadstica, estadstica ambiental, biometra,


software libre, Latinoamrica, docencia de estadstica]

ABSTRACT. Why purchase commercial statistical software if there is R?: Statistics is used in all
scientific disciplines. Researches on ecology, natural resources, and engineering use statistical
software packages for conducting their statistical analysis. We briefly review two statistical
software packages most often used in ecological and engineering studies, SPSS and SAS, and
compare them with the free statistical software R. We recommend the use of R for problems in
ecology and engineering in Latinoamerica and third world countries, not only because it is a free,
top shelf statistical software, but also because it offers a greater control of how each procedure is
performed, thorough and widely available documentation, and a computing environment both
suitable for statistics as well as for many quantitative areas in several disciplines.

[Keywords: statistics, computing, statistical ecology, environmental statistics, biometrics, free


software, Latin America, statistical teaching]

INTRODUCCIN yman (1955) proclam a la estadstica como


la sirvienta para todas las ciencias, ejem-
plificando su importancia en el estudio de la
La estadstica es una ciencia aliada de la in-
vestigacin cientfica. Nadie discute el gran existencia y evolucin, medicina, psicologa,
aporte a la ciencia moderna de la teora de la industria y astronoma. La estadstica no slo
relatividad de Einstein, la mecnica cuntica ha contribuido enormemente al desarrollo de
y la teora de la evolucin de Darwin. Sin las anteriores, sino tambin en ingeniera, agri-
embargo, pocos parecen reconocer el gran cultura y silvicultura. Por ejemplo, Gregoire
aporte de la estadstica en el ltimo siglo. Ne- & Khl (2000) comentan sobre el amplio uso

* School of Forestry and Environmental Studies,


Yale University, 360 Prospect Street, New
Haven, CT 06511, USA. Tel.: +1(203)432-9398. Recibido: 18 de marzo de 2008; Fin de arbitraje: 13 de mayo
Fax: +1(203)432-3809. de 2008; Revisin recibida: 14 de mayo de 2008; Aceptado: 19
christian.salas@yale.edu de junio de 2008
Debate
224 C SALAS Ecologa Austral 18:223-231

de la estadstica en el desarrollo de las ciencias este tipo de programas son especficos, se pue-
forestales. Mediante la estadstica se evalan den usar en investigacin y ofrecen lo que se
cuantitativamente hiptesis de investigacin, necesita para un trabajo puntual. Sin embargo,
se desarrollan modelos predictivos, se estiman su uso est limitado a un tipo de anlisis y, por
parmetros y se analizan experimentos, entre lo tanto, slo son de inters para un pequeo
otras aplicaciones. El anlisis de regresin es abanico de usuarios. En consecuencia, este
uno de los mtodos estadsticos ms empleados trabajo se centrar en programas estadsticos
en varias disciplinas, mientras que los mtodos genricos que permiten ejecutar una variada
multivariados gozan de popularidad entre gama de procedimientos, y no se abordarn
eclogos. Los investigadores que trabajan los software-tarea-especficos.
en disciplinas aplicadas como las ciencias
agrcolas y forestales, as como tambin en En este artculo se revisan y comparan carac-
disciplinas que requieren de un intensivo tersticas generales de dos programas estads-
trabajo en laboratorio (e.g., microbiologa ticos comerciales de amplio uso en ecologa
y anlisis qumicos) emplean diversos (SPSS y SAS) con el programa estadstico libre
modelos estadsticos para el anlisis de sus R. El objetivo del presente trabajo es aportar
experimentos (ntese que los llamados dise- a la discusin con respecto a los programas
os experimentales son, en realidad, modelos estadsticos empleados en ciencias ecolgicas
estadsticos). y a los recursos econmicos necesarios para su
uso tanto en investigacin como en docencia
El uso de un programa de computacin (i.e., universitaria. Se advierte al lector que el au-
software) estadstico es importante tanto en tor no tiene afiliacin con ninguno de los tres
la ciencia bsica como en la aplicada (e.g., programas estadsticos analizados.
ejercicio profesional). En la prctica, tanto
investigadores como profesionales emplean
algn programa estadstico para realizar PROGRAMAS ESTADSTICOS
pruebas de hiptesis, ajustes de modelos y
anlisis de diseos experimentales complejos. Existen varios programas estadsticos gen-
Muchas veces deben analizar grandes bases ricos. Sin embargo, slo nombrar a los que
de datos y una gran cantidad de variables. se citan generalmente en artculos en revis-
Microsoft Excel es una planilla de clculo tas cientficas latinoamericanas (SPSS, Stata,
ampliamente usada debido a que es parte Systat y SAS), y luego introducir una nueva
de la instalacin tpica de computadores con alternativa, el programa R. Dado que SPSS,
sistema operativo Microsoft Windows, y con Stata y Systat poseen estructuras similares
la ayuda de algunos add-ins puede tambin (aunque con diferencias en sus procedimien-
ejecutar algunos procedimientos estadsticos tos), slo considerar SPPS por su mayor
(Zhu & Kuljaca 2002). Sin embargo, su uso popularidad.
en anlisis estadstico sigue siendo bastante
limitado. Adems, se ha mostrado la baja SPSS (SPSS Inc. 2007) es un software lanzado
calidad de los procedimientos estadsticos de al mercado en 1968. Originalmente se desarro-
M. Excel (McCullough & Wilson 1999, 2002, ll para las ciencias sociales, por lo que ofrece
2005). Algunas investigaciones emplean an- un uso sencillo de las opciones, acceso rpido
lisis bastante especficos que son realizados en a datos y procedimientos, generacin de sali-
programas estadsticos pequeos, diseados das y grficos. SPPS es un programa con una
exclusivamente para tales fines, y a los que interfaz grfica de usuario (trmino denomi-
denominar software-tarea-especficos. Por nado en computacin, GUI) amigable, y slo
ejemplo, el programa SPPA (Spatial Point a travs de sta se accede a sus opciones (e.g.,
Pattern Analysis), que se usa para calcular abrir los datos y ejecutar clculos) mediante el
la funcin de Ripley (Ripley 1977), la cual es uso de los botones de la interfaz grfica.
empleada en estudios de estadstica espacial
como el de Haase et al. (1996) en matorrales SAS (SAS Institute Inc. 2007) ha sido por
y el de Salas et al. (2006) en bosques. Aunque largos aos el software ms utilizado en la
Debate
Agosto de 2008 USO DEL PROGRAMA ESTADSTICO R 225
comunidad estadstica y, por lo tanto, tambin COMPARACIN GENERAL
se ha propagado su uso entre investigadores
de diferentes disciplinas. SAS, a diferencia de
Dado que diferentes programas implemen-
SPSS, es un programa que requiere el ingreso
tan distintos algoritmos para llevar a cabo los
de comandos (i.e., sintaxis) para ejecutar gran mismos tipos de anlisis, los usuarios se bene-
parte de sus rutinas y opciones. Por lo tanto, fician de una comparacin entre los programas
necesita del conocimiento de la sintaxis antes ms usados. Se han realizado comparaciones
de su uso. SAS ha llegado a ser el programa de clculos para los procedimientos (e.g.,
estndar empleado en ensayos clnicos y regresin y experimentos factoriales, entre
por la industria farmacutica en los Estados otros) implementados por algunos programas
Unidos. estadsticos (Okunade et al. 1993; McCullough
1999; Zhu & Kuljaca 2002). Sin embargo, estos
R (Ihaka & Gentleman 1996; R Development son bastante especficos y se circunscriben a
Core Team 2007) es un programa estadstico aspectos puntuales. En este contexto, se pre-
y un lenguaje de programacin de uso libre, senta una comparacin general sobre la base
de distribucin gratuita y de cdigo abierto de una serie de aspectos (Tabla 1).
(i.e., el cdigo fuente del programa esta dis-
ponible para los usuarios), desarrollado como a. Amigabilidad con el usuario. SPSS es
un gran proyecto colaborativo de estadsticos bastante amigable para el usuario, ya que
de diversos pases y disciplinas. R tambin es permite acceder a todas las opciones me-
diante un men de funciones. Por su parte,
un programa basado sobre comandos, en
SAS y R requieren conocer la sintaxis y/o los
el que se puede acceder a todos los proce-
comandos antes de ejecutar un procedimiento,
dimientos y opciones a travs de sintaxis
lo cual los hace poco amigables para aquellos
computacional. Fue oficialmente presentado usuarios no familiarizados con la programa-
en 1997 y es un software libre que se rige por cin computacional o con poco inters por
la licencia general pblica (General Public aprender una cantidad de instrucciones. Para
License o GPL) de la fundacin de software ejecutar R no es necesario utilizar el men
libre (Free Software Foundation o GNU, de funciones y para ejecutar SAS, adems
http://www.gnu.org/). R es muy similar de requerir sintaxis es necesario utilizar los
al programa estadstico S-plus (el cual no botones de la interfaz grfica (e.g., se escribe
es gratuito y es distribuido por Insightful la sintaxis para ajustar un modelo mediante
Corporation), ya que la implementacin base el procedimiento de regresin, PROC REG,
y semntica de ambos son derivados de un y luego se debe accionar el botn run para
lenguaje estadstico llamado S y de un lenguaje ajustar el modelo).
llamado Scheme (Ihaka & Gentleman 1996).
Las diferencias entre R y S-plus radican en el No obstante, tanto en SAS como en R existen
nuevas aplicaciones desarrolladas para faci-
lxico empleado, en el cdigo para modelar
litar el uso de los programas. En las ltimas
y en otros aspectos tcnicos computacionales
versiones de SAS se han implementado las
que escapan al alcance de este artculo, pero
utilidades Insight y Analyst que permiten
que pueden ser revisados en Hornik (2008). De realizar algunos tipos de anlisis accionando
todas maneras, la mayora de los comandos de botones sin necesidad de conocer la sintaxis.
R funcionan en S-plus, y viceversa. De igual forma, para R existe Rcommander
(Fox 2005), que permite similares funciones.
Es importante hacer notar que tanto SPSS Sin embargo, R y SAS son sistemas basados
como SAS son programas comerciales y, por lo en comandos, por lo que el empleo de las
tanto, tienen una orientacin y administracin utilidades GUI de estos programas puede
diferentes a las de R, y adems se enfocan en resultar complicado para el usuario ya que
aquellos mercados y usuarios que les propor- debe acceder a diferentes menes antes de
cionan los mayores beneficios. ejecutar un procedimiento especfico, difi-
Debate
226 C SALAS Ecologa Austral 18:223-231

Tabla 1: Comparacin de aspectos generales entre los programas estadsticos SPSS, SAS y R.
Table 1. Comparison of general features of the statistical software SPSS, SAS, and R.
Programa estadstico
Aspecto SPSS SAS R
Amigabilidad con el usuario Excelente Baja-Regular Baja-Regular
Manipulacin de datos Baja Buena Buena
Calidad de grficos Regular Buena-Excelente Excelente
Control de procesos Baja Excelente Excelente
Costo U$S 1500 U$S 7200 Gratis
Cdigo fuente disponible No No S
Variedad anlisis estadsticos Buena Buena-Excelente Excelente
Documentacin Excelente Buena Buena-Excelente
Soporte tcnico Bueno Bueno Bajo
Sistema operativo Windows
Windows
Windows
Macintosh Macintosh
Linux Linux

cultando tambin la reproduccin de anlisis SAS como R emplean sintaxis y procedimien-


estadsticos. Aunque el uso de las utilidades tos que afectan a los datos en una memoria vir-
GUI hace ms amigable el software, el usua- tual, cualquier modificacin en los datos (e.g.,
rio pierde el control de lo que requiere del crear una variable que no existe en el archivo)
programa (ver punto d), limitando adems no es guardada fsicamente en el archivo (a
la flexibilidad de los anlisis y la posibilidad menos que se requiera al finalizar una sesin).
de respaldar y registrar lo que se ha hecho. Es decir, uno puede incorporar transforma-
Claro est, existen varias clases de usuarios: ciones a un archivo de datos, dejando intacto
hay quienes prefieren el control total de cada el archivo original. Esta es una gran ventaja
proceso ejecutado y quienes tan slo buscan ya que por muchos anlisis que se realicen,
los resultados, sin importarles el proceso de siempre es posible partir de un nico archivo
clculo. De todas maneras, tanto SAS como R de datos, evitando la duplicacin de versiones.
permiten la adaptacin al uso tanto de unos SPSS, en cambio, trabaja fsicamente sobre el
como de otros. archivo, modificndolo cada vez que se reali-
zan anlisis. Debe notarse que es posible evitar
b. Manipulacin de datos. Todos los progra- esto, pero debe seleccionarse en alguna de las
mas permiten leer datos en una gran variedad diversas ventanas existentes. Adems, SPSS no
de formatos estndares (e.g., ASCII, txt y dat), es tan verstil en la manipulacin de un gran
y de algunos otros especficos. Los tres pro- nmero de archivos con datos, a comparacin
gramas permiten abrir datos en archivos de de SAS o de R.
tipo M. Excel, lo cual resulta atractivo para
muchos usuarios. c. Calidad de grficos. Una representacin
grfica permite mostrar ms eficientemente re-
Tanto SPPS como SAS permiten abrir el ar- sultados y tambin ayuda a su entendimiento.
chivo de datos en una ventana aparte, lo cual SPSS ofrece una serie de grficos tipo que si
puede ser importante para algunos usuarios. bien pueden modificarse en su formato (e.g.,
R muestra los datos, o una porcin de ellos, leyendas y color), son difciles de personalizar.
segn se requiera, aunque empleando la fun- Aunque tanto SAS como R permiten el diseo
cin fix tambin es posible mostrar y editar personalizado de grficos, SAS requiere del
los datos en una ventana. Debido a que tanto uso de diferentes rutinas (o paquetes), mien-
Debate
Agosto de 2008 USO DEL PROGRAMA ESTADSTICO R 227
tras que las sintaxis de R son ms sencillas (o can aqu los costos para un usuario particular
planas) y no requieren de una gran canti- (i.e., licencia personal) como base de compa-
dad de paquetes. R tambin ofrece una amplia racin. SPPS cuesta U$S 1599 (SPPS Inc. 2007),
gama de formatos en los cuales los grficos un valor promedio a levemente alto entre los
pueden ser exportados, sin necesidad de ma- programas estadsticos de similar categora, y
yor sintaxis. Finalmente, a ttulo subjetivo, la corresponde a una licencia perpetua (i.e., pue-
calidad visual de un grfico en R parecera ser de ser empleado de por vida) de la ltima ver-
superior a la de SAS y a la de SPPS. sin disponible (la nmero 16.0). Si el usuario
desea actualizar la versin que adquiri, debe
d. Control de procesos. Los procedimientos pagar un adicional de U$S 400.
estadsticos usan una serie de algoritmos
que poseen diferentes variantes. Cuando un SAS es el software estadstico ms caro del
usuario no los conoce en profundidad, normal- mercado. Cuesta U$S 7200 (com. pers. SAS,
mente el programa usa variantes predefinidas New Haven, CT, USA, diciembre de 2007).
de estos algoritmos. En todos los programas, Este valor corresponde slo a una licencia
estas definiciones pueden ser especificadas. anual para la versin del ao en curso. El
En SPSS, sin embargo, resulta complejo cam- costo de actualizacin anual es de U$S 2100,
biarlas (slo estn disponibles algunas bsi- aproximadamente un 30% del valor de ad-
cas). Dado que SAS y R requieren sintaxis, quisicin.
tambin permiten un mayor control de los
procedimientos estadsticos a ser ejecutados. R es totalmente gratuito y est disponible en
Por ejemplo, al ajustar modelos no lineales Internet, al igual que cada versin nueva. No
puede especificarse el empleo de derivadas es necesario pagar ni por obtener el software
analticas o numricas. R es ms flexible por ni por actualizarlo. La instalacin tpica de
ser de cdigo abierto; un usuario puede usar R consiste de una serie de paquetes, y cada
las funciones programadas en el software paquete nuevo que ha sido desarrollado es
como tambin escribir funciones propias de publicado en Internet, desde donde se puede
manera sencilla. obtener y agregar a R. A diferencia de SPSS y
de SAS, la distribucin de R es actualizable,
Tanto SPSS y SAS ofrecen generalmente una pudindosele agregar paquetes adicionales
gran cantidad de salidas completas (outputs) por separado. Si bien el costo no debera ser
para un procedimiento estadstico cualquiera. el nico aspecto a considerar en una compa-
En cambio, R ofrece como salidas slo aspectos racin entre programas, la gratuidad de R es
bsicos y, en el caso de que el usuario necesite claramente ventajosa. A pesar de que para
ms detalles, debe solicitarlos especialmente. los usuarios particulares el costo es decisivo,
Contar con demasiadas salidas puede pro- para instituciones y empresas puede ser no
vocar errores de anlisis en aquellos usua- tan importante porque las licencias corpora-
rios con escasos conocimientos estadsticos tivas (si fueran calculados luego en una base
(Searle 1989). En este sentido parece acertada individual) son bastante menores tanto para
la filosofa de R, que slo muestra lo solici- SPSS como para SAS.
tado por el usuario al momento de ejecutar
un procedimiento. As, esa multiplicidad de f. Variedad de anlisis estadsticos. SPPS
estadsticos que aparecen en las salidas de los ofrece un amplio rango de procedimientos
otros programas no distrae al usuario de R, estadsticos, que probablemente cubren gran
quien puede centrarse en lo que ms conoce, parte de los que se utilizan en ecologa e
le interesa y entiende. ingeniera. Sin embargo, cuando se requiere
de mayores especificaciones en los procedi-
e. Costo. Cada empresa que desarrolla pro- mientos (e.g., el ajuste de un modelo no lineal
gramas estadsticos ofrece diferentes costos no converge y es necesario definir el rango
de adquisicin de sus productos en funcin posible de valores para los parmetros del
del tipo de licencia (e.g., personal, empresa, modelo), SPPS no ofrece mucha versatilidad.
educacin y otros). No obstante, slo se indi- SAS es un software de slido desarrollo y en
Debate
228 C SALAS Ecologa Austral 18:223-231

donde la empresa invierte cerca del 20% de nales estn presentes en diferentes paquetes.
sus utilidades en investigacin (SAS 2007). Esto implica que el uso del programa no est
Por lo tanto, la variedad de procedimientos 100% optimizado. Sin embargo, R ha sido y es
implementados es bastante amplia. R ha sido desarrollado gracias a un trabajo colaborativo
desarrollado por estadsticos que trabajan en importante. El veloz avance ocurrido en los
diferentes instituciones a nivel mundial y, por ltimos tres aos hace pensar que se imple-
lo tanto, implementa algoritmos modernos y mentarn mejoras.
robustos. Adems, un nmero importante de
paquetes estn continuamente siendo desa- g. Documentacin y soporte de ayuda. To-
rrollados y puestos a disposicin en Internet dos los programas ofrecen documentacin,
para su instalacin. Esto implica, tambin, la tanto manuales de usuario como libros con
disponibilidad de una gama amplia de pro- aplicaciones. Sin embargo, SPSS ofrece una
cedimientos de primer nivel. Por ejemplo, el documentacin fcil de usar y de entender,
paquete nlme para ajustar modelos lineales y
quizs debido a que fue originalmente disea-
no-lineales de efectos mixtos en R, es explica-
do para las ciencias sociales, en las que la for-
do en detalle en el libro de Pinheiro & Bates
macin cuantitativa no es generalmente muy
(2000), es un referente en el tema. As tambin,
profunda. Siguiendo el estilo colaborativo de
para aquellos usuarios que prefieren software-
tarea-especficos, el desarrollo por expertos de R, la comunidad cientfica usuaria de R ha sido
paquetes en diferentes disciplinas permite la especialmente generosa al producir manuales
existencia de paquetes especficos, como el y diversos documentos gratuitos.
geoR para anlisis geoestadstico en R.
Una ventaja de SPSS y de SAS es el soporte
La renovacin e implementacin de nuevos (e.g., servicio al cliente), a travs del cual es
procedimientos en R es relativamente rpida. posible indicar problemas de ejecucin en cier-
Frecuentemente aparecen nuevos procedi- tos procedimientos y, por lo tanto, obtener el
mientos y/o paquetes en desarrollo y en revi- respaldo tcnico de las respectivas empresas.
sin, los cuales despus pueden ser obtenidos Por otra parte, para R no existe un respaldo
a travs de Internet e instalados directamente. formal de una empresa con respecto a todos
En cambio, SAS y SPSS demorarn aos en sus paquetes, rutinas y funcionamiento ge-
implementar nuevos procedimientos, requi- neral. Es decir, R no tiene ninguna garanta
riendo necesariamente una nueva versin del legal y el usuario asume cualquier potencial
software. Sin embargo, los paquetes de R no problema causado por su uso (esto es definido
estn garantizados, y son mejorados a medi- en detalle en la licencia GPL). La falta de un
da que los usuarios encuentren problemas y responsable legal de R podra ser una desven-
los desarrolladores actualizan los paquetes. taja para empresas que piensan emplearlo. Sin
Por su parte, SPSS y SAS, al ser programas embargo, no debera ofrecer mayores proble-
comerciales, deberan ofrecer paquetes ms mas para usuarios individuales o instituciones
depurados.
de investigacin. De todas maneras, gracias al
trabajo colaborativo mencionado ms arriba,
Existen diferencias entre SAS y R en cuanto
los potenciales problemas en algn paquete
a la variedad de anlisis estadsticos, aunque
slo a escala detallada. Por ejemplo, se podra son tambin mejorados, aunque eso depen-
decir que SAS posee una leve ventaja en mode- de de la voluntad y el esfuerzo del creador
los mixtos vs. R, ya que ofrece la opcin de ele- de dicho paquete. Finalmente, para los tres
gir diferentes distribuciones de probabilidad programas existen foros en Internet donde
para los parmetros aleatorios. R, en cambio, se plantean los problemas relacionados con
actualmente slo ofrece la opcin de emplear los respectivos programas y las tcnicas de
una distribucin normal. Dado que diferentes anlisis estadsticos empleadas, y donde los
personas generan paquetes para R, y a pesar usuarios independientes publican sus solu-
de que existe una cierta estandarizacin al ciones, siendo una excelente alternativa de
respecto, las mismas funciones computacio- ayuda gratuita.
Debate
Agosto de 2008 USO DEL PROGRAMA ESTADSTICO R 229
h. Sistemas operativos. A pesar de que el de software basado sobre sintaxis es ms
sistema operativo (S.O.) Microsoft Windows apropiado. Ntese tambin que dado que R
est ampliamente difundido, existe una gran es un lenguaje de programacin, permite su
cantidad de usuarios que usan otros sistemas uso en una variedad de problemas que no son
operativos. Los tres programas analizados es- necesariamente estadsticos, como por ejem-
tn implementados para Windows. Si bien plo, optimizacin y modelacin matemtica.
tanto SPSS como SAS pueden funcionar en el Otra ventaja de R, tanto en ciencia bsica como
S.O. Linux, su configuracin es compleja. SPPS aplicada, es que puede ser empleado indepen-
tambin puede ejecutarse en Macintosh. R es dientemente de la institucin del usuario. Con
el nico que funciona de manera estable e n- otros programas no gratuitos, el tiempo inver-
tegra en los tres sistemas operativos de mayor tido en aprenderlos no es capitalizado cuando
uso. La versatilidad de plataformas donde R el usuario debe trasladarse a otra institucin
puede ser instalado ofrece una ventaja para los que no posee dicho software. En este contexto,
diferentes usuarios en distintas disciplinas. existe un nmero importante y creciente de
centros acadmicos y de investigacin que
emplean R.
USO DE PROGRAMAS ESTADSTICOS
EN DOCENCIA E INVESTIGACIN La documentacin de un software computa-
cional es muy importante para saber realmente
qu est calculando cada procedimiento pre-
La eleccin de un software estadstico en programado en un software (Searle 1989). En
ecologa y disciplinas afines (e.g., ciencias pases latinoamericanos y del tercer mundo en
forestales, agrcolas y ambientales), y en inge- general, donde el acceso a libros y literatura
niera, normalmente depende de la formacin actualizada es muchas veces complejo, la posi-
de los usuarios, como as tambin de si ser bilidad de contar con acceso a documentacin
empleado en docencia o en investigacin. En gratuita es una fortaleza. En este sentido, el
la docencia en ciencias biolgicas-sociales, la uso de R ofrece una ventaja. De todas mane-
tendencia es emplear programas que permitan ras, es recomendable la compra de literatura
ejecutar los procedimientos en la forma ms (sobre todo para R) dado que la disponible
sencilla posible, evitando que el alumno se gratuitamente por lo general no es la que mejor
confunda con demasiados detalles de pro- satisface las necesidades y requerimientos de
gramacin (como los necesarios para SAS y los usuarios.
R). En este contexto, los usuarios preferiran
el uso de programas con GUI amigables. Por En Latinoamrica, el control de uso de
otra parte, en la docencia de disciplinas con programas legales (i.e., copias permitidas)
preparacin en matemtica y programacin es muy dbil, y la piratera de software es un
computacional, si se fomentara el empleo de problema comnmente aceptado. La tasa de
programas estadsticos basados sobre sintaxis piratera de software en Latinoamrica alcan-
desde los estudios de pre-grado, se ganara za el 66%, una de las ms altas del mundo.
un mejor entendimiento del tema (e.g., para Pases como Venezuela, El Salvador, Bolivia
poder programar el ajuste de algn modelo y Paraguay estn ubicados entre los 20 pases
es necesario primero saber el modelo que con mayores tasas de piratera en el mundo,
se va a ajustar) y la resolucin ms fcil de con porcentajes que se ubican entre 82% y 86%
los problemas del rea. En cualquier caso, y (Business Software Alliance 2006). De acuerdo
aunque no con todas las facilidades de SPSS, al mismo estudio, Chile y Argentina presentan
tanto SAS como R poseen utilidades GUI que tasas menores aunque igualmente altas en tr-
los transforman en programas basados sobre minos globales, con porcentajes de 68% y 75%,
el uso de botones. respectivamente. Incluso a nivel universitario,
dado los elevados costos de algunos de los
En investigacin, los usuarios normalmente programas usados, se ensea empleando soft-
poseen mayor nivel de conocimientos esta- ware sin licencia, que tambin es distribuido a
dsticos. En esta rea pareciera que el empleo los estudiantes para su prctica personal. Con
Debate
230 C SALAS Ecologa Austral 18:223-231

este proceder, es difcil disminuir la piratera. AGRADECIMIENTOS


An peor, y considerando que a travs de la
docencia no tan solo se entrega conocimien-
A Dylan Craven (Yale University, USA),
to sino que se establecen principios ticos y
Gabriel Mancilla (Universidad de Chile) y
morales, el uso de software sin licencia no
Salvador Gezan (Rothamsted Research, UK)
debera ocurrir en centros acadmicos. Cuan- por sus comentarios en un primer borrador
do los proyectos de investigacin cuentan con del presente trabajo. La detallada revisin de
fondos, se destinan grandes sumas de dinero los evaluadores annimos permiti mejorar
a la adquisicin de software estadstico. Estos el artculo. Cualquier error remanente en el
fondos podran ser destinados a otros tems artculo es responsabilidad del autor.
si se emplea un software estadstico gratuito.
El uso de un programa estadstico de exce-
lente nivel y gratuito como R ayudara a la BIBLIOGRAFA
enseanza en las universidades, adems de
permitir a los estudiantes seguir empleando BUSINESS SOFTWARE ALLIANCE. 2006. Fourth Annual
el mismo programa en su futuro ejercicio BSA and IDC Global Software Piracy Study.
profesional, sin necesidad de invertir dinero Washington DC, USA. 17 p.
en programas estadsticos y con la ventaja de FOX, J. 2005. The R Commander: A basic-statistics
graphical user interface to R. Journal of Statistical
aprovechar los conocimientos tcnicos adqui-
Software 14(9):42.
ridos previamente.
GREGOIRE, TG & M KHL. 2000. Editorial: Statistical
ecology and forest biometry. Environmental and
Ecological Statistics 7:213-216.
CONCLUSIONES
HAASE, P; FI PUGNAIRE; SC CLARK & LD INCOLL.
1996. Spatial patterns in a two-tiered semi-arid
Debido a que SAS y R son programas basados shrubland in southeastern Spain. Journal of
en comandos, permiten al usuario un mayor Vegetation Science 7:527-534.
control de los procedimientos ejecutados, en HORNIK, H. 2008. The R FAQ. 118 p. http://CRAN.R-
comparacin con SPSS. Adems de la clara project.org/doc/FAQ/R-FAQ.html [consultado
el 13 de Mayo, 2008].
ventaja del costo cero de R versus los otros
programas, las salidas de procesos que ofrece IHAKA, R & R GENTLEMAN. 1996. R: A language for
data analysis and graphics. Journal of Computational
R son concisas y dejan al usuario la opcin de
and Graphical Statistics 5(3):299-314.
solicitar un mayor nivel de detalle, favorecen
MCCULLOUGH, BD. 1999. Assessing the reliability
una mejor prctica en el uso de la estadstica of statistical software: Part II. The American
y evitan la tentacin de tratar de interpretar Statistician 53(2):149-159.
todos los estadsticos que aparecen en una M C C ULLOUGH , BD & B W ILSON . 1999. On the
salida. En resumen, la gran versatilidad de accuracy of statistical procedures in Microsoft
los procedimientos estadsticos disponibles Excel 97. Computational Statistics & Data Analysis
(as como los tarea-especficos), la capacidad 31(1):27-37.
de producir grficos de calidad y la amplia MCCULLOUGH, BD & B WILSON. 2002. On the accuracy
documentacin gratuita, entre otros aspectos, of statistical procedures in Microsoft Excel 2000
and Excel XP. Computational Statistics & Data
hacen de R un excelente programa estadstico
Analysis 40(4):713-721.
para ser usado en docencia e investigacin.
M C C ULLOUGH , BD & B W ILSON . 2005. On the
La gratuidad de R adems, permite no solo
accuracy of statistical procedures in Microsoft
trasmitir el uso de un software legal, sino tam- Excel 2003. Computational Statistics & Data Analysis
bin acceder libremente a un programa de alta 49(4):1244-1252.
calidad. Por otra parte, la transparencia en la NEYMAN, J. 1955. Statistics - Servant of all sciences.
construccin de R permite un mayor control Science 122(3166):401-406.
del proceso de generacin de conocimiento O KUNADE , AA; CF C HANG & RD E VANS . 1993.
por parte de los usuarios. Comparative analysis of regression output
Debate
Agosto de 2008 USO DEL PROGRAMA ESTADSTICO R 231
summary statistics in common statistical packages. SAS INSTITUTE INC. 2007. SAS. Cary, NC, USA. http:
The American Statistician 47(4):298-303. //www.sas.com.
PINHEIRO, JC & DM BATES. 2000. Mixed-effects models SAS. 2007. SAS overview. http://www.sas.com/
in S and Splus. Springer-Verlag, New York, USA. corporate/overview/index.html [consultado el
528 p. 14 de Diciembre, 2007].
R DEVELOPMENT CORE TEAM. 2007. R: A Language SEARLE, SR. 1989. Statistical computing packages:
and Environment for Statistical Computing. R
Some words of caution. The American Statistician
Foundation for Statistical Computing, Vienna,
43(4):189-190.
Austria. http://www.R-project.org.
SPSS INC. 2007. SPSS. Chicago, IL, USA. http://
RIPLEY, BD. 1977. Modelling spatial patterns (with
discussion). Journal of the Royal Statistical Society, www.spss.com [consultado el 14 de Diciembre,
B. 39(2):172-212. 2007].
S ALAS , C; V L E M AY ; P N EZ ; P P ACHECO & A ZHU, X & O KULJACA. 2002. A short preview of
ESPINOSA. 2006. Spatial patterns in an old-growth free statistical software packages for teaching
Nothofagus obliqua forest in south-central Chile. statistics to industrial technology majors. Journal
Forest Ecology and Management 231(1-3):38-46. of Industrial Technology 21(2):1-6.

Debate

You might also like