You are on page 1of 12

Programas de estadstica y econometra

por Rubn Osuna Esto es un breve resumen de algunas de las posibilidades existentes que no pretende ser una revisin detallada de las capacidades de ninguno de los programas, pues el objetivo es orientar a quienes se enfrentan al problema de encontrar un buen software para la estadstica y econometra aplicadas. Me referir especialmente a Mac OS X, el sistema operativo de Apple basado en FreeBSD Unix, por ser la plataforma en la que yo trabajo. Dos buenas plataformas alternativas son Linux y Windows. Con Mac OS X y Linux se puede sacar partido de los microprocesadores de 64 bits que multiplican la capacidad de clculo de las mquinas1.

La econometra es una rama de las matemticas y la estadstica que desarrolla procedimientos para trabajar con los datos y encontrar propiedades en ellos y relaciones entre determinadas variables (determinados grupos de datos pueden ser "observaciones" de una variable). Por ejemplo, el SPSS (www.spss.com), cuya versin 11 funciona ya en OS X, es el tipo de programa enorme compuesto por

Los 64 bits aluden a la unidad de enteros, mientras que los clculos matemticos se llevan

a cabo en la unidad de punto flotante (floating point unit, FPU), que siempre ha sido de 64 bits. No obstante, el disponer de una unidad de enteros de 64 bits tiene sus ventajas, como disponer de mucha ms memoria RAM para cada aplicacin, rompiendo la barrera de los 4GB globales. 1

una base y mdulos para casi todo, de precio alto, relativamente fcil de usar pero no especializado en econometra propiamente dicha; lo mismo puede decirse de SAS (www.sas.com, pero no tiene versin para OS X), ambos capaces de hacer algunos test economtricos, ms que suficientes para muchos usuarios y con funcionalidades complementarias muy importantes (tratamiento de datos, presentacin de resultados), pero quizs insuficientes para la mayora de los econmetras a tiempo completo. GAUSS (www.aptech.com, la versin 6 corre en OS X), MATLAB (www.mathworks.com, las versiones 6.5 y 7 funcionan en OS X) y O x (http://www.nuff.ox.ac.uk/Users/Doornik/, programa gratuito si se emplea en la investigacin o la enseanza, que en su versin 3.3. soporta OS X) ofrecen lenguajes de programacin basados en matrices, requiriendo un trabajo de programacin de test que otras aplicaciones (de las que hablaremos ahora) traen ya hecho, si bien hacer los test uno mismo evita trabajar con "cajas negras" preprogramadas.

Tanto si el programa que usamos utiliza algoritmos que quedan ocultos para el usuario como si ste los aplica por s mismo, existe un gravsimo problema de fiabilidad en los clculos. Y es que, por extrao que parezca, no podemos saber en muchos casos si el programa que usamos nos est dando resultados correctos. Ello se debe a que la aritmtica de las mquinas es distinta a la de lpiz y papel y a que los ordenadores trabajan con un nmero determinado de dgitos ms un sistema de redondeos.

Algunos de los resultados de nuestros programas favoritos pueden ser falsos simplemente porque el ordenador toma unos valores como aproximaciones de otros (los muy grandes o muy pequeos) y porque hemos aplicado el procedimiento de clculo equivocado para los datos de que disponemos (forzando al programa a operar con nmeros que sobrepasan el lmite). Estos errores pueden conocerse mediante bateras de test que ofrecen resultados de validez garantizada con los que comparar. Pero hay muchas funcionalidades para las que no se han desarrollado an test, y en esos casos los programas pueden dar resultados distintos, por lo que no sabemos qu resultado es el correcto (o cules son aceptables). Es ms, en muchos artculos publicados no se dice qu software (o qu algoritmos) se ha empleado, por lo que no hay forma de saber si los resultados expuestos son correctos o no (se puede estar usando un programa que sabemos que falla con determinados datos y clculos). Es un problema ciertamente grave. Un articulo excelente sobre el tema, que todos deberan conocer, es McCullough, B.D. and Vinod, H.D. (1999): "The Numerical Reliability of Econometric Software", Journal of Economic Literature , vol. 27, june, pp. 633-665.

Pero centrmonos ahora en el tema: hay tres tipos de programas: los estadsticos genricos, las aplicaciones para la programacin mediante matrices y las colecciones de test o procedimientos. En funcin de las necesidades cada uno utiliza el que ms le conviene (o la combinacin que ms le interese). Veremos despus el ltimo tipo
3

de aplicaciones mencionado, si bien trataremos primero someramente el segundo tipo.

Los "canned packages"


Algunos de los ms usados son TSP, Eviews, LIMDEP y Stata, aunque hay otros muchos. Son conocidos como "canned packages", es decir, programas en los que los test estn ya hechos y uno slo tiene que invocarlos pulsando un botn, abriendo un men o escribiendo un comando. Presentan el problema al que acabamos de aludir: no sabemos cmo hacen eso que hacen, aunque nos libera de tener que conocer mucha econometra para poder aplicarla, lo que es una ventaja y un inconveniente. Usualmente quienes se dedican a la econometra aplicada utilizan un "canned package", mientras que aquellos que necesitan estar a la ltima incorporando por s mismos los ltimos avances suelen usar un programa tipo GAUSS o MATLAB. En el caso de usuarios de OS X la eleccin de este segundo tipo de programas est clara: como hemos dicho slo la ltima versin de MATLAB funciona sobre OS X (de manera admirable, dicho sea de paso, si bien es prcticamente una versin Unix recompilada con interfaz X11). Pero veamos ahora qu opciones tenemos entre los "canned packages".

TSP y Eviews, los programas ms populares


El TSP era un software economtrico para mainframes. La empresa que lo haca decidi hacer una versin "reducida" para ordenadores personales en 1981, y eligieron el mtico Apple II. El software se llam
4

MicroTSP. Era un programa donde una serie de comandos ejecutaban determinadas acciones. Decas, por ejemplo, "regresa la variable X con la variable Y y la variable Z" (con los comandos correspondientes), y el programa te daba una serie de resultados: los residuos, los coeficientes, los errores estndar, el coeficiente de determinacin (la R cuadrado), etctera. El MicroTSP acab comercializndose por una empresa independiente llamada QMS. En 1985 el TSP pudo funcionar en ordenadores personales, y qued como el "hermano mayor" del MicroTSP. En 1995 QMS dio un paso muy inteligente: aadir una interfaz grfica al programa donde los comandos estaban recogidos en mens. Esto convirti al MicroTSP en el estndar para la enseanza de la econometra y extendi su uso entre los investigadores. El nuevo MicroTSP con GUI pas a llamarse Econometric Views (Eviews). Existi versin para Mac, pero no pas de la 1.1 (creo recordar). Hoy el EViews va por la versin 5 y la empresa no sabe si desarrollar para Mac OS X, pues todo del desarrollo desde 1995 se ha hecho pensando slo en Windows. Muchos manuales de econometra basan sus ejercicios en Eviews. Es un programa fcil de aprender a manejar (dentro de lo que cabe) y muy potente, con herramientas para hacer casi de todo en econometra. El primer paso es disponer de una hoja de Excel (aunque importa desde otros formatos) con los datos: variables y observaciones de dichas variables. Por ejemplo, la renta y 50 observaciones (para 50 aos) y el tipo de inters y sus observaciones (otras 50). Creas un "workfile" vaco, para un rango de datos (50), le pones un nombre y lo guardas. Despus Eviews importa los datos a ese "workfile". Cada variable aparecer en la ventana del
5

"workfile" con un smbolo y el nombre que le hayas dado. Si haces doble click en el smbolo aparece la serie. Despus ya puedes crear "objetos" en ese "workfile", por ejemplo una ecuacin. Si has llamado a la renta "Q" y al tipo de inters "i" puedes ir al men "objeto", seleccionar "ecuacin" y decirle que "Q c i", es decir, que relacione linealmente "Q" e "i", siendo la renta la variable explicada. Inmediatamente surge un panel con resultados. A ese "objeto ecuacin" puedes aadirle ms clculos, y pedir, por ejemplo, que haga un test de normalidad a partir de los residuos de la relacin lineal estimada. Todo queda guardado en la "ecuacin", que ser otro smbolo en la misma ventana del "workfile" donde estn las variables. En cualquier momento puedes abrir esa ecuacin y reestimarla, o pedir nuevos clculos, o hacer grficos, o aadir variables al "workfile" y calcular nuevas ecuaciones, etc. Todo muy sencillo cuando aprendes la mecnica. Los grficos son simples pero funcionales. La presentacin de los resultados se hace en tablas que se pueden copiar y pegar (igual que los grficos, que el Word puede, curiosamente, "desagrupar"). El Eviews de hoy se ha convertido en un programa tan completo y potente como el "viejo" TSP, que sin embargo, en su versin 4.5, s soporta OS X (y otros muchos Unix). TSP adems incorpora una interfaz grfica suficiente llamada GiveWin. Ambos son programas plenamente capaces de bregar con toda la macro y microeconometra que les echen. Eviews viene con un buen manual, cosa que no puede decirse de TSP. Pero la documentacin no es un problema para Eviews, en parte porque su aprendizaje es relativamente fcil, y en parte porque muchos
6

manuales de econometra traen ejercicios para el programa. En el caso de TSP pueden encontrarse recursos adicionales en Internet. En castellano hay editado un buen libro para aprender econometra con Eviews: Carrascal, U.; Gonzlez, Y.; y Rodrguez, B. (2001): Anlisis economtrico con EViews, Ed. RA-MA, Madrid. www.tspintl.com www.eviews.com

Stata, un programa de elite


El Stata 8, de Stata Corporation, es de naturaleza distinta a los dos anteriores, aunque quizs se parezca ms a TSP. Para empezar existe versin para OS X, Windows y distintos tipos de Unix. Stata 8 es una aplicacin Mach-O, es decir, una aplicacin 100% nativa para Mac OS X (empleando APIs Carbon), muy optimizada. Adems, en su versin 8 Stata incorpora una nueva interfaz grfica programable muy desarrollada y mejorada, que lo iguala prcticamente al Eviews en este apartado, librando al usuario de la necesidad de aprender series interminables de comandos, pues stos han quedado recogidos en mens desplegables. No obstante la antigua interfaz orientada a la entrada manual de comandos persiste (un panel en blanco que funciona de forma similar al TSP, es decir, con comandos escritos seguidos del nombre de las variables y otras instrucciones adicionales, ms ventanas para los resultados, ms la lista de variables disponibles y los comandos ejecutados hasta el momento). Se trata en definitiva de un hbrido ideal entre la forma de trabajar clsica de las mainframes o las terminales Unix (mejoradas al dividir la ventana en dos partes,
7

comandos y resultados) y las modernas (y a veces molestas) interfaces grficas, que en Stata queda fuera del rea de trabajo, aportando mens cuando stos son requeridos.

Stata es un programa muy abierto: puedes crear fcilmente archivos que contienen programaciones genricas, y aadirlas despus al Stata fcilmente o compartirlas con otros. Existe de hecho una comunidad que desarrolla esas programaciones en Stata para todo tipo de test imaginables, y que puedes bajar de la red. Los resultados se presentan de forma correcta y funcional, y los grficos, muy mejorados en la versin 8, se colocan a la altura de los ofrecidos por cualquier
8

otro paquete economtrico (aunque no de aquellos que tienen un punto fuerte en la presentacin de resultados, como SPSS y SAS). En definitiva, Stata es muy potente y ofrece soluciones para casi todo, directamente o a travs de la aportacin de investigadores de todo el mundo. Muchos econmetras de alto nivel trabajan con este programa, y la versin 8 ha conseguido adems que su curva de aprendizaje se suavice sustancialmente, hacindolo cmodo de usar en la enseanza. Adems, para los usuarios de Unix que usen Macs, Stata te permite instalar un componente gratuito con el que puedes ejecutar el programa desde el Terminal si tienes OS X (accediendo a las funcionalidades del programa slo a base de comandos, claro).

Tres caractersticas curiosas ms: a) en el mismo CD estn las versiones de todas las plataformas soportadas, aunque tu nmero de licencia activa una u otra la primera vez que ejecutas el programa (no cuando lo instalas); b) el programa no mete nada en la carpeta del sistema ni en otra parte que no sea la propia carpeta del Stata, por lo que es fcil de desinstalar (y de copiar), adems de muy estable; c) Stata coloca todos los datos en la RAM del ordenador, por lo que sus lmites estn en la RAM que tengas instalada, y es muy, muy rpido. Stata se ofrece en una versin Small (muy asequible); otra Intercooled, que es la estndar; y una Special Edition, ms cara y potente. Las diferencias estn bsicamente en la cantidad de variables y el tamao de las matrices que puedes manejar. El Small se me antoja demasiado corto para segn qu cosas (slo maneja, por ejemplo, matrices 40x40).
9

Existe

adems

un

programa

llamado

Stat/Transfer

(http://www.stattransfer.com), no demasiado caro y que corre en OS X, que convierte multitud de formatos de archivos en otros, sean bases de datos (como Access o FoxPro), hojas de clculo (Excell, Lotus, QuatroPro...) o programas matemticos y estadsticos (SPSS, Gauss, Matlab, Stata, JMP, SAS...). Es un programa til para cualquier usuario de programas estadsticos y economtricos en general, pues te permite trabajar con dos o ms de ellos sin problemas, haciendo con Stat/Transfer las conversiones necesarias (se ofrecen multitud de opciones para controlar con detalle el proceso de conversin). Visto de otra forma, aprender a manejar en profundidad un solo programa tiene indudables economas de escala, y Stat/Transfer te permite concentrar ese esfuerzo de aprendizaje.

10

La documentacin que trae Stata 8 aade mucho material a la ya masiva que vena con la versin anterior: Getting started with Stata (190 pginas), User's Guide (420 pginas), Graphics (500), Programming (470), Cluster Analysis (120 pginas), Cross-Sectional Time Series (240 pginas), Survey Data (101 pginas), Survival Analysis&Epidemiological Tables (350 pginas), Time Series (340 pginas), ms cuatro volmenes de 1830 pginas en total con el Manual de Referencia; todo en ingls, claro. Como se ha dicho, en la red puede encontrarse mucha ms documentacin. El Stata Technical Bulletin (STB) es una publicacin que aparece cada dos meses y ofrece extensiones y herramientas escritas por los usuarios,
11

analizadas y "validadas". Eso sin contar los numerosos libros y manuales de econometra que hacen referencia a Stata. Adems existe una lista de correo, y la propia Stata Co. ofrece cursos on-line un par de veces al ao (Introduccin y Programacin, bsica y avanzada). Tambin se puede acceder a una enorme base de datos de desarrollos de terceras partes mantenido por Christopher Baum, en el Boston College (http://ideas.uqam.ca/ideas/data/bocbocode.html); all hay ms tareas programadas disponibles que las que ofrece el propio Stata! Las referencias que tengo del soporte tcnico son excelentes (responden siempre al momento). www.stata.com

En resumen
Mis recomendaciones para usuarios de Mac OS X son: para tratamiento de datos y presentacin de resultados SPSS 11; y para econometra ms completa TSP 4.5 o Stata 8. Si se desea utilizar un programa para el desarrollo de test basado en matrices el usuario de OS X debe dirigirse a MATLAB 7 (o a GAUSS 6). En cualquier caso resulta interesante el programa Stat/Transfer 7 para importar o exportar archivos a los formatos propios de otros programas, ya sea para compartirlos o para poder utilizar ms de uno con comodidad. Los usuarios de Mac OS X tienen opciones de sobra para el anlisis estadstico y economtrico. Adems, los procesadores G5 de IBM, de 64 bits, hacen de Mac OS X (basado en FreeBSD Unix) una plataforma ideal para el tratamiento masivo de datos a coste relativamente reducido.
12

You might also like