Professional Documents
Culture Documents
dar, coeficiente de variación, etc), medidas de una base de datos de Microsoft Excel al pro-
posición (cuartiles, octiles, percentiles, etc.). grama Statistica.
Entre estas herramientas, un análisis impor-
El tutorial se divide en las siguientes
tante es la identificación de datos aberrantes
partes: 1) presentación del problema, 2)
o extremos (outlier en inglés) y que por defi-
importar un archivo de Microsoft Excel al
nición son datos que no siguen la distribución
programa Statistica, 3) cálculo de las medidas
del conjunto de valores; a este respecto una
Universidad del mar Campus Puerto Ángel, Oaxaca, Instituto de Recursos, Carretera a Zipolite, Ciudad Universitaria s/n, Distrito de San
Pedro Pochutla C.P. 70902. México. Correo electrónico amontoya@angel.umar.mx
67
de tendencia central (MTC) de dispersión 2. Cómo importar un archivo de Microsoft Excel al
(MD), de posición (MP), intervalos de con- programa Statistica
fianza (95%) para la media, 4) identificación
El programa Statistica trabaja en hojas de
de puntos aberrantes, 5) creación de un his-
cálculo (Spreadsheet) terminación .sta, hay
tograma, 6) edición de gráficos y tablas, 7)
varias maneras de crear una hoja de cálculo en
exportar tablas y gráficos de Statistica o Excel
el programa, una de ellas es copiar y pegar las
y/o Word.
variables (columnas) y los renglones (casos),
sin embargo en el presente tutorial explicaré
Desarrollo y procedimiento el procedimiento para importar de Excel al
Statistica debido a que, generalmente se tienen
1. Presentación del problema bases de datos muy grandes y éstas son reali-
zadas en Excel por su versatilidad y facilidad
de manejo. Es importante que se incluya, en
En un estudio llevado a cabo en la bahía de
el primer renglón, el nombre de las variables,
Puerto Ángel durante un año (datos ficticios),
ya que Statistica tiene la opción de importar
se registraron los datos que se presentan en la
archivos considerando el nombre de las varia-
Tabla I.
bles e inlcuso el de los renglones.
Una vez listo el archivo de temperatura en
Tabla I.- Datos de temperatura mensual en la bahía de Excel, se debe guardar en la versión 97-2003.
Puerto Ángel (datos ficticios)
Abrir el programa Statistica seleccionar
File, en la barra de comandos, seleccionar
Temperatura Open, aparecerá una ventana de búsqueda de
26.82 archivos; en el campo inferior desplegar las
26.3
opciones de Tipo y seleccionar All files, buscar
26.82
el archivo de Excel (terminación.xls), oprimir
25.6
el botón Abrir (Fig. 1).
26.45 En la siguiente ventana seleccionar Import
27.1 select sheet to a Spreadsheet y escoger Hoja
25.4 1 (donde están los datos en Excel), dar clic
25.4 en OK. En la siguiente ventana se indican
26.9 el número de renglones y de columnas, que
25.7 son leídos automáticamente por el programa.
25.8
Elegir Get variable names from first row (para
25.4
el nombre de la variable) y clic en OK (Fig. 1).
A continuación se despliega la base de
datos con el mismo nombre del archivo origi-
Con los datos de la Tabla I se desea calcular: nal con terminación.sta, el programa lo guarda
medidas de tendencia central (MTC: media, en la misma carpeta del archivo fuente.
Ciencia y Mar 2014, XXII (54):67-74
68 Montoya-Márquez
a la carpeta Advanced y elegir los estadísticos Whiskers Plot), considerando los cuartiles, el
requeridos (MTC, MD, MP), oprimir el botón recorrido intercuartílico y los límites donde
summary: statistics (Fig.2). no hay puntos aberrantes. En el programa
Statistica hacer lo siguiente:
El programa guarda los resultados de una
sesión en un libro de trabajo (Workbook) (Fig. Ir al menú principal y seleccionar Graphs,
3), la tabla puede también copiarse y pegarse luego 2D graphs y Box Plots; se selecciona la
en Word o Excel para su edición. variable haciendo clic en el botón de: Variables
dentro de la ventana del módulo 2D Box
4. Identificación de puntos aberrantes
Plots, la ventana de Grouping vairable debe
Éste es un paso importante en el análisis ir vacía (Fig. 4). En la carpeta: Advanced ir a
descriptivo de los datos, pues estos valores Box ecoger: Percentiles y en Coefficient: 25,
sesgan la estimación de muchos estadísticos, en Whiskers: Non-outliers range, en Outliers:
lo cual puede afectar las inferencias que de Out & Extremes y por último en Coefficient:
ellos se obtengan y por ende las conclusiones 1.5 (todo esto lo selecciona el programa por
que se deriven. Una de las formas de identi- default) (Fig. 5) dar clic en OK para obtener el
ficar estos valores es a través de la construc- gráfico (Fig.6).
ción del gráfico de caja y bigotes (Box and
Figura 1.- Pasos para importar un archivo (base de datos) al programa Statistica(StatSoft 2008)
70 Montoya-Márquez
Figura 5.- Selección de las características del diagrama de caja y bigotes
72 Montoya-Márquez
Figura 8.- Histograma con cinco intervalos comenzando a partir del
valor mínimo (25.4)
Referencias
StatSoft, Inc. 2008. STATISTICA (data analysis software Recibido: 19 de agosto del 2016
system), version 8.0. www.statsoft.com. Aceptado: 25 de agosto del 2016
74 Montoya-Márquez