You are on page 1of 18

Aburto, C. (1982) La elaboración de los datos: Revisión de datos y Clasificación de datos.

En: “Elementos de Bioestadística para Estudiantes de Ciencias de la Salud”. (pp.47-64).


México: Adisson-Wesley Iberoamericana

LA ELABORACION DE LOS DATOS

Revisión, clasificación, cómputo y presentación

Una vez que se ha captado la información de cada uno de los elementos del
conjunto en estudio, esta tiene que ser revisada, clasificada, presentada y
resumida para permitir su análisis e interpretación, y a este conjunto de
actividades se le denomina elaboración de los datos. En este capítulo se trataran
todas ellas excepto la de resumen, que se estudiara en los capítulos siguientes.

Revisión de datos

La revisión tiene por objeto: a) determinar si se han recibido todos los formularios
o, cuando menos, en una proporción que sea suficiente para no invalidar las
conclusiones que se podrían hacer; b) verificar que están registradas todas las
respuestas requeridas y c) localizar posibles incongruencias en la información
proporcionada. La revisión de datos constituye lo que se ha dado en llamar control
de calidad de la información.

Es claro que todo investigador desearía recibir todos los formularios, tener todas
las respuestas y que todas estas fuesen acordes con la realidad; pero también es
fácil imaginar que puede haber serias deficiencias. Sin embargo, algo puede
hacerse para reducir el margen de error si se conocen de antemano cuales suelen
ser las causas más frecuentes, que veremos en los siguientes párrafos.

Entre las causas del envió incompleto de formularios deben mencionarse:

Formularios demasiado extensos, insuficiente sensibilización del informante,


carencia de instrucciones claras, inadecuada asignación de funciones,
irresponsabilidad o bajo nivel educacional del informante, remuneración
insuficiente, falta de autoridad ejecutiva o moral de los responsables de la
investigación y dotación insuficiente o inoportuna de los formularios o de los
elementos para realizar las mediciones.

Algunas de las medidas que podrían tomarse antes de la captación misma de los
datos podrían ser: que los formularios tengan una extensión moderada, que se
realice una propaganda adecuada no solo de que se va a investigar sino también
para que; probar la comprensión de las instrucciones con personas tan
semejantes a las que irán dirigidas como sea posible; comunicar por los conductos
adecuados a cada uno de los participantes lo que se espera de ellos y el momento
en que deban cumplir su parte; selección apropiada de personal y, para
protegerse del bajo nivel educacional de los elementos en estudio, solo queda el
no preguntar temas de complejidad o hacer la captación utilizando los recursos de
personal o equipo adecuados; procurar que la amplitud y profundidad de la
investigación no rebase la capacidad económica de sus realizadores, para que el
personal participante responda a lo que pudiera considerarse como una
remuneración justa.

Si el informante identifica carencia de autoridad para solicitar información por parte


de los que conducen el estudio, fácilmente generara predisposición para no
colaborar, por lo que, comenzando con la sensibilización antes mencionada, debe
buscarse también el apoyo de personas o instituciones que representen la
suficiente respetabilidad científica, moral y legal para lograr los objetivos del
estudio y, finalmente, considerar la dotación suficiente y oportuna de los
formularios, identificando convenientemente a los destinatarios.

El que no estén registrados todas las respuestas requeridas puede tener como
causa un formulario mal diseñado, que no tenga considerada la posibilidad de que
algunas preguntas no resulten aplicables o comprensibles a todos los miembros
del conjunto en estudio; puede deberse también a negligencia del que haga las
preguntas, ya que pudo haber omitido hacer alguna o habiéndola hecho, no haber
registrado la respuesta; otra posibilidad es que el informante se hubiese negado a
contestar la pregunta correspondiente.

Soluciones para los problemas mencionados en el párrafo anterior pueden ser la


prueba de campo del formulario, la selección y adiestramiento apropiados del
personal y la adecuada motivación de personal e informantes. De cualquier
manera, debe aceptarse la posibilidad de que a pesar de haber satisfecho estos
requisitos, aun preguntas sin la debida respuesta.

Las incongruencias en las repuestas obtenidas se refieren a lecturas de


instrumentos, características medidas por el personal o respuestas
proporcionadas por los informantes que queden fuera de los valores considerados
como posibles o bastante probables, por ejemplo: peso de adultos de 25 kilos,
padecimientos privativos de un sexo consignados en el otro (cáncer del útero en
hombres) o características comunes en ciertas edades detectadas en otras
(sarampión en ancianos, viudos de 12 años, embarazos en mujeres de 55 años,
etc.). Como algunas de estas respuestas podrían resultar correctas conviene
investigarlas.

Las causas de tales incongruencias pueden ser aparatos defectuosos, personal


poco calificado o irresponsable, preguntas confusas en el formulario, que por su
extensión provoca fatiga, informante poco motivado que da como respuesta lo
primero que se le ocurre para salir del paso o demasiado complaciente, pues
pinesa que negar o afirmar determinada cosa va a ser recibido con beneplácito por
el encuestador.

La sola identificación de las posibles causas hace evidente que para evitar las
incongruencias, las medidas son prácticamente las mismas mencionadas antes.

Cuando se desea hacer una discusión sistemática de los errores que pueden
cometerse en la medición, algunos autores consideran que esta depende de: a) la
estructura cerebral del observador; b) estado de movimiento relativo del
observador y del objeto observado; c) los receptores físicos y fisiológicos del
observador; d) la interacción entre el observador y el objeto observado; e) las
propiedades del objeto observado y f) del efecto del resto del universo. Sin
embargo, con más frecuencia se identifican fundamentalmente tres causas: las
atribuciones al sujeto que hace la observación, al instrumento con el que se hace y
al objeto observado. Para ilustrar lo anterior, se dan a continuación algunos
ejemplos.

Atribuibles al sujeto: no observa a todos los elementos que debe estudiar por
negligencia (no visita ciertas viviendas porque se encuentran distantes, no se
mantiene en su puesto de observación y no hace las mediciones en los intervalos
señalados o los eventos transcurren sin que se haya percatado de ellos; posterga
el registro a tal grado que o no registra el dato definitivamente o lo que anota no es
verídico, pues habiendo olvidado el dato preciso registra lo que cree recordar,
etc.); tiene deficiencias no compensadas adecuadamente (problemas visuales o
auditivos, principalmente); nivel educacional básico insuficiente para comprender
la información que está manejando (los cursos de adiestramiento no pueden tener
una duración indefinida y, por lo tanto, deben presuponer cierta preparación
mínima, que debe ser detectada en la selección de personal, a partir de la cual
desarrollar tal adiestramiento y aunque los conocimientos mínimos requeridos
dependerán de la investigación que se vaya a realizar, se pueden mencionar como
indispensables la lectura, escritura, expresión satisfactoria y cierta capacidad para
hacer operaciones aritméticas elementales).

Imputables al instrumento: aquí se están incluyendo como “instrumentos” desde


un microscopio electrónico para determinar la presencia de virus, pasando por
espectrógrafos, electrocardiógrafos, baumanometros, termómetros, basculas,
contadores, etc., sin omitir medios de cultivo, aparatos de rayos X y, finalmente,
hasta las preguntas que se utilicen para determinar preferencias o actitudes. Entre
las posibles causas de error debidas al instrumento podrían citarse como ejemplos
aparatos mal calibrados, suministro no uniforme de energía eléctrica que origine
variaciones en las lecturas, substancias que no estén en la concentración
requerida y preguntas que surgieran una cuestión distinta a la deseada.

Propias del objeto: puede ocurrir que la persona se niegue a informar; que informe
mentiras o que no sepa o no recuerde la respuesta; que por ignorancia, descuido
o intención no se presente al estudio en las condiciones establecidas; que si se
trata de una substancia, esta sea inestable o de un material excesivamente frágil o
con elementos que no corresponden realmente al conjunto que debía estudiarse.

La enumeración que se ha hecho en los párrafos anteriores no pretende ser


exhaustiva y seguramente el lector puede encontrar situaciones no citadas; pero el
propósito fue llamar la atención sobre el tipo de errores u omisiones que podrían
generarse, a mas desmotivar la actitud vigilante tanto del que planee la
investigación como del que se encargue del control de calidad de la información,
para que se tomen las medidas pertinentes, ya sea la simple elaboración de un
instructivo, la prueba del formulario en el campo, la selección y adiestramiento
apropiado de los enumeradores, la supervisión en el terreno, la divagación de los
objetivos de la investigación o cualquier otra providencia que tenga relevancia
para las causas mencionadas.

Clasificación de datos

Cuando la información satisface los requerimientos establecidos en la revisión de


datos, se hace necesario realizar cierto ordenamiento de los elementos de
acuerdo con las categorías de una determinada característica, formando clases o,
dicho de otra manera, clasificar o hacer grupos; para ello se requiere identificar
primero ciertas propiedades intrínsecas a cada características para definir el
criterio o escala de clasificación y en la situación más común se manejan dos: la
escala cualitativa y la escala cuantitativa.

Se dice que una característica es cualitativa si se busca en ella solo la presencia o


ausencia de una cualidad o atributo y, en este caso, la clasificación estará
constituida por dos o más categorías que comúnmente son sugeridas por las
diversas respuestas que pudieran obtenerse. Como ejemplos de características de
esta naturaleza están el sexo, con sus categorías de masculino y femenino; el
estado civil, con categorías de soltero, en unión libre, casado, viudo y divorciado;
la posición en la ocupación, como obrero, empleado, patrón, trabajador por su
cuenta, ayudante de la familia sin retribución, etc.

En algunas otras situaciones, las categorías son establecidas con cierto grado de
arbitrariedad, como cuando se clasifica a un enfermo de tuberculosis según el
avance de la lesión, pudiendo ser esta mínima, moderadamente avanzada,
avanzada y muy avanzada, o cuando se clasifica a los individuos según estén en
contra, les sea indiferente, acepten o apoyen decididamente una proposición. Por
refinamientos en las medidas de resumen, algunos autores denominan a estas
escalas “ordinales” y a las mencionadas en el párrafo anterior “nominales”. Ambas
serán consideradas aquí como cualitativas.

Si la característica puede ser cuantificada y es posible asignarle un valor


numérico, se habla de que la escala de clasificación es cuantitativa y aquí
conviene distinguir entre aquellas características cuyos valores se cuentan, por
ejemplo, el número de hijos que ha tenido una mujer, el numero de dientes
perdidos, el numero de eritrocitos por milímetro cubico, etc. Y las que se miden
como la estatura, el peso, presión arterial, etc.; a las primeras se les denominara
cuantitativas discontinuas o discretas y a las segundas, cuantitativas continuas. La
distinción resultara importante cuando se hable de la presentación grafica y de los
modelos que se utilicen para su descripción.

Las palabras contar y medir deben resultar básicas para determinar si se trata de
una escala cuantitativa discontinua (cantar) o de una escala cuantitativa continua
(medir). En el primer caso, solo son posibles valores enteros y en el segundo,
cualquier valor (entero, decimal, etc.) es posible. Es claro que una mujer pudo
haber tenido 1, 2 o más hijos, pero no 1.5 hijos, por lo que el número de hijos es
cuantitativo discontinuo; sin embargo, debe tenerse cuidado con lagunas
características que aparentemente se cuentan pero que en realidad se miden,
como es el caso de la edad, que se proporciona contando años, aunque es
esencia se está midiendo el tiempo transcurrido desde el nacimiento hasta el
momento actual y por lo tanto, la edad es una característica continua.

Más trascendente va a ser, no obstante, la distinción entre características


cualitativas y cuantitativas, pues las medidas de resumen son diferentes para unas
y otras y, en este caso, la clave seria preguntarse si se trata de algo que se tiene o
de lo cual se carece, o si además se puede decir cuánto, en términos numéricos,
se tiene. El primer caso sería un ejemplo de característica cualitativa y el segundo
de una cuantitativa.

En la escala de clasificación que aquí se ha calificado de cuantitativa, algunos


autores distinguen dos, una llamada de intervalos y la otra de razón, (2 y 3)
aunque también hay quienes aceptan que la distinción resulta solo de interés
académico. Sin embargo, resultara útil, pero menos evidente que el manejo de las
escalas cualitativas y cuantitativas, el identificar las escalas nominal, ordinal y de
intervalo por las existencia de algunas guías (4) para la selección de las técnicas
estadísticas apropiadas, que usan como punto de partida la calificación de los
datos que se requieren analizar con algunos de los términos de estas tres escalas.
En este libro se seguirán manejando solo las escalas cualitativa y cuantitativa.
Como ejemplo de datos clasificados con escala cualitativa, se presenta en la
página siguiente la población mexicana mayor de 11 años, según su estado civil.

Las categorías utilizadas no tienen un uso generalizado en todo el mundo, pues,


en algunos casos, los que viven en “unión libre” (uniones consensuales) están
incluidos entre los casados, y los separados están incluidos entre los divorciados.
En México, los casados están todavía desglosados en “casados por lo civil”,
“casados por la iglesia” y “casados por lo civil y por la iglesia”.

Lo anterior muestra que aunque se cumple lo dicho previamente respecto a que


las categorías que se refieren a atributos o cualidades son sugeridas por la misma
naturaleza de los datos, ello o significa que deba haber necesariamente
clasificaciones únicas para todos los atributos, aunque la necesidad de realizar
comparaciones propicia que se generalice la utilización de un conjunto particular
de categorías para una determinada característica.

CUADRO 1

POBLACION DE 12 AÑOS O MÁS SEGÚN SU ESTADO CIVIL

MEXICO, 1970

Estado civil Num.* %


Solteros 12 012 40.45
Casados 13 480 45.39
Viven en unión libre 2 427 8.17
Viudos 1 235 4.16
Divorciados 136 0.46
Separados 407 1.37

Total 29 97 100.0
* En miles.

Fuente: IX Censo General de Población y Vivienda de la Dirección de Estadística; S. I. C., 1970.

En medicina y en salud pública se trabaja con una gran cantidad de


enfermedades, accidentes, envenenamientos y violencias, así como con las
defunciones originadas por ellos, y es prácticamente imposible incluirlas todas en
una tabla que permita estudiarlas con facilidad, lo que obliga a considerar grupos
de causas utilizando convenientes acordes con los avances de la Medicina y con
la utilización que se le vaya a dar a la información.

Siendo tantas las causas es claro que habría una gran cantidad de clasificaciones
posibles y sería muy difícil que dos coincidieran para permitir la comparación de
daños en las correspondientes regiones.
La necesidad de contar con una clasificación única se hizo evidente, y, después
de algunos intentos, (5) en 1893, el Instituto Internacional de Estadística aprobó
una clasificación preparada por el Dr. Jacques Bertillon que fue adoptada por
varios países. Esta debería revisarse cada diez años, revisiones que se llevaron a
cabo en 1900. 1909, 1920, 1929 y 1938, las dos últimas bajo el patrocinio del
Instituto y de la organización de Higiene de la Sociedad de las Naciones. La sexta
revisión, en 1948, se realizo ya bajo los auspicios de la Organización Mundial de la
Salud, que se encargo de la séptima de 1955, de la octava en 1965 y de la novena
en 1975.

En las revisiones mencionadas, se han operado cambios en los criterios para


asignar los números (códigos) a las causas encontradas y en el agrupamiento de
las causas, lo cual sugiere cautela, por ejemplo, al comparar el comportamiento de
una determinada causa de muerte durante periodos largos, pues los cambios bien
podrían tener su origen en modificaciones de una revisión a la siguiente.

La revisión de 1965 de la Clasificación Internacional de Enfermedades consta de


una lista detallada que asigna números desde el 000 hasta el 999, a los cuales se
les puede agregar todavía un cuarto digito si se requiere mayor especificación; de
listas de 150, 50, 70 y 300 grupos de causas; de una lista de 100 grupos de
causas para tabulaciones de morbilidad y inmortalidad perinatales; de una
clasificación de admisiones en hospitales y otra para accidentes de trabajo.
También están incluidas algunas definiciones y recomendaciones sobre el manejo
de la clasificación.

La utilización más frecuente de la clasificación se ha realizado con datos sobre


defunciones, lo cual ha sido posible gracias a la adopción, también a nivel
internacional, de un modelo de certificado médico de la defunción, que facilita la
selección de la causa básica de la defunción cuando se registran de manera
conjunta dos o más causas.

El modelo de certificado está constituido en realidad solo por la selección en


donde deben registrarse las causas, mientras que la decisión sobre los demás
datos que deban ser incluidos corresponde a las autoridades de cada país. El
modelo consta de dos partes, la I y la II, que se designan como:

I. a) causa directa (debida a)

b) causa antecedente que intervino (debida a)

c) causa antecedente básica.

II. Otros estados patológicos significativos que contribuyeron a la defunción


pero no relacionados con la enfermedad o estado patológico que la causo.
Como la certificación en la realidad deja mucho que desear, la clasificación
también incluye una serie de reglas para hacer la selección de la causa básica.
Esta selección de causa y asignación del numero o código constituye en sí misma
una especialización en el campo de la Estadística.

En las dos páginas precedentes se presentan las diez principales causas de


defunción en Suecia en 1973 y las diez principales causas de defunción de México
durante el mismo año, como ilustración del uso de la Clasificación Internacional de
Enfermedades (C. I. E.).

Al tratar con características cualitativas, los elementos son clasificados por la


cualidad o atributo que posean, pero no se podría hacer lo mismo con una
característica cuantitativa puesto que podrían encontrarse desde unos cuantos
valores hasta una infinidad de ellos. Considérese, por ejemplo, el clasificar a las
mujeres según el número de hijos que hayan tenido: es claro que los valores que
podrían encontrarse serian 0, 1, 2, 3,… etc. Hasta un numero que difícilmente
podría exceder de 30, y trabajar con 30grupos que, aunque no es imposible, si
presenta algunos problemas. Sin embargo, supóngase que se estuviera
clasificando a las mujeres respecto a la edad y con un detalle que no rebase a los
años cumplidos (podría pedirse mayor precisión y exigir el dato en meses, días,
horas, etc.). En este caso ya resultaría posible encontrar 90 o más clases; y esto si
constituiría un obstáculo para describir al conjunto; además de que sería necesario
que este fuera lo bastante grande como para no encontrarse con algunos valores
en los cuales no se hubiese clasificado a mujer alguna.

CUADRO 4
DEFUNCIONES DEBIDAS A SARAMPION
POR EDAD MEXICO, 1974
Edad Muertes
0 116
1 88
2 58
3 40
4 37
5-9 64
10-19 28
20 y + 16
Total 447
CUADRO 5
DEFUNCIONES DEBIDAS A ENFERMEDADES
ISQUEMICAS DEL CORAZON MEXICO, 1974
Edad Muertes
< 15* 0
15-24 269
25-34 246
35-44 577
45-54 1240
55-64 2110
65-74 3229
75-84 2060
85 y + 1535
Total ** 11266
 < significa “menor que”
 ** se excluyeron 13 muertes en las que se ignoraba la edad.
Fuente: estadísticas Vitales de los estados Unidos Mexicanos; S. S. A., 1974.

Lo anterior es resultado por el estadístico formando grupos, clases o más


comúnmente intervalos. La construcción de tales intervalos resulta específica para
cada característica y, aun manejando la misma característica, una serie puede
estar integrada por diferentes intervalos que otra, dependiendo de lo que se desee
presentar. Si el objetivo es presentar muertes por sarampión, un conjunto posible
de intervalos podría ser: 0, 1, 2, 3, 4, 5-9, 10-19, 20 y mas años. Si, por el
contrario, se trata de presentar muertes por enfermedad isquémica del corazón,
los intervalos podrían ser: menores de 15, 15-24, 25-44, 45-54, 55-64, 65-74, 75-
84, 85 y más años.

La razón para usar las series de intervalos descritos es aquel que las muertes por
sarampión ocurren predominantemente en menores de 5 años, en tanto que las
muertes por enfermedad isquémica del corazón se presentan en los últimos años
de la vida, y esos intervalos permiten destacar las características esenciales de las
dos series, pues si se hubieran usado intervalos, por ejemplo, de 10 años cada
uno para presentar las muertes por sarampión, casi todas hubieran quedado en el
primer intervalo de 0-9 años y los demás intervalos hubieran resultado
prácticamente sin defunción alguna o con muy pocas defunciones.

Ya que se utilizo a la edad como ejemplo para la formación de intervalos, vale la


pena mencionar que esta característica se maneja de manera diferente a otras
también cuantitativas en cuanto a los limites reales de cada intervalo, pues en el
primer caso, en la serie de intervalos para las muertes por sarampión al escribir el
intervalo 0 se requiere decir desde el nacimiento hasta la víspera del primer
aniversario, con 1 se debe entender desde el día del primer cumpleaños, hasta la
víspera del segundo, etc. Esto se expresa comúnmente diciendo que la edad debe
obtenerse o consignarse en años cumplidos o sea que si una persona murió por
enfermedad isquémica del corazón con 44 años 11 meses debe ser clasificada en
el grupo de 25-44 y no en el de 45-54 sencillamente porque no había cumplido los
45 años. Esta práctica entre los que presentan estadísticamente datos por edad,
se opone a lo que se acostumbra entre la población que con frecuencia informa su
edad diciendo “ando en 55años”, queriendo decir que tiene 54 y que su siguiente
cumpleaños es el numero 55.

En el volumen I de la Clasificación Internacional de Enfermedades (revisión 1965)


se hace la siguiente recomendación en relación con los cuadros estadísticos:

“El grado de detalle en la clasificación cruzada por causa, sexo, edad y divisiones
del territorio dependerá, por una parte, del propósito y del alcance de las
estadísticas y, por otra, de los limites prácticos en relación con el tamaño de los
cuadros correspondientes.

Los siguientes modelos, diseñados con el objeto de facilitar la comparabilidad


internacional, consisten en maneras uniformes de expresar diversas
características. Cuando en los cuadros, para la publicación, se utilice una
clasificación diferente (v. g. en la agrupación por edad) deberán ordenarse en
forma tal que permitan su transformación en alguna de las agrupaciones
recomendadas”.

Más adelante se agrega:

III. b) Clasificación por edad para propósitos generales.


i) De menos de 1 año, de año en año hasta los 4 años inclusive, de
grupos de 5 años desde los 5 hasta los 84 años, de 85 y mas;
ii) De menos de 1 año, de 1 a 4 años, de 5 a 14 años, de 15 a 24 años,
de 25 a 34 años, de 35 a 44 años, de 45 años a 54 años, de 55 a 64
años, de 65 a 74 años, de 75 años y mas;
iii) De menos de 1 año, de 1 a 14 años, de 15 a 44 años, de 45 a 64
años, de 65 años y más.

c) clasificación por edad para estadísticas especiales de mortalidad infantil.

i) De día en día para la primera semana de vida (de menos de 24 horas 1,


2, 3, 4, 5, 6 días), de 7 a 13 días, de 14 a 20 días, de 21 a 27 días, de 28
días a 2 meses exclusive, de mes en mes desde los 2 meses hasta 1 año
(2, 3, 4,… 11 meses);

ii) De menos de 24 horas, de 1 a 6 días, de 7 a 27 días, de 28 días a 3


meses exclusive, de 3 a 5 meses, de 6 a 11 meses;
iii) De menos de 7 días, de 7 a 27 días, de 28 días a 11 meses.

Con otras características cuantitativas, la clasificación se realiza de la siguiente


manera. Supóngase que se tiene la siguiente serie de densidades de orina en
alumnos de 1963 de la Escuela de Salud Publica:

El procedimiento para formar los intervalos o clases consiste en buscar primero el


valor mínimo y el máximo en la serie y, restando el primero del segundo, encontrar
la amplitud de variación de los valores (lo que también se conoce con el nombre
de rango y acerca del cual se hablara mas en el capitulo siguiente). Después,
elegir el número de intervalos que se va a formar, lo cual depende del número de
observaciones que se tenga. En general, el numero de intervalos* varia de 5 a 20
y aunque en casos especiales se manejan más de 20 no resulta conveniente usar
menos de 5.

Decidido el número de intervalos se busca una amplitud de intervalos que, al


sumarse tantas veces como intervalos deba haber, apenas se rebase el valor del
tango. Esta amplitud de intervalo debe ser tal que se pueda trabajar fácilmente con
ella y sus múltiplos, procurando, cuando sea posible, que el límite inferior del
primer intervalo no coincida con el valor mínimo, ni que el límite superior del último
coincida con el valor máximo.

En la serie dad, el valor mínimo es 1007 y el máximo es 1035, de modo que el


rango es 1035-1007=28. Supóngase que se decide formar 6 intervalos, de manera
que para que la suma de las amplitudes apenas exceda a 28, cada intervalo debe
tener 5 unidades y entonces los intervalos podrían ser los siguientes:
1006 – 1010
1011 – 1015
1016 – 1020
1021 – 1025
1026 – 1030
1031 - 1035

Considérese ahora la serie siguiente de estaturas de alumnos de la escuela de


Salud pública del sexo masculino:

El valor menor es 157 y el mayor 188; el rango es, por lo tanto, 188-157=31; si se
quisieran formar 5 intervalos, la longitud tendría que ser de 7 centímetros; si se
desearan 6, la longitud tendría que ser de 6; sin embargo, resultaría más
conveniente para cálculos y para describir la serie usar longitudes de 5
centímetros, empezar con 155 y terminar con 189, quedando la clasificación
compuesta por los intervalos siguientes:

155 – 159
160 – 164
165 – 169
170 – 174
175 – 179
180 – 184
185 - 189

Las estaturas se obtienen comparando la altura que alcanza un individuo con una
escala graduada en centímetros (o en pulgadas) y es costumbre dar el valor de la
estatura como el entero que quede más próximo, de modo que si una estatura se
da como de 168 en realidad corresponde a cualquier valor entre 167.5 y 168.5. por
ello es necesario mencionar que el intervalo dado como de 155 a 159 en realidad
abarca desde 154.5 hasta 159.5 y si a este ultimo valor se le resta el precedente,
se confirma que la amplitud de cada intervalo es de 5 unidades. A los números
155 y 159 o a cualquier otra pareja de valores que defina un intervalo, de tal
manera que su límite superior no coincida con el límite inferior del intervalo
siguiente, se les denominara, en lo sucesivo, limites relativos, a los números 154.5
y 159.5 o a cualquier otra pareja de valores que defina a un intervalo sin que
queden valores no considerados entre un intervalo y el siguiente, se les llamara
limites reales.

Supóngase que la precisión con que se obtiene la estatura alcanza a decimos de


centímetro y que se obtiene el valor 164.5. Usando limites reales, los tres primeros
intervalos en el ejemplo que se ha estado manejando serian 154.5 – 159.5, 159.5
– 164.5 y 164.5 – 169.5, de modo que el valor 164.5 correspondería al punto de
separación de los últimos intervalos. Habría tres cosas que podrían hacerse: a)
considerar medio individuo en el segundo intervalo y medio en el tercero; b) lanzar
una moneda al aire y asignar al individuo al segundo intervalo, si sale, por
ejemplo, cara en la moneda, y al tercero en el caso contrario; c) “redondear” al
número par más próximo.

Aunque las tres soluciones son validas, es más común decidirse por la tercera y
entonces la cifra 164.5 se convierte en 164, que es el par más próximo, y la
observación se incluye en el segundo intervalo.

Como existen tantos números pares como impares, la mitad de las ocasiones se
suprime media unidad y la otra se agrega, pues un valor como 159.5 se redondea
a 160. Por supuesto que en el ejemplo se procedió de esta manera, en el
entendido de que 164.5 debía tomarse como una manera abreviada de escribir
ese mismo número seguido de una cantidad infinita de ceros, ya que un solo digito
diferente de cero en cualquier posición después del 5, como por ejemplo
164.500000001, convertiría el valor en 165 y entonces la observación debería ser
asignada al tercer intervalo.

Para fines de presentación y resumen de los datos, es preferible, aunque no


indispensable, que la amplitud de cada intervalo sea la misma dentro de cada
serie.

En algunas ocasiones, el límite inferior del primer intervalo se deja indeterminado


como en el caso de las muertes por enfermedad isquémica del corazón citado
antes y en otras; el que no se precisa es el límite superior del último intervalo
como en el ejemplo de las muertes por sarampión. A veces, los dos extremos de
toda la serie quedan sin especificar. El dejar los extremos indeterminados es algo
sugerido por la misma información; pero siempre que sea posible deben
delimitarse completamente los intervalos.

En el ejemplo anterior, las cifras fueron el resultado de medir la estatura, una


característica cuantitativa continua, aun cuando a veces se trabaja con cantidades
que representan enumeraciones como en el caso del número de hijos, dientes
perdidos, glóbulos blancos, etc. A continuación se presenta un cuadro en el cual
se clasifica a las mujeres por el número de hijos tenidos, y otro cuadro con la
clasificación de alumnos según el número de leucocitos por milímetro cubico de
suero.

Obsérvese que en las series anteriores solo son posibles valores enteros, pues no
se tienen fracciones de hijos y no se habla de fracciones de glóbulos blancos, y
que también pueden manejarse “intervalos” con un solo valor o con la posibilidad
de incluir solo los valores enteros comprendidos en ellos.

You might also like