You are on page 1of 264

Bioestadística

Herramienta de la Investigación

Eddy Puertas López


Jesús Urbina M.
M. E/vira 8/anck
Daisy Granadíllo
Maritza 8/anchard
José Antonio García
Pedro Vargas V.
Ana Chiquito

Consejo de Desarrollo Científico, Humanístico y Tecnológico - CDCHT-UC


Valencia, 1998
Título: Bioestadística, Herramienta de la Investigación
Autores: Eddy Puertas López, Jesús Urbina M., M. Elvira Blanck, Daisy Granadillo,
Maritza Blanchard, José Antonio García, Pedro Vargas V., Ana Chiquito.

I.S.B.N.: 980-233-188-0
Editado por: CDCHT-UC
Valencia, Venezuela

Diseño Editorial: Compugráfica C.A. - Valencia, Edo. Carabobo


Diagramación: Orlando Zabaleta
Diseño de Portada: Orlando Zabaleta/Compugráfica C.A.

Impreso en Venezuela
Printed in Venezuela

4
PRÓLOGO
Este libro fue diseñado especialmente para los alumnos de Ciencias de la
Salud que se inician en el estudio y uso de la Estadística como herramienta
auxiliar en el campo de la investigación científica.
En él, hemos buscado la forma de hacerles comprender a nuestros edu­
candos, de la manera más sencilla posible, el manejo de los datos, los proce­
dimientos en los cálculos de los diversos estadísticos, así como sus interpre­
taciones. Por lo tanto, el lenguaje empleado en su redacción responde a este
propósito. Es un lenguaje llano, sencillo y conciso, donde, de manera direc­
ta vamos a la esencia del concepto o del procedimiento que queremos ense­
ñar, despojándolo de todo adorno o retóricas explicaciones, las cuales ha­
rían más compleja su aprehensión. Para teorías más elaboradas y conoci­
mientos de mayor profundidad, será necesario consultar otras de las
muchas publicaciones que abundan en esta disciplina.
La experiencia de más de veinte años de docencia en el área de las Cien­
cias de la Salud, nos ha enseñado que nuestros alumnos están más motiva­
dos por el aprendizaje de aquellas asignaturas directamente relacionadas
con los procesos de salud-enfermedad; más que con cualquier otra materia.
Están ávidos de esos conocimientos, por lo tanto, lo demás lo perciben
como innecesario o distractor de su objetivo fundamental.
Consciente de esta situación, al escribir este libro hemos omitido inten­
cionalmente extensas explicaciones teóricas, demostraciones, despejes de
fórmulas matemáticas, así como complejas técnicas de análisis estadístico,
en particular del campo de la Estadística Inferencia!. Por lo tanto, no es un
exhaustivo tratado de Estadística. Es fundamentalmente, un libro de texto
básico, muy didáctico y sencillo de comprender por quienes lo consulten, y
aún cuando está elaborado para alumnos de pre-grado de las Escuelas de
Medicina, Bioanálisis y Enfermería, prevemos que también será de utilidad
en otros niveles donde se utilice la metodología estadística como un auxi­
liar de la investigación. Esta obra es producto de una extensa revisión bi­
bliográfica y de nuestra experiencia docente, por largo años acrisolada en
las aulas de clase de esta Universidad.
Eddy Puertas López
Profesora Titular de la Facultad de Ciencias de la Salud
de la Universidad de Carabobo
CAPÍTULO/
Uso de la Estadística en el campo de la Salud
Algunas definiciones básicas en estadística: Estadística. Estadística descriptiva.
Estadística inferencia/. Variables. Escalas de medición: escalas nominales, ordi­
nales, de intervalo y de razón. Parámetros y estadísticos. Bioestadísticas. Epide­
miología. Estadísticas de la salud. Estadísticas vitales. Uso de la Estadística en el
campo de la salud. La Estadística en la Administración sanitaria. Aplicación de la
Estadística en la investigación. Etapa de planificación de una investigación. Ela­
boración de un plan o proyecto. Planteamiento del problema: enunciado del pro­
blema; importancia del problema y justificación de su estudio; formulación del
problema; control del problema. Objetivos de la investigación. Marco teórico:
marco histórico, marco conceptual, sistema teórico, definiciones de términos.
Marco metodológico: Tipos de diseños de investigación. Niveles y tipos de investi­
gación: estudios descriptivos, correlacionales, comparativos, experimentales,
cuasi-experimentales, estudios transversales, retrospectivos, prospectivos. Marco
administrativo. Elaboración de las referencias bibliográficas. Bibliografia.

7
l. DEFINICIONES BÁSICAS
Estadística.- Cuando se intenta definir el término Estadística, se encuen­
tran diversas opiniones que incluyen su ubicación como ciencia, método,
técnica y aún como arte. Sin embargo, como denominador común se en­
cuentra el criterio de que es una rama de la matemática, utilizada para el
manejo de masas de datos numéricos y por consiguiente, para estudiar la
variación de diferentes fenómenos. También puede definirse como el méto­
do empleado para la recopilación, presentación, análisis e interpretación de
datos numéricos.
G. Utni Juli, la define como la ciencia que trata de la recolección, clasifi­
cación y presentación de los hechos, sujetos a una apreciación numérica
como base a la explicación, descripción y comparación de un fenómeno.
Serenko y Esmakov, la definen como la ciencia social que estudia el as­
pecto cuantitativo de los fenómenos sociales en masa, en relación indisolu­
ble con sus particularidades cualitativas.
Shelly Hernández habla de la Estadística como el conjunto metódico de
los hechos, de los individuos o de las cosas que suelen contarse o medirse,
de sus frecuencias, y de la ordenación y significación analítica de las cifras
obtenidas.
Gini la define como una técnica especial, apta para el análisis de los fe­
nómenos de masa o colectivos, entendiendo por tales aquellos fenómenos
naturales, económicos, sociales, etc., cuya medición requiere de la observa­
ción de una masa de fenómenos más simples llamados individuales o parti­
culares.
Para Ledezma, la Estadística es el arte y la ciencia de manejar los núme­
ros cuando expresan los valores cuantitativos de hechos similares. Serviría,
por lo tanto, para valorar observaciones o experimentos cuando éstos se ex­
presan cuantitativamente, es decir, mediante números.
Para Chao, la Estadística es un conjunto de teorías y métodos que han
sido desarrollados para tratar la recolección, el análisis y la descripción de
datos muestrales con el fin de extraer conclusiones útiles... es decir, que la
Estadística moderna abarca la estadística descriptiva y la inferencia.
Kaplan sostiene que la Estadística, en su sentido más amplio, consiste en
las maneras de tratar con una multiplicidad de datos para determinar qué

9
conclusiones apoyan y cuánto apoyo les proporcionan. Desde este punto de
vista, la estadística suele ser caracterizada hoy en día como disciplina que
trata del razonamiento empleado cuando se toman decisiones frente a la in­
certidumbre.
De acuerdo con los niveles de conocimientos que puede proporcionar el
estudio de una variable desde el punto de vista estadístico, la estadística
puede dividirse en dos partes:
Estadística Descriptiva, tiende a condensar o resumir un conjunto de da­
tos o características de una serie de valores, describiendo ciertas caracterís­
ticas del conjunto examinado. Por ejemplo, al medir la inteligencia, la ten­
sión arterial, la hemoglobina de un grupo de sujetos, se pueden agrupar los
valores obtenidos en distribuciones de frecuencias, construir tablas, gráfi­
cas, calcular promedios, percentiles, etc.
Estadística Inferencia/. Se refiere a los métodos estadísticos donde a
partir del estudio de una muestra (parte de la población total), se busca esti­
mar o generalizar sus conclusiones a la totalidad de la población. Se ocupa
específicamente de hacer inducciones, generalizando al universo los ha­
llazgos logrados en las muestras. Utiliza métodos y técnicas adecuadas para
ese proceso inductivo.
Variable estadística: Es una característica o propiedad que puede variar
(adquirir diversos valores) de un sujeto a otro, o en un mismo sujeto en di­
versas oportunidades; siendo esta variación susceptible de medición. Ejem­
plos: diagnóstico, síntomas, motivación intrínseca, sexo (son variables
cualitativas. Se refieren a un atributo), peso, talla, edad, temperatura (son
variables cuantitativas. Se refieren a magnitudes).
El procesamiento de estas variables da origen a las escalas de medición
nominales, ordinales, de intervalo y de razón.
Escalas de medición: Los valores de medición de cualquier variable,
para ser procesados y luego analizados, deben presentarse de manera resu­
mida en clases estadísticas, cuyo número depende de las divisiones que ad­
mita la variable. El conjunto ordenado de clases constituye lo que se deno­
mina escala. Según la naturaleza de la variable que la origina, ésta puede
ser: nominal, ordinal, de intervalo, o de razón.
Escalas Nominales o Categóricas: Existe un tipo de variable cuya me­
dición consiste simplemente en indicar si la característica está presente o

10
no en cada sujeto de estudio, o en incluir determinados elementos dentro de
las categorías que les correspondan.
A través de algunos ejemplos puede aclararse mejor el concepto. Al tra­
bajar con la variable "sexo" en un grupo de sujetos, se le asigna a unos la
condición de masculinos y a otros la de femenino, en otras palabras, se ubi­
can a los sujetos en una de las dos categorías que puede admitir la variable:
masculino o femenino. La variable ansiedad se distribuye en una escala no­
minal cuando se ubican a las personas en las "clases" de ansiosas o no an­
siosas. Del mismo modo, si se dice que unas cepas de un parásito son infec­
tantes y otras no lo son. La variable "infectante" está medida en una escala
nominal con dos posibilidades: SI o NO.
En resumen, la escala de medición nominal indica la presencia o ausen­
cia de un atributo en los sujetos de estudio, pero no permite cuantificar la
magnitud del atributo.
En la siguiente lista se ofrecen otros ejemplos de escalas nominales de
uso frecuente en Ciencias de la Salud, y los valores o categorías en las
cuales pueden clasificarse:
VARIABLE CLASES O CATEGORÍAS
Dermatitis, Sarampión, Cáncer, Gastroente­
Diagnóstico
ritis, Neumonía.
Accidentes, Neumonías, Cáncer, Envenena­
Causas de muerte
miento.
Tipo de reacción Positivo, Negativa.
Deshidratación, Herida, Parto, Intoxicación,
Causas de Admisión
Traumatismos.
Escalas Ordinales: Una variable se expresa en una escala ordinal, cuan­
do los valores que asume se jerarquizan en un orden de rango o magnitud.
La variable "estado nutricional" comúnmente se presenta en escala ordi­
nal, con sus clases: "Desnutrición Grado 1, Grado 2 y Grado 3 ". Cada una
de estas categorías es algo más que nominal, sin llegar realmente a lo numé­
rico. La variable "Quemadura ", cuando se expresa en la misma forma, es
una escala ordinal. Cuando a la variable "Ingresos económicos " se le asig­
nan los valores "ALTO ", "MEDIO ", "BAJO " también se está expresando
en una escala ordinal, entendiendo que el valor "ALTO ", numéricamente es
superior al "MEDIO "; pero no se indica cuanto es la diferencia.

11
En ocasiones las escalas ordinales son difíciles de manejar por cuanto ni
son nominales ni son numéricas y requieren ser tratadas con técnicas esta­
dísticas adecuadas.
No es frecuente encontrar variables que se midan rigurosamente de ma­
nera ordinal. Con frecuencia ocurre que variables de naturaleza numéricas,
por razones prácticas se expresan en escalas ordinales. Por ejemplo, cuando
se habla de dosis altas, medias o baja, originalmente las dosis fueron medi­
das en escala numérica: 1 ce, 2 ce, 3 ce, ... , pero pueden manejarse como:
bajas = dosis inferiores a 1,5 ce. Medias = dosis entre 1,5 y 3 ce. Altas = do­
sis superiores a 3 ce. De esta manera una variable numérica se expresa en
una escala ordinal.
Las otras dos escalas de medición: De intervalo y De razón correspon­
den a variables numéricas o cuantitativas, en las cuales se asigna un valor
numérico para expresar la magnitud de la característica en estudio.
Escalas de intervalos. - Se caracterizan porque en ellas la presencia del
valor "CERO" no significa la ausencia de la característica que se está mi­
diendo; sólo es un punto de referencia. Las cifras asignadas en esta escala
no indican exactamente una magnitud.
Ejemplo: Si al aplicar una prueba de Bioquímica a un alumno de Medici­
na, y éste obtiene una calificación de cero puntos no significa, necesaria­
mente, que el alumno carezca totalmente de conocimientos en esa asignatu­
ra, sino que no supo responder adecuadamente a las preguntas formuladas
en ese momento. Así mismo, si otro alumno obtiene, en la misma prueba 16
puntos, no significa que él posee exactamente el doble de conocimientos de
otro que obtuvo sólo 8 puntos.
En Ciencias de la Salud, suele utilizarse este tipo de escala especialmen­
te en el campo de la Psicología, donde muchas variables se miden a través
de Tests. Ej. Test de ansiedad, de depresión, de Locus de Control, de Inteli­
gencia, de Motivación Intrinseca, de Razonamiento Abstracto, etc.
Por su parte, las escalas de razón sí están referidas a un CERO
ABSOL UTO donde su presencia significa la ausencia de la característica
medida; y las cifras numéricas realmente indican una magnitud. Por ejem­
plo, un niño de 60 cm. de estatura, mide la mitad de otro cuya talla es de 120
cm. U otro de 10 kilos pesa el doble de lo que pesa otro de 5 Kilos. O un jo­
ven de 21 años de edad ha vivido exactamente tres veces el tiempo vivido

12
por un niño de 7 años.
Al estudiar las variables numéricas o cuantitativas, es necesario desarro­
llar otros aspectos importantes con relación a los valores que pueden tomar
dentro de las escalas. Algu nas escalas sólo admiten valores enteros, es de­
cir, no pueden expresarse mediante fracciones o decimales; por ejemplo: el
número de hijos de una familia, el número de embarazos de una mujer, ha­
bitantes por viviendas, glóbulos rojos, etc. En tales casos se les denominan
variables discretas.
Cuando la variable puede asumir cualquier valor, incluso decimal, se
dice que varía de manera continua. Como ejemplos se pueden citar: el
peso, la talla, los valores de hemoglobina. Tanto las variables de intervalos
como las de razón pueden variar de manera continua o discreta. Algunas va­
riables que teóricamente son de naturaleza continua, como por ejemplo la
edad, son comúnmente expresadas en forma discreta. En casi todos los ca­
sos la edad se expresa en números enteros.
Variabilidad.- La aplicación de la Estadística en diversas áreas de las
Ciencias de la Salud, viene dada por la naturaleza variable de muchos de los
fenómenos que se estudian en esa área: la natalidad, la morbilidad y la mor­
talidad, por ejemplo, son hechos vitales afectados por factores biológicos y
sociales en forma variable, no sólo dentro de grupos humanos diferentes,
sino también dentro de los mismos individuos. Esa característica básica que
está presente en los hechos investigados y en base a la cual son diferentes o
toman valores diferentes es lo que se conoce como variabilidad. En todo fe­
nómeno donde la variabilidad esté presente, la Estadística tiene aplicación.
Población o universo: Conjunto completo de individuos, objetos o
unidades que poseen alguna característica común observable. Ejemplo, la
población en edad de votar.
Muestra: Un subconjunto o parte de la población o del universo que re­
fleja las características del mismo.
Parámetro: Es la medida de resumen (o valor representativo) de cual­
quier característica medible en una población. Ejemplo, la tasa de mortali­
dad general para una población; el porcentaje de desnutridos en una pobla­
ción; el peso promedio de los niños al nacer.
Estadístico: Es la medida de una característica estudiada o calculada en
una muestra, de acuerdo con determinados procedimientos específicos. Co-

13
múnmente, se usa un estadístico para estimar el parámetro correspondiente
de una población. Por ejemplo, la media aritmética de una muestra permite
estimar la media aritmética para la población de la cual se obtuvo.
Serie estadística: Es un conjunto de datos referidos a una variable cuali­
tativa o cuantitativa. Estos datos pueden estar ordenados o no.
Igualmente pueden estar agrupados en clases (series agrupadas) o pre­
sentados en un listado de datos, conocidos como datos directos.
Bioestadística: Es la rama de la estadística aplicada al estudio de los fe­
nómenos variables en los seres vivos.
Epidemiología: Es el estudio de la distribución de una enfermedad o
condición fisiológica en poblaciones humanas, y de los factores que influ­
yen en esa distribución.
Estadística Vital: Se refiere al estudio de los hechos relacionados con el
comienzo y fin de la vida y los cambios de estado civil que ocurren durante
ella. Para Swaroop, el término estadísticas vitales se usa para denotar he­
chos registrados sistemáticamente y reunidos en forma numérica que se re­
lacionan o derivan de registros de eventos vitales, a saber: nacidos vivos,
muertes, muertes fetales, matrimonios, divorcios, adopciones, legitimacio­
nes, etc. De hecho, las estadísticas vitales se derivan de eventos registrados
legalmente sin incluir los datos de población o las características de morbi­
lidad.
Estadísticas de salud: Conjunto de datos referidos a la situación de salud
de una comunidad. Incluye todo lo relacionado con natalidad, morbilidad y
mortalidad.

11. USO DE LA ESTADÍSTICA EN EL CAMPO DE LA SALUD


En los últimos años, y gracias al desarrollo de tecnologías que así lo han·
permitido, la Estadística se ha convertido en un auxiliar poderoso de mu­
chas actividades humanas, pues, su campo de aplicación abarca las más di­
símiles actividades, tanto científicas como de otra naturaleza. En el área de
las Ciencias de la Salud, esta metodología tiene una amplia historia, siendo
fundamental en el estudio de una en particular como es la Salud Pública.

14
Una revisión de la literatura sobre la Estadística en el campo de las Cien­
cias de la Salud permite establecer una base de sustentación firme para la
justificación de la importancia que tiene la aplicación de la Metodología
Estadística en este campo del conocimiento.
En relación con las Estadísticas de Salud, Fayad Camel, uno de los auto­
res más consultado en Venezuela, señala que éstas son indispensables para
la planificación, ejecución y evaluación de los programas de salud, ya que
permiten el diagnóstico de comunidad (descripción de la situación de salud
en una comunidad), y facilitan la aplicación de técnicas apropiadas para
medir hasta que punto se ha logrado el cumplimiento de los programas de
salud.
En el sector salud, la Estadística permite:
a) Describir el nivel de salud de la comunidad
b) Diagnosticar las enfermedades de la comunidad.
c) Encontrar soluciones a los problemas de salud y hallar las claves para
la acción administrativa.
d) Determinar prioridades para los programas de salud.
e) Dirigir y mantener el control durante la ejecución de los muestreos,
etc.
f) Promover la legislación en salud.
g) Crear estándares administrativos de actividades de salud.
h) Determinar el alcance y restricciones de las actividades de salud.
i) Difundir información confiable sobre la situación de salud y los pro-
gramas de salud.
g) Determinar el éxito o fracaso de los programas específicos de salud.
k) Pedir ayuda pública para el trabajo de salud.
Bancroft expresa que de manera cotidiana, el médico utiliza la Estadísti­
ca al tener presente las variaciones entre los individuos y cuando tales va­
riaciones son normales o no. Igualmente cuando hace el diagnóstico de un
paciente y el pronóstico, según su enfermedad (probabilidad de curar o de
morir). Al mismo tiempo, la introducción de nuevos tratamientos debe ir
acompañada de un análisis crítico, no sólo acerca de su superioridad de los

15
antiguos tratamientos, sino además, tener claramente establecido todo lo re­
ferente al control de los experimentos: la similitud del grupo control con el
grupo experimental y si la diferencia obtenida es atribuible o no al azar.
Mainland señala, por su parte, que el método estadístico es usado por el
laboratorista al promediar dos lecturas de una pipeta, o por el clínico cuan­
do determina si es o no normal la tensión arterial de un paciente o cuando se
recomienda un tratamiento fundado en el hecho de que es mejor que otro.
Del mismo modo Hill fundamenta la importancia y necesidad de la in­
formación estadística, tanto en la medicina clínica como en salud pública,
al indicar que, en el primer caso, es esencial precisamente debido a la varia­
bilidad humana. Por otro lado, la reacción favorable de un caso de una en­
fermedad a un nuevo tratamiento puede considerarse significativa cuando
la experiencia anterior ha demostrado, luego de la observación de muchísi­
mos casos, que esas reacciones no son variables. Así mismo, Hill añade que
sin el uso de la estadística no puede fundamentarse el mayor o menor valor
de un determinado tratamiento o si una droga poderosa tiene más efectivi­
dad que otra en condiciones particulares.
Otros elementos que valorizan la estadística en su aplicación a la clínica
médica, son su utilización en la determinación de la variación de una enfer­
medad de un paciente a otro, o si está asociada a determinadas característi­
cas como edad, sexo u otra; en el seguimiento de pacientes; en la definición
de normalidad o la exactitud de procedimientos de laboratorio. En el caso
de la salud pública, la aplicación es muy amplia, refiriéndose, por ejemplo,
a la comprobación de la eficacia de medidas preventivas, tales como una
vacunación. En resumen, para Hill, la información estadística en salud pú­
blica está orientada hacia dos propósitos principales: por una parte, ser utili­
zada como el indicador del estado de salud de una comunidad y por la otra,
para determinar las razones fundamentales de las diferencias entre las for­
mas como los indicadores se presentan en diversos sectores de la sociedad.
Otro elemento teórico que destaca la necesidad de la información esta­
dística, lo encontramos en trabajos de Morichau-Beau-Chant, quien reco­
noce lo indispensable de conocimientos suficientemente precisos de la si­
tuación sanitaria, para la planificación en salud, al igual que para la evalua­
ción de sus resultados. Indica que en general, la mortalidad es mal
conocida, lo mismo que la morbilidad. Sin embargo, cuando no es posible
disponer de información precisa, aquella que pueda obtenerse mediante un

16
sondeo, puede aproximar muy bien a la realidad, y los procedimientos y
técnicas para la realización y análisis de los sondeos son de tipo fundamen­
talmente estadístico.
Si se enfoca la importancia de la estadística desde otro punto de vista, el
de la investigación en Ciencias de la Salud, tanto social como propiamente
biológica y epidemiológica, se pueden encontrar suficientes elementos de
tipo conceptual y de procedimiento que revelan el papel fundamental de la
Estadística en este campo de la investigación. Snedecor al analizar la defi­
nición de Estadística, destaca la importancia de ésta, tanto para quien reali­
za activamente investigación de tipo cuantitativo como para quienes van a
hacer carrera en las Ciencias Sociales. La investigación epidemiológica
tendría serias limitaciones sin un adecuado fundamento estadístico.
En la investigación biológica y social aplicada a la salud, la Estadística
juega un papel de primer orden al proveer de suficientes procedimientos y
técnicas de análisis para las pruebas de hipótesis, lo cual constituye el pilar
fundamental de la investigación experimental, aparte, naturalmente, de los
elementos de análisis que provee para los estudios de tipo descriptivo. Bel­
trán resume con bastante claridad el aporte de la estadística en la aplicación
del método científico, tanto en lo referente a la planificación de la investiga­
ción, como en la aplicación de los procedimientos metodológicos y en el
análisis de los resultados.
Ferrero, al referirse a la magnitud y complejidad de servicios que hoy
maneja la administración sanitaria (atención médica, seguridad social,
etc.), ha planteado la necesidad de disponer de información estadística de
forma permanente y sistemática, ya que no bastan algunos datos, sino que
es necesaria suficiente información para hacer inferencias y predicciones
sobre el comportamiento de los fenómenos en estudio. La presencia de la
variabilidad como característica de los fenómenos objeto de estudio, tanto
por la medicina como por la salud pública, determinan la necesidad del uso
de la Estadística en esas áreas del conocimiento, lo mismo es válido para el
campo de "la investigación clínica que trabaja con fenómenos eminente­
mente variables, al igual que todo el campo de la biología... " (197 1 , Pg.
1 1 9).
En síntesis, los autores mencionados y muchos más, Armitage, Cañedo,
le atribuyen a la Estadística una importancia de primer orden en los diver­
sos aspectos de la actividad médica en particular y de salud en general.

17
Es necesario, sin embargo, indicar que la aplicación de los métodos esta­
dísticos en cada una de esas áreas, se da de manera diferente atendiendo a
los procedimientos y objetivos propios de la planificación, la administra­
ción, la evaluación y la investigación en salud. También, es necesario desta­
car que, como sostiene Kaplan toda medición contiene un elemento de
error. La más exacta descripción o predicción que puede hacerse es siempre
aproximada; tanto en el sentido del constante cambio o transformación de
la realidad, como en el sentido mismo de la realidad, la cual es una cons­
trucción teórica, y a ella se suman las diferencias provocadas de los proce­
dimientos y circunstancias de la medición.
Si una medición particular fuera totalmente exacta y libre de errores, las
repeticiones de la medición, difícilmente proporcionarían medidas idénti­
cas, ya sean, de un mismo observador, en ocasiones sucesivas, o de obser­
vadores diferentes, porque no verán exactamente del mismo modo lo que
puede llamarse la "misma situación".

APLICACIÓN DE LA ESTADÍSTICA EN LA ADMINISTRACIÓN


SANITARIA.
Administrar es un término generalmente utilizado para definir la forma
en que una persona o institución dispone de sus recursos (tiempo, dinero,
personal), para lograr una meta. En el área de la salud existe una rama deno­
minada Administración Sanitaria. Esta especialidad es útil tanto para médi­
cos, enfermeras, bioanalistas, economistas o cualquier otro profesional que
tenga que ver con la salud de un grupo o población. Puede definirse como:
El conocimiento utilizado para guiar a individuos y/o institucio­
nes a satisfacer el objetivo de mejorar de manera permanente el es­
tado de salud de una persona o población, mediante el uso racional y
eficaz de los recursos disponibles a tal fin (Ferrero, 1971).
En ese sentido la administración sanitaria puede emplearse tanto en un
ambulatorio rural como en el más moderno hospital. Al lograrse una más
justa distribución de los recursos para atender las necesidades de salud (en
el área preventiva y curativa), de una comunidad o de una gran ciudad, se
elevará el grado de desarrollo social y económico, y con ello, la población
tendrá mayor capacidad para estudiar y trabajar; crecer y reproducirse, y
garantizar a sus descendientes una mejor calidad de vida, asegurar su iden-

18
tidad como nación, además de disminuir la dependencia de otros países.
La administración sanitaria no puede verse, entonces, sólo como un ins­
trumento gerencial, es, además, una herramienta eficaz para el crecimiento
y desarrollo de un país. Así, el uso racional y creativo de la administración
por quienes tengan esa responsabilidad a su cargo, puede contribuir a un
mayor grado de bienestar social.
Los planteamientos anteriores sirven de marco para entender el uso de la
Estadística en el campo de la salud. Es evidente que se necesita manejar in­
formación acerca del estado de salud de una población. Esta información
surge de los estudios epidemiológicos. Si se cuenta con el diagnóstico de la
comunidad en lo referente a salud, y con información adicional pertinente,
el administrador, Jefe de un Distrito Sanitario, por ejemplo, estará en capa­
cidad de hacer una PLANIFICACIÓN de sus actividades para atender las
necesidades de salud diagnosticadas.
En la planificación es importante, no sólo fijar los objetivos del plan,
sino también hacer una evaluación de los recursos disponibles y considerar
los faltante, a fin de elaborar un presupuesto. Es en este momento cuando el
administrador y su equipo, debe procesar gran cantidad y variabilidad de
datos. Tendrá que analizar informes, resumir y clasificar datos, elaborar
proyecciones y tendencias. Definirá prioridades basándose en tasas e índi­
ces sobre natalidad, fertilidad, morbilidad y mortalidad y asignará recursos
en función de los mismos.
En el caso de la administración de un servicio de salud público o privado,
se requiere una revisión exhaustiva de todos los parámetros disponibles
para conocer la demanda de servicios, y a la vez saber con qué recursos
cuenta para satisfacer los requerimientos. En el proceso de planificación
buscará equilibrar la demanda con la oferta, tratando de optimizar los recur­
sos que posee, generalmente escasos, por lo menos en la administración pú­
blica. Nuevamente entrarán en juego los datos e información que deberán
ser analizados estadísticamente.
Como puede verse, la Estadística está presente en todas las etapas del
proceso de administración en salud. Constituye una herramienta metodoló­
gica para que el administrador de salud diagnostique, planifique, ejecute y
evalúe las acciones necesarias, a fin de lograr que cada individuo y cada co­
munidad tengan el nivel de salud adecuado, y puedan llevar a cabo sus acti-

19
vidades normales.

APLICACIÓN DE LA ESTADÍSTICA EN LA INVESTIGACIÓN.


En el trabajo de investigación, la estadística tiene una función decisiva.
Las Ciencias Biológicas en sus aspectos relacionados con la salud, y las
Ciencias Sociales que han venido desarrollando un gran aporte al campo de
la salud, emplean métodos estadísticos no sólo con mayor frecuencia, sino
cada vez más complejos y sofisticados en la investigación. La posibilidad
de establecer relaciones entre la multiplicidad de variables que afectan al
fenómeno salud, requiere de la utilización sistemática y adecuada de méto­
dos estadísticos. Hoy en día, con el uso de las computadoras se abren posi­
bilidades inmensas a la estadística en el campo de la investigación, es más,
gracias a ellas, es posible la aplicación de esos métodos complejos.
El trabajo de investigación científica requiere de la utilización del méto­
do científico para su desarrollo. Este método combina el proceso de induc­
ción para obtener el conocimiento científico, más confiable que la tradición
y la experiencia o vivencia de las personas. El método científico implica un
conjunto de procedimientos ordenados sistemáticamente para obtener un
conocimiento cierto, veraz.
La realización de un trabajo científico sigue una serie de etapas:
- Planificación de la Investigación.
- Recolección de la información.
- Procesamiento y Presentación de los datos.
- Análisis e interpretación de los resultados.
- Elaboración del informe final.

111. ETAPA DE PLANIFICACIÓN


La búsqueda del conocimiento científico no puede ser una tarea anárqui­
ca, guiada por la improvisación o por el azar, debe ser un trabajo cuidadosa­
mente planificado, donde se fijen previamente los objetivos, los recursos y
los procedimientos a emplearse durante la ejecución del mismo. Fayad Ca­
mel plantea que planificar es esencial no sólo para calcular el tiempo de

20
duración de la investigación, el personal requerido y el presupuesto nece­
sario, sino con elfin de realizar el estudio con metas perfectamente defini­
das, evitando improvisaciones que puedan introducir errores, capaces de
invalidar o desmeritar la investigación (Camel, 1 979. p 1 7).
La planificación de un trabajo científico es una tarea ardua, y se estima
que consume aproximadamente la mitad (el 50 % ) del tiempo total necesa­
rio para toda la investigación. Contiene una serie de sub-etapas, las cuales
se inician al concebir la idea de investigar sobre un tema en particular. Al
inicio el área de investigación puede ser muy amplia, lo cual obliga a anali­
zar diferentes aspectos que ayuden a evaluar la conveniencia de centrar el
estudio en alguna de las múltiples facetas del tema posibles de investigar.
Para ayudar a definir el punto específico a estudiar se recomiendan dos
técnicas sencillas; la primera se llama "diluvio de ideas" y consiste en escri­
bir todas las ideas que surgen espontáneamente para luego ir filtrando cada
una de ellas hasta quedarse con aquellas que sean más factibles de realizar.
La segunda técnica sugiere discusiones sistemáticas del equipo de trabajo,
acerca de los problemas apremiantes por resolver en un área determinada,
así como la factibilidad de realizar esas investigaciones. La idea de ambas
técnicas, posibles de combinar, es promover el análisis de la factibilidad de
un tema de investigación.
Cubierta esta etapa, es recomendable elaborar un plan o proyecto de in­
vestigación, donde se exprese anticipadamente y en forma escrita, lo que se
espera realizar. Al escribir, el investigador se obliga a organizar sus pensa­
mientos en cuanto al problema a considerar. De esta manera podrá darse
cuenta si el estudio es factible, si el diseño metodológico es consistente con
los objetivos, si cuenta con los recursos y el tiempo necesario para realizar­
lo. Este plan contiene los detalles relacionados con las etapas posteriores de
la investigación, como son: la recolección de la información, la presenta­
ción de los datos y el análisis de los resultados obtenidos.
Llegar a resumir en un plan escrito todos los aspectos a considerar en la
investigación, requiere de muchas horas de trabajo, consumidas en reunio­
nes con el equipo de trabajo, con personal de instituciones públicas o priva­
das que puedan participar en el estudio (bien con el aporte de recursos hu­
manos o materiales, o facilitando la muestra o la información necesaria o el
financiamiento para la investigación), en entrevistas con expertos en el área
del conocimiento del fenómeno o problema que se estudia, en la búsqueda y

21
revisión de la bibliografia sobre el tema en cuestión, en reuniones con los
asesores y en muchas gestiones más.
Una vez seleccionado el tema, se describe de la manera más exacta posi­
ble el problema específico a investigar. Esta tarea suele ser uno de los as­
pectos más dificiles de concretar, especialmente para los nuevos investiga­
dores, quienes tienen tendencia a divagar en sus enunciados iniciales, su­
mergiéndose en generalidades que originan confusión y pérdida en la
dirección del proyecto. Ante esta situación es conveniente disponer de un
esquema sencillo, que oriente al investigador en la formulación del plantea­
miento del problema, considerado el primer aspecto del proyecto.

PLANTEAMIENTO DEL PROBLEMA


Los especialistas en investigación enfatizan en la importancia de este as­
pecto dentro del proceso de la investigación, sin embargo, no hay homoge­
neidad entre ellos sobre los elementos que lo conforman.
A fin de facilitar esta tarea, se sugieren de manera esquematizada los pa­
sos o los elementos que conforman el planteamiento del problema.
ENUNCIADO DELPROBLEMA. - Una vez realizado el análisis de la
situación considerada problemática, el investigador está en capacidad de
enunciar el problema a investigar. En este caso, enunciar es expresar con­
cretamente QUE se va investigar y describir el problema de estudio. Resul­
taría dificil establecer las etapas posteriores del proyecto si antes no se ha
delimitado clara y concretamente el problema que se pretende investigaL
Por ejemplo, el estudio "La Nutrición en el Estado Carabobo", puede resul­
tar muy amplio y general para una investigación específica, aún cuando
pueda ser adecuado para un proyecto de investigación más complejo. Es
preferible afinar o precisar más y señalar un aspecto particular de ese tema
que se estudiará en una determinada zona del estado, por ejemplo, "Nutri­
ción en Menores de 1 año, del Barrio Oeste de Naguanagua" o "Nutrición
en Ancianos del Barrio La Cidra de Naguanagua" o "Problemas Nutricio­
nales en las Embarazadas que acuden a la Consulta Prenatal del Ambulato­
rio de La Isabelica" o "Nutrición en las Cárceles del Estado Carabobo" o
"Malnutrición en Escolares del Distrito Valencia" o "Relación Entre Obesi­
dad y Tensión Arterial en Pacientes Atendidos en la Consulta de Cardiolo­
gía del Hospital "Angel Larralde", de 1 990 a 1997" y aún cualquiera de es­
tos tópicos puede delimitarse más si se quiere especificar con mayor preci-

22
sión lo que interesa estudiar.
JUSTIFICACIÓN E IMPORTANCIA DEL PROBLEMA.- No todos
los problemas enunciados tienen suficiente importancia como para justifi­
car su estudio. Existen problemas poco relevantes y carecen de valor cientí­
fico. Se trata de presentar argumentos sólidos sobre la validez, viabilidad,
interés y significado del problema a investigar. Implica ello la necesidad de
señalar el PORQUÉ se desea realizare dicho estudio, pudiendo esto deter­
minarse, entre otras formas, por la cuantificación de individuos afectados
por el fenómeno o problema descrito (magnitud), por las consecuencias que
dicho problema traería a la población si no es atendido (trascendencia), y
por las posibilidades disponibles para resolverlo (vulnerabilidad).
FORMULACIÓN DEL PROBLEMA- Aun cuando algunos textos uti­
lizan indistintamente los términos "planteamiento" y "formulación" del
problema, es prioritario aclarar que se trata de conceptos diferentes. La for­
mulación del problema busca explicar con claridad los diversos elementos
que lo conforman y las relaciones que éstos guardan entre sí. Este aspecto
contempla además la descripción de como se realizará la investigación del
problema inicialmente enunciado. En la formulación se sintetizan y reflejan
los aspectos más significativos del planteamiento del problema. La formu­
lación forma parte de este proceso.
COMPROBACIÓN Y CONTROL DEL PROBLEMA.- Una vez for­
mulado el problema a estudiar es recomendable plantearse algunas pregun­
tas, con el propósito de comprobar la claridad y precisión del problema des­
crito, su viabilidad investigativa y la pertinencia de todo lo dicho, durante
las diferentes sub-etapas del planteamiento.
En síntesis, en el PLANTEAMIENTO DEL PROBLEMA se incluye:
- Enunciado del problema.
- Importancia del problema y justificación del estudio.
- Formulación del problema.
- Control del problema.

OBJETIVOS DE LA INVESTIGACIÓN
Al tener claro el planteamiento del problema, es posible definirse los ob­
jetivos -mediatos o inmediatos- (PARA QUÉ), que se pretenden alcanzar

23
con la investigación. Este punto es crucial en todo trabajo, alrededor del
mismo girarán las etapas posteriores de la investigación. Los objetivos
constituyen la meta hacia donde se orienta la investigación.
La redacción de estos debe ser clara y concisa, siendo necesario cuidar la
selección de los verbos que describan la acción que se pretende lograr; por
ejemplo: describir, calcular, determinar, establecer, relacionar, comparar,
evaluar, diagnosticar, etc.
La recolección de los datos se hará en f.unción de los objetivos, a través
de un instrumento elaborado al efecto o seleccionado para tal fin. La elabo­
ración y presentación de la información se orientará hacia el logro de los
objetivos y el análisis y las conclusiones estarán en función de las interro­
gantes planteadas en los objetivos.
Dada la importancia de este punto, es vital la formulación de objetivos
precisos y factibles de lograr. No es conveniente plantearse propósitos inal­
canzables o irreales. No deben formularse objetivos que requieran informa­
ción muy dificil de obtener (confidencial) o cuya fuente no sea accesible; o
bien cuando el logro de los objetivos no dependa del equipo de investiga­
ción sino de personas ajenas a ésta.
La definición o especificación de un problema va unido a la realización
de una revisión bibliográfica lo más detallada posible acerca del tema en
cuestión. El propósito es familiarizarse con el mismo, ampliar y profundi­
zar el conocimiento de las variables relacionadas con éste, indagar acerca
de la forma como ha sido abordado el problema por otros investigadores,
así como los resultados obtenidos y si existen coincidencias o contradiccio­
nes entre ellos. En resumen la idea es precisar cuanto se conoce en relación
con el problema de interés. La investigación es un proceso que va de lo
conocido a lo desconocido.
Son variadas las fuentes de donde se nutre el investigador para familiari­
zarse con el problema. Estas fuentes pueden incluir expertos en el tema, re­
vistas científicas, textos, datos estadísticos, etc., las cuales deben ser con­
fiables y revisadas con sentido crítico. La información obtenida de ellas
configura el soporte teórico de la investigación, y es lo que en la literatura
especializada se denomina "Marco Teórico ".

24
MARCO TEÓRICO
Una vez que el investigador ha leído, evaluado, resumido y clasificado el
material bibliográfico pertinente, está en capacidad de conformar un marco
teórico de referencia, que le permita ubicar al fenómeno en estudio dentro
de un contexto teórico o conceptual. Sólo dentro de ese contexto los resulta­
dos obtenidos pueden contribuir al conocimiento, pues los datos aislados
tienen poca utilidad o aplicabilidad.
Una buena investigación no existe en el vacío. Requiere de una exhausti­
va revisión de la literatura para conformar la base de donde surgirán nuevos
conocimientos. Tal revisión debe ser crítica y objetiva, tomando en cuenta
no sólo los trabajos que apoyen las hipótesis del estudio, si no también
aquellos que las contradigan. Sin embargo, el marco teórico no puede ser
una serie de citas de diferentes autores. Las ideas planteadas en él deben te­
ner coherencia y desarrollo lógico. Es necesario parafrasear o resumir con
lenguaje propio lo expresado en la literatura consultada, y establecer la rela­
ción entre los aportes de esas fuentes y el problema en estudio, así como los
aspectos que ya han sido aclarados y las interrogantes aún pendientes.
El marco teórico a niveles más específicos y concretos, compren­
de la ubicación del problema en una determinada situación históri­
co-social, sus relaciones con otros fenómenos, las relaciones de los
resultados por alcanzar con otros ya logrados, como también defini­
ciones de nuevos conceptos, redefiniciones de otros, clasificaciones,
tipologías por usar, etc. (Briones. 1981, 44).
Son múltiples las funciones que cumple el marco teórico, de allí que esté
conformado por varios subsistemas, los cuales le proporcionan sus caracte­
rísticas y rasgos fundamentales. La literatura especializada en el área, co­
múnmente menciona dentro de este aspecto, diversos subsistemas, siendo
los más frecuentes:
- Marco histórico.
- Marco conceptual.
- Sistema teórico.
- Definiciones de términos.
MARCO HISTÓRICO. - Referido por algunos autores como "Antece­
dentes del problema" o "Puesta al día del tema". Su propósito fundamental

25
es hacer un recuento histórico del fenómeno o del problema, desde sus orí­
genes hasta el momento de la investigación, a nivel internacional, nacional
y regional.
El conjunto de trabajos anteriores referidos al problema, constituye los
antecedentes del mismo, y permite determinar hasta donde ese problema ha
sido investigado. Además servirá de marco, para el análisis de los resulta­
dos al comparar los propios hallazgos con los obtenidos en los anteriores
trabajos, siendo esto lo que hace posible el avance del conocimiento.
Las fuentes bibliográficas con las cuales se ha conformado el marco de­
ben mencionarse en el mismo, a fin de darle crédito a sus autores, en cuyo
caso se menciona entre paréntesis, el apellido del autor de la obra y el año
de su publicación.
MARCO CONCEPTUAL o bases teóricas.- Cada ciencia posee su pro­
pio cuerpo de conocimientos, con sus principios, sus leyes, sus teorías, don­
de se explica el porqué de los hechos. Es justamente parte de ese cuerpo de
conocimientos donde se apoya toda investigación, sirviendo de base o fun­
damentos teóricos para edificar sobre ellos nuevos conocimientos, lo cual
constituye el propósito básico de la investigación.
Las distintas disciplinas del saber ofrecen múltiples ejemplos sobre este
aspecto. En el campo de la psicología, por ejemplo, pueden aplicarse diver­
sas teorías al estudiar un problema. La teoría de las motivaciones de Mas­
low; o las del aprendizaje social de Rotter; o teorías de la personalidad o de
la disonancia cognoscitiva de Festinger, son de utilidad para enfocar pro­
blemas de actitudes hacia la salud. Estas bases teóricas permiten, en los di­
seños experimentales, formular hipótesis de trabajo, pues establecen rela­
ciones entre variables claramente definidas como independientes y depen­
dientes.
SISTEMA TEÓRICO el cual está conformado por las variables relacio­
nadas con el fenómeno y las hipótesis de la investigación. Las variables son
características de los sujetos, las cuales pueden tomar valores diferentes en
cada uno de ellos; por ejemplo el peso, tensión arterial, edad, sexo, valores
de hemoglobina, valores de colesterol, estado de salud, hábitos alimenta­
rios, hábitos de fumar, etc. Para Cerda (1991) las variables son conceptos
clasificatorios, que permiten ubicar a los individuos en categorías y clases,
siendo susceptibles de identificación y de medición.

26
Estas variables, según el caso, pueden funcionar como variables depen­
dientes o independientes. Se consideran variables independientes aquellas
que NO son afectadas por otras variables; ellas "causan", "afectan" o "in­
fluyen" en otras variables. Al cambiar las primeras producen variaciones en
las segundas, denominándose a estas últimas variables dependientes. Ellas
resultan "afectadas" o "influenciadas" por otras. Sin embargo, la relación
de implicación entre ellas no siempre es de tipo causal; pudiendo existir
otras relaciones diferentes, por lo cual también se habla de relaciones multi­
causales.
La condición de independiente o dependiente es, en algunos casos, de
carácter relativo o metodológico. Por ejemplo, en el proyecto de investiga­
ción "Uso de la medicina homeopática en el control de la obesidad ", como
variables asociadas a este problema de reducción de peso, se menciona: la
edad, el sexo, la estatura, la actividad fisica, los hábitos alimentarios, el es­
tado de salud y el tratamiento homeopático (esta última como variable en
estudio). En este proyecto, el peso se considera dependiente y las demás in­
dependientes. Sin embargo, en un estudio sobre "Hipertensión arterial ",
las variables: hábitos de alimentación, peso, hábitos de fumar, stress, etc.,
influyen sobre el problema en estudio. En este caso, la variable peso es ma­
nejada como una variable independiente. Las variables son un recurso me­
todológico utilizados por el investigador para medir y manejar ciertas ca­
racterísticas de su interés.
Muchas investigaciones buscan establecer relaciones entre las variables.
Cuando esas relaciones se consideran funcionales y se sustentan teórica­
mente se expresan a través de hipótesis, siendo éstas definidas como la ex­
plicación temporal o tentativa de la relación entre variables. La formula­
ción de las hipótesis, al menos en ciertos tipos de investigación, sugiere la
posibilidad de medir las variables y los mecanismos para esa medición. Un
ejemplo de este tipo de hipótesis puede ser:
Hi: "Los niños nacidos de madres fumadoras tienen menor peso que
los nacidos de madres nofumadoras ".
En otras oportunidades, las hipótesis se enuncian en función a valores
esperados, denominándose hipótesis operacionales. Ejemplo:
Hi: "Con el nuevo medicamento el porcentaje de curación será ma­
yor del 30%, considerado normal para esa población ".

27
En el momento de redactar las hipótesis, es conveniente recordar los cri­
terios establecidos para su adecuada elaboración: Las hipótesis deben ser
redactadas en términos claros y sencillos. Deben ser específicas. Deben for­
mularse como afirmaciones, evitando los juicios. No deben comenzar con
verbos, ni presentarse en forma interrogativa. Deben ser congruentes con
los hechos confirmados.
Estas proposiciones tentativas sobre las posibles relaciones entre dos o
más variables se denominan hipótesis de trabajo o hipótesis de investiga­
ción; y se simbolizan como Hi:
Para la verificación estadística de las hipótesis de trabajo, el investigador
se vale de la hipótesis Nula, la cual afirma que no existe relación entre las
variables independientes y dependientes. Son el reverso de las hipótesis de
investigación. Se simbolizan como Ho:
Las hipótesis nulas correspondientes a los dos ejemplos anteriores pue­
den ser:
Ho: "Los hijos nacidos de mujeres fumadoras tienen el mismo peso al
nacer, que los nacidos de mujeres no fumadoras ".
Ho: "Con el nuevo medicamento el porcentaje de curación será igual
al 30%, considerado normal para esa población ".
Este tipo de hipótesis no suele presentarse de manera explícita en el plan
de trabajo, sin embargo, en el momento de efectuar las pruebas estadísticas
para verificar las hipótesis de la investigación, se da por entendida su exis­
tencia.
También existen las llamadas Hipótesis estadísticas que son la transfor­
mación de las hipótesis de investigación y nulas en símbolos estadísticos.
Los dos ejemplos de hipótesis de trabajo y sus respectivas hipótesis nu­
las formuladas anteriormente, al expresarse como hipótesis estadísticas,
quedarían de la siguiente manera:
Hi: µ1 < µ2 ; Ho:µ 1 = µ2
Hi: P1 >30 % ; Ho: P1 = 30 %
Las variables, además de ser definidas como independientes o <lepen: ·
dientes, también pueden describirse de manera nominal y operacional. En
la definición nominal de una variable se ofrece la interpretación de su signi-

28
ficado, a fin de evitar confusiones o ambigüedades en la comprensión del
término o de la variable. Por su parte, la definición operacional se refiere a
la enumeración de los indicadores que conforman dicha variable.
En las investigaciones a nivel descriptivo este aspecto del "sistema teóri­
co" puede obviarse. No así en una investigación a nivel experimental o cua­
si experimental.
DEFINICIONES DE TÉRMINOS o glosario.- Cuando en un proyecto
se utilizan términos que pueden ser interpretados de diversas maneras, es
indispensable establecer claramente el significado bajo el cual será emplea­
do dicho término en la investigación. Esto tiene como propósito unificar
criterios en cuanto a su uso. De allí la necesidad de elaborar este listado sólo
cuando realmente se justifiquen su uso.

MARCO METODOLÓGICO
Una vez conformado el marco teórico, se construye el marco metodoló­
gico u operacional, es decir se define COMO se realizará la investigación.
Esta separación es sólo con fines didácticos, pues en la práctica el investiga­
dor piensa simultáneamente en varias cosas a la vez. Al definir los objeti­
vos, ya tiene una idea de como lograrlos, al definir las variables ya piensa en
como medirlas e incluso puede tener ciertas expectativas en cuanto a los po­
sibles resultados.
Sin embargo, para fines de presentar el proyecto o redactar el informe fi­
nal, y dado el carácter sistemático del método científico, es conveniente tra­
bajar siguiendo un esquema básico de investigación.
El marco metodológico tiene como propósito describir en detalle la ma­
nera como se realizará la investigación: como se hará la recolección de los
datos, como se procesará y presentará la información y como se realizará
el proceso de análisis estadístico.
Cada una de estas etapas (recolección, procesamiento y análisis) requie­
re de técnicas y procedimientos particulares dependiendo de tipo de investi­
gación a realizar.

Niveles y Tipos de investigación


La literatura revisada sobre este aspecto, presenta diferentes criterios de
clasificaciones de los niveles de investigación; aun cuando muchos autores

29
tienden a dividirlos en: estudios descriptivos, comparativos, correlaciona­
/es, experimentales y cuasi-experimentales.
Estudios descriptivos Estos permiten tener un conocimiento de como se
presenta un problema en una población (o parte de ella), la frecuencia con
que ocurre (cuántos), y quiénes presentan determinadas características. Los
estudios descriptivos buscan especificar las propiedades encontradas en la
población. Miden o evalúan diversos aspectos. Con ellos se describe un fe­
nómeno en la población en función de porcentajes, tasas y promedios. Los
diagnósticos de comunidad pueden ser un buen ejemplo de los estudios des­
criptivos.
Los estudios descriptivos se caracterizan porque resumen las caracterís­
ticas encontradas en la población. Presentan la magnitud del problema (pre­
valencia, incidencia). Describen los hechos o fenómenos pero no los expli­
ca. No requieren de hipótesis centrales explícitas. Representan el primer ni­
vel de investigación, aún cuando algunos autores consideran que puede
existir un nivel previo al descriptivo como lo es el nivel exploratorio, donde
se busca simplemente indagar sobre un tema o problema poco estudiado
con anterioridad. Su propósito es familiarizarse con el problema cuando
existe escasa información sobre éste.
Los estudios correlaciona/es buscan conocer la asociación o relación
entre dos o más variables estudiadas en los mismos sujetos, de una muestra.
Su utilidad radica en que permiten conocer el comportamiento de una varia­
ble, en función de otra variable a ella asociada.
Los estudios correlaciona/es se distinguen de los descriptivos, funda­
mentalmente en que, estos últimos buscan medir las variables encontradas
en la población, mientras que los correlacionales pretenden conocer el gra­
do de relación entre dos o más variables estudiadas en una población.
Los estudios comparativos se refieren al establecimiento de diferencias
entre dos o más grupos de interés, un ejemplo puede ser la necesidad de ve­
rificar si dos comunidades presentan una determinada morbilidad con la
misma frecuencia, o si el porcentaje de curación de las mismas enfermeda­
des, entre dos hospitales es diferente o no. Requieren que los grupos sean
comparables a fin de que el estudio tenga sentido, y sus conclusiones sean
válidas.

30
Los estudios comparativos, también denominados analíticos o explicati­
vos tienen como propósito conocer si existen diferencias estadísticamente
significativas entre los grupos comparados. Este tipo de estudio requiere el
uso de hipótesis de trabajo, tendientes a verificar las relaciones explicativas
causales. Es un nivel de investigación más avanzado que el descriptivo.
Los estudios experimentales se caracterizan por la introducción o "ma­
nipulación" de una variable causal o factor de riesgo, para luego conocer su
efecto. Un experimento científico se caracteriza por presentar tres propie­
dades: Manipulación de un factor (también llamado tratamiento experi­
mental) que el investigador administra a un grupo pero no al otro. Control
por parte del investigador sobre una o más situaciones experimentales. La
introducción del grupo testigo o control permite garantizar esta propiedad.
Distribución aleatoria de los sujetos asignados al grupo control y al grupo
experimental.
Para poder evaluar el efecto del factor causal es imprescindible conocer
las características de ambos grupos antes de iniciar el experimento, y medir
posteriormente, de acuerdo al tiempo fijado, el cambio o efecto producido
en el grupo de estudio.
En muchas oportunidades, no es posible realizar este tipo de estudio, en
todas las ciencias. En Ciencias de la Salud, en algunas áreas y por razones
éticas, se dificulta la experimentación de manera rigurosa. En las Ciencias
Sociales, además de razones éticas en algunos casos, la complejidad de las
variables y su dificultad para manipularlas y/o controlarlas, también limitan
la investigación experimental.
En los estudios experimentales y cuasi-experimentales se intenta deter­
minar la influencia de una o varias variables independientes sobre una va­
riable dependiente. La diferencia estriba fundamentalmente en que en los
estudios experimentales el investigador manipula a su conveniencia la o las
variables independientes y además asigna por azar, los sujetos a cada
grupo. En los cuasi-experimentales esto último no es posible. (Polit, 1 99 1 )
En el caso de la investigación en salud muchas veces es más dificil iden­
tificar un agente etiológico, que producir la medicina para combatirlo. Las
investigaciones en cáncer son un ejemplo de lo que ha costado identificar
factores cancerígenos. En oportunidades, un mismo equipo de investiga­
ción, con proyectos bien definidos, trabaja un problema a diferentes nive-

31
les, pues un hallazgo conlleva a un nuevo problema y así de manera perma­
nente.
Según el tipo de investigación, el estudio puede desarrollarse de manera
transversal, longitudinal, retrospectiva o prospectiva, dependiendo del mo­
mento de recopilación o registro de la información sobre el fenómeno estu­
diado.
En los estudios transversales se miden una sola vez las variables involu­
cradas; mientras que en los estudios longitudinales se miden en varias oca­
siones las variables, con el propósito de conocer la evolución de las mis­
mas. Implica seguimiento a través del tiempo.
Los estudios retrospectivos permiten indagar sobre hechos ocurridos en
el pasado, empleando para ello información registrada con anterioridad a la
investigación; o buscando del pasado información sobre el origen de mani­
festaciones actuales, como consecuencia de un hecho ocurrido tiempo
atrás. Por ejemplo, las exposiciones a factores de riesgo en el pasado, próxi­
mo o remoto, pueden provocar en la actualidad manifestaciones de sus
efectos; lo cual hace necesario indagar en los antecedentes el origen o la
causa del fenómeno que en la actualidad se ha disgnosticado.
Por su parte, para los estudios prospectivos toda la información se reco­
gerá con fines propios de la investigación, siguiendo los criterios estableci­
dos en el plan. Algunos autores mencionan los estudios retro-prospectivos,
donde se utiliza información sobre hechos ocurridos anteriormente, y el re­
gistro continúa una vez diseñado el estudio.
El marco metodológico incluye también la descripción del Universo
y de la Muestra, donde se realizará la investigación.
Población o Universo: Es la totalidad de sujetos o unidades de estudio
que poseen determinadas características observables. Ej., todos los habitan­
tes del estado Carabobo, o todos los niños menores de 1 año del Dtto. Va­
lencia, o las mujeres embarazadas atendidas en el Hospital Central de Va­
lencia en el lapso 1 990- 1 997, o todos los pacientes con hipertensión arterial
atendidos en la consulta de cardiología del H.C.V. durante el año pasado.
Muestra: Pocas veces es necesario o posible estudiar a toda la pobla­
ción, a menos que sea muy pequeña. Generalmente se estudia sólo una parte
de ella, la cual se denomina muestra, y se espera que esa parte o subconjun­
to posea las mismas características del universo.

32
En el proyecto de investigación o plan de trabajo se incluye el diseño es­
tadístico de la muestra con el propósito de asegurar que las conclusiones
obtenidas en los grupos de estudio (muestra) puedan inferirse al resto de la
población. En este diseño se describe:
1 - El Marco muestra/ que es el marco de referencia o sitio donde están
localizadas todas las unidades de estudio de la población. Este puede
ser todos los elementos o unidades que conforman la población, un
archivo de historias, un mapa fisico o plano donde estén incluidos to­
das las unidades de muestreo. De la estructura del marco muestral, de­
pende en gran parte, el tipo de muestra que se utilice, y las técnicas de
recolección de datos.
2- Unidad última de muestreo se refiere a cada uno de los elementos que
será objeto de estudio en la población. De cada unidad de muestreo se
toma información sobre las variables. Pueden ser individuos, fami­
lias, objetos, radiografías, historias clínicas, etc.
3- El tipo de muestra a utilizar, la cual puede ser probabilística (aleatoria
simple, estratificada, de conglomerado, polietápica) o no probabilísti­
ca (opináticas, errático y de voluntarios). En caso de utilizar muestras
probabilísticas, es conveniente mencionar también el procedimiento
de azar mediante el cual se seleccionan las unidades de muestreo.
4- El tamaño de la muestra, y la proporción que ésta representa del uni­
verso. Es necesario que la muestra sea representativa de la población
no sólo en calidad, sino también en cantidad.
El marco metodológico incluye, además, la descripción del instrumento
de recolección de datos, así como las técnicas empleadas para tal fin. Los
instrumentos debidamente elaborados o seleccionados para obtener la in­
formación de manera completa y organizada. Su elaboración puede resultar
dificil dependiendo de la cantidad de variables a estudiar, por lo cual, deben
estar en función de los objetivos del trabajo. En algunos casos puede ser ne­
cesario utilizar más de un instrumento.
Cuando se trata de hacer mediciones precisas de algunas variables a tra­
vés de ciertos instrumentos, es conveniente conocer su confiabilidad y vali­
dez, la primera se refiere a la capacidad del instrumento para dar los mismos
valores cuando se aplica en diversas ocasiones, y la segunda a la capacidad
de medir lo que realmente se quiere medir.

33
Cuando la información es recogida por otras personas distintas al inves­
tigador, es necesario asegurarse que conocen y manejan debidamente el
instrumento y la técnica de recolección a utilizar. En tal caso, deben recibir
entrenamiento previo. El uso de computadoras para procesar la informa­
ción requiere de datos debidamente codificados, lo cual debe considerarse
en el momento de elaborar el instrumento. Antes de su aplicación definitiva
es recomendable efectuar una prueba piloto a objeto de determinar su fun­
cionalidad.
El otro aspecto importante de la metodología es establecer claramente
las técnicas de análisis a utilizar. Estas dependen del tipo de investigación,
de los objetivos y de las variables en estudio.

MARCO ADMINISTRATIVO
Todo trabajo de investigación necesita recursos de diversa naturaleza,
según el tipo. Estos recursos deben ser previstos en el plan de trabajo y ga­
rantizar la disponibilidad de ellos. Estos suelen ser: financiamiento, perso­
nal, equipos, bibliografía, etc., además del tiempo; en cuyo caso es conve­
niente la elaboración de un cronograma o ruta crítica para distribuir los pe­
ríodos en los cuales se realizarán cada una de las etapas sub-etapas de todo
el trabajo de investigación. Siendo particularmente necesario cuando el
tiempo pueda alterar los resultados del estudio.
Por lo tanto, en el marco administrativo se elabora un listado de los Re­
cursos Humanos (nombre de los investigadores, asesores y colaboradores
directos), Institucionales (patrocinantes o participantes) y Materiales
(equipos, reactivos, tratamientos, materiales de oficina, etc.) necesarios
para la investigación.

REFERENCIAS BIBLIOGRÁFICAS.
Otro elemento de presentación imprescindible en todo proyecto de in­
vestigación o informe final, es la bibliografía o referencias bibliográficas de
las obras citadas en el marco teórico, o en cualquiera de sus partes; lo cual
permite conocer las fuentes documentales que dan soporte a la investiga­
ción.
Por regla general, la referencia comprende cinco elementos fundamenta­
les: a) autor o autores; b) fecha de la publicación; c) título de la obra; d) lu-

34
gar de la edición; e) editorial. Sin embargo, pueden requerirse otros ele­
mentos, dependiendo de los documentos citados. Las referencias se orde­
nan alfabéticamente, según el apellido del autor.
Tan importante es la presentación de la bibliografia como la forma en
que ésta se efectúa. De allí la conveniencia de establecer normas para su co­
rrecta organización. La A.P.A. (Americam Psychological Asociation) pro­
puso unificar un estilo internacional, donde se consideran cada uno de los
posibles casos:
Libros:
Comprende: Apellido del autor, coma, inicial o iniciales del nombre,
punto, fecha entre paréntesis. punto, título subrayado o en letra cursiva,
punto, ciudad donde fue editada, dos puntos, nombre de la casa editora.
Ejemplos:
a) Si es un solo autor:
Cerda, H. (1991). Los elementos de la investigación. Bogotá: El Búho.
Gilbert, N. (1981). Estadística. México: Interamericana.
b) Cuando son varios los autores, todos deben indicarse separados por co­
mas, excepto el último quien va precedido de la conjunción "y".
Calello, H. y Neuhaus, S. (1990). La investigación en las ciencias hu­
manas. Caracas: Fondo Editorial Tropykos.
Scheaffer, R., Mendenhall, W. y Ott, L.(1987). Elementos de muestreo.
México, D.F.: Grupo Editorial Iberoamérica.
Nota: En el momento de citar estas obras en el texto, allí sólo se incluye
el apellido del primer autor, seguido de la expresión et al y el año. Por
ejemplo: Scheaffer et al. (1987). Pero en la bibliografia todos los autores
deben nombrarse, como se mencionó anteriormente.
c) Cuando el apellido del autor es muy corriente suelen incluirse los dos
apellidos, manteniéndose igual los demás elementos. Igualmente en
caso de que el autor sea popularmente conocido con sus dos apellidos.
Ejemplos:
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodolo­
gía de la investigación. Bogotá: McGraw-Hill.

35
Prieto Figueroa, L. B. (1985). Principios generales de la educación. Ca­
racas: Monte Avila Editores.
d) Cuando se cita el autor de un capítulo de un libro, el cual es una compila­
ción; en la referencia primeramente sea menciona al autor del capítulo,
año y título. Luego la preposición "En" y seguidamente Iniciales y ape­
llido del compilador, del editor o del director; mencionando entre parén­
tesis esta condición: (Comp.), (Eds.) o (Dtor.). Título de la obra; luego,
entre paréntesis número de las páginas del capítulo consultado; y por úl­
timo, lugar de edición y editorial, al igual que en la referencia de cual­
quier libro. Ejemplos:
Bartolomé, M. ( 1 987). Estudio de las variables en la investigación en
educación. En J. Arnau (Dtor.) Métodos de investigación en las Ciencias
Humanas. (pp 1 03-1 38). Barcelona, España: Omega.
Shefter, M. (1997). Partidos interna y externamente movilizados. En J.
Preciado (Comp.) Auge y caída de las maquinarias politicas venezola­
nas. (pp 1 5 1 -1 58). Valencia, Venezuela: Fuente Alterna.
Nota: En cualquier referencia donde la obra ha sido editada en un lugar
poco conocido o en ciudades cuyo nombre se repite en otros países, en la
referencia se incluye también el nombre del estado o del país.
e) Cuando existen varias ediciones de la obra, el número de la edición con­
sultada se menciona después del título. Ejemplos:
Méndez, l., Guerrero, D., Moreno, L. y Sosa, C. ( 1 987). El protocolo de
investigación. Segunda edición. México, D.F.: Trillas.
Polit, D. y Hungler, B. P. ( 1 99 1 ). Investigación Científica en Ciencias de
la Salud. Tercera edición. México, D.F.: Interamericana.
t) Cuando el autor es un Organismo o Institución:
Organización Panamericana de la Salud. (1 990). Manual de organiza­
ción y procedimientos hospitalarios. Sao Paulo, Brasil: O.P.S.
Consejo Nacional de la Cultura. (199 1 ). Presencia y luz de Armando Re­
verán. Caracas: Arte.
Artículos de revistas :
Además de los elementos contenidos en las referencias antes menciona­
das, en el caso de las revistas se le agregan otros datos, tales como: Título

36
del artículo; número de la publicación; volumen (si lo tienen); número(s) de
la(s) página(s) ocupada(s) por el artículo, y separados por guiones.
Apellido del autor e inicial del nombre. Año de publicación (entre parén­
tesis). Título del artículo. Nombre de la revista (subrayado o en letra cur­
siva). Número de la revista. Volumen. Números de las páginas donde
aparece el artículo.
Ejemplos:
Guzmán, C. (1997). Hablando de los libros. Revista Ciencias de la Edu­
cación, 14, 261-264.
Moreno J., E. (1990). Sociedad y Ecología. Nueva Sociedad, 107, 21-26.
Ruiz B., C. (1996). La competencia tutorial. Planiuc, 22, 93-118.
Otros documentos:
a) Si la obra no ha sido aún publicada, pero se conoce su pronta publicación,
en lugar de la fecha, se escribe la expresión "(en prensa)".
Ejemplo:
Puertas, E. (en prensa). Diversos enfoque de Educación para la Salud.
b) Si el documento no ha sido publicado y se desconoce su posible publica­
ción, se indica con la palabra "(paper)". Ejemplos:
Blanck, E. (1987). Un modelo para planificar y desarrollar programas
de Educación para la Salud. Valencia: Universidad de Carabobo (pa­
per).
Puertas, E., Barreta, T. y Piñate, A. (1993). La revolución de los para­
digmas científicos y la educación andragógica. Valencia, Venezuela:
Instituto Internacional de Andragogía (paper).
c) Cuando se trata de ponencias presentadas en Congresos, Seminarios,
Simposiums, Conferencias, etc. Se especifica autor, año, título, nombre
del evento, lugar, mes y la expresión "paper". Ejemplo:
Melet, N. (1991). Locus de control y rendimiento académico. XXIII
Congreso Interamericano de Psicología. San José, Costa Rica. 7-12 de
julio. (paper).
Puertas, E. ( 1 989).Locus de control y programas de reducción de peso.
Primer seminario internacional de Psicología de la salud. La Habana,

37
Cuba. 1-4 de noviembre. (paper).
Orden alfabético
a) La bibliografia debe ordenarse alfabéticamente según el apellido del au­
tor, o primer autor, en caso de que sean varios los autores.
b) Si se citan varias obras de un mismo autor, éstas se ordenan cronológica­
mente: según el año de la publicación; o si tiene varias publicaciones en
un mismo año, después del año se coloca la letra "a", "b", "c", etc., según
los meses en los cuales fueron presentadas.
c) Si un autor además es ca-autor de otras obras, donde él figura en primer
lugar, éstas se colocan posterior a las obras individuales de dicho autor,
ordenadas según el apellido del segundo autor; independientemente del
año de la publicación. Ejemplos.
Romero García, O. (1 980). Locus de control, inteligencia, estatus so­
cioeconómico y rendimiento académico. Laboratorio de Psicología, 1O,
Toda.
Romero García, O. (1981 a). Necesidad de logro, locus de control y ren­
dimiento académico. Laboratorio de Psicología, 19, Toda.
Romero García, O. (198 1 b). Motivación intrínseca, motivación de logro
y valor incentivo de los estudios superiores. Laboratorio de Psicología,
27, toda.
Romero García, O. (199 1 ). Motivaciones sociales y crecimiento psicoló­
gico. Mérida, Venezuela: ROGYA, C.A.
Romero García, O. y Pérez de Maldonado, l. ( 1 985). Escala Levenson de
locus de control: Análisis factorial en Venezuela. Laboratorio de Psico­
logía - ULA, 51, Toda.
Romero García, O. y Salón de Bustamante, C. (1990). Poder, afiliación,
estrés y estado general de salud. Memorias EVEMO, 3 , 444-449.

Por último, en el proyecto se incluyen los anexos, pudiendo ser de diver­


sos tipos. Los instrumentos de recolección de la información suelen incluir­
se en este aparte.
En resumen el plan de trabajo o proyecto de investigación contiene los
siguientes aspectos, en forma general:

38
Título del trabajo.
- Planteamiento del problema:
- Enunciado del problema.
- Justificación de la investigación e importancia del problema.
- Formulación del problema.
- Comprobación y control del problema.
Objetivos de la investigación: Generales y Especificas.
- Marco teórico:
- Marco histórico o Antecedentes o Puesta al día del tema.
- Marco conceptual o Bases teóricas.
- Sistema teórico: Definición de variables e Hipótesis de Trabajo (si
las requiere).
- Definición de Términos (si las requiere).
- Marco metodológico: Nivel y tipo de investigación Descripción de la
Población y muestra. Diseño muestra!. Descripción de técnicas e ins­
trumentos de recolección de datos Descripción de las técnicas para el
análisis estadístico.
- Marco administrativo:
- Cronograma de actividades o ruta crítica.
- Recursos humanos.
- Recursos institucionales.
- Recursos materiales.
- Bibliografia
- Anexos

Un esquema similar se sigue para la elaboración del informe final, una


vez concluida la investigación. En tal caso es necesario incluir tres aspectos
adicionales: Resultados obtenidos, Análisis e interpretación de esos resul­
tados (discusión), y por último, las Conclusiones del trabaj o, y como aporte
adicional, las Recomendaciones propuestas por el investigador, en función
de las conclusiones obtenidas.
En resumen, el Informe Final contiene los siguientes aspectos:
Título del trabajo.
- Planteamiento del problema:

39
- Enunciado del problema.
- Justificación de la investigación e importancia del problema.
- Formulación del problema.
- Comprobación y control del problema.
Objetivos de la investigación: Generales y Especificas.
Marco teórico:
- Marco histórico o Antecedentes o Puesta al día del tema.
- Marco conceptual o Bases teóricas.
- Sistema teórico: Definición de variables e Hipótesis de Trabajo.
- Definición de Términos (si las requiere).
Marco metodológico: Nivel y tipo de investigación Descripción de la
Población y muestra. Diseño muestra!. Descripción de técnicas e ins­
trumentos de recolección de datos Descripción de las técnicas para el
análisis estadístico.
- Resultados del estudio
- Cuadros estadísticos
- Gráficos estadísticos (cuando sean necesarios)
- Análisis e interpretación de los resultados (Discusión de los resulta-
dos).
- Conclusiones y Recomendaciones.
Marco administrativo
- Cronograma de actividades o ruta crítica.
- Recursos humanos
- Recursos institucionales
- Recursos materiales.
- Bibliografia
- Anexos

BIBLIOGRAFÍA
Briones, G. (1981 ). Métodos y técnicas de investigación para las ciencias
sociales. Bogotá: Uniandes.

40
Camel V., Fayad. (1979). Estadística Médica y de Salud Pública. Cuarta
edición. Mérida, Venezuela: Talleres Gráficos Universitarios.
Canales, F., Alvarado, E. L. y Pineda, E. B. (1989). Metodología de la in­
vestigación. Segunda edición. Colombia: Carvaj al, S.A.
Cañedo D., Luis. (1987). Investigación Clínica. México, D. F. Nueva Edi­
torial Interamericana.
Cerda, H. (1991). Los elementos de la investigación. Bogotá: El Búho.
Ferrero, C. (1971). Estadística, Medicina Sanitaria y Administración de
Salud. Buenos Aires: El Ateneo.
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Hill, B. (1965). Principios de Estadística Médica. Tercera edición. Buenos
Aires: El Ateneo.
Mainlan, D. (1963). Estadística Médica. Segunda edición. México, D.F. In­
teramericana, S.A.
Méndez, l., Guerrero, D., Moreno, L. y Sosa, C. (1987). El protocolo de in­
vestigación. Segunda edición. México, D.F.: Trillas.
Morichau-Beachaunt,J. (1971). La Salud en el Mundo. Barcelona, España:
Oikos-Tau, S.A. Ediciones.
Polit, D., Hungler, B. (1991). Investigación Científica en Ciencias de la Sa­
lud. Tercera edición. México, D.F. : Interamericana. Seijas, F. (1981).
Investigación por muestreo. Caracas: División de publicaciones de la
U.C.V.

41
CAPÍTULO 11
Muestreo
Universos o Poblaciones. Universos finitos o infinitos. Poblaciones cautivas.
Muestras. Ventajas y desventajas de las muestras. Tipos de muestras: Probabilísti­
cas y No probabilísticas. Muestras Probabilísticas: Muestras aleatorias simples.
Muestras estratificadas. Muestras de conglomerados. Muestras combinadas.
Muestras polietápicas. Técnicas de azar: Azar simple. Azar sistemático Tabla de
números aleatorios. Muestras No probabilísticas: Muestras opináticas. Muestras
erráticas. Muestras de voluntarios. Características de una buena muestra. Tama­
ño de la muestra. Ejercicios.

43
l. UNIVERSO Y POBLACIÓN
Desde el punto de vista estadístico, se entiende por universo o pobla­
ción, a un conjunto de sujetos en los cuales está presente una o varias ca­
racterísticas observables, y que son objeto de estudio. Definirlo de esta ma­
nera tan general, permite pensar en una gran variedad de universos: nume­
rosos, escasos, simples, complejos, finitos, infinitos, etc. Sin embargo, en
todo caso lo importante es que el universo de interés debe ser delimitado,
para hacerlo manejable desde el punto de vista estadístico.
La delimitación de un universo de estudio, se da básicamente, ubicándo­
lo en el espacio y en el tiempo. Es decir, el conjunto de sujetos de interés
está constituido por aquellos cuyas características se establecen en un mo­
mento y en un lugar específico.

Universos finitos e infinitos.-


Los universos pueden ser definidos con relación a su extensión en finitos
e infinitos. Los primeros son limitados en cuanto al número de elementos.
Siendo posible enumerar a todas sus unidades. Por ejemplo, los pacientes
hospitalizados en una Clínica, los estudiantes de la Escuela de Medicina,
los productos farmacéuticos producidos por una empresa del ramo, los cen­
tros asistenciales en un área del país, etc.
Otras poblaciones conformadas por cantidades ilimitadas de unidades
no permiten ni siquiera formarse una idea aproximada de cuantos elemen­
tos la integran, por lo cual se conocen con el nombre poblaciones infinitas.

Poblaciones cautivas
Algunos universos, hablando estadísticamente, son finitos y cautivos. Es
decir, se conoce el número de elementos que lo constituyen y además se en­
cuentran circunscritos en un espacio determinado. Por lo tanto pueden ser
contactados fácilmente, haciendo menos laboriosa la recolección de los da­
tos. Por ejemplo, los pacientes recluidos en un hospital, los ancianos resi­
dentes en una unidad geriátrica, los escolares inscritos en un Centro de En­
señanza, etc. Este tipo de poblaciones ayudan a realizar estudios más com­
pletos y precisos, pero lamentablemente, tienen la desventaja, de
constituirse en poblaciones con características muy limitadas por sus pro-

45
pias condiciones, proporcionando muestras representativas sólo para el
conglomerado de donde han sido extraídas.
Este tipo de universos presenta la facilidad de ofrecer, casi de manera in­
mediata la lista de unidades que lo conforman, constituyendo el marco
muestra/, siendo éste indispensable para la selección de la muestra. De no
existir el marco muestral, es aconsejable construirlo antes de iniciar el pro­
ceso de muestreo.

11. MUESTRAS
Independientemente del tamaño o complejidad del universo de interés,
lo usual en la investigación, es trabajar con una parte del universo que lo re­
presente, es decir, con un subconjunto del mismo en el cual estén presentes
sus características de interés. Dicho subconjunto recibe el nombre de
MUESTRA.
Con una muestra se busca que, estudiando una porción reducida del uni­
verso se puedan obtener conclusiones similares a las que se tendrían si se
analizara la totalidad del universo. Aún cuando las muestras permiten efec­
tuar este tipo de generalizaciones siempre existe cierto margen de error, por
lo cual, tales generalizaciones no pueden ser absolutas.
Sin embargo, el margen de error, al cual está sometido todo estudio reali­
zado mediante muestras, puede ser controlado y reducido, de manera tal
que no distorsione los resultados obtenidos en la muestra, con respecto a los
del universo. Dicho en otros términos: no se produzca un sesgo en los esti­
mados calculados en la muestra.
(sesgo: tendencia del estimado a desviarse del parámetro real.)
(estimado: Valor de una característica en el universo, pero calculado a
partir de una muestra.)
Así mismo, el margen de error, puede resultar mayor o menor, depen­
diendo del tipo de muestreo que se utilice. Para Pardiñas ( 1979), el mues­
treo consiste en seguir un método, un procedimiento tal que al escoger un
grupo pequeño de la población se pueda tener un grado de probabilidad de
que ese pequeño grupo efectivamente posee las características del universo
que se está estudiando (p 79). Se estima que son más representativas de la

46
población, las muestras obtenidas mediante procedimientos aleatorios, que
aquellas seleccionadas a través de otros procedimientos.
Ventajas de las muestras: Las razones por las cuales se utilizan mues­
tras en lugar de todo el universo son, entre otras:
1) Permiten ahorrar tiempo, recursos y trabajo.
2) Con ellas se puede obtener información de mejor calidad, más verás,
con menos errores, dado que es menor el número de sujetos a estu­
diar, por lo tanto, disminuyen las probabilidades de equivocación.
Permiten centrar la atención en menor número de casos.
3) Permiten la obtención de datos que de otra forma serías imposible lo­
grar, especialmente cuando por razones de análisis, los elementos so­
metidos a estudio o a prueba deben ser destruidos en ese proceso. Ej.
una muestra de sangre para efectuar un examen de hematología com­
pleta.
4) Cuando el universo es infinito o muy extenso, la única forma de reali­
zar estudio en él, es mediante el uso de muestras.
A pesar de todas estas ventajas de las muestras, también se le atribuyen
algunas desventajas o limitaciones:

Desventajas de las muestras


1 - En algunas investigaciones, cuando en el universo es muy pequeña la
proporción de sujetos que presentan determinada característica, en la
muestra ésta suele aparecer alterada, resultando fácil evidenciar esa
desproporción, por lo cual, el uso de muestras puede parecer de poca
credibilidad, especialmente para aquellas personas con escasos cono­
cimientos de muestreo.
2- El uso de muestras siempre genera un error denominado error de
muestreo, el cual representa la diferencia que puede existir entre el es­
timado y el parámetro. Afortunadamente, la magnitud de este error
puede ser calculado mediante las fórmulas de error estándar, y redu­
cido a voluntad, al aumentar el tamaño de la muestra. Además, exis­
ten procedimientos estadísticos que permiten determinar el tamaño
adecuado de la muestra, utilizando las fórmulas del error estándar.

47
En esencia, a través de las muestras se pretende obtener estimados lo
más cercanos posible a los valores del universo o población. En este sentido
es conveniente distinguir entre la exactitud y la precisión del estimado, al
efecto, la exactitud de un estimado se refiere al grado en el cual éste se
aproxima al parámetro. La precisión mide el grado en el cual un estadísti­
co representa a su parámetro. Por esta razón se hace referencia a la preci­
sión de los estimados muestrales más que a su exactitud (Bisqueda, 1 989).

TIPOS DE MUESTRA: Probabilísticas y no Probabilísticas.


Teniendo en cuenta la estructura y los procedimientos de selección pue­
den distinguirse dos tipos de muestras, y dentro de cada uno de ellas, dife­
rentes clases, las cuales reciben el nombre del método de muestreo que las
produce, por lo cual se habla indistintamente de tipos de muestras o de tipos
de muestreo.
El primer tipo, denominado Muestras aleatorias o Probabilísticas está
basado en la "Ley de los grandes números" y en el "Cálculo de probabilida­
des". De estas dos leyes fundamentales para la Estadística se infieren aque­
llas que sirven de base más directamente al muestreo, a saber:
Ley de regularidad estadística, según la cual un conjunto de "n" unida­
des tomadas al azar, de un conjunto mayor N, tendrá la probabilidad de po­
seer las características del conjunto mayor.
Ley de la inercia de los grandes números establece que en la mayoría de
los fenómenos, cuando una parte del conjunto varia en una dirección, existe
la probabilidad que otra parte, de igual tamaño, varíe en dirección opuesta.
Ley de la permanencia de los números pequeños, la cual plantea que si
una muestra, suficientemente grande es representativa de la población, una
segunda muestra de igual magnitud deberá ser semejante a la primera; y si
en la primera muestra se encuentran pocos individuos con características
poco frecuentes, es de esperarse encontrar igual proporción en la segunda
muestra; e igualmente en muestras sucesivas.
Basándose en estas leyes, se estima que las muestras aleatorias, son más
representativas del universo de donde han sido elegidas; y sólo con ellas los
resultados obtenidos pueden ser inferidos y establecer conclusiones válidas
para el universo. Además, permiten ftjar, por adelantado, el grado de preci­
sión deseado o error máximo permitido para los "estimados" que serán ob-

48
tenidos en la muestra. Solamente las muestras probabilísticas son suscepti­
bles de tratamientos estadísticos, cuando se busca conocer la significancia
de los resultados.
En la conformación de las muestras probabilísticas todos los elementos
del universo tienen una probabilidad conocida y diferente de cero de perte­
necer a la muestra, y será el azar el que determine quienes la conformarán;
además, las unidades se seleccionan independientemente unas de otras.

TIPOS DE MUESTRAS PROBABILÍSTICAS.-


La literatura especializada en esta área reporta diferentes tipos de mues­
tras probabilísticas, sin embargo en este capítulo se hará referencia sólo a
las utilizadas con mayor frecuencia.
Muestras aleatorias simples.- Se conforman al elegir por azar a n ele­
mentos de una población de tamaño N, de manera que cada elemento del
universo tenga la misma probabilidad de ser seleccionado para formar parte
de la muestra.
El muestreo aleatorio simple es el método más sencillo, aunque no nece­
sariamente más fácil, ya que requiere de un listado de todos los elementos
de la población, lo cual en oportunidades resulta laborioso, en especial
cuando se trata de universos amplios o dispersos. En este listado o marco
muestra/ se enumeran los elementos de l a N, y luego, mediante procedi­
mientos aleatorios, se extraen separadamente los n elementos de la muestra.
Se utiliza en poblaciones muy homogéneas, con varianzas próximas a cero
(con poca variabilidad).
Los elementos que conformarán la muestra pueden ser seleccionados del
marco muestra! bajo dos modalidades:
a) Con reemplazamiento, donde cada uno de los elementos ya seleccio­
nados retoma nuevamente al conjunto o universo, conformando de
esta manera poblaciones infinitas, en cuyo caso las unidades muestra­
les pueden formar parte de la muestra varias veces.
b) Sin reemplazamiento, donde las unidades pueden ser seleccionadas
sólo una vez, y al serlo quedan excluidas del marco muestra!. En este
caso el muestreo recibe el nombre de irrestrictamente aleatorio.

49
Muestras aleatorias estratificadas.- Para este tipo de muestreo se clasi­
fican primero los elementos de la población en clases o estratos (si es que
previo a la investigación no están clasificados) y luego se seleccionan de
cada estrato, una muestra simple al azar. En cada estrato están agrupados
elementos similares, de manera que la varianza es pequeña y el grupo resul­
ta homogéneo. También se busca que los estratos sean diferentes entre sí;
que entre ellos exista suficiente variación.
En el muestreo estratificado no es necesario que todos los elementos ten­
gan la misma probabilidad de selección, es suficiente con que tengan algu­
na probabilidad de pertenecer a la muestra.
La forma en que se eligen los elementos n de la muestra en los estratos es
denominada afzjación, y puede realizarse de dos maneras: Afijación pro­
porcional, cuando se elige de cada estrato la misma proporción o porcentaje
de elementos, esto produce un muestreo proporcional, siendo éste el más
comúnmente utilizado. Según este procedimiento, aun cuando se utiliza el
mismo porcentaje en cada estrato, el número de elementos en la muestra va­
ría de un estrato a otro, dependiendo del tamaño del estrato en la población.
Afzjación óptima, donde se busca que la cantidad de cada estrato sea propor­
cional al número de elementos y a la desviación estándar de la variable a
medir. Este tipo de muestreo produce el menor error muestral.
Muestras de conglomerado.- En las muestras antes mencionadas, las
unidades de muestreo (sujetos u objetos elegidos para la muestra) coinciden
con las unidades de estudio, de análisis o de observación (sujetos u objetos
en quienes se observarán las variables de interés). En las muestras de con­
glomerados no se presenta esta situación. En ellas se eligen al azar conjun­
tos o conglomerados de individuos, en este caso, no se seleccionan sujetos
individuales, sino más bien coryuntos de individuos. Las unidades de mues­
treo son conglomerados, los cuales deben ser internamente lo más hetero­
géneos posibles en cuanto a las variables en estudio, pero lo más homogé­
neo posible entre ellos; esto es, que las variaciones internas entre los ele­
mentos sean grandes, y entre los conglomerados las diferencias sean
pequeñas.
Es importante establecer las diferencias entre estratos y conglomerados.
Los elementos dentro de cada estrato deben ser lo más homogéneos posi­
bles, mientras que los de cada conglomerado deben ser internamente hete­
rogéneos. Asimismo, los estratos entre sí deben ser heterogéneos (un estra-

50
to diferente a otro estrato), y los conglomerados entre sí homogéneos (un
conglomerado similar a otro).
Además, existe el muestreo de conglomerado con estratificación, tam­
bién denominado Muestras combinadas o mixtas. La escogencia de los su­
jetos a estudiar se realiza tomando de cada estrato del universo un determi­
nado número de conglomerados. De esta manera se utilizan las ventajas de
ambos procedimientos. Se recoge la información en grupos y se mantiene la
representatividad de cada estrato del universo en la muestra.
Muestras polietápicas.- En grandes poblaciones, por su estructura, las
investigaciones suelen resultar complejas, lo cual dificulta el diseño de téc­
nicas de muestreo sencillas. En estas circunstancias es conveniente realizar
un muestreo por etapas, donde se van conformando muestras sucesivas, con
técnicas diferentes, según sea el caso.
El procedimiento indica que lo primero es dividir el universo en áreas,
siendo cada una de estas áreas definidas como "unidades primarias de
muestreo ". De ellas se elige una primera muestra. Los elementos que con­
forman esta muestra se consideran "unidades secundarias de muestreo ", de
las cuales se efectúa una segunda elección, para conformar la segunda
muestra. En cuyo caso, sus elementos reciben el nombre de "unidades ter­
ciarias de muestreo ", de donde nuevamente puede efectuarse otra selec­
ción, y así sucesivamente hasta llegar a las "unidades últimas de muestreo "
o unidades muestrales, los cuales conformarán la muestra definitiva para la
investigación.
Cada selección hecha sirve de base para otra selección más pequeña. Por
ejemplo, el universo de estudio puede ser un distrito, el cual se divide en
áreas (unidades primarias de muestreo) de donde se eligen algunas que con­
formarán la primera muestra. Luego estas áreas se dividen en sectores (uni­
dades secundarias de muestreo) y de ellas se selecciona la segunda muestra,
conformada en este caso, por algunos sectores. Estos sectores están distri­
buidos en manzanas o cuadras (unidades terciarias de muestreo) y de ellas
se elige otra muestra referida a las cuadras. En estas cuadras se encuentran
ubicadas las viviendas ( unidades últimas de muestreo) de las cuales se eli­
gen algunas que conformarán la muestra de estudio.
Distrito � Areas � Sectores � Cuadras � Viviendas.

51
Si el propósito de la investigación es obtener información sobre las ca­
racterísticas de las viviendas (tipo, materiales de construcción, comodida­
des, servicios, etc.), ellas serán las unidades de estudio además de unidades
últimas de muestreo. Pero si el propósito de la investigación es conocer ca­
racterísticas de los moradores (edad, ocupación, grado de instrucción, in­
gresos, morbilidad, etc.) de estas viviendas, ellas serán las unidades últimas
de muestreo y sus ocupantes, las unidades de estudio.
En resumen, las muestras polietápicas son muestras sucesivas, elegidas
con técnicas diferentes, puesto que las distintas muestras se obtienen sobre
fracciones o conglomerados variables del universo total.
En un estudio para conocer la morbilidad en menores de 15 años en la
ciudad de Valencia, dado lo complejo del universo es necesario precisar el
proceso de muestreo hasta llegar a las unidades de estudio, siendo en este
caso los menores de 1 5 años. En un muestreo por etapas puede procederse
de la manera siguiente:
a) Dividir a la ciudad en zonas de acuerdo a las características socio-econó­
micas de las mismas.
b) Escoger de manera aleatoria dentro de cada zona, las áreas residenciales
en las cuales se ubican las unidades de muestreo: barrios, urbanizacio­
nes, etc.
c) Una vez determinados las áreas residenciales, se escogen al azar calles de
cada una de los barrios o urbanizaciones seleccionados.
d) Una vez escogidas las calles, de nuevo, con un proceso aleatorio se esco­
gen las viviendas (unidades últimas de muestreo) en las cuales se aplica­
rá la encuesta de morbilidad.
e) En cada vivienda se determina si existen personas menores de 1 5 años
(unidad de estudio) y se hace el estudio de morbilidad respectivo. En
caso de no haber personas que satisfagan las condiciones del universo, se
sustituye la vivienda por otra a fin de no disminuir innecesariamente el
tamaño de la muestra.

TÉCNICAS DE AZAR:
En las muestras probabilísticas, las unidades de muestreo son elegidas
mediante procedimientos o técnicas de azar, como por ejemplo: azar sim-

52
ple, azar sistemático y la tabla de números aleatorios o números aleatorios
generados por computadoras.
Azar simple: Esta técnica consiste en elaborar una lista con todas las uni­
dades que configuran el universo (marco muestral), numerando cada una de
ellas; luego por sorteo (loterías, bingo, papelitos, etc.) se van obteniendo los
números que corresponden a las unidades de muestreo hasta completar el
tamaño de la muestra deseado.
Azar Sistemático: Se parte también de una lista completa de las unida­
des que integran el universo y se continúan los siguientes pasos:
a) Se calcula una constante, denominada K, la cual se obtiene de dividir
"N" (total de unidades en el universo) entre "n" (número de unidades
en la muestra.
N
K =­
n
b) Una vez calculada "K", se efectúa un sorteo para escoger un número
igual o menor que K, ese número corresponde al primer sujeto de la
muestra. Para obtener los restantes sujetos se le suma a ese primer nú­
mero el valor de K, luego al resultante se le suma K nuevamente y así
de manera sucesiva hasta completar el tamaño deseado para la mues­
tra. Este método es práctico cuando el universo es numeroso.
Tabla de Números Aleatorios: Se recomienda generalmente para mues­
tras pequeñas, consiste en el uso de una tabla constituida por filas y colum­
nas de números distribuidos completamente al azar. Existen varias versio­
nes de esta tabla, siendo las más utilizadas las preparadas por L. N. Tippett,
Fishcer, Y stes, Kendall, entre otras, y cualquiera de ellas pueden conseguir­
se en los diversos textos de estadística. También, en la actualidad se pueden
generar números aleatorios por medio de la computadora usando los dife­
rentes paquetes estadísticos que se encuentran a disposición en el mercado
(SPSS, STAGRAF, STATPAC, MYSTAT, SIGMA, etc.).

MUESTRAS NO PROBABILÍSTICAS
Se caracterizan éstas porque la selección de los elementos no depende de
la probabilidad, sino de otros factores diferentes al azar. La selección es
subjetiva. Aquí el procedimiento no es mecánico, ni basado en fórmulas de

53
probabilidades, éste depende de la toma de decisiones de una o varias per­
sonas, o de otras circunstancias. Por esta causa, las muestras no probabilís­
ticas pueden ser: opináticas o intencionales, circunstanciales o erráticas, y
de voluntarios o de autoselección.
Las muestras opináticas requieren cierto conocimiento previo de la po­
blación, por tal motivo el investigador está en capacidad de indicar cuales
elementos del universo serán objeto de estudio, por considerar los "típicos "
o representativos del problema investigado. En sí es el investigador, quien
según su opinión y los objetivos del estudio, elige a los sujetos que confor­
marán la muestra.
Las muestras circunstanciales o erráticas se forman con los casos o
elementos que el investigador tiene a su alcance. Están constituidas por gru­
pos de personas que en determinado lapso de tiempo acuden o transitan por
un lugar específico. Son muestras formadas por sujetos errantes, para efecto
del encuestador.
Las muestras de voluntarios se conforman con los sujetos que deciden,
por voluntad propia participar en la investigación, una vez que conocen sus
propósitos.
Utilizar una muestra probabilística o una no probabilística depende de
los objetivos del estudio, del esquema de investigación y de la contribución
científica que dará dicho estudio. Existen oportunidades en las cuales se
justifica el uso de muestras no probabilística, aún cuando éstas generalmen­
te producen resultados sesgados y son poco representativas del universo.

CARACTERÍSTICAS DE UNA BUENA MUESTRA


Las condiciones para que una muestra sea considerada buena es que sea
adecuada en calidad y en cantidad. La primera condición viene dada por la
representatividad, la cual es más segura conseguir cuando la muestra se ob­
tiene mediante procedimientos aleatorios. La segunda condición se satisfa­
ce mediante procedimientos matemáticos.

Tamaño de la muestra
El tamaño de la muestra está en función del tamaño del universo. Se dice
que debe ser proporcional a éste. Sin embargo, cuando el universo es muy
extenso, no es indispensable que la muestra sea tan numerosa como él; es

54
cuestión de determinar cual es la cantidad apropiada, a fin de que el error
muestra! no afecte los resultados, y a su vez, no se derrochen recursos, al
utilizar una muestra de mayor tamaño que la requerida.
Existen fórmulas que permiten calcular el tamaño adecuado de una
muestra cuando se espera una determinada precisión en los resultados.
Las fórmulas a utilizar dependen de la información disponible.
1) Cuando se conoce el tamaño del universo (N), se puede aplicar la si­
guiente fórmula:
n = ---- 2-
l + (N x P )
donde: n = tamaño de la muestra.
N = número total de sujetos en el universo.
P = precisión (error máximo permitido entre el parámetro y el
estadístico), expresado en proporción.
2) Cuando se quiere estimar el promedio de una población y se conoce la
desviación estándar de la población:
xs
n = -p
--
2 2
z
2

donde: n = tamaño de la muestra


Z = 1,96 constante. Expresa el nivel de confianza.
s = desviación estándar (conocida o estimada) de la población
P = es la precisión.
3) Cuando se conoce la proporción o porcentaj e de la población que tiene la
característica de interés:
pxq
n = p2 . z 2

donde: n = tamaño de la muestra


Z = l ,96 constante. Expresa el nivel de confianza
p = porcentaje de la población que tiene la característica de inte­
rés

55
q = porcentaje de la población que NO tiene la característica de
interés (q = 1 - p)
P = precisión.

E.JERCICIOS
1 ) Se desea saber el porcentaje de familias interesadas en los servicios de
vacunación que ofrecen los servicios de salud de la zona. Se estima que
el área de influencia de dichos servicios abarcará unas 20.000 familias.
Se decide tomar una muestra en la cual el error máximo permitido en los
resultados no sea mayor de un 5%. Se pregunta: ¿Cuántas familias deben
incluirse en la muestra?
N = 20.000 familias
P = 5% (0,05 expresado en proporción)
N=?
N 20.000 = 392,.5
n = ----2-
l + (N x P ) 1 + [20.000(0,05 2 )]
Por lo tanto, la muestra requerida debe ser aproximadamente de 393 fa­
milias.
2) Un investigador tiene interés en conocer el valor promedio de glucosa en
sangre venosa de los pacientes que asisten al hospital donde él trabaja.
En la literatura revisada encuentra que el valor promedio de glucosa en
sangre es de 83 mg/ 1 00 ml., con una desviación estándar de 5 mg/ 1 00
ml, determinado con un método diferente al que él utilizará. Está dis­
puesto a tolerar 2 mg/ 1 00 ml. como error máximo entre el valor del uni­
verso y el de la muestra. Se pregunta: ¿Cuántos pacientes deben confor­
mar la muestra?
S= 5 mg/ 1 00 ml.
P= 2 mg/ 1 00 ml.
Z= 1 ,96
n= ?
z 2 x s2 1,962 X 5 2
n = -__2__ = = 24,0 1
p 22
La muestra debe estar conformada aproximadamente por 24 pacientes.

56
3 ) Se desea realizar una investigación sobre teniasis en una población don­
de, por trabajos anteriores, se ha estimado que la positividad a este pará­
sito es de un 20%. Se desea saber cuantas familias deben constituir la
muestra, si el índice buscado no varíe en más de un 6% con respecto al
del universo.
p= 20%
q= ( 1 00-20) = 80%
P= 6%
Z= 1 ,96
n= ?
1,962 X p X q = 1,962 20 X 80 =
n= 1 70'73
X
p 2 62

La muestra debe estar formada aproximadamente por 1 7 1 familias.


4) Determine cuántas personas debe estudiar un investigador, para demos­
trar la existencia de una endemia de bocio, cuando se ha estimado, por
trabajos anteriores, que la prevalencia de la enfermedad es del 1 0%. Es­
pera que los resultados obtenidos en la muestra no varíen en más de un
2% con respecto a los valores reales del universo. (R: n = 864 personas).
5) Se sabe que el valor promedio de glicemia es de 90 mg/ 1 00 ce con una
desviación estándar de 1 0 mg/ 1 00 ce. Se desea realizar una investiga­
ción en la cual la muestra dé una media de glicemia no mayor del valor
real en más de 0,50 mg/ 1 00 ce. ¿Cuántas personas deben incluirse en la
muestra? (R: n = 1 .537 personas).
6) Se desea realizar una investigación sobre enterovirus verniculares, en
una población compuesta por 2.000 familias. ¿Cuántas familias deben
incluirse en la muestra, si se espera que el error máximo permitido no sea
mayor del 6%? (R: n= 244 familias).
7) En una comunidad, los programas de planificación familiar son acepta­
dos por 8 personas de cada 1 0 encuestados. ¿Cuántas personas deben in­
cluirse en una muestra para determinar los conocimientos que tiene la
población sobre estos programas, si el error máximo permitido es de
5%? (R: n = 246 personas).
8) En una barriada constituida por 1 . 1 46 familias se desea realizar un diag­
nóstico de comunidad, para lo cual se tomará una muestra representativa

57
que admita un error máximo de un 5%. ¿Cuántas familias deben consti­
tuir la muestra? (R: n = 297 familias).
9) En un estudio realizado sobre Infecciones oportunistas y neoplasias de
mayor frecuencia en pacientes con sida, en tres hospitales de Valencia,
entre 1 990 y 1 996 se encontró un total de 88 pacientes, distribuidos de la
siguiente manera:
HOSPITAL Pacientes
, C.H.E.T. 41
GONZÁLEZ PLAZA 31 --
H.U.A.L. 16
TOTAL 88

El estudio se realizó en los tres hospitales utilizando una muestra aleato­


ria equivalente al 75% del universo descrito, en cuyo caso, para que di­
cha muestra haya sido representativa, indique que tipo de muestra se uti­
lizó, y cómo quedó cuantitativamente constituida.
1 O) En una edificación escolar ubicada en la Urb. La Isabelica, funcionan
paralelamente dos escuelas: una en el tumo de la mañana (A) y la otra en
la tarde (B). La del primer tumo tiene una matrícula de 840 alumnos, dis­
tribuidos en 20 secciones. La escuela de la tarde tiene 756 alumnos en 1 8
secciones. Ambas son d e etapa básica d e l º a 6º grado, con escolares en
edades de 7 a 1 2 años; distribuidos de la siguiente manera:
Número de secciones en:
GRADOS Escuela A Escuela B
lro 5 4
2do 4 4
3ro 4 3
4to 3 3
Sto 2 2
6to 2 2
TOTAL 20 18

58
Se desea realizar el diagnóstico de salud de los niños de 7 a 1 2 años de
esa zona, por lo tanto, se resolvió efectuarlo en una escuela allí ubicada.
Para efecto de la investigación se elegirá por azar una de las dos escuelas
antes descritas, de la cual se estudiará el 50% de su población escolar. En
espera de que la muestra sea representativa en cuanto a los grados, como
quedará ésta constituida y que tipo de muestra se debe utilizar.
1 1 ) En un estudio donde se busca conocer la frecuencia y características de
la infección por VPH y el uso del DIU, en mujeres que acuden a las con­
sultas ginecológicas en la maternidad de la Ciudad Hospitalaria Dr. En­
rique Tejera, durante el año 1 997, donde fueron atendidas 3 .070 muje­
res, distribuidas de la siguiente manera:

PACIENTES PACIENTES
USO DE DIU TOTAL
SIN VPH CON VPH
SÍ 1 .368 207 1.575
NO 1 .432 63 1.495
TOTAL 2.800 270 3.070

De esta población de estudio se conformará una muestra aleatoria del 25


% de las historias clínicas de estas mujeres atendidas. Se pregunta que
tipo de muestra se debe utilizar y como quedaría constituida dicha mues­
tra, para que sea representativa, en cuanto a las dos variables estudiadas.
12) A continuación se suministra información sobre cien hospitales del
país, distribuidos en función del número de servicios que prestan.

Nº de servicios Nº de hospitales
2 20
3 30
4 14
5 16
6 20
TOTAL 1 00

Se desea conocer los costos para la atención hospitalaria. Se espera for­


mar una muestra aleatoria del 1 O %, por lo tanto se pregunta que tipo de
muestra se debe utilizar, y como quedaría ésta constituida para que sea

59
representativa de la población.
13) Se planifica un estudio sobre el tiempo utilizado por el equipo de salud
en la atención a los pacientes recluidos en cuatro hospitales de Carabo­
bo. En la tabla siguiente se ofrece información sobre el número de camas
por tipos de servicios, en los cuatro centros.
Número de camas en los hospitales:
Servicios A B e D TOTAL
Obstetricia 80 70 80 55 285
Medicina 50 25 50 35 160
Cirugía 30 30 o 30 90
Pediatría 40 25 20 10 95
TOTAL 200 1 50 1 50 130 630

¿Qué tipo de muestra aleatoria debe utilizarse para que todos los hospi­
tales, con sus respectivos servicios sean incluidos para conformar una
muestra de 1 26 camas? Numéricamente, ¿cómo estará formada dicha
muestra?

BIBLIOGRAFÍA
Azorin, F. ( 1 970). Curso de muestreo y aplicaciones. Segunda edición. Ca­
racas: Dirección de Publicaciones. UCV.
Bancroft, H. ( 1 960). Introducción a la Bioestadística. Buenos Aires: Edito­
rial Universitaria.
Bisqueda, R. ( 1 989). Métodos de investigación educativa. Barcelona, Es­
paña: Ediciones CEAC.
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta Edición.
Mérida, Venezuela: Talleres Gráficos Universitarios. Universidad de
los Andes.
Cochran, W. ( 1 985). Técnicas de Muestreo. México, D.F.: Continental.
Daniel, W., W. ( 1977). Bioestadística: Bases para el estudio en las Cien­
cias de la Salud. México, D.F.: Lemusa.

60
Gómez, F. (1976). Estadística aplicada. Caracas: División de publicacio­
nes de la Universidad Central de Venezuela.
Gonzalvo, G. (1978). Diccionario de Metodología Estadística. Madrid:
Morata.
Hemández Sampieri, R., Femández C. y Baptista, P. ( 1 991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Pardiñas, F. ( 1 979). Metodología y Técnicas de Investigación en Ciencias
Sociales. México, D.F.: Siglo XXI Editores.
Polit, D. y Hungler, B. (199 1 ). Investigación científica en Ciencias de la
Salud. Tercera Edición. México, D.F.: Interamericana.
Runyon, R. y Haber, A. ( 1 987). Estadística para las Ciencias Sociales.
Cuarta edición. México, D.F.: Addison-Wesley Iberoamericana.
Scheaffer, R. y Mendenhall, W. ( 1 989). Elementos de Muestreo. México:
Grupo Editorial Iberoamérica.
Seijas Z., F. ( 1 981). Investigación por Muestreo. Caracas: División de Pu­
blicaciones de la U.C.V.
Slonim M., J. ( 1 960) Sampling. N ew York: Editado por Simon y Schauffer.

61
CAPÍTULO 111
Recolección de información
El proceso de recolección de los datos. Escalas de medición. Fuentes de informa­
ción: Fuentes primarias y fuentes secundarias. Instrumentos de recolección de da­
tos. Tipos de instrumentos. Validez y Confiabilidad. Técnicas de recolección de
datos: Observación. Interrogatorio. Revisión documental. Ventajas y desventajas
de cada una de ellas.

63
l. EL PROCESO DE RECOLECCIÓN DE LOS DATOS
La Etapa de recolección de los datos involucra una serie de actividades
estrechamente vinculadas al éxito de la investigación, el cual depende de la:
1- Elección adecuada de la fuente de información.
2- Elaboración o selección del instrumento de recolección de datos, el
cual debe ser acorde con los objetivos de la investigación y las varia­
bles en estudio.
3- Administración del instrumento de recolección.
Al plantearse un problema en el área de las ciencias de la salud, es nece­
sario pensar en el tipo de información requerida para resolverlo. Ese tipo de
información debe definirse en función de los objetivos del trabajo a realizar
y de la posibilidad de tener acceso a las fuentes donde se encuentra dicha in­
formación. El proceso planificado y sistemático por el cual se obtiene la in­
formación para resolver el problema, se conoce con el nombre de
RECOLECCIÓN, y su objetivo es compilar los datos de la investigación.
Para entender con mayor claridad los elementos fundamentales de la re­
colección, es indispensable definir algunos conceptos básicos. Las unida­
des de estudio, de donde se obtendrá la información pueden ser: tejidos,
bacterias, parásitos, muestras de sangre, animales de laboratorio u hom­
bres; o historias médicas, expedientes, informes, etc. Cada unidad de obser­
vación permite tener parte de toda la información requerida en la investiga­
ción, y al ser debidamente registrada constituye lo que se denomina DATO
o conjunto de datos.
Los datos estadísticos en muchos casos constituyen una MEDICIÓN, la
cual puede definirse como la asignación de un valor numérico a una deter­
minada observación o, la expresión numérica de una observación. Al reali­
zar observaciones es fácil notar que aún en grupos homogéneos, no todos
los sujetos de estudio aportan iguales mediciones sobre el mismo fenóme­
no. Por ejemplo, si se determina el número de colonias de bacterias en va­
rias siembras, es frecuente observar que no todas las siembras tienen el mis­
mo número de bacterias. Del mismo modo, al revisar un grupo de historias
clínicas en un hospital, no todos los pacientes han ingresado con el mismo
diagnóstico. Esto indica que existe una variabilidad entre los sujetos u obje­
tos bajo estudio y que las características que se buscan conocer en ese uní-

65
verso, son variables.
Cuando una característica toma valores diferentes en las diversas uni­
dades de estudio, se define como una variable. En forma más precisa una
variable es un recurso metodológico que permite la conversión de un con­
cepto abstracto en uno observable (Sorokin, Lazarsfeld y otro, 1 977). Des­
de el punto de vista estadístico lo fundamental es medir las variables de la
manera más precisa posibles, así como sus relaciones entre ellas.
Si se piensa en todas las características posibles de medir en una mues­
tra, se entiende que no todas pueden ser medidas de igual forma, pues no
poseen la misma naturaleza. Para resolver este problema se han creado las
escalas de medición, donde las variables de naturaleza diferente puedan ser
expresadas en diversas escalas: nominales, ordinales, de intervalo y de ra­
zón, vistas en el primer capítulo.

11. FUENTES DE INFORMACIÓN


Al hablar del proceso de recolección de los datos se ha mencionado la
necesidad de definir con claridad la muestra de donde se obtendrá la infor­
mación, es decir, cual es la fuente que la posee y que la proveerá, dado que
esa fuente puede ser primaria o secundaria.
En trabajos de observación o experimentación en el área clínica, las uni­
dades de observación pueden ser los propios pacientes, o muestras de teji­
do, órganos, cultivos, etc., en cuyo caso el investigador tiene a su disposi­
ción la fuente original de los datos. En estas situaciones obtiene la informa­
ción directamente de quien la produce. Utiliza así una fuente primaria.
Las fuentes primarias son convenientes cuando se necesita una informa­
ción de primera mano, sin elementos que pudieran distorsionarla o modifi­
carla. Cuando el investigador quiere garantizar la calidad de la información
recurre al uso de este tipo de fuente.
Fuente Secundaria: Aún cuando en la mayoría de las investigaciones es
recomendable obtener la información directamente de la fuente de origen,
en ocasiones suele aprovecharse la información previamente registrada,
por otras personas, con propósitos administrativos, de servicio o de otras
investigaciones. Los estudios retrospectivos, sólo pueden efectuarse con la
información registrada en una fuente secundaria.

66
Ejemplos típicos de fuentes secundarias frecuentemente utilizados en
Ciencias de la Salud, son las historias médicas archivadas en los diferente
servicios de salud; o los Anuarios de Epidemiología y Estadísticas Vitales,
publicados por el Ministerio de Sanidad y Asistencia Social. Sin embargo,
estas fuentes, al igual que muchas otras del mismo tipo, presentan grandes
limitaciones, en cuanto a la calidad de la información que poseen. No siem­
pre es totalmente confiable la veracidad de la información allí registrada
(puede haber error en el diagnóstico, por ejemplo), o son incompletas al no
poseer toda la información requerida, lo cual es muy frecuente que ocurra.
O la información sobre las variables de interés puede haber sido registradas
en escalas de medición diferentes a la prevista, limitándose así las técnicas
de análisis estadístico a aplicar. O bien, la información recopilada en esas
fuentes no está actualizada (no es oportuna), como es el caso de los Anua­
rios, los cuales generalmente se publican con tres, cuatro o más años de
atraso.
La información recopilada en las fuentes secundarias ha podido ser re­
gistrada de manera continua, periódica u ocasional. El registro continuo es
aquel que se efectúa diariamente, en la medida en que el fenómeno ocurre.
Requiere de una organización permanente y contiene información referida
a un largo período de tiempo. Ejemplo: Archivos de Historias clínicas, en
tal caso, el marco muestral está constituido por las historias médicas corres­
pondientes al período de tiempo estudiado.
El registro periódico se efectúa cada cierto período de tiempo fijo. Por
ejemplo, cada 1O años se recopila la información de los Censos de Pobla­
ción. Por su parte, la información ocasional es aquella registrada esporádi­
camente, sin ninguna periodicidad y por cortos períodos de tiempo. Gene­
ralmente los datos obtenidos para efectos de investigaciones son registra­
dos bajo esta modalidad.
Un elemento importante a evaluar en el momento de elegir la fuente de
información es su calidad; donde se consideran dos criterios básicos: La ac­
cesibilidad, y la buena información.
La accesibilidad se refiere a la posibilidad de disponer de la información
en el momento requerido, de acuerdo al cronograma elabora do para la in­
vestigación. Una fuente accesible es aquella que para su consulta no presen­
ta mayores dificultades de tipo administrativo, legal o ético, por supuesto
que, conservando la confidencialidad y discreción que todo caso amerita.

67
Esto en lo relacionado a la accesibilidad administrativa; dado que es
igualmente conveniente considerar la accesibilidad geográfica de la fuente.
Cuan distante se encuentra del sitio de trabajo; o que tan dispersa está; o si
el lugar donde se halla resulta "peligroso" para el investigador. De la eva­
luación de estos elementos, el investigador puede orientarse para elegir la
fuente de información, en función de las características de su universo de
estudio.
Para que una información sea considerada de buena calidad, ésta debe
ser fidedigna (cierta, real, apegada a la verdad de los hechos), completa
(que aporte información sobre todas las variables de interés), oportuna (que
sea una información actualizada, vigente) y por último, que sea pertinente
(los datos deben guardar relación con las variables en estudio).
La escogencia adecuada de la fuente de información es fundamental para
que la información recogida resulte de buena calidad y permita llegar a con­
clusiones válidas.

111. INSTRUMENTOS DE RECOLECCION DE DATOS


El proceso de recolección de la información debe realizarse en forma sis­
temática y organizada. Los instrumentos se elaboran en función de los obje­
tivos y de las variables a medir, y deben incluir ítems referentes a todos los
datos necesarios para el trabajo.
Para su construcción no existe una fórmula claramente definida, y esta
tarea puede resultar más o menos compleja dependiendo de la naturaleza de
las variables en estudio. Sin embargo, la literatura especializada en el área,
menciona una serie de recomendaciones a seguir en este proceso de cons­
trucción de instrumentos de recolección; entre ellas se tiene:
1.- Las preguntas deben ser claras y concisas, de manera que resulten fá­
ciles de comprender por las personas a quienes van dirigidas. No de­
ben dar lugar a interpretaciones dudosas o falsas, ni exigir excesivo
trabajo a quienes han de responderlas.
2.- Las preguntas deben dar lugar a una sola interpretación, inequívoca e
inmediata.
3.- Las preguntas no deben sugerir las respuestas.

68
4.- Cada pregunta debe contener una sola idea y referirse a un sólo suje­
to, de otro modo se corre el riesgo de confusión.
5.- Debe cuidarse el número de preguntas. Se ha comprobado que el ex­
ceso de preguntas disminuye la calidad de las respuestas y aumentan
el porcentaje de abstención por cuanto produce fatiga o cansancio en
el interrogado.
6. - Deben incluirse solamente preguntas que tengan relación directa con
el problema en sí y con los objetivos de la investigación.
7.- Siempre que sea posible deben elaborarse preguntas cerradas (Sí o
No), o de abanico (con varias alternativas), en lugar de preguntas
abiertas, donde el interrogado responde con sus propias palabras. Es­
tas últimas resultan difíciles de computar.
8 . - Siempre que sea posible, deben evitarse las preguntas sobre temas
muy personales o privados.
9.- Igualmente, debe cuidarse el orden en que se presenten las preguntas,
ya que un ítem colocado en un lugar inadecuado, puede influir en las
respuestas de otros.
En la elaboración de un instrumento de recolección de datos también es
importante la presentación del mismo, de allí la necesidad de seguir algunas
sugerencias:
1 . - Debe contener una nota de presentación: En ella se pueden incluir los
siguientes aspectos:
- Explicación de la finalidad de la encuesta, de los beneficios que los
resultados de la investigación pueden aportar a la comunidad, así
como del uso que se le dará a la información obtenida.
- Solicitud de colaboración a los encuestados y sinceridad en sus
respuestas, para lograr el éxito de la investigación. Esto también
puede hacerse a través de una carta personal.
- Nombre de la entidad o institución que realiza la investigación, lo cual
le da seriedad y responsabilidad a quien efectúa la investigación.
2.- Instructivo para contestar: Todo formulario debe ir acompañado de
un instructivo en el cual se explique la forma en que debe ser respon­
dido.

69
3 .- Aspectos materiales y estéticos: La hoja o folleto debe tener un tama­
ño conveniente que facilite su manipulación. Cada pregunta debe te­
ner suficiente espacio para las respuestas.
Es conveniente también que los formularios se construyan ya codifica­
dos para facilitar su posterior procesamiento y análisis, cuando se tiene pre­
visto realizar éste a través de computadoras. El formulario debe ser exhaus­
tivo, pero pertinente, es decir, contener la información requerida para el tra­
bajo, evitando la información superflua.
En oportunidades, el investigador puede utilizar instrumentos de reco­
lección ya elaborados con anterioridad para trabajos similares, en especial
Escalas para medir variables, generalmente de tipo Psico-social, tales como
la "Escala de lnternalidad-Externalidad ", de Levenson, para medir la va­
riable Locus de Control, o la "Escala de Graffard ", para medir situación
socio-económica; o el "Inventario Multifásico de la Personalidad de Min­
nesota ", para estudiar algunas psicopatologías; y muchas otras escalas o
tests de usos frecuentes.
En todo caso, bien sea que el investigador diseñe sus propios instrumen­
tos de recolección de datos, o utilice uno elaborado anteriormente, es con­
veniente conocer la Validez y Confiabilidad de éste, de tal manera que los
resultados obtenidos merezcan confianza, al existir mayor seguridad de
haber medido realmente la variable que se esperaba medir. La Validez y la
Confiabilidad son dos requisitos esenciales que debe reunir todo instru­
mento de medición o de recolección de datos.

Validez
La validez de un instrumento de medición representa un criterio funda­
mental para evaluar su calidad y adecuación, y denota el grado con el cual,
el instrumento mide la variable que con él se desea medir Por ejemplo,
quien elabora un instrumento para medir las actitudes de los médicos hacia
los enfermos de SIDA. ¿Cómo puede estar seguro de que las puntuaciones
obtenidas con ese instrumento, reflejan realmente o de manera válida tales
actitudes, y no otra variable, como podría ser, conocimiento sobre esa en­
fermedad? El problema de la validez se centra alrededor de este plantea­
miento. ¿El investigador está midiendo realmente el atributo que en su opi­
nión intenta medir?.

70
Un instrumento válido permite hacer un diagnóstico real de la situación
o característica estudiada. Para determinar la validez de un instrumento es
necesario analizar su Sensibilidad y Especificidad.
La sensibilidad se refiere a la capacidad de un instrumento de dar un re­
sultado positivo, cuando el sujeto analizado tiene realmente la variable en
estudio. El debe permitir identificar o diagnosticar a quienes poseen la ca­
racterística que se busca medir. Por ejemplo, en una encuesta epidemiológi­
ca la sensibilidad se refiere a su capacidad de identificar correctamente a los
enfermos que forman parte de la población.
La especificidad se refiere a la capacidad del instrumento de dar un re­
sultado negativo cuando el suj eto analizado no tiene la variable en estudio.
Ese instrumento debe permitir identificar a quienes no poseen la caracterís­
tica que se busca medir. En el ejemplo de la encuesta epidemiológica, la es­
pecificidad se refiere a su capacidad para identificar correctamente en la
población, a las personas que no tienen la enfermedad estudiada (Cañedo,
1987).
Es de esperarse que un instrumento posea una elevada sensibilidad y es­
pecificidad simultáneamente, con el fin de reducir el número de casos fal­
sos positivos y de falsos negativos, así como identificar adecuadamente los
verdaderos positivos y verdaderos negativos.
También es conveniente buscar la validez en toda técnica o método de
diagnóstico.
La literatura especializada menciona cuatro tipos de validez: de conteni­
do, de criterio y de constructo y predictiva. Cada una de ellas se determina
mediante procedimientos diferentes.
Además de la validez, todo instrumento debe tener precisión o confiabi­
lidad.

Confiabilidad
La confiabilidad es el otro criterio para evaluar la calidad de un instru­
mento, y está referida al grado en el cual, su aplicación repetida produce
iguales resultados, en la misma unidad de observación. Por ejemplo, si con
un test de inteligencia, un investigador mide este constructo en una persona,
y obtiene un puntaje de 115 puntos en una primera aplicación; luego, dos
días después, en una segunda aplicación el puntaj e de esta persona baja a 60

71
puntos, y en un tercer intento, pasados dos meses, obtiene 1 30 puntos. En
tal caso, ¿cómo se puede tener confianza en esas puntuaciones tan cambian­
tes? Evidentemente que ese instrumento no es confiable (su aplicación re­
petida produce resultados distintos) sus resultados no son consistentes en el
tiempo.
Con un instrumento confiable, se espera la menor variación, en medicio­
nes repetidas, sobre el mismo fenómeno. Para el cálculo de esta propiedad,
existen diversos procedimientos, entre ellos: las pruebas repetidas o test
retests, la técnicas de las dos mitades o división por mitad; y las pruebas
paralelas; el Coeficiente alfa de Cronbach, y el Coeficiente KR-20 de
Küder-Richardson.
Estos dos últimos procedimientos, generalmente son utilizados para me­
dir Consistencia interna, que es otro elemento de la confiabilidad. Está re­
ferida a la homogeneidad de los ítems con respecto al constructo a medir.
Cuanto mide cada ítem, por separado, la variable que mide todo el instru­
mento.
La validez y la confiabilidad de un instrumento no son características in­
dependientes una de otra. Se afirma, que un instrumento que no sea confia­
ble, posiblemente tampoco sea válido.
Cuando es el propio investigador quien diseña el instrumento de recolec­
ción, o utiliza uno creado por otros investigadores, debe cerciorarse de su
validez para medir realmente la característica a medir. Es necesario que el
instrumento haya sido validado para la población donde se realizará la in­
vestigación. Un instrumento utilizado para medir las variables psico-socio­
lógicas, validado para una población, generalmente no posee la misma vali­
dez para otras poblaciones, con culturas, valores y costumbres diferentes.

TIPOS DE INSTRUMENTOS:
Al hablar de formularios o instrumentos de recolección de datos, es
oportuno señalar las diversas modalidades que de estos existen:
- Los Cuestionarios: Son formularios para ser llenados por los mismos
sujetos interrogados, sin la intervención directa del encuestador. Exis­
ten dos variedades de cuestionario: los postales y los de auto adminis­
tración. Estos últimos se aplican a grupos de personas que en forma
colectiva, y con la presencia próxima del encuestador, responden el

72
instrumento. Tienen la ventaja de garantizar el aprovechamiento má­
ximo del tiempo, y permiten al investigador aclarar cualquier duda
que pueda surgir, por parte de los interrogados.
Por su parte, los cuestionarios postales, son enviados, por cualquier
medio, a la muestra, y ésta responde según interprete las preguntas
formuladas. No hay quien aclare las dudas, y generalmente, es muy
bajo el número de cuestionarios devueltos debidamente respondidos.
Por lo tanto, se piensa que cuando sólo una pequeña parte de la mues­
tra de informantes devuelve los formularios llenos, resulta dificil su­
poner que estos constituyan un segmento "típico " de la población. En
tal situación, es inadecuado generalizar los resultados de los estudios a
toda la población, dado que se ha utilizado una muestra sesgada.
- Las Encuestas: Se conoce con este nombre genérico a los instrumen­
tos de recolección utilizados para recoger información, mediante la
técnica del interrogatorio directo (entrevista estructurada).
- Listas de Cotejo o Guías de Observación: Sirven para registrar anota­
ciones producto de la observación y no de un interrogatorio. Consta de
un listado de características o comportamientos, presentadas en co­
lumna, y al lado de cada una de ellas, un espacio en blanco para indi­
car la presencia o ausencia de la característica observada en cada
sujeto, o la frecuencia y duración conque ésta se produce. A este tipo
de instrumento también se la denomina Lista de registro.
- Las Escalas: Son instrumentos utilizados para medir en forma cuanti­
tativa, el grado en que un individuo posee la característica en estudio.
Polit ( 1 99 1 ) define a las Escalas como un instrumento diseñado para
asignar un puntaje numérico que coloque a los sujetos en un continuo
respecto al atributo que se medirá (p 249). El propósito de estos ins­
trumentos es distinguir cuantitativamente a las personas, según el gra­
do en que poseen determinada característica. Por ejemplo, así como la
escala de un termómetro permite establecer la diferencia entre la tem­
peratura de dos personas, una Escala que mida Locus de Control, pue­
de detectar a los sujetos de "orientación interna " de aquellos de
"orientación externa ".
Dentro de esta categoría de Escalas también pueden incluirse los
Tests, por cuanto su "manejo" es similar. Se utilizan para medir actitu-

73
des y variables psico-sociales.
Todos los instrumentos antes mencionados se utilizan cuando el in­
vestigador obtiene la información de una fuente primaria.
- Fichas: Son instrumentos utilizados para tomar una información ya
registrada, con anterioridad a la investigación, bien sea en un archivo
de historias clínicas, o un libro de registro de casos, o de ingresos a la
emergencia de un hospital, o los datos de Anuarios, o cualquier otra
fuente secundaria.
Las fichas contienen un listado de variables o información a buscar, y
sus respectivos espacios en blanco, que serán llenados por el investi­
gador con información contenida en los documentos consultados, se­
gún las variables en estudio.

IV. TÉCNICAS DE RECOLECCIÓN DE DATOS


En una investigación las técnicas de recolección de datos a utilizar están
en función del tipo de fuente de donde se obtendrá la información. Cuando
la información no está registrada, es necesario acudir a su fuente de origen
para obtenerla, en cuyo caso se utilizan como técnicas de recolección la ob­
servación de campo y de laboratorio, y el interrogatorio. Cuando se utiliza
una fuente secundaria, la técnica de recolección de datos empleada es la re­
visión documental.
La observación: Este método consiste en obtener datos o información
mediante los sentidos, tiene carácter científico cuando cumpla con los si­
guientes requisitos:
a) Sirve a un objetivo de investigación ya formulado.
b) Es planificada y controlada sistemáticamente.
c) Está sujeta a comprobación y a controles de validez y de confiabili­
dad.
Las observaciones científicas requieren de examen, selección y registro
sistemático de las variables o conductas, además de las situaciones ambien­
tales donde éstas se desarrollan y que pudieran estar relacionadas con el
problema investigado.

74
Como técnica de recolección de datos, puede variar desde la no estructu­
rada hasta la estructurada, siendo esta última la más recomendable, por
cuanto la observación ha de realizarse para la búsqueda de la información
requerida en el formulario elaborado.

Ventajas de la Observación:
1 .-Permite obtener la información de manera directa, sin intermediarios
y en el momento en que ocurre; con ello se evitan las deformaciones produ­
cidas por el recuerdo o la memoria, o por las limitaciones de la expresión
verbal.
2.- En ocasiones, no es necesario contar con la colaboración expresa del
informante para aportar la información requerida.
3.- Permite obtener información de sujetos que no estén en condiciones
fisicas o mentales de suministrarla.
4.- Los fenómenos se analizan con carácter de totalidad y aunque no es
posible aprender los resultados de todas las interrelaciones y otros aspectos,
se trata de un procedimiento que aborda globalmente a una problemática.
Los fenómenos pueden observarse en el mismo contexto donde se desarro­
llan.

Desventajas de la Observación:
1 .- Sólo permite obtener información de hechos presentes y de conduc­
tas observables, quedando excluidos los hechos pasados y los aspectos sub­
jetivos y opiniones de los individuos.
2.- No es adecuado su uso en muestras grandes y dispersas, pues resulta­
ría muy costoso.
3.- También, es necesario destacar que la observación requiere de apren­
dizaje y ejercicio. Se puede mirar todo y no observar nada. ¿Qué se quiere
ver?, ¿qué es significativo, esencial y qué no?. Son preguntas que el investi­
gador debe hacerse constantemente, si quiere que sus datos sean útiles para
responderse las preguntas previamente formuladas.
El Interrogatorio: Con este método se obtiene información mediante
una serie de preguntas formuladas al interrogado. Puede utilizarse en dos
modalidades: El interrogatorio oral o entrevista y el escrito o cuestionario.

75
Ventajas del Interrogatorio:
Mediante esta técnica puede obtenerse información referida a hechos
ocurridos en el pasado y a variables biológicas y psico-sociales (opiniones,
actitudes, expectativas, deseos), los cuales, por su misma naturaleza son
casi imposible conocer desde afuera. Nadie mejor que la misma persona in­
volucrada para expresar lo que piensa, siente y ha vivido.

Desventajas del interrogatorio


Para obtener la información es indispensable contar con la colaboración
y buena intención del interrogado, y de su buena memoria. La calidad de la
información está sujeta al recuerdo del hecho y a la disposición de compar­
tirla.
La entrevista o interrogatorio oral, definido por Ander-Egg como una
conversación cuyo propósito va más allá del simple placer de la plática. En
ella se presentan una serie de preguntas y respuestas por parte del entrevis­
tado y del entrevistador, respectivamente.
El entrevistador tiene como tarea conducir la conversación hacia la bús­
queda de la información deseada. Debe propiciar un clima de tranquilidad y
naturalidad, de tal manera que el entrevistado se sienta cómodo, y pueda ex­
presar sus opiniones honestamente y con la seguridad de que la información
por él suministrada será utilizada de manera confidencial.
El entrevistador debe dar una imagen imparcial y crear un ambiente fle­
xible que estimule la espontaneidad en las respuestas. Todas las opiniones
del entrevistado deben aceptarse con naturalidad. El entrevistador no debe
manifestar sorpresa, censura y ni siquiera aprobación sobre la información
aportada por el interrogado. Para esto el entrevistador debe ser una persona
que comprenda el valor y la importancia de cada dato aportado, además de
tener la capacidad para oír y respetar en cada momento al entrevistado.
La preparación del investigador junto a la veracidad de las respuestas del
entrevistado, del tiempo requerido y los costos, constituyen las limitaciones
más frecuentemente mencionadas de la técnica de la entrevista.
Ander Egg ( 1 972) señala las siguientes ventajas del interrogatorio direc­
to (entrevista) sobre el indirecto (cuestionarios postales):

76
- Posibilidad de obtener mayor porcentaje de respuesta, dado que es
más fácil no responder una carta que rechazar un entrevistador.
- Posibilidad de obtener una información más precisa, por cuanto en
ciertas circunstancias pueden comprobarse de inmediato las "discor­
dancias" en la información suministrada, o controlar la veracidad de
las respuestas.
- Posibilidad de captar el "sabor" de las respuestas; reacciones, adema­
nes, gestos, movimientos, tonos de voz, énfasis, etc. En este aspecto la
superioridad de la entrevista es evidente al permitir añadir muchas ob­
servaciones que constituyen "la circunstancia" de lo registrado.
- Puede obtenerse información de analfabetas, o de personas que no es­
tén en condiciones fisicas para escribir.
- Ofrece mayor flexibilidad. El encuestador puede aclarar y repetir las
preguntas y adaptarse más fácilmente a las personas entrevistadas y a
circunstancias concretas.
Con respecto al interrogatorio indirecto o cuestionarios postales, entre
sus ventajas se menciona que al utilizar el correo como vehículo no requie­
re la presencia del investigador, y por lo tanto, el costo de la recolección de
los datos es menor y su cobertura geográfica puede ser mayor. Además, la
posibilidad de mantener el anonimato, facilita la sinceridad del interrogado
al momento de ofrecer sus respuestas.
En cuanto a las desventajas de los cuestionarios postales, se mencionan:
1 - El riesgo de recibir un elevado porcentaje de cuestionarios sin res­
puestas.
2- La exclusión de la muestra, a quienes no saben leer o escribir.
3 - La imposibilidad de ayudar al informante cuando no comprenda las
instrucciones o las preguntas.
4 - La dificultad para verificar la información recolectada.
Como se ve, las ventajas del cuestionario postal, son las desventajas de
la entrevista y viceversa.

77
La Revisión Documental
Cuando la información está registrada en una fuente secundaria, se utili­
za la revisión documental como técnica para obtener los datos necesarios
para la investigación. En estos casos, no se trata de efectuar un análisis de
contenido de diversas obras, sino de obtener información de una serie de
documentos (historias clínicas, informes, expedientes, etc.) donde se ha re­
copilado información previamente, y con un propósito diferente a la inves­
tigación planificada.
A través de esta técnica pueden ser contestados los planteamientos esta­
blecidos y expresados en un plan. En los documentos se analizan las fre­
cuencias en que los hechos ocurren. Por ejemplo, en los Anuarios de Epide­
miología y Estadística Vital se buscan datos sobre morbilidad, mortalidad y
natalidad que permitan calcular tasas, tanto regionales como nacionales.
Datos para ser procesados según los objetivos establecidos.
Esto mismo puede aplicarse cuando se revisan informes de otras investi­
gaciones ya realizadas, o de documentos personales.

BIBLIOGRAFÍA RECOMENDADA
Ander-Egg, E. ( 1 972). Introducción a las técnicas de Investigación Social.
Tercera Edición. Buenos Aires: Editorial Humanitas.
Goode, W. y Hatt, P. ( 1 970). Métodos de investigación Social. México: Tri­
llas, S.A.
Hemández Sampieri, R., Femández, C. y Baptista, P. ( 1 99 1 ). Metodología
de la investigación. Bogotá: McGraw-Hill.
Polit, D. y Hungler, R. ( 1 99 1 ). Investigación Científica en Ciencias de la
Salud. Tercera edición. México, D.F. : Interamericana.
Sabino, C. ( 1 986). Metodología de Investigación. Una introducción teórico
práctica. 2da edición. Caracas: Lagos.

78
CAPÍTULO /V
Procesamiento y Presentación de los datos
El proceso de elaboración de los datos. Sub-etapas. Frecuencias absolutas. Ran­
go. Intervalo de clase. Límite inferior y límite superior de una clase estadística.
Centros de clase. Elaboración de cuadros estadísticos. Partes de un cuadro. Cua­
dros de distribución defrecuencias, de asociación y de series cronológicas. Gráfi­
cos. Tipos de gráficos: Barras simples. Diagrama circular. Histograma. Polígono
de frecuencia. Curva integral. Barras múltiples. Barras proporcionadas. Líneas
de tendencia. Números índice.

79
ETAPA DE ELABORACIÓN
O PROCESAMIENTO DE DATOS
La elaboración de los datos consiste en resumirlos en cuadros o tablas, y
en gráficos estadísticos, de acuerdos a los criterios u objetivos definidos
con anticipación. Esta etapa se cumple en cuatro sub-etapas: Revisión de
los datos; Ordenación y clasificación de estos; Computación de los mismos,
y Presentación de la información.
1. - La revisión de la información en los formularios donde fue recolec­
tada, tiene como finalidad verificar si ésta permite cumplir con los objetivos
formulados previamente. En caso de presentar alguna falla (recuérdese las
cuatro características de una buena información) susceptible de corrección,
se procede a hacerlo en este momento, evitando así el procesamiento de es­
tos errores que conducirán a conclusiones erradas o falsas.
2.-Seguidamente, a fin de manejar con mayor facilidad la clasificación y
categorización de cada variable, los datos pueden ordenarse en las formas
más conveniente para el cómputo de las frecuencias, aun cuando este paso
no es indispensable. Si se trata de magnitudes éstas pueden ordenarse en
sentido creciente o decreciente.
Por su parte, la clasificación permite la conformación de grupos de datos
más homogéneos, colocándolos en estratos o clases estadísticas.
El procedimiento para la conformación de las clases depende del tipo de
variable en estudio, pudiendo ser éstas numéricas (discretas o continuas) o
categóricas.

81
TABLA MAESTRA # 1
INFORMACION OBTENIDA DE LA CONSULTA EXTERNA DEL
AMBULATORIO RURAL DE LA AGUADITA, ESTADO COJEDES.
1 997
EDAD 1 TALLA EDO. SEXO EDAD PESO TALLA EDO.
SEXO PESO
·-

NUTRIC. --1 7 kg NUTRIC.


M 4A 8 kg 84 cm D. Grave 11 A 122 cm D. Moderada
7 kg 7A 23 kg 128 cm Normal
F
M 6m 66 cm Normal
8 kg 68 cm Normal !A 1 5 kg 96 cm S/Norma
F
7m
22 kg 126 cm D. Leve 3A 8 kg 77 cm D. Grave
F
lO A
F

M 10 m 8 kg 76 cm Normal M 5A 1 6 kg 100 cm D. Leve


F F

M !A 1 2 kg 78 cm Normal M 8A 27 kg 1 26 cm Normal
!A 1 I kg 78 cm Normal 8A 28 kg 1 24 cm Normal
39 kg S/Norma 5A 1 3 kg 1 0 1 cm D. Leve
F
9A 1 54 cm
F

7A 1 2 kg 1 1 0 cm D. Moderada 4A 1 1 kg 91 cm D. Moderada
F F

2A 1 5 kg 88 cm Normal 9A 35 kg 1 3 8 cm Normal
F F

1 4 kg M 2A 1 0 kg 82 cm Leve
F
2A 87 cm Normal
F

M 4A M 1 2A 9 kg 80 cm D. Moderada
F
1 9 kg 1 14 cm S/Norma
M 5A 1 8 kg 1 1 2 cm Normal M lOA 36 kg 1 3 8 cm Normal
l A 8 kg 74 cm D. Leve M 11A 25 kg 1 30 cm D. Leve
M 3A 1 8 kg 98 cm Normal lOA 40 kg 140 cm Normal
F

4A 1 3 kg 93 cm D. Leve
F
4A 1 9 kg 102 cm Normal
3A F llm 9 kg 77 cm Normal
F
1 7 kg 95 cm Normal
F

8A 1 3 kg 100 cm D. Moderada M 3A 1 0 kg 84 cm D. Moderada


F

5A 3A 1 2 kg 86 cm D. Leve
F
22 kg 1 14 cm Normal
5A 2 1 kg 1 1 0 cm Normal llA 42 kg 148 cm Normal
F F

M 27 kg 130 cm Normal M 7m 9 kg 72 cm Normal


F
8A
F

M ll m 7 kg 68 cm D. Leve 2A 7 kg 70 cm D. Grave
M 6A 2 1 kg 120 cm Normal 6A 1 5 kg 106 cm D. Leve
F

9A 26 kg 130 cm Normal 6A 1 0 kg 95 cm D. Grave


F

23 kg Normal M 7A 34 kg 146 cm S/Norma


F
6A 1 1 6 cm
F

M 9A 33 kg Normal M !A 1 1 kg 1 81 cm Nonnal
F
1 34 cm
M !A 1 5 kg 88cm S/Norma F !A 9 kg ¡ 71 cm D. Leve
3A 1 4 kg 97 cm Normal F lO m 1 7 kg 1 67 cm I D Leve
M 7A 24 kg 124 cm Normal M l A 8 kg 68 cm D Moderada
F

2A 1 2 kg 89 cm _r,Jorm__¡il__ -� F-�_�l A
� _ l__2._l<g_j__27 _c_l!l D. Moderada .
1 1

Información obtenida de las Historias Clínicas del Archivo del Ambulatorio Rural
La Aguadita. Cojedes.

La elaboración de escalas nominales y ordinales resulta muy sencillo por


cuanto se forman tantas clases como divisiones admite la variable en estu­
dio. Por ejemplo, la variable cualitativa sexo contenida en la tabla maestra #
1 , sólo admite dos clases: masculino y femenino, acompañadas de sus res­
pectivas frecuencias absolutas.

82
Frecuencias
Sexo
absolutas
Femenino 36
��-
Masculino 24
Total 60
El término frecuencias absolutas se refiere a la cantidad de sujetos que
poseen una característica específica, y por lo tanto, pertenecen a una cate­
goría o clase determinada. Se obtienen mediante el conteo o computación
de los datos.
En las escalas nominales las clases se ordenan en forma decreciente, to­
mando en cuenta las frecuencias, con la finalidad de dar mayor énfasis a la
categoría más frecuente. Por su parte, en las escalas ordinales las clases se
ordenan en función de la jerarquía de cada categoría, y no de las frecuencias
de éstas. Igualmente, estas escalas se conforman con tantas clases como di­
visiones admite la variable.
Por ejemplo, la variable Estado nutricional contenida en la tabla maestra
# 1 , puede distribuirse en cinco clase: Sobre la norma, Normal, Desnutri­
ción leve, Desnutrición moderada y Desnutrición grave, con sus respecti­
vas frecuencias:

Estados nutricionales frecuencia absoluta (f)


Sobre la norma 5
Normal 31
Desnutrición leve --
12
Desnutrición moderada 6
Desnutrición grave
"·-"··-

--------
4
Total 60

Por su parte, la formación de clases de las variables numéricas requiere


de un proceso más elaborado, en el cual es necesario el cálculo de Rango
(R), Intervalo de clase (le), Límites de clase: Inferior (Li) y Superior (Ls).
El rango (R) es el recorrido de la variable desde su valor máximo hasta
su valor mínimo. Se obtiene mediante la diferencia de estos dos valores ex­
tremos. También se conoce con el nombre de Recorrido de la variable o
Campo de variación.

83
R = X (max.) - X min.
Donde:
( )

Xcmax.J = Valor máximo de la serie.


X(m in.) = Valor mínimo de la serie.
La tabla maestra # 1 , también contiene información sobre la variable nu­
mérica Peso. Para la distribución de esa serie estadística en clases se buscan
los valores extremos para calcular el rango y luego el intervalo de clase:
Valor máximo = 42 Kg.
Valor mínimo = 7 Kg.
R = 42 Kg - 7 Kg = 35 Kg
El intervalo de clase (le) se define como el número de unidades de me­
didas a incluir en cada clase.
Se obtiene mediante la división del rango entre el número de clases esco­
gido para formar la escala. Este número de clases lo fija el investigador a
conveniencia, siguiendo la recomendación de que es prudente formar entre
5 y 20 clases, ambos inclusive.
Rango
Je = º
N de clases
Para el ejemplo de la variable peso presentada en la tabla maestra # 1 , po­
dría distribuirse en seis clases:
Rango = 35 Kgs.
Número de clases = 6
35 Kg =
Je = 5 '8 Kg
6
Dado que la serie sólo contiene valores enteros, el intervalo de clase cal­
culado puede redondearse, aproximándolo a 6 Kgs.
le = 6 Kgs., lo cual indica que en cada clase estadística se incluirán 6 pesos
diferentes, comenzando por el menor valor de la serie, el cual se considera el
límite inferior de la primera clase. A este valor se le suma el intervalo de
clase calculado y se obtiene el límite inferior de la segunda clase. A éste, de
manera consecutiva se le suma el le. y se obtienen los límites inferiores (Li)
de las clases restantes.

84
Menor valor de la serie = 7 Kgs.
Intervalo de clase = 6 Kgs.

Peso en Kg.
Li
7-
13 -
19 -
25 -
3- 1 ----�
--

�·-

-
37

Una vez obtenidos todos los límites inferiores (Li = valor menor de cada
clase) de la escala se calculan los límites superiores de cada clase. El límite
superior (Ls) es el valor mayor incluido en una clase estadística.
Dado que en una buena escala sus clases deben ser mutuamente exclu­
yentes (los valores contenidos en una clase no se repiten en la siguiente), el
límite superior de la primera clase debe ser una unidad (o una décima o cen­
tésima, etc., en caso de utilizar valores decimales) menor que el límite infe­
rior de la segunda clase.
En el presente ejemplo, el límite inferior de la segunda clase es 1 3 , por lo
tanto el límite superior de la primera clase es 12. Una vez obtenido el límite
superior de la primera clase, los demás se obtienen mediante la suma conse­
cutiva del intervalo de clase utilizado en el ejemplo mencionado se tienen:
1 2 + 6 = 1 8; 1 8 + 6... y así de manera sucesiva.

Peso en Kg.
Li -Ls
7 a 12
13 a 18
--··-�--�·----
1 9 a 24
25 a 30
-

3 1 a 36
--- ··
37 a 42

85
Es conveniente aclarar que en escalas numéricas continuas existen dos
tipos de límites superiores: Límite superior aparente y Límite superior real.
El primero es el que se escribe en la escala, mientras que el real es tácito. En
el ejemplo utilizado, el límite superior aparente de la primera clase es 12;
sin embargo, esta clase realmente llega hasta 12 kilos y 999 gramos, es de­
cir, 0,001 gr antes de llegar a 13 kilos. Por tal motivo y para fines prácticos,
se considera que el límite superior real de cada clase es igual al límite infe­
rior de la clase siguiente. Tal criterio es convencional y puede variar de un
autor a otro.
En cada clase de la escala utilizada en el ejemplo, quedan incluidos seis
pesos diferentes (le= 6). En la primera clase, por ejemplo, se ubicarán a los
niños de 7; 8; 9; 10; 11 y 12 kgs. En la última clase estarán los de 37; 38; 39;
40; 41 y 42 kgs.
Una vez formada la escala se computa cuantos sujetos corresponden a
cada clase, es decir, se obtiene lafrecuencia absoluta de cada clase.

Peso en Kg. frecuencia absoluta (f)


7 a 12 25
13 a 18 14
19 a 24 9
25 a 30 5
31 a 36 4
37 a 42 3
Total 60

También la variable edad, incluida en la tabla maestra # 1, puede ser dis­


tribuida en una escala de razón.
X(max.J = 11 años
X(min ) = O años (los niños de meses de edad se consideran con cero años
para trabajar con una sola unidad de medida).
Número de clases = 5
le = Rango = 11 años - O años = 11 años = 2,2 años
# de clase 5 5

86
2,2 puede redondearse a 2 años. Al hacer esta aproximación por defecto,
se pierden fracciones importantes del intervalo, por lo cual será necesario
formar una clase más de lo previsto.

Edad en años f
Oal 16
2a3 12
4a5 10
6a7 8
�·

8a9 8
10 a 1 1 6
Total 60

Puede observarse que en lugar de 5 clases fue necesario formar 6 clases


utilizando el mismo intervalo (le) calculado. Tal situación se presenta siem­
pre que el intervalo de clase se aproxima por defecto, o el le es producto de
una división exacta.
Por ejemplo, en la variable peso de la tabla maestra # 1 , donde el rango es
3 5 kg, si se calcula el le con 7 clases, en la escala será necesario crear real­
mente 8 clases, para que la escala sea exhaustiva.
35 Kg
le = Rango = = S Kg
# de clases 7

Peso en Kg f
7- 11 21
1 2 - 16 14 --
17 -2 1 8 --
22 -26 7
27 -3 1 3
32 -36 4
37 - 41 2
42 - 46 1
Total 60

87
Una buena escala, además de tener clases mutuamente excluyentes tam­
bién debe ser exhaustiva, lo cual significa que debe disponer de las clases
necesarias para que todos los valores o datos de la serie estadística puedan
ser ubicados en su clase respectiva. Ningún valor debe quedar sin ubica­
ción. Por tal motivo, en el ejemplo anterior hubo necesidad de agregar la
clase de 42 a 46 kgs, dado que el límite superior de la séptima clase fue 4 1 ,
dejando fuera al niño de 42 kgs. y en tal caso, la escala no sería exhaustiva.
Para que esto no ocurra se adicionan las clases necesarias, sin hacer modifi­
caciones a los cálculos realizados anteriormente.
Cuando los sujetos son ubicados en sus respectivas clases, pierden el ca­
rácter individual que tenían en la serie original, por lo cual es necesario bus­
car para cada clase, un valor que represente a todos los valores contenidos
en ellas.
Este valor representativo de los valores de cada clase se conoce con el
nombre de centro de clase o punto medio o marca de clase. Es el valor cen­
tral de cada clase, por lo cual la divide en dos partes iguales. Se simbolizan
como Xm o Ce, y se calculan mediante la fórmula:
Li + Ls ( real)
Xm =
2
Xm = Punto medio o Centro de clase
Li = límite inferior de la clase
Ls (real) = límite superior real de la clase. (Recuerde que el límite supe­
rior real de una clase es el mismo límite inferior de la clase si­
guiente, cuando la variable es continua).
Ejemplo:
Peso en Kg. Xm (t)
1 7 a 12 10 25
2 13 a 18 16 14
3 19 a 24 22 9
4 25 a 30 28 5
5 3 1 a 36 34 4
6 37 a 42 40 3
Total 60

88
Xm(]) = - - = - = l O Kgs
7 + 1 3 20
2 2

Xm<2l = = 1 6 Kgs. . .
13 + 19
-
-
2

37 + 43 =
Xm0 6) = 40 Kgs
2
Se calculan tantos centros de clase como clases tenga la escala. Cada uno
de ellos representa el promedio de su clase. Por ejemplo, los 25 niños de la
primera clase tienen un peso promedio de 1 O kgs.
Los centros de clase (Xm) NO se redondean.
Peso en Kg Xm
7- 11 9,5
12 - 1 6 14,6
1 7 -2 1 1 9,5
22 -26 24,5
27 -3 1 29,5
32 -36 34,5
37 - 41 39,5
42 - 46 44,5

Frecuentemente es necesario distribuir los datos en función de dos varia­


bles simultáneamente. En tal caso, la formación de las clases de cada varia­
ble se realiza de manera individual, siguiendo los procedimientos antes des­
critos para cada tipo de escala (nominal, ordinal o numéricas). Luego las
clases en que fue dividida la variable principal se colocan en la primera co­
lumna, y las de la variable secundaria en la primera fila. Posteriormente la
ubicación de cada dato (computación) debe responder a las dos característi­
cas que cada sujeto posee. Por ejemplo, en la tabla maestra # 1, el sujeto # 6
es un niño de 1 año y de sexo masculino, por lo cual debe ubicarse en la cla­
se de O a 1 año y en la columna de masculino.

89
SEXO
Edad en años Total
Femenino Masculino
Oa l 8 8 16
2a3 8 4 12
4a5 6 4 10
6a7 5 3 8
8a9 5 3 8
10 a 1 1 4 2 6
Total 36 24 60

Al proceso de formar las clases y acompañarlas de sus respectivas fre­


cuencias algunos autores lo denominan "tabulación de los datos ", lo cual
no debe confundirse con un cuadro estadístico, aun cuando lo origina.
4.- La cuarta sub-etapa de la elaboración o procesamiento de los datos es
la Presentación. Esta puede hacerse en Cuadros estadísticos o en gráficos,
dependiendo de su propósito. Tiene como finalidad resumir la información
y ofrecerla de manera completa para facilitar su análisis. Pueden construir­
se básicamente tres tipos de cuadros: De Distribución de frecuencias, de
Asociación y de Series cronológicas, los cuales serán explicados más ade­
lante.

CUADROS ESTADÍSTICOS
En los Cuadros estadísticos la información se presenta de manera precisa
y detallada, lo cual permite el análisis minucioso de los datos. Para cumplir
con este propósito el cuadro debe ser completo, con sus cuatro partes y no
sólo la tabulación de los datos.

PARTES DE UN CUADRO ESTADÍSTICO


Encabezamiento (número y título), matriz o molde, cuerpo y pie (fuente
y notas explicativas).
Ejemplo:

90
Cuadro # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Ambulatorio Rural JI,
La Agu adita. Edo. Cojedes. Marzo, 1997.
Sexo f F. R.
Femenino 36 60 %
Masculino 24 40 %
Total 60 1 00 %
Fuente: Archivo de Historia Médicas del Ambulatorio Rural II, La Aguadita, Edo.
Cojedes.

A- Encabezamiento: Colocado en la parte superior del cuadro. En él se in­


cluye el número del cuadro y el título de éste.
EL título se refiere al aspecto o problema que fue estudiado. Debe espe­
cificar como se distribuyen los sujetos según la variable presentada en el
cuadro, así como el lugar donde se realizó el estudio y la fecha cuando se
obtuvo la información.
En el cuadro # 1 se observa que el estudio se refiere a la evaluación nutri­
cional de los menores de 12 años. Los sujetos fueron distribuidos en las
clases en que fue dividida la variable sexo. El estudio se realizó en La
Aguadita, estado Cojedes, y la información fue recopilada en marzo de
1997.
B- La matriz o molde: Constituida por la primera columna (denominada
"columna matriz", donde se coloca el nombre de la variable principal y
sus clases) y primera fila, donde se coloca la identificación de las otras
columnas y las clases de una segunda escala, si el cuadro lo requiere.
En el cuadro # 1 , la matriz es:
Sexo f F. R.
Femenino
Masculino
Total
C- Cuerpo: Esta parte lo constituyen el cruce de columnas con filas. Es el
sitio donde se colocan las columnas correspondientes a frecuencias ab­
solutas yfrecuencias relativas. Y las cifras totales de cada columna y de

91
cada fila, si esta última lo requiere. También pueden colocarse otras co­
lumnas referidas a cálculos adicionales que permitan procedimientos o
análisis posteriores, como por ejemplo los centros de clase y lasfrecuen­
cias acumuladas, entre otras.
D- El pie. En la parte inferior del cuadro se coloca lafuente de donde se ob­
tuvo la información presentada. Cuando sea necesario pueden anexarse
notas explicativas que faciliten la comprensión de la información mos­
trada en el cuadro. Estas notas se colocan después de la fuente.

TIPOS DE CUADROS ESTADÍSTICOS


Además de las tablas maestras, donde se transcribe toda la información
contenida en los formularios utilizados para la recolección de los datos,
pueden construirse (con los datos de la tabla maestra) tres tipos de cuadros:
De Distribución de frecuencias, de Asociación y de Series cronológicas.
Los cuadros de distribución de frecuencias. Donde se describe la fre­
cuencia con que se presenta el fenómeno de interés. Se elaboran sobre la
base de una sola variable, bien sea numérica o no. También incluyen las fre­
cuencias relativas, y un gran total. Las frecuencias relativas indican la rela­
ción entre cada frecuencia absoluta y el total; expresadas generalmente en
porcentaje.

Cuadro # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural II.
La Aguadita. Edo. Cojedes. Marzo, 1 997.
Estado nutricional f F. R.
Sobre la norma 5 8%
Normal 31 52 %
Desnutrición leve 12 20 %
Desnutrición moderada 8 13 %
Desnutrición grave 4 7%
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II. La Aguadita, Edo. Co­
jedes.

92
Cuadro # 3
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad. Ambulatorio Rural //,
La Aguadita, Edo. Cojedes. Marzo, 1997.

Edad en años f F. R.
O-1 16 27 %
2-3 12 20 %
4-5 10 17 %
6-7 8 13 %
8-9 8 13 %
10 - 1 1 6 10 %
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co­
jedes.

Cuadro # 4
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según peso. Ambulatorio Rural //,
La Aguadita, Edo. Cojedes. Marzo, 1997.

Peso en Kgs f F. R.
7 - 12 25 42 %
13 - 1 8 14 23 %
19 - 24 9 15 %
25 - 30 5 8%
3 1 - 36 4 7%
37 - 42 3 5%
Total 60 1 00 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co­
jedes.

Estos tres cuadros son de distribución de frecuencias. El # 2 presenta una


escala ordinal. El # 3 y # 4 están referidos a variables numéricas y confor­
man escalas de razón.

93
Los cuadros de Asociación se construye para estudiar la posible relación
entre dos o más variables. Por lo tanto, incluyen al menos dos variables de
manera simultánea, y regularmente varios sub-totales y un gran total. Un
ejemplo típico de este tipo de cuadro es aquel donde se muestra la distribu­
ción de un grupo de sujetos por edad y sexo al mismo tiempo.
Los cuadros de asociación también incluyen las frecuencias relativas, las
cuales pueden ser calculadas de diversas maneras, de acuerdo a los objeti­
vos planteados.

Cuadro # 5
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad y sexo. Ambulatorio Rural JI,
La Aguadita, Edo. Cojedes. Marzo, 1997.

SEXO
Edad en años Femenino Masculino Total
f F. R. f F. R.
O- 1 8 (22 %) 8 (33 %) 16
2-3 8 (22 %) 4 ( 1 7 %) 12
4-5 6 ( 1 7 %) 4 ( 1 7 %) 10
6-7 5 ( 1 4 %) 3 ( 1 2.5 %) 8
8-9 5 ( 1 4 %) 3 ( 12.5 %) 8
10 - 1 1 4 ( 1 1 %) 2 (8 %) 6
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI. La Aguadita, Edo.
Cojedes.

Este cuadro (nº 5) muestra la distribución de los sujetos según las varia­
bles cuantitativa (edad, en la escala principal) y cualitativa (sexo, en la es­
cala secundaria).
El cuadro nº 6 está referido a dos variables cualitativas: estado nutricio­
nal y sexo.

94
Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.

SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma 2 (6 %) 3 ( 12.5 %) 5
Normal 18 (50 %) 13 (54 %) 31
Desnutrición leve 8 (22 %) 4 ( 1 7 %) 12
Desnutrición moderada 5 ( 1 4 %) 3 ( 12.5 %) 8
_Qesnutrición grave 3 (8 %) (4 %) 4
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.
Cojedes.

Cuadros de Series cronológicas. En las ciencias de la salud, en muchas


ocasiones es necesario estudiar un fenómeno, una enfermedad por ejemplo,
a lo largo de varios periodos ( días, semanas, meses o años), a fin de conocer
su evolución en el tiempo. En estos casos, la información se presenta en un
cuadro de series cronológicas, donde sólo se pretende mostrar la variación
de un fenómeno de una época a otra, omitiendo los totales, lo cual lógica­
mente impide el cálculo de porcentajes.
Generalmente estos cuadros constan de dos columnas. La columna ma­
triz destinada para la escala del tiempo, y la segunda para indicar el número
de veces que ocurrió el fenómeno estudiado (frecuencias absolutas). Sin
embargo, cuando se describen las variaciones de una población, es conve­
niente disponer de una tercera columna de tasas (frecuencias relativas),
donde se relaciona las veces que ocurrió el fenómeno con respecto a 1.000;
10.000 ó 100.000 sujetos de la población susceptible; con lo cual se facili­
tan las comparaciones. Cuando es posible, puede incluirse en el cuadro la
población susceptible en cada período estudiado.
Los cuadros 7, 8 y 9 corresponden a esta categoría.

95
Cuadro # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Carabobo. 1992-1996

Casos Tasa de morbilidad


Aiios Población
notificados por 100.000 hab.
1 992 220 1 .225.740 1 7,9
1 993 267 1 .388.461 1 9,2
1 994 261 1 .437.246 1 8,2
1 995 3 07 1 .486.682 20,7
1 996 329 1 .562.323 21,1
Fuente: Hojas de notificación de tuberculosis del M.S.A.S. Comisionaduría de Sa­
lud del Edo Carabobo.

Cuadro # 8
Mortalidad general diagnosticada y no diagnosticada.
Venezuela, 1992-1996.

DIAGNOSTICADA NO DIAGNOSTICADA
Año Total
Muertes Porcentaje Muertes Porcentaje
1 992 70.760 85.8 1 1 .710 1 4.2 82.470
1 993 7 1 .635 85.6 12.050 1 4.4 83.685
1 994 73.288 84.4 1 3.546 1 5.6 86.834
1 995 77.245 85.5 1 3 . 1 00 14.5 90.345
1 996 78.591 85.8 1 3.007 14.2 9 1 .598
Fuente: M.S.A.S. Memoria y Cuenta 1 .992- 1 .996. Venezuela.

96
Cuadro # 9
Dengue hemorrágico. Morbilidad y mortalidad. Venezuela.
Septiembre 1996-Marzo 1997.

Meses Casos diagnosticados Muertes


Septiembre 3 o
Octubre 5 3
Noviembre 27 5
Diciembre 1 .656 19
Enero 7.265 33


Febrero 2.788 12
Marzo
-
276 1
Fuente: Trabajo de investigación "Dengue hemorrágico en Venezuela". Castillo, E.
y otros. 1 997.

Es necesario precisar que las series cronológicas no son cuadros de dis­


tribución de frecuencias ni de asociación, pues estudian los fenómenos
desde el punto de vista de su evolución en el tiempo.

GRÁFICOS ESTADÍSTICOS
En ocasiones, es conveniente presentar la información de manera gene­
ral, sin los detalles de los cuadros estadísticos. Normalmente, cuando la
idea es trasmitir la información a .un público no especializado, o simple­
mente destacar la variación importante de un fenómeno, suelen utilizarse
los gráficos estadísticos, por su ventaja de presentar fácilmente los mensa­
jes que se desean transmitir.
Para su construcción existe una serie de recomendaciones que facilitan
su confección; entre ellas:
1- Todo gráfico debe ser completo. Deben contener: Encabezamiento, grá­
fico propiamente dicho y fuente.

97
- El encabezamiento, ubicado en la parte superior del gráfico. Contiene
Número y Título, el cual requiere los mismos elementos que los títu­
los de los cuadros.
- El gráfico propiamente dicho generalmente se construye sobre un sis­
tema de coordenadas, donde en la abscisa (eje horizontal) se colocan
las clases en que ha sido dividida la variable, y en la ordenada (eje ver­
tical) se colocan las frecuencias, generalmente relativas.
En la parte inferior del gráfico se coloca el pie, en el cual se menciona
la fuente de donde se obtuvo la información y notas explicativas,
cuando el gráfico las amerita.
2- Se recomienda que exista relación entre la longitud de la abscisa y de la
ordenada, con el propósito de mantener la proporción del gráfico. Se es­
tima que por cada centímetro de longitud de la ordenada se dé entre uno
y dos centímetros a la abscisa. Podría hablarse de un promedio de 1 ,5
aproximadamente.
3- La abscisa se divide en tantas partes como clases se deban presentar. El
número de partes en que se divide la ordenada queda a criterio de quien
elabora el gráfico; teniendo cuidado de que todos los segmentos sean de
igual tamaño, y aumenten con un mismo intervalo, por ejemplo, de 1 O en
1 0: O - 1 0 - 20 - 30 - 40. Otro puede ser de 5 en 5: O - 5 - 1 0 - 1 5 - 20 - 25,
etc. La ordenada siempre comienza en cero y termina en la mayor fre­
cuencia (generalmente relativa) a presentar, o en un valor próximo a
ésta.
4.- Cuando la frecuencia menor a representar en el gráfico está muy alejada
de cero, se aconseja realizar un corte en el inicio de la ordenada, por en­
cima de cero, y colocar por encima del corte la frecuencia menor. Este
corte sugiere que se ha desechado el segmento sin uso en la ordenada. De
esta manera se mantiene la proporción del gráfico.
5- Dado que existen diferentes gráficos, estos se eligen según el propósito y
el tipo de cuadro que lo origina; así como la escala de medición de la va­
riable a representar. Para ellos puede utilizarse como guía, el siguiente
esquema:

98
ESCALA DE
TIPO DE
MEDICIÓN DE LA TIPO DE GRÁFICO
CUADRO
VARIABLE
Barras Simples y Diagra­
Nominal, ordinal Y Numé-
ma Sectorial o Gráfico de
ricas Discretas
Distribución Torta
de Frecuencias Histogramas y Polígonos
Numéricas Continuas de frecuencias. Además,
Curva Integral
Numérica y nominal o nu­
Polígono de frecuencias
mérica y ordinal
Cuadrosde Ambas Nominales o Am-
Barras múltiples y Barras
Asociación bas ordinales o Nominal y
Proporcionadas
ordinal
Ambas Numéricas Diagrama de puntos
Series Tiempo (años, meses, se­ Línea de tendencia, Núme­
Cronológicas manas, días, etc.) ros Indices y Barras

GRÁFICOS DE BARRAS SIMPLES:


Con la información contenida en el cuadro # l se puede construir un grá­
fico de barras simples. Este gráfico consiste en una serie de rectángulos se­
parados unos de otros. Cada rectángulo representa a una clase estadística.
Su construcción se inicia con el encabezamiento (# y título) del gráfico.
Seguidamente se traza la ordenada y la abscisa, manteniendo la proporción
aproximada de 1: 1,5 ; como se indicó en la segunda de las recomendaciones
señaladas inicialmente. Luego, se divide el eje horizontal en tantas partes
como clases se deban presentar. Para la elaboración del gráfico correspon­
diente al cuadro # 1, puede construirse una abscisa de 12 cm. de longitud, y
dividirla en dos segmentos de 6 cm. cada una (uno para cada sexo). En cada
segmento se marca un espacio de aproximadamente 1/4 de su longitud; es­
pacio que se deja libre para separar las barras entre sí.
Luego se divide el eje vertical en partes iguales. Para representar gráfica­
mente el cuadro # 1, la ordenada puede ser de unos 8 cms aproximadamen­
te, y dividirla en cuatro segmentos de 2 cms cada uno. La escala de identifi-

99
cación de esta ordenada puede ir aumentando de 15 en 1 5 , partiendo de cero
hasta llegar a 60 %, siendo ésta la frecuencia relativa máxima mostrada en
el cuadro.
Una vez divididas las coordenadas, se construyen los rectángulos o ba­
rras de igual base y a la altura que lo indiquen las frecuencias relativas a re­
presentar. Luego se identifica la variable llevada a la abscisa y las frecuen­
cias llevadas a la ordenada. Por último, en la parte inferior del gráfico se in­
dica la fuente de donde se obtuvo la información, y si se requiere, se
escriben las notas explicativas pertinentes.

Cuadro # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Ambulatorio Rural JI,
La Aguadita. Edo. Cojedes. Marzo, 1997.

Sexo f F. R.
Femenino 36 60 %
Masculino 24 40 %
Total 60 100 %

Fuente: Archivo de Historias Médicas del Ambulatorio Rural II, 'La Aguadita, Edo.
Cojedes.

Como este cuadro es de distribución de frecuencias de escala categórica,


se representa mediante un gráfico de Barras simples o de diagrama secto­
rial.

1 00
Gráfico # 1
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según sexo. Frecuencias expresadas en porcentajes.
Ambulatorio Rural JI, La Aguadita. Edo. Cojedes. Marzo, 1997.

70

60

p 50
o

e
e
40

L_
e
j 20

10

Sexo

Fuente: Archivo de Historias Médicas del Ambulatorio Rural II, La Aguadita, Edo.
Cojedes.

GRÁFICO CIRCULAR O DIAGRAMA SECTORIAL


Otra manera de representar la misma información es a través del llamado
diagrama sectorial o gráfico circular. Este se construye en un círculo, cuya
área se distribuye de manera proporcional entre las frecuencias relativas a
representar. Los 3 60 grados del círculo, representan la frecuencia total, y
cada frecuencia relativa una parte de ese total, es decir, se divide el círculo
en tantos sectores como clases tenga la distribución, correspondiéndole a
cada uno un área determinada, expresada en grados de circunferencia. Para
el cuadro # 1 , a la clase defemenino le corresponden 2 1 6 grados, y a la clase
de masculino 1 44 grados (360 x 40% / 1 00).
También la información contenida en el cuadro # 2, referido a evalua­
ción nutricional de un grupo de pacientes, puede ser presentada gráfica­
mente en un diagrama sectorial. En este caso, el círculo se divide en 5 partes
y se calculan los grados correspondientes a los ángulos de cada clase, según
los porcentajes previamente obtenidos.

101
Cuadro # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural /l.
La Aguadita. Edo. Cojedes. Marzo, 1 997.

Grados de
Estado nutricional f F. R.
circunferencia
Sobre la norma 5 8% 29
Normal 31 52 % 187
Desnutrición leve 12 20 % 72
Desnutrición moderada 8 13 % 47
Desnutrición grave 4 7% 25
Total 60 100 % 360
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JILa A guadita. Edo. Co­
jedes.

Gráfico # 2
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según Estado nutricional. Ambulatorio Rural 11.
La Aguadita. Edo. Cojedes. Marzo, 1 997.

Desnutrición leve
20%

Sobre la norma Desnutrición grave


8% 7%

Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI La A guadita. Edo. Ca­


jedes

102
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
El histograma, al igual que las barras, también se construye sobre un
sistema de ejes de coordenadas. Está conformado por un conjunto de rec­
tángulos, cuyas bases tienen una longitud proporcional al intervalo de la
clase que representan y la altura es proporcional a la frecuencia relativa de
cada clase. A diferencia de las barras simples, los rectángulos del histogra­
ma están unidos por sus lados, es decir, no hay separación entre ellos.
La información contenida en los cuadros # 3 y 4 puede presentarse gráfi­
camente en un histograma o en un polígono de frecuencias, dado que se tra­
ta de cuadros de distribuciones de frecuencias de escalas numéricas (de ra­
zón).
Para construir histogramas se recomienda seguirlos siguientes pasos:
1 - En la parte superior escribir el número y título del gráfico. Luego trazar
la ordenada y la abscisa, manteniendo proporción en sus longitudes
( 1 : 1 ,5 aproximadamente).
2- Dividir el eje horizontal en tantas partes como clases se deban presentar,
indicando en cada segmento el límite inferior de cada clase. En caso de
construir un histograma con la información del cuadro # 3, será necesa­
rio dividir la abscisa en seis partes iguales, indicando en cada división el
límite inferior de cada clase.
3- Igualmente, dividir el eje vertical en partes iguales. Identificar la escala
desde cero hasta su valor máximo correspondiente a la mayor frecuencia
relativa a representar. En el cuadro # 3 el mayor porcentaje es 27 %, por
lo tanto, la ordenada puede dividirse en 3 partes iguales y aumentar de 9
en 9 hasta llegar a 27; o puede llevarse hasta 30 %, e igualmente dividirla
en 3 parte y aumentar de 1 0 en 10.
4- Luego se construye cada rectángulo con bases proporcionales a cada in­
tervalo de clase y a la altura que lo indiquen las frecuencias relativas. Se
identifica la variable llevada a la abscisa y las frecuencias colocadas en
la ordenada.
5- Por último, en la parte inferior se indica la fuente de donde se obtuvo la
información y las notas explicativas si son necesarias.

103
Cuadro # 3
Evaluación nutricional de pacientes menores de 12 años
distribuidos según edad. Ambulatorio Rural JI,
La Aguadita, Edo. Cojedes. Marzo, 1 997.

Edad en años f F. R. Xm
O-1 16 27 %
2-3 12 20 % 3
4-5 10 17 % 5
6-7 8 13 % 7
8-9 8 13 % 9
10 - 1 1 6 10 % 11
Total 60 100 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural /1, La Aguadita, Edo.
Cojedes.

Gráfico # 3
Evaluación nutricional de pacientes menores de 12 años
distribuidos según edad, expresada en porcentaje.
Ambulatorio Rural 11, La Aguadita, Edo. Cojedes. Marzo, 1997.

25

p
o 20

e
e 15
n
t
a 10

0-1 2-3 4-5 6-7 8-9 10-11


Años

Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.


Cojedes.

104
Por su parte, el polígono de frecuencias es un gráfico lineal construido
por una serie de puntos unidos por líneas rectas, en un sistema de ejes de co­
ordenadas.
Para su elaboración se siguen prácticamente los mismos pasos del histo­
grama. Sólo varia el cuarto paso donde, una vez indicados los límites infe­
riores de cada clase, en cada uno de los segmentos en que ha sido dividida la
abscisa, se señalan además, los centros de clase (Xm). Luego se levantan
los puntos sobre los centros de clase, a una altura proporcional a la frecuen­
cia de la misma, y seguidamente, se unen dichos puntos con trazos rectos.
El resto de los pasos también son similares al del histograma.

Gráfico # 3 - B
Evaluación nutricional de pacientes menores de 12 años distribuidos
según edad, expresada en porcentaje. Ambulatorio Rural 11,
La Aguadita, Edo. Cojedes. Marzo, 1997.
30

27

25

p
o 20

e
e 15
13
n

a 10 10

0-1 2-3 4-5 6-7 8-9 10-11

- ---- - - -- - - - - - - - - - - - -� ---- �
Años

Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.


Cojedes.

CURVA INTEGRAL O DIAGRAMA DE FRECUENCIAS ACUMU­


LADAS.
La misma información del cuadro # 3 también puede representarse en
forma diferente a través del gráfico de frecuencias acumuladas o curva inte­
gral. Para este fin, se calculan las frecuencias acumuladas (FA), las cuales

105
se obtienen mediante la suma consecutiva de las frecuencias absolutas de
cada clase.
El gráfico permite saber cuántos sujetos hay hasta un determinado valor
o a partir de éste. Del mismo modo pueden expresarse las frecuencias relati­
vas en forma acumuladas.
Este gráfico también se construye sobre el sistema de ejes de coordena­
das. Cada clase se representa por un punto colocado en el límite superior de
cada clase, a la altura indicado por la frecuencia acumulada.
Para su construcción igualmente se siguen casi todos los pasos del polí­
gono de frecuencias, una vez acumuladas las frecuencias. La diferencia bá­
sica radica en que no requiere de los centros de clase. Además, en la abscisa
se indican los límites superiores de cada clase, y cada punto se marca sobre
cada uno de estos, a la altura indicada por la frecuencia acumulada corres­
pondiente a cada clase. Luego se unen los puntos mediante rectas. La curva
producto de la unión de estos puntos, siempre tiene una sola dirección, ge­
neralmente en sentido ascendente.
Los cuadros # 3 y 4 también pueden representarse mediante este gráfico.
Como ejemplo se tomará la información del cuadro # 4, para lo cual es ne­
cesario calcular las frecuencias acumuladas de cada clase.

Cuadro # 4
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según peso. Ambulatorio Rural 1l
La Aguadita, Edo. Cojedes. Marzo, 1997.

Peso en Kgs f F. R. F. A.
7 - 12 25 42 % 25
13 - 18 14 23 % 39
1 9 - 24 9 15 % 48
25 - 30 5 8% 53
3 1 - 36 4 7% 57
37 - 42 3 5% 60
Total 60 1 00 %
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11, La Aguadita, Edo. Co­
jedes.

106
Gráfico # 4
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según peso, expresada en frecuencias acumuladas. Ambulatorio Rural II,
La Aguadita, Edo. Cojedes. Marzo, 1997.

F 70

e
e
u
60

e
n
50

e
1 40
a

e
A 30

u
m 20

1
10

d
a

a
7-12 1 3-18 19-24 25-30 31-36 37-42
Kgs.

Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Co­
jedes.

POLÍGONO DE FRECUENCIA PARA CUADROS DE ASOCIA­


CIÓN CON VARIABLE NUMÉRICA COMO VARIABLE PRIN­
CIPAL.
El cuadro # 5 muestra información referente a la edad y sexo del grupo
estudiado, puede ser representado gráficamente por polígonos de frecuen­
cias; en este caso, se construyen sobre el mismo eje coordenado dos polígo­
nos, uno para el sexo masculino y otro para el femenino, como si fueran dos
distribuciones de frecuencias, pues, ambos tienen las mismas clases con los
mismos intervalos y centros de clases, por lo cual, se siguen las mismas re­
comendaciones formuladas en la construcción de polígonos para cuadros
de distribución de frecuencias.

107
Cuadro # 5
Evaluación nutricional de pacientes menores de 12 años,
distribuidos según edad y sexo. Ambulatorio Rural /1
La Aguadita, Edo. Cojedes. Marzo, 1997.

SEXO
Edad en años Femenino Masculino Total
f F. R. f F. R.
O-1 8 (22 %) 8 (33 %) 16
2-3 8 (22 %) 4 ( 1 7 %) 12
4-5 6 ( 1 7 %) 4 ( 1 7 %) 10
6-7 5 ( 1 4 %) 3 ( 12.5 %) 8
8-9 5 ( 1 4 %) 3 ( 12.5 %) 8
10 - 1 1 4 ( 1 1 %) 2 (8 %) 6
Total 36 ( 1 00 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11. La Aguadita, Edo.
Cojedes.

Gráfico # 5
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según edad y sexo, expresados en porcentajes. Ambulatorio Rural IL
La Aguadita, Edo. Cojedes. Marzo, 1997.

30

p 25
o

20
e
--Femenino
e " w•w �Masculino
n 15
t
.....................'•
'•,
..
.... ,..... .......
10

L -��
0-1 2-3 4-5
Años
6-7 8-9

Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI. La Aguadita, Edo.


10.11

Cojedes.

108
BARRAS PROPORCIONADAS
Se utilizan para mostrar la variación proporcional de una variable con
respecto a la otra. Por lo tanto, es indispensable calcular porcentajes. Cada
sub-total (de columnas o de filas, según sea el caso) se iguala a 1 00, y en
función de ello se obtienen los porcentajes respectivos, por consiguiente,
todas las barras tendrán la misma altura (100).
Se construyen con la información presentada en cuadros de asociación
con dos escalas nominales u ordinales, o nominal y ordinal.
El cuadro # 6 corresponde a este tipo, en él se tiene una escala nominal y
la otra ordinal. Para representarlo gráficamente se puede construir de dos
maneras diferentes, según lo que se desee mostrar. Si interesa mostrar la
proporción de los diversos estados nutricionales en cada uno de los sexos,
se construyen barras proporcionadas, como las mostradas a continuación.
Se elaboran dos barras, y cada una representa el 100% de cada sexo. En este
caso, cada barra se divide en cinco segmentos, correspondiente a los cinco
estados nutricionales mostrados en el cuadro # 6. El área correspondiente a
cada segmento es proporcional a la frecuencia relativa a representar. Todas
las demás indicaciones para su elaboración son similares a las utilizadas en
la construcción de barras simples.

Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.
SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma
Normal 13
2 (6 %) 3 ( 1 2 . 5 %) 5

Desnutrición leve
18 (50 %) (54 %) 31

Desnutrición moderada
8 (22 %) 4 ( 1 7 %) 12

Desnutrición gra��-
5 ( 1 4 %) 3 ( 1 2.5 %) 8

Total
3 (8 %) (4 %) 4
36 ( 100 %) 24 ( 1 00 %) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural 11, La Aguadita, Edo. Co-
jedes.

109
Gráfico # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural,
La Aguadita, Edo. Cojedes. Marzo, 1997.

90%

80%

p 70%
o
r so%
111D Desnutrición grave
e 50%
D Desnutrición moderada
n � Desnutrición leve
40%
t • Normal

ª 30%
D Sobre la norma

e 20%

10%

Femenino Masculino
Sexo

Fuente: Archivo de Historias Médicas. Ambulatorio Rural //, La Aguadita, Edo.


Cojedes.

GRÁFICO DE BARRAS MULTIPLES.


Otra forma de presentar la información de un cuadro de asociación con
dos escalas nominales u ordinales es mediante el diagrama de barras múlti­
ple. En tal caso, se calculan las frecuencias relativas sobre la base del gran
total indicado en el cuadro. Este gráfico se construye siguiendo las mismas
recomendaciones dadas para la elaboración del diagrama de barras simples.
La diferencia radica en que en las barras múltiples se forman conjuntos de
barras, correspondientes a las clases en que ha sido dividida una variable.
Estos conjuntos se separan unos de otros, en función de una de las variables.
Según el número de barras que conforman cada grupo se denominan barras
dobles, barras triples, etc.

1 10
Cuadro # 6
Evaluación nutricional de pacientes menores de 12 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural, La Aguadita, Edo.
Cojedes. Marzo, 1997.

SEXO
Estado Nutricional Femenino Masculino Total
f F. R. f F. R.
Sobre la norma 2 (3.3 %) 3 (5 %) 5
Normal 18 (30 %) 13 (2 1 .6 %) 31
Desnutrición leve 8 ( 1 3.5 %) 4 (6.6 %) 12
Desnutrición moderada 5 (8 %) 3 (5 %) 8
Desnutrición grave 3 (3 %) (2 %) 4
Total 36 (60 %) 24 (40 % ) 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.
Cojedes.

Gráfico # 6 - B
Evaluación nutricional de pacientes menores de 12 años, distribuidos
proporcionalmente según estado nutricional cada sexo. Ambulatorio
Rural, La Aguadita, Edo. Cojedes. Marzo, 1997.

30

P 25
o

e
e
20
O Sobre la norma
B Normal
� Desnutrición leve
n 15 O Desnutrición moderada
IIIIIJ Desnutrición grave

e
10

Femenino Masculino
Sexo

Fuente: Archivo de Historias Médicas. Ambulatorio Rural JI, La Aguadita, Edo.


Cojedes.

111
DIAGRAMA DE DISPERSIÓN PARA CUADROS DE ASOCIA­
CIÓN CON DOS ESCALAS NUMÉRICAS: DISCRETAS O CON­
TINUAS.
El Diagrama de Dispersión o de puntos es un gráfico utilizado para mos­
trar la asociación existente entre dos variables numéricas de intervalo o ra­
zón, continuas o discretas. Se construye utilizando el eje de coordenadas,
colocando en la abscisa la variable considerada independiente (X) y en la
ordenada, la variable dependiente (Y). Para cada valor X, hay un valor Y.

GRÁFICO DE LÍNEAS DE TENDENCIA.


La representación gráfica de una serie cronológica es a través de un grá­
fico lineal llamado LÍNEA DE TENDENCIA el cual se construye también
sobre un eje coordenado. En la abscisa se colocan las clases correspondien­
tes a la variable tiempo, y en la ordenada las frecuencias relativas, tal como
se muestra a continuación, con la información del cuadro # 7.

Cuadro # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Aragua. 1992-1996.

Casos Tasa de morbilidad


Años Población
notificados por 100.000 hab.
1 992 220 1 .225.740 1 7,9
1 993 267 1.388.461 1 9,2
1 994 261 1 .437.246 1 8,2
1995 307 1 .486.682 20,7
1996 329 1 .562.323 21,1
Fuente: Hojas de notificación de tuberculosis del MS.A.S.

1 12
Gráfico # 7
Tuberculosis. Morbilidad y tasas por 1 OO. 000 habitantes.
Estado Aragua. 1992-1996.

21

20.5

T 20
a
S 19,5
a
s
19

18,5

18

1992 1 993 1994 1995 1996


Allos

Fuente: Hojas de notificación de tuberculosis del M.S.A.S.

GRÁFICO DE NÚMEROS ÍNDICES PARA CUADROS DE SERIE


CRONOLÓGICA.
Existe un tipo de gráfico utilizado para mostrar la variación porcentual
de un fenómeno con respecto a sí mismo a través del tiempo. Este gráfico,
aun cuando es muy parecido al de línea de tendencia, se diferencia básica­
mente, en que las alturas de los puntos (que se unen para formar una línea)
representan una variación proporcional en términos porcentuales, lo cual se
denomina NÚMEROS ÍNDICES; mientras que en el gráfico de línea de
tendencia se representan (generalmente) las variaciones absolutas del fenó­
meno de estudio.
Los números índices son valores relacionados a un valor base igual a
cien. Se calculan tomando el valor que tenga como manifestación el fenó­
meno ocurrido en un año o período de tiempo, al cual se le denomina base.
Debe ser un período en donde se considera que el fenómeno se ha presenta­
do dentro de lo esperado, es decir, que no constituya un valor excepcional.
La decisión de tomar un año o período base depende del investigador o pro­
fesional, y a veces es una decisión dificil, pues, casi nunca se puede tener
seguridad de que es lo normal, y mucho menos cuando la variable tiempo

1 13
influye en el fenómeno. Una vez decidido el año o período base, su fre­
cuencia rel ativa se iguala a cien, siendo éste el primer número índice. El se­
gundo y los demás números índice se calculan haciendo una simple regla de
tres. Con la información del cuadro # 8 pueden calcularse estos val ores.
En ese cuadro, para la columna de muertes diagnosticadas, puede tomar­
se como período base el año 1 992, en el cual se iguala a 1 00 su frecuencia
rel ativa de 85,8 %. Para los años restantes, l os demás números índices se
cal culan por simples reglas de tres. Para 1 993 se tiene:
85,8 % - 1 0 0
85•6 x l 00 =
85, 6 % - X , X = 99,8 (segundo # índice)
85,8
Para el año 1 994 :
85,8 % - 1 00
84•4 x I OO =
84 ,4 % - X , X = 98,4 (tercer # índice)
85,8
y así sucesivamente para los años siguientes.
Para la col umna correspondiente a muertes no diagnosticadas, la fre­
cuencia relativa del año 1 992 se toma como período base, por l o cual , 14,2
% es equivalente a 1 0 0, y en función de esto se plantean las regl as de tres. ·
Para el año 1 993 se tiene:
1 4 ,2 % -=-- 1 0 0
1 4 •4 x l OO =
1 4 ,4 % - X , X = 1 0 1,4 (segundo # índice)
1 4,2
Para el año 1 994 :
1 4 ,2 % - 1 0 0
1 5 •6 x l 00 =
15, 6 % - X , X = 1 09,9 (tercer # índice)
1 4,2
Una vez obtenidos estos val ores se elabora el gráfico de números índi­
ces. Para ello, se procede como se indicó en el gráfico de líneas de tenden­
cia, con la única diferencia que en el eje de la ordenada se ubican los val ores
de los números índices calculados. El gráfico siguiente es l a representación

1 14
de un gráfico de números de índices con los valores correspondientes al
cuadro # 8.

Cuadro # 8
Mortalidad general diagnosticada y no diagnosticada.
Venezuela, 1992-1996.

DIAGNOSTICADA NO DIAGNOSTICADA
Año Números Números Total
Muertes Porcentaje Índices Muertes Porcentaje Índices
1 992 70.760 85.8 1 00.0 1 1 .7 1 0 14.2 1 00.0 82.470
1 993 7 1 .635 85.6 99.8 1 2.050 14.4 1 0 1 .4 83.685
1 994 73.288 84.4 98.4 1 3.546 1 5.6 109.9 86.834
1 995 77.245 85.5 99.7 1 3 . 1 00 14.5 1 02.1 90.345
1 996 78.59 1 85.8 1 00.5 1 3 .007 14.2 97.2 91 .598

Fuente: M.S.A.S. Memoria y Cuenta 1 .992- 1 .996. Venezuela.

Gráfico # 8
Mortalidad general diagnosticada y no diagnosticada, expresada en
Números índices. Venezuela, 1992-1996.

115

110 ..
n
105

--- Diagnosticada

. . . •·
· · • · No dia nosticada
e
100
e

95

90
1992 1993 1994 1995 1996
Años

Fuente: M.S.A.S. Memoria y Cuenta 1 .992- 1 .996. Venezuela.

1 15
RECOMENDACIONES FINALES.
Una vez completado el proceso de elaboración de la información, el si­
guiente paso es el análisis de los datos. Antes de iniciar ese punto, es conve­
niente efectuar algunas revisiones importantes.
1 . - Es necesario, en primer lugar, una revisión de los cuadros y gráficos a
fin de verificar y entender que tipo de información contienen. Es decir,
examinar detenidamente el título para ver de QUE se trata, COMO está
distribuida la información, DONDE Y CUANDO fue recogida.
2.- La segunda recomendación es revisar el contenido, verificar si las clases
están apropiadamente construidas, si las cifras son las correctas y otros
detalles (fuentes, notas explicativas, etc.) que permitan alcanzar conclu­
siones válidas.
3.- Verificar si hay correspondencia entre los objetivos del trabajo y la in­
formación presentada. Esto permite evaluar la pertinencia de los datos.
4.- Comprobar que las formas de presentación se ajustan al tipo de análisis
que se realizará.

EJERCICIOS PARA RESOLVER:


1 ) En un estudio sobre Ruptura Prematura de Membranas (RPM), realizado
en la maternidad de la Ciudad Hospitalaria "Dr. Enrique Tejera", en Va­
lencia, en el año 1 997. De las historias clínicas se obtuvo información de
las variables: Peso y Sexo; conformando las siguientes series estadísti-
cas:

PESO, en Kgs. SEXO PESO, en Kgs. SEXO


3,250 F 2,500 F
3 , 1 00 F 3 , 1 00 F
3 , 1 50 F 1 ,950 M
2,860 M 2,350 M
2,450 M 2,770 F
3,550 M 3,600 M
1,900 F 2,450 F
3,000 M 3, 1 50 M

1 16
2,500 M 3,290 F
2,800 F 2,000 M
3,250 F 3,500 F
2,980 F 3,800 M
3,950 M 2,500 M
1 ,900 M 3,3 1 0 M
2,980 F 3,000 M

A) Distribuya la información de la variable cuantitativa en: cinco clases,


siete y diez.
B) Presente esa información en tres cuadros de distribución de frecuen­
cias de escala cuantitativa.
C) Elabore un cuadro de distribución de frecuencias con la variable cua­
litativa.
D) Elabore un cuadro de asociación, donde relacione las dos variables.
E) Construya los gráficos correspondientes a cada uno de los cuadros es­
tadísticos elaborados.
2) Valores de hemoglobina de un grupo de niños menores de 1 2 años aten­
didos en el Centro Materno Infantil "San Bias", en Valencia; durante el
mes de enero de 1 998.
Hemoglobina expresada gramos por 100 ce de sangre:
1 0,8 1 1 ,3 1 2,7 12,2
1 1,1 1 3,5 14,6 8,6
9,3 1 0,2 14,0 1 0,4
14,3 1 1,8 1 1 ,4 1 1 ,3
1 5,0 9,9 1 2,3 1 0,4
12,7 1 0,6 1 3,0 12,5
A) Distribuya esta información en: cinco clases, seis y ocho clases.
B) Presente la información en un cuadro de distribución de frecuencias.
C) Construya el gráfico adecuado a la variable y tipo de cuadro.
3 ) En un estudio sobre morbilidad pediátrica, realizado en el H.U.A.L. en
1 997, se obtuvo de las historias clínicas, la siguiente información

1 17
EDAD DIAGNÓSTICO EDAD DIAGNÓSTICO
a gastroenteritis 3 a rubeola
�·

1
7 a sarampión 4 a varicela
9 m. bronquitis 2 a sarampión
6 m. amigdalitis 3 a otitis
5 a otitis a amigdalitis
1

1
9 a rubeola 9 a bronquitis
4 a sarampión 1 a varicela
8 m. gastroenteritis m. -
a gastroenteritis 7 a sarampión
10

a amigdalitis 2 a bronquitis
2
3
8 a bronquitis 1 a rubeola
3 a bronquitis 4 a sarampión
6 a otitis 5 a neumonía
4 a 3 a sarampión
8 a sarampión 2 a amigdalitis

A) Distribuya la información de la variable cuantitativa en: cinco y diez


clases.
B) Presente esa información en dos cuadros de distribución de frecuen­
cias de escala cuantitativa.
C) Elabore un cuadro de distribución de frecuencias con la variable cua­
litativa.
D) Elabore un cuadro de asociación, donde relacione las dos variables.
E) Construya los gráficos correspondientes a cada uno de los cuadros es­
tadísticos elaborados.
4) Observe la siguiente información tomada de 3 0 historias médicas del
H.U.A.L. en julio del 996, para una investigación sobre HEPATITIS
VIRAL B. Para ello se obtuvo información sobre las variables: Edad (en
años). Resultados del Inmunoensayo enzimático y Factoes de riesgo.

1 18
TABLA MAESTRA N º 2

EDAD RESULTADOS FACTORES DE RIESGO 1

27 Positivo Relaciones sexuales promiscuas


18 Negativo Contactos con enfermos de hepatitis
38 Negativo Transfusiones de sangre o uso de drogas inyectables
35 Negativo Enfermedades venéreas previas
30 Positivo Contactos con enfermos de hepatitis
22 Negativo Contactos con enfermos de hepatitis
30 Negativo Transfusiones de sangre o uso de drogas inyectables
25 Negativo Relaciones sexuales promiscuas
33 Positivo Contactos con enfermos de hepatitis
48 Negativo Enfermedades venéreas previas
37 Positivo Transfusiones de sangre o uso de drogas inyectables
41 Negativo Relaciones sexuales promiscuas
20 Negativo Transfusiones de sangre o uso de drogas inyectables
29 Negativo Contactos con enfermos de hepatitis
25 Negativo Contactos con enfermos de hepatitis
29 Negativo Relaciones sexuales promiscuas
39 Positivo Transfusiones de sangre o uso de drogas inyectables
40 Negativo Contactos con enfermos de hepatitis
23 Negativo Contactos con enfermos de hepatitis
34 Positivo Transfusiones de sangre o uso de drogas inyectables
32 Positivo Relaciones sexuales promiscuas
29 Positivo Transfusiones de sangre o uso de drogas inyectables
36 Negativo Relaciones sexuales promiscuas
24 Positivo Contactos con enfermos de hepatitis
45 Negativo Enfermedades venéreas previas
42 Negativo Contactos con enfermos de hepatitis
31 Negativo Contactos con enfermos de hepatitis
38 Positivo Contactos con enfermos de hepatitis
43 Negativo Enfermedades venéreas previas
23 Negativo Transfusiones de sangre o uso de drogas inyectables

Con la información presentada en esta tabla maestra:


A) Tabule, en 5 clases, la información referente a la variable
CUANTITATIVA y

1 19
B) Preséntela en un CUADRO DE DISTRIBUCIÓN DE FRECUEN­
CIAS.
C) Elabore el gráfico adecuado al cuadro de Distribución de frecuencias,
anteriormente construido.
D) Presente en un cuadro asociado la información referente a las dos va­
riables CUALITATIVAS.
E) Elabore un gráfico donde se muestre la relación de las dos variables
cualitativas.
F) Elabore un GRÁFICO que muestre la VARIACIÓN PROPORCIO­
NAL de los factores de riesgo para cada uno de los resultados inmu­
noensayo.
G) Elabore un gráfico que muestre la VARIACIÓN PROPORCIONAL
de los resultados del inmunoensayo para cada uno de los factores de
riesgo.
H) Elabore un cuadro de asociación donde se relacione la EDAD y LOS
RESULTADOS del inmunoensayo.
1) Elabore un cuadro de asociación donde se relacione la EDAD y LOS
FACTOES de riesgo.
G) Elabore los gráficos adecuados para presentar la información de los
dos cuadros anteriores.

BIBLIOGRAFÍA CONSULTADA
Camel, F. (1979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Hernández Sampieri, R., Fernández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.

120
CAPÍTULO V
Técnicas de Análisis Univariado
Etapa de análisis estadístico. Medidas de tendencia central: Media Aritmética.
Mediana. Moda. Media ponderada. Medidas deposición: Cuartiles, Deciles y Per­
centiles. Medidas de dispersión: Desviación media. Desviación estándar. Varian­
za. Coeficiente de variación. Intervalo intercuartil. Rango. Indice endémico.
Frecuencias relativas. Tasas Generales: de mortalidad, de fecundidad, de natali­
dad. Tasas de morbilidad por una causa específica. Tasas de incidencia, Tasas de
prevalencia. Tasas específicas de mortalidad para un grupo de edad o causa espe­
cífica. Tasa de letalidad. Tasas de mortalidad infantil, neonatal, perinatal, fetal,
temprana, temprana propiamente dicha. Tasa de mortalidad materna. Tasas de
mortalidad proporcionada por una causa o a una edad específica. Indice de Swa­
roop. Medidas de riesgo: riesgo absoluto, relativo y atribuible.

121
EL PROCESO DE ANÁLISIS ESTADÍSTICO
La etapa de análisis estadístico involucra la aplicación de técnicas esta­
dísticas a una serie de datos u observaciones, con la finalidad de describir­
los, analizarlos, interpretarlos y hasta inferir resultados, según sea el caso:
de estadísticas descriptivas o estadística inferencia!, en función de los obje­
tivos de la investigación.
En el presente capítulo se tratará sólo lo relacionado con las técnicas de
análisis descriptivas para variables cualitativas y cuantitativas.
Durante el proceso de elaboración se aprecia como el carácter individual
de las observaciones es sustituido por el interés de conocer los valores refe­
ridos a los grupos, es decir, el carácter colectivo de éstas. Esos valores refe­
ridos al grupo, se expresan a través de medidas estadísticas que se transfor­
man en valores típicos o representativos del conjunto de datos. Ellos dan in­
formación sobre la manera en que los valores del conjunto se agrupan o se
dispersan en una distribución.
De acuerdo al tipo de información requerida pueden calcularse:
- Medidas de tendencia central
- Medidas de posición.
- Medidas de dispersión.
Existen además, otras medidas que dan información acerca de la forma
de la distribución como el caso de la "simetría" y la "curtosis". Sin embar­
go, en esta oportunidad sólo se revisará lo concerniente a las tres primeras
mencionadas.

Medidas de Tendencia Central


Los gráficos estadísticos muestran la forma en que se distribuyen las fre­
cuencias de una variable estudiada. Pero en ocasiones es necesario además,
conocer un valor numérico que represente al conjunto de datos. Este valor
numérico es conocido con el nombre de medida de tendencia central, el cual
puede expresarse a través de la Media Aritmética, La Mediana y la Moda o
valor modal.

123
La Media Aritmética
La media aritmética es un valor intermedio, que oscila entre el menor y
el mayor de los números incluidos en una serie estadística. Es la medida de
concentración o de tendencia central más estable y posee mayores propie­
dades matemáticas que la Mediana y el Modo. Se simboliza como X.
Esta medida de tendencia central (X) es muy representativa de la serie si
ésta es simétrica o ligeramente asimétrica. En su cálculo intervienen todos
los valores de la serie estadística, por lo cual no debe utilizarse cuando algu­
no de los valores extremos presenta una gran diferencia con respecto a los
demás valores. Así mismo, no puede calcularse cuando se desconoce el va­
lor máximo o el mínimo de la distribución.
La media aritmética de un conjunto de n valores (x), se define como el
cociente de la sumatoria de todos los valores de la serie, dividida entre el
número total de ellos. La expresión matemática es:
¿ X = X l + X2 + X 3+. . . Xn
X=
n n
donde:
_¿ = Sumatoria.
x = cada valor que ha tomado la variable en los sujetos estudia­
dos.
n = el número total de casos u observaciones.
El cálculo se ilustra a través del siguiente ejemplo:
5 . 1 . Los valores de la presión sistólica de 5 pacientes atendidos en un
hospital son los siguientes:
XI = 131 mm de Hg
X2 = 116 mm de Hg
X3 = 11O mm de Hg
X4 = 99 mm de Hg
X5 = 121 mm de Hg.
Aplicando la fórmula, la media aritmética de estos cinco valores es:

1 24
131 + 116 + 11O + 99 + 121 = 577 =
X= 115 '4 mm de Hg
5 5
Cuando los datos están agrupados en clases de intervalo uno, se multi­
plica cada valor por la frecuencia absoluta de la clase respectiva; en este
caso, el valor de la media se calcula con la siguiente fórmula:
¿ ( Xi · fi) = Xi · f l + X2 · f 2 +. . . + Xn · fn
X=
n f l + / 2 + / 3 + . . . + fa
Donde:
¿ = Sumatoria
Xi = Valores de la variable en cada clase
fi = frecuencia absoluta de cada clase
n = frecuencia total
Ejemplo 5.2:
Presión arterial Sistólica en 1O pacientes

Presión Sistólica
f Xi . fi
mm de Hg
131 3 393
116 2 232
110 3 330
99 99
121 121
n 10 1.175
(31 x 3 ) + (116 x 2) + (1 l O x 3 ) + (99) + (121)
X=
10
- = 1175
X -- = 117 � mm de Hg
10
La media se obtiene mediante la sumatoria de los productos de los valo­
res por su frecuencia, dividida entre el número total de datos, y se interpreta
como el valor representativo de esos valores, es decir, el valor de la media
resume a todos los valores de la serie.

125
Cuando el rango de la variable es amplio, los datos pueden agruparse en
clases para facilitar su manejo, aun cuando hoy en día, con el auxilio de las
computadoras, en realidad este proceso tiende a obviarse, a menos que con­
venga expresamente la agrupación en clases. Al agrupar los datos en clases,
se asume que los valores en cada una se distribuyen de manera igual a lo lar­
go de ella, perdiendo su carácter individual, por lo cual pasan a ser repre­
sentados por los centros de clase o puntos medios. La media así calculada es
una aproximación a la media de los datos no agrupados, pues, al hacer la
agrupación se pierde precisión.
En este caso, la media de la distribución es igual a la sumatoria de las fre­
cuencias multiplicadas por el centro de cada clase, y dividido luego entre el
total de la frecuencia.
(X - )
X = ¿ m fi
n
Donde:
L = Sumatoria.
Xm = Puntos medios o centros de clase.
fi = frecuencias absolutas de cada clase.
n = total de las frecuencias.
Ejemplo 5.3:
Distribución de 71 pacientes de acuerdo a su edad

Edad fi Xm Xm.fi
20 - 24 5 22,5 1 1 2,5
25 - 29 6 27,5 1 65,0
30 - 34 12 32,5 390,0
35 - 39 11 37,5 41 2,5
40 - 44 8 42,5 340,0
45 - 49 15 47,5 71 2,5
50 - 54 14 52,5 735,0
Total 71 2.867,5

126
¿ (Xm · ji) = 2·867� =
X= 40,.19 años
n
La media aritmética es el valor alrededor del cual tienden a agruparse los
valores del conjunto de observaciones. Podría decirse que si no existiera va­
riación, todos los sujetos habrían tomado el mismo valor de la media en esa
serie. Por lo tanto, en el ejemplo anterior, todos los valores tienden a agru­
parse al rededor de 40,39 años.

La Mediana
Es una medida descriptiva ubicada en el centro de la distribución, por lo
cual, divide a la serie en dos partes iguales. Indica el punto por debajo del
cual se encuentra el 50% de los casos, de tal forma que la mitad de los datos
toman valores menores a la mediana y la otra mitad, valores superiores a
ésta. Se simboliza como Md.
Cálculo de la Mediana en series no agrupadas:
Ejemplo 5.4:
Se tiene la siguiente serie: J O, 11, 9, 12, 8 años de edad.
1 .- Se ordenan los valores en forma creciente o decreciente:
8, 9, J O, 11, 12
2.- Se busca la posición o lugar de la mediana:
Lugar de Md = -- n +l =-5 +1 6
=- =3
n 2 2
3 .- En la Serie, se busca el valor de la observación que está en el lugar de
la mediana. En este ejemplo, en el tercer lugar se encuentra el valor
1 0. Por lo tanto, la Md = 1 0 años.
Nótese en este caso, que el número de observaciones es impar (n = 5),
por lo tanto, la mediana es el valor observado en el centro de la serie,
luego de ordenados los datos.
Ejemplo 5.5:
Si el número de datos fuera par: 8, 8, 1O, 11, 14 y 15 años; la posición de
la mediana sería:

127
n +l 6+1 7
n
Lugar = -- = -- = - = 3,5
2 2
Al estar ordenados los datos, la posición 3,5 es un lugar intermedio entre
el 3ro. y el 4to., en consecuencia, el valor de la mediana es el promedio en­
tre los dos valores que ocupan esos lugares centrales, es decir, entre 1 O y 1 1 .
1O + 1 1 21
Md = = = l 0,5
2 2

Cuando los datos están agrupados en clases estadísticas, la Mediana se


calcula mediante la siguiente fórmula:
( l)
Md = Li + {[ n ; _ F , A ] � }

Donde:
Li =límite inferior de la clase donde está la mediana.
F .A = Frecuencia acumulada hasta la clase anterior a aquella
donde se encuentra la mediana.
fi = frecuencia absoluta de la clase donde está la mediana.
le = Intervalo de la clase donde está la mediana.
n = frecuencia total, o total de datos.

Ejemplo 5.6:
A través del siguiente ejemplo se ilustrará el cálculo de la mediana para
los datos agrupados.
Distribución de 100 estudiantes de acuerdo a la edad

128
Edad en
años
fi FA
5 -7 4 4
8 - 10 7 11
1 1 - 13 26 37
14 - 1 6 41 78
17 - 19 14 92
20 - 22 9 101
Total 101
1 .- Determinación del lugar de la mediana.
n + l 1 02
Lugar = -- = - = 5 1
2 2
2.- Obtener las Frecuencias acumuladas:
Al examinar la columna de las FRECUENCIAS ACUMULADAS, se
aprecia que la observación número 5 1 está contenida entre las 78 fre­
cuencias acumuladas hasta la cuarta clase, por lo tanto, en ella se en­
cuentra la mediana. Nótese que hasta la tercera clase sólo hay 37 obser­
vaciones, por lo tanto, allí no puede encontrarse la observación número
51.
La mediana se encuentra en la clase de 1 4 a 1 6 años (4ta clase), por lo
tanto,
Li = 14
fi = 4 1
l e = 3 , o sea 1 7 - 1 4 = 3 (resta de dos límites inferiores consecutivo)
F.A= 37 (Frecuencia acumulada hasta la 3ra clase).
2.- Cálculo de la Md:
Md = 1 4 + (5 1 - 37 ) 2_
41
+
Md = 1 4 ( 1 4 x 0,07)
Md = l4 + 1 ,02
Md = 1 5,02 años.

129
Lo cual significa que 15,02 años es la edad por debajo de la cual está el
50% de los estudiantes, en otras palabras, que la mitad de los estudiantes
tienen una edad igual o inferior a 15,02 años.

La Moda o Valor modal (Mo)


Es una medida de tendencia central fácilmente obtenible. Se define
como el valor más repetido en un conjunto de datos. Es conveniente, sin
embargo, hacer algunas consideraciones:
1. - Cuando los valores de una serie tienen la misma frecuencia se dice que
no hay valor modal, ejemplo:
1, 4, 2, 8, 1, 4, 8, 2, 9, 6, 6, 9, todos los valores se repiten el mismo núme­
ro de veces.
2. - Cuando dos valores adyacentes tienen la misma frecuencia y esta fre­
cuencia común es la mayor, la moda es el promedio de esos dos valores
adyacentes, así, por ejemplo: 2, 3, 3, 4, 4, 4, 5, 5, 5, 6.
5+4
2
Mo = - = 4,.5

3. - Si en un grupo de valores hay dos que no son adyacentes y tienen la mis­


ma frecuencia y esta frecuencia común es la mayor, existen dos modas,
es decir, la distribución es bimodal. Conjuntos muy numerosos se deno­
minan bimodales cuando presenta un polígono con dos picos, aún cuan­
do la frecuencia en los dos picos no sean exactamente iguales. Cuando
los datos están agrupados en una distribución de frecuencias, la moda se
toma como el punto medio o centro de la clase que tenga la mayor fre­
cuencia.
Consideraciones en el uso de las medidas de tendencia central:
1. - La media es la medida de tendencia central que se emplea con mayor
frecuencia, cuando las distribuciones son visiblemente simétricas. Es un
estadístico que permite el cálculo de otros estadísticos como, por ejem­
plo, la desviación típica y tiene una amplia aplicación en diversos tipos
de análisis estadístico. Es, además, la medida de tendencia central más
estable o confiable.
2. - Cuando la di�ibución es muy asimétrica se usa la mediana como la me­
dida más adecuada, así como cuando se necesita conocer con exactitud

130
el punto medio de la distribución. Del mismo modo, es útil cuando se tie­
nen series abiertas o valores muy altos o muy bajos en los extremos de la
sene.
3.- La moda se utiliza cuando se desea una estimación aproximada y rápida
de la tendencia central. En grupos pequeños la moda puede ser comple­
tamente inestable.

El Promedio ponderado o Media combinada o Media ponderada (Xp).


Se aplica cuando se requiere conocer la media de varias medias, es decir,
si se tienen dos o más medias correspondientes a otras tantas muestras y se
desea conocer la media general de todas las observaciones como si se trata­
ra de un sólo grupo.
La media ponderada de un conjunto de observaciones, se define como la
sumatoria de los productos de cada una de estas observaciones por su co­
rrespondiente ponderación (p), dividida entre la suma de las ponderaciones.
¿ (Xi · ni)
X p = ��- -
- -
nI + n2+. . . + nn
Donde:
Xi = Media aritmética de cada grupo.
ni = número de sujetos que conforman cada grupo.
Ejemplo 5. 7:
Promedio de días de hospitalización de l. 000 pacientes, distribuidos por
servicios. "Ciudad Hospitalaria Enrique Tejera " (CHET). Valencia.
1997.
" ---- --�

Servicios X de días n
#1 60 1 00
#2 50 600
#3 40 300
Total 1 .000

(60 x 1 00) + (5 0 x 600) + (40 x 300) 48.000


Xp = = = 4S días
1 00 + 600 + 300 1.000

131
48 días fue el promedio de hospitalización de estos 1 .000 pacientes.

MEDIDAS DE DISPERSIÓN O VARIABILIDAD.


Ejemplo: 5.8
Observe la siguiente información:
Peso de 7 lactantes sanos:
Grupo A: Grupo B: Grupo C:
6 6 6
6 7 7
7 . -·- - 7 8
8 8 8
-

9 9 8
10 9 9
10 10 10

Estas tres series, referidas a una misma variable presenta varias caracte­
rísticas comunes:
- Todas contienen la misma cantidad de datos, n = 7
- Todas tienen extremos comunes, por lo tanto, el mismo rango:
JO - 6 = 4 kgs.
· . . ( n - 1) ( 7 - 1) 8
- Todas tienen 1a misma medrnna: - -; --; - = 4
2 2 2
En el 4° lugar se encuentra el valor 8. Md = 8 kgs.
.
- Todas tienen . . . . ¿ X 56
1a misma medta antmetlca:
' X = -- = - = 8 Kg
n 7
Sin embargo, las tres series no son similares en cuanto a su forma de dis­
tribución. En la primera serie (grupo A), los valores tienden a agruparse en
los extremos, mientras que en la última (grupo C), los valores tienden a
agruparse en el centro de la distribución. Aun cuando tienen tantos elemen­
tos comunes, tienen una gran diferencia: la dispersión o variación de sus va­
lores.

1 32
Para describir o analizar una distribución de datos en forma completa, se
necesita conocer la variación de sus valores con relación a su medida de
tendencia central. La necesidad de calcular e interpretar las medidas de dis­
persión viene dada por el hecho de que al construir una distribución y calcu­
lar las medidas de tendencia central, aún cuando son los valores representa­
tivos que resumen el conjunto, no todos los datos de la serie coinciden con
ellas, sino que se desvían. Esta desviación se expresa con las medidas de
dispersión. De allí, la necesidad de conocer también las medidas de disper­
sión o de variabilidad. Entre estas medidas se tiene: el Rango, la Desviación
Media, la Desviación Estándar, la Varianza y el Intervalo Intercuartil.

Rango o Campo de Variación:


Es la distancia recorrida entre el valor mayor y el menor de la serie. Se
refiere a la diferencia entre los valores extremos de las observaciones.
Como medida de dispersión, el rango tiene un uso muy limitado, por cuanto
sólo toma en cuenta a dos valores de la distribución, los extremos.

La Desviación Media (DM).


Es la suma de los valores absolutos (sin tomar en cuenta el signo) de las
desviaciones con respecto a la media, dividida entre n; representa la disper­
sión promedio de las observaciones con respecto a la media. Se entiende
por desviación media, la diferencia entre cada valor y la media de la distri­
bución.
Para datos no agrupados, se calcula mediante la siguiente fórmula:

n
Donde:
x = valor de cada observación.
X = Media aritmética de la serie.
n = número total de datos.
lx - X I = diferencia entre cada valor y la Media, ignorando signos.
Ejemplo 5.9:
Peso de los niños del grupo A: 6 - 6 - 7 - 8 - 9 - 10 - 10 kgs.

133
1. - Se calcula la media:

X=
6 + 6 + 7 + 8 + 9 + 1 0 + 1 0 = 56 = 8 kgs
7 7
2.- Cálculo de la desviación media:
Xi Xi - X I Xi - X I
6 6-8=-2 2
6 6-8=-2 2
7 7-8=- 1 1
8 8-8=O o
9 9-8=1 1
10 10 - 8 = 2 2
10 10 - 8 = 2 2
n=7 = 10

lO =
3.- Aplicando la fórmula DM = 1,43 kgs
7

Desviación estándar
Es la medida de variación frecuentemente utilizada para mostrar la dis­
persión de los valores individuales alrededor de la media en una distribu­
ción. La desviación estándar es el promedio de desviaciones de las puntua­
ciones con respecto a la media. Cuanto mayor es la dispersión de los datos,
mayor es la desviación estándar. Se simboliza como "s" (en minúscula), o
la letra griega sigma ( cr).
Para su cálculo se utilizan las siguientes fórmulas:
Para datos no agrupados o datos directos:
X -X) (X - X)
s = P) o s = IL,
n n-l
Se define como la raíz cuadrada de la sumatoria de las desviaciones de
cada puntuación con respecto a la media, elevadas al cuadrado, y dividida
entre el número total de datos; o entre el total de datos menos uno (n - 1 ),
cuando se tienen menos de 30 observaciones (muestra pequeña) y los datos
no han sido agrupados en clases.

134
Ejemplo 5.10:
Peso de los niños del grupo A: 6 - 6 - 7 - 8 - 9 - J O - J O kgs.
1. - Se calcula la media aritmética de la serie:
6 + 6 + 7 + 8 + 9 + 10 +10 = 56 =
X= 8 kgs
7 7
2. - Cálculo de las desviaciones medias:
Xi Xi - X (Xi - X)2
6 6-8=-2 4
6 6 -8=-2 4
7 7 - 8= - 1 1
8 8-8=O o
9 9-8=1 1
10 10 - 8 = 2 4
�-
10 10 - 8 = 2 4
n=7 L = 18

3. - Aplicando la fórmula,
18 = {18 = �
s=�
7 -1 �6
s = 1, 7 kgs.
En series agrupadas, para calcular la desviación estándar o desviación tí­
pica, se utiliza la siguiente fórmula:
- (X - X) 2
s = � fi :

Donde:
s = Desviación estándar
fi = frecuencia absoluta de cada clase
Xm = Centro de cada clase
X = Media aritmética
n = total de datos

135
Ejemplo 5. 1 1 :
Distribución de 248 pacientes atendidos por
intoxicación alimentaria. HUAL. 1997.

Edad en años fi Xm f . Xm
10 - 1 1 36 11 396
12 - 1 3 56 13 728
14 - 17 80 16 1 .280
18 - 19 46 19 874
20 - 25 30 23 690
Total 248 L =3.968
Para calcular la desviación estándar (s):
L Xm · Ji 3968
X= = -- = 16 anos
. . . _
A- Se ca1cu1a 1a medrn antmetlca:
,
n 248
X = 16 años
B- Se obtienen los desvíos medios, restando la media a cada centro de clase
[Dm = (Xm - X)}.
C- Cada desvío medio se eleva al cuadrado.
D- Cada desvío medio al cuadrado se multiplica por la frecuencia absoluta
de la respectiva clase.
E- Se suman los productos de estas multiplicaciones [fi.(Xm - x2)].
F- Se divide el total de la sumatoria entre el total de la frecuencia. Este re­
sultado se denomina varianza.
G- Se extrae la raíz cuadrada de la varianza.

136
(B ) (D)
Edad en años fi Xm
(C)
(Xm - X) (Xm - X)2 fi.(Xm-X)2
10 - 1 1 36 11 1 1 - 1 6 = -5 25 900
12 - 13 56 13 1 3 - 1 6 = -3 9 504
14 - 17 80 16 16 - 16 = O o o
18 - 19 46 19 1 9 - 16 = 3 9 414
20 - 25 30 23 23 - 1 6 = 7 49 1 .470
Total 248 3.968 (E) 3.288

(F) � = -J1 32580 (Varianza)

(G) s = 3, 64 años
3,64 años, valor que indica la forma como se dispersan las observaciones
alrededor de la media.

Varianza (cr2)
Es la desviación estándar elevada al cuadrado, y se simboliza como "S2".
Es un concepto estadístico muy importante, especialmente en pruebas
cuantitativas, sin embargo, para fines descriptivos se utiliza preferiblemen­
te la desviación estándar.

El Coeficiente de Variación.
En oportunidades es necesario comparar la variabilidad de diversas se­
ries estadísticas, expresados en diferentes unidades de medida, por ejemplo
en kgs, cms, años, pulsaciones por minuto, etc. En tal caso, no es posible
utilizar directamente la desviación estándar para determinar en cual de ellas
existe menor o mayor variación. En su lugar, se utiliza el coeficiente de va­
riación, el cual mide la variación porcentual de los valores en la distribu­
ción. Es una medida de variación relativa, y se expresa en porcentaje.
El coeficiente de variación se define como el cociente entre la desviación
estándar y la media, multiplicado por 1 00.
s
Cv = = x l OO

137
A mayor coeficiente de variación, más heterogéneo es el grupo, hay ma­
yor dispersión, el grupo está menos concentrado. A menor coeficiente, hay
más homogeneidad en la serie, mayor concentración de los valores y la me­
dia es más representativa de los valores que conforman la serie.
Ejemplo 5. 1 2: ¿Cuál de estas dos series es más heterogénea?
s
Talla 1 ,75 Mts 0,08 mts.
Peso 60 kg 1 ,5 kg
008
Cv (talla) = -'- x 1 00 = 4,57 %
1,75
l,5
Cv (peso) = x 1 00 = 2,5 %
60
El mayor coeficiente de variación es el de la variable talla (4,6%). Por lo
tanto, este grupo de valores es más heterogéneo; su media es la menos re­
presentativa de la serie. En la talla se aprecia mayor variación entre sus da­
tos.

MEDIDAS DE POSICIÓN
Las medidas de posición se refieren a los lugares donde se ubican deter-
minados valores de la distribución.
Son medidas de posición:
- Los cuartiles (Q)
- Los deciles (D)
- Los percentiles (P)

Cuartiles.
Son aquellas medidas que dividen una serie de datos en cuatro porciones
iguales, en términos de la proporción de observaciones en cada una de ellas.
Q 1 = valor por debajo del cual está el 25% de las observaciones.
( + l)
Para calcular el lugar: Lugar = n
4

138
Q2= valor por debajo del cual está el 50% de las observaciones.
2 (n + l)
Para calcular el lugar: Lugar = - -
4
Q3= valor por debajo del cual está el 75% de las observaciones.
3 (n + 1)
Para calcular el lugar: Lugar = ---
4
Ejemplo 5. 1 3 :
Como ilustración, se calculará el tercer cuartil (Q3 ) en la distribución si­
guiente:
Edad (Xi) ti F.A
20 años 2 2
2 1 años 1 3
22 años 3 6
23 años 16 22
24 años 12 34
25 años 5 39
26 años 9 48
27 años 8 56
28 años 13 69
29 años 11 --�
80---��-
Total 80

Procedimiento:
3 ( n + l) = 3 x 8 1 = 243 =
Posición del Q3= 60,75 (es el lugar)
4 4 4
Al observar la columna de frecuencias acumuladas, se nota que el lugar
60,75 está incluido en la clase # 9; por lo tanto, el Q3 tiene un valor de 28
años, dado que el intervalo de la distribución es igual a 1, es decir, el 75% de
los sujetos de la distribución son menores de 28 años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el cuartil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:

139
Q (buscado) = Li + {[(lugar del Q buscado) - F. AJ le/ji}
Donde:
Q (buscado) = Cuartil buscado el cual puede ser 1; 2 ó 3
Li = límite inferior de la clase donde está el Q buscado
F. A = Frecuencia acumulada hasta la clase anterior a aquella
donde está el Q buscado.
ji = frecuencia absoluta de la clase donde está el Q buscado.
Je = Intervalo de la clase donde está el cuartil buscado
n = frecuencia total, o total de datos.

Deciles
Son los valores o puntos de la serie que la dividen en 1 O partes iguales. El
primer decil o D 1 , es el valor por debajo del cual está el 1 0% de los casos de
la distribución. Para calcular, por ejemplo el D4 en la serie anterior, se pro­
cede de la manera siguiente:
4(n + 1) 4 x 8 1 3 24
Lugar = = = = 3 2,4
10 10 10
El decil 4 está en el lugar 3 2,4. Este lugar corresponde a la clase # 5 don­
de se encuentran los sujetos de 24 años; por lo cual, el decil 4 corresponde a
un valor de 24 años. El 40% de los sujetos tienen una edad igual o menor de
24 años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el Decil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:
D buscado = Li + [(lugar del D buscado) - F. AJ le/ji

Percentiles.
Son puntos o valores que dividen la serie en 1 00 partes iguales. Es decir,
por debajo de un determinado percentil se encuentra un cierto porcentaje de
casos, por ejemplo, el percentil 60 es el punto por debajo del cual se encuen­
tra el 60% de los sujetos.
Para ilustrar se calculará el percentil 25 (P25), en la serie anterior.

140
El lugar del P25 =
25 x 8 1 2º25
= = 20,25
1 00 100
En esta distribución, la posición 20,25 está ubicado en la cuarta clase,
donde están las personas de 23 años. Luego, el percentil 25 es de 23 años, lo
cual indica que el 25 % de los sujetos tienen edades iguales o inferiores a 23
años.
Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el Percentil buscado, se siguen los mis­
mos pasos utilizados anteriormente para calcular la mediana, según la fór­
mula:
P buscado = Li + {[(lugar del P buscado) - F. AJ lc/fi}
Donde:
P buscado = Percentil buscado (el cual puede ser cualquier va­
lor entre 1 y 100)
Li = límite inferior de la clase donde está el Percentil buscado.
F. A = Frecuencia acumulada hasta la clase anterior a aquella
donde está el Percentil buscado.
fi = frecuencia absoluta de la clase donde está el Percentil bus­
cado.
le = Intervalo de la clase donde está el Percentil buscado.
n = frecuencia total, o total de datos.

141
Ejemplo 5.14:
Edad de 1 04 pacientes hipertensos.
Consulta de medicina interna CHET. Valencia, 1997

Edad fi F.A
43 - 47 7 7
48 - 52 18 25
53 - 57 24 49
58 - 62 36 85
63 - 67 13 98
68 - 72 4 102
73 - 77 2 104
Total 1 04

Calcular Percentil 75
l) 75(104 + 1) = 75 x 105 = 7.875 =
l.- Lugar de/ P75 = 75(n + = 78 75
1 00 100 1 00 1 00 '
Lugar del Percentil 75 = 78,75
2.- Según la columna de Frecuencias acumuladas, el percentil 75 está con­
tenido en la cuarta clase, correspondiente a las edades de 58 a 62 años.

3.- P 15 = Li + {[(lugar del P) - F.A]Jc/fi}


Límite inferior de la 4ta clase = 58 añ.os.
Lugar del Percentil 75 en la serie = 78,75
Intervalo de clase de la 4ta el. = 5 añ.os.
frecuencia absoluta de la 4ta el = 36 pacientes.
Frecuencia Acumulada hasta la 3ra el = 49
P15 = 58 + {[78, 75 - 49] 5/36}
- = 58 + {29, 75 x 0, 14} = 58 + 4,13
P15 = 62, 13 años.
Lo cual significa que el 75 % de esos pacientes tienen una edad igual o
inferior a 62, 13 años.

142
Intervalo lntercuartil
Se emplea con el fin de superar la limitación del rango como medida de
dispersión. Su mayor utilidad radica que entre sus límites se encuentra el
50 % de las observaciones centrales de la distribución, que no son afecta­
das por los valores extremos de la serie.
El intervalo intercuartil, también denominado intervalo semi-intercuar­
til, mide la dispersión de los valores de la serie, pues, mientras más próxi­
mos son sus límites, existe mayor concentración de las observaciones alre­
dedor de la mediana. Es igual a la mitad de la distancia entre el Primero y el
Tercer cuartil.
QJ - Q1 p1s - P2s
Q=
2 2

EL ÍNDICE ENDÉMICO
Un problema fundamental en el campo de la salud pública, es conocer el
comportamiento de las enfermedades, es decir, su evolución y cambios tan­
to en su capacidad para producir daños, como en la frecuencia con que se
presentan. En este último aspecto, el trabajador de la salud cuenta con un in­
dicador muy importante, que provee información para decidir si el número
de casos de una enfermedad representa una situación normal en una comu­
nidad en un momento determinado o si se está en presencia de una epide­
mia. El índice endémico muestra tal situación.
Para elaborar el índice endémico, se procede de la manera siguiente:
1 . - Averiguar la morbilidad de la enfermedad estudiada en los últimos 5 ó 7
años, especificada por meses o semanas. No se debe usar menos de 5
años debido a las fluctuaciones que se presentan de un año a otro, ni más
de 7 por cuanto en largos períodos las condiciones de la comunidad pue­
den cambiar notoriamente. La especificación por semanas o meses, se
hará de acuerdo con el número de habitantes de la región y con la fre­
cuencia de la enfermedad estudiada.
2.- Se ordenan los casos por meses (o por semanas), independientemente de
los años.

143
3.- Se calcula la media aritmética y la desviación estándar en las series co-
rrespondientes a cada mes. La media indica el promedio de casos espe-
rados por mes, siendo considerado el índice endémico. La media más
una desviación y menos una desviación (Mx + y - 1 s) serán las medidas
de las fluctuaciones de un año a otro.
Ejemplo 5. 1 5:
Casos de meningo-encefalitis viral por meses Caracas, 1990-1996
Total
Años Meses del año
anual
E F M A M J J A s o N D
1 990 62
1 99 1 65
8 2 4 6 5 8 6 7 5 5 5

1 992 1 13
4 2 7 5 4 6 6 18 3 4 5

1 993 154
2 8 4 7 6 13 18 13 17 11 2 12

1994 1 72
13 14 8 10 18 15 22 20 12 7 5 10

1995 120
15 21 10 16 26 21 10 7 20 4 14 8

1 996 1 04
6 6 4 10 9 13 11 10 16 20 10 5
6 13 18 9 6 16 9 6 7 6 6 2
Fuente: anuario de Epid. y Estad/Vital, M.S.A.S, Venezuela, 1990-1996.

Calcular la media y la desviación estándar para cada mes y los valores de


X - s y X + s:
X s X:-s X:+s
ENERO 7,7 1 4,37 3,33 1 2,09
FEBRERO 9,43 6,41 3,08 15,90
MARZO 7,00 5,26 1 ,74 12,26
ABRIL 9,28 3,1 1 6, 1 7 1 2,39
MAYO 10,7 1 7,55 3,16 1 8,26
JUNIO 1 2,85 5,1 1 7,74 1 7,96
JULIO 1 1 ,7 1 5,62 6,09 1 7,73
AGOSTO 9,85 4,76 5,09 1 4,61
SEPTIEMBRE 1 3,57 5,3 1 8,26 1 8,88
OCTUBRE 8,00 5,45 2,55 13,45
NOVIEMBRE 6,57 3,84 2,73 10,41
DICIEMBRE 6, 1 4 3,75 2,39 9,89

1 44
Con la columna X-s, se construye la primera curva; con los promedios la
segunda, y con los valores de X + s la tercera, mostrando así las 4 zonas de
la curva endémica: Zona de éxito, zona de seguridad, zona de alarma y zona
de epidemia.

18
ZONA DE EPIDEMIA
16

e
14

A
12

S 10
o
S 8

2
ZONA DE EXITO

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Meses

Cuando las frecuencias de los casos por mes se distribuyen de manera


muy asimétrica, se sugiere el uso la mediana, del primer cuartil y tercer
cuartil, para elaborar la curva endémica.

TÉCNICAS DE ANÁLISIS DESCRIPTIVO PARA VARIABLES


CUALITATIVAS.
Las Frecuencias Relativas, sean éstas Proporciones, Porcentajes o Ta­
sas, se emplean comúnmente para analizar la información obtenida de va­
riables cualitativas.
Frecuencia Relativa de un determinado atributo es la relación que existe
entre el número de individuos que presentan ese atributo, en una muestra o
población, y la totalidad de los individuos que la conforman. En términos
generales, se calculan dividiendo el número de sujetos que poseen la carac­
terística entre el total de sujetos que podría poseerla. El producto de esta di­
visión será una proporción, la cual puede magnificarse por cien para expre-

1 45
sarla en porcentaje; y para las tasas, multiplicarlas por 1 on (la "n" puede to­
mar el valor de 1 00, 1.000, 1 0.000 o más, según la tasa que se calcule).
La importancia de las frecuencias relativas, como medida de resumen,
radica en que:
1 - Permiten comparar varias muestras, aún cuando sean de tamaños dife­
rentes.
2- En cierto modo, envuelven la noción de probabilidades o de riesgo de la
existencia del referido atributo, en los individuos de la población.
En Ciencias de la Salud, el uso de las tasas es muy frecuente cuando se
busca analizar los fenómenos de morbilidad, mortalidad o natalidad, en una
población. Ellas indican el riesgo o probabilidad de que estos aconteci­
mientos ocurran, en esa población en un período determinado. La expresión
matemática genérica es:

Tasa =
Número de veces que ocurre un fenómeno en un lugar y tiempo determinado
X IO"
Total de veces que ese fenómeno pudo ocurrir, en ese lugar y tiempo determinado

TASAS GENERALES BRUTAS: Tasa General de Mortalidad, Tasa


General de Fecundidad, Tasa de Natalidad.

Tasa General de Mortalidad:


Número total de muertes ocurridas durante un periodo, en un lugar determinado
T.G.M. = X 1 .000
Población total del lugar, para el 1 º de julio del año en estudio

Indica el riesgo o probabilidad que tuvo esa población de morir por cual­
quier causa en el período estudiado.

Tasa General de Fecundidad:


Nacimientos vivos ocurridos durante un periodo, en un lugar determinado
T.G.F. = - ------- - - - - - � ----�- - - - -� X J .000
Población femenina de 1 5 a 49 años del lugar, para el 1 º de julio del año en estudio

Indica la probabilidad que tiene la población de que en ella ocurran naci­


miento vivos, por cada mil mujeres en edades fecundantes, en el período es­
tudiado.

1 46
Tasa de Natalidad:
--- . ---
Nacimientos vivos ocurridos durante un período, en un lugar determinado
T.N. = X 1 .000
Población total del lugar, para el 1 ° de julio del año en estudio

Indica la probabilidad que tiene la población de que en ella ocurran naci­


miento vivos, en el período estudiado.
Tasas Específicas por causa o por edad: Tasa de morbilidad por causa
específica, tasa de incidencia, Tasa de prevalencia, Tasa de Letalidad, Tasa
de mortalidad por causa específica, Tasa de mortalidad infantil, Tasa de
mortalidad temprana, Tasa de mortalidad temprana propiamente dicha,
Tasa de mortalidad fetal, Tasa de mortalidad perinatal, Tasa de mortalidad
materna. Tasa de mortalidad proporcionada por causa específica o por
edad.

TASA DE MORBILIDAD POR CAUSA ESPECÍFICA:


Nº de enfermos por determinada
- --- - - - causa, ocurridos en un-------
lugar y período determinado
T M E = --- -� -- - ------ x J OOO
· · · Población total del lugar, para el 1 ° de julio del año en estudio

Indica el riesgo o probabilidad que tiene la población susceptible a una


enfermedad específica, a enfermar por esa causa, en un lugar y período de­
terminado.

Tasa de Incidencia:
º
T .I. = __ N de casos nuevos de determinada enfermedad, en un lugar y período determinado X ] 0"
Población total del lugar, para el 1 º de julio del año en estudio

Indica el riesgo o probabilidad que tiene una población de que en ellas se


presenten nuevos casos de una enfermedad específica, por cada 1 on habi­
tantes, en ese período determinado.

Tasa de Prevalencia:
Total de enfermos por determinada ca11sa, existentes en un lugar y período determiriado
T.P. = x 1 O"
Población total del lugar, para el 1 º de julio del año en estudio

Indica el riesgo o probabilidad que tiene la población de que en ella exis­


ta una cantidad de casos de una enfermedad específica, por cada 1 o n habi­
tantes, en un lugar y período determinado.

147
TASAS DE MORTALIDAD ESPECÍFICAS, POR CAUSA O POR
EDAD.
Nº de muertes ocurridas por determinada causa, en un lugar y período determinado
T.M.E. = X IOn
Población total del lugar, para el I º de julio del año en estudio

Indica el riesgo o probabilidad que tiene la población susceptible a una


enfermedad específica, de morir por esa causa, en un lugar y período deter­
minado.

Tasa de Letalidad
Nº de muertes ocurridas por determinada causa, en un lugar y período determinado
T.L. = X 100
Total de enfermos por esa causa, en ese lugar y período determinado

Indica el riesgo o la probabilidad que tienen los enfermos de determina­


da causa de morir a consecuencia de la enfermedad que padecen, en ese lu­
gar y período estudiado.

Tasa de Mortalidad Infantil


Nº de Muertes en menores de un año, ocurridas en un lugar y período determinado
T.M.l. = - - - - ---- - -- - - -�� - - -- -- X 1 .000
Nacimientos vivos ocurridos durante el año, en el lugar estudiado

Indica el riesgo que tienen los niños menores de un año, de morir antes
de haber cumplido su primer año de edad, en ese lugar y período en estudio.
Además de esta tasa de mortalidad infantil, también pueden calcularse
las Tasas de:
a) Mortalidad Precoz (Incluye sólo las defunciones de niños menores de 7
días).
b) Mortalidad Neonatal (Defunciones de niños menores de 28 días.)
c) Mortalidad Residual (Defunciones de niños de 28 días a 11 meses).
Para el cálculo de estas tres tasas, el denominador es igual al de mortali­
dad infantil, o sea, nacimientos vivos ocurridos durante el año; y el numera­
dor dependerá de la tasa a calcular.

148
Tasa de Mortalidad Temprana:
Nº de Muertes en menores de 5 años, ocurridas en un lugar y período determinado
T.M.T. = - - - - ---- - - - - - --- � � � --- - - - x 1 .000
Población menor de 5 años de edad, de ese lugar y período en estudio

Indica el riesgo que tienen los niños menores de 5 años, de morir antes de
haber cumplido 5 años de edad, en ese lugar y período en estudio.

Tasa de Mortalidad Temprana Propiamente dicha:


Nº de Muertes en niños de I a 4 años, ocurridas en un lugar y período determinado
T.M.T.P = X 1.000
Población de niños de I a 4 años de edad, de ese lugar y período en estudio

Indica el riesgo que tienen los niños de 1 a 4 años de edad, de morir en


ese lapso, en ese lugar y período en estudio.

Tasa de Mortalidad Fetal:


N_º_de Muertes fetales ocurn._ dur_an e el año, en un lugar determinado
T.M.F. = ______________da_s__ _t_ ___________________ x l .OOO
Nacimientos vivos ocurridos durante el año, en ese lugar estudiado

Tasa de Mortalidad Perinatal:


Muertes fetales de más de 28 semanas + Mortalidad precoz, en lugar y tiempo det.
T.M.T.Pn X 1.000
Nacimientos vivos ocurridos durante el año, en ese lugar

Tasa de Mortalidad Materna:


Mortalidad materna ocurridas durante el año, en un lugar determinado
T.M.M. =-- - - - - ------ - - - - - -� --- -- -- x 1 .000
Nacimientos vivos ocurridos en ese lugar, durante el año en estudio

Indica el riesgo que tienen las mujeres embarazadas, parturientas y puér­


peras, de morir por causas asociadas al embarazo, al parto o al puerperio, en
ese lugar y período en estudio.

Tasa de Mortalidad Proporcionada por causa específica:


Nº de muertes ocurridas durante el año por determinada causa, en un lugar específico
T.M.Pc.e. = . x 100
Total de muertes ocurridas durante el año, en el lugar estudiado

Indica la probabilidad de que por cada 1 00 muertes ocurridas en ese lu­


gar por cualquier (todas) causa, determinada cantidad haya sucedido por
una causa específica, durante el período estudiado.

149
Tasa de Mortalidad Proporcionada por edades:
Nº de muertes ocurridas a determinada edad, durante el año en un lugar específico
T.M.Pe. = X 100
Total de muertes ocurridas durante el año, en el lugar estudiado

Indica la probabilidad de que por cada 100 muertes ocurridas en ese lu­
gar por cualquier causa, determinada cantidad haya sucedido a una edad es­
pecífica, durante el período estudiado.

Indicador o Tasa de Mortalidad Proporcionada, para 50 años o más


(Indice de Swaroop):
Nº de defunciones de personas de 5 0 ó más años, en un lugar y período específico
T.M.P = - --- - -� �- - - - - - - -�� �- �--- x 100
Total de muertes ocurridas durante el año, en el lugar estudiado

Indica la probabilidad de que por cada 100 muertes ocurridas en ese lu­
gar por cualquier (todas) causa, determinada cantidad haya sucedido en
personas que ya han cumplido 50 o más años de vida, durante el período es­
tudiado.

Medidas de riesgo
La incidencia además de reflejar la velocidad con que aparecen nuevos
casos de una enfermedad, también sirve para calcular el riesgo relativo de
contraer la enfermedad; siendo igualmente útil para conocer la etiología de
una enfermedad.
Por su parte, la Prevalencia mide la totalidad de casos existentes de una
enfermedad en la población durante un determinado período. La prevalen­
cia se ve afectada por tres factores:
Incidencia (Casos nuevos que se suman.)
Duración de la enfermedad (agudas o crónicas).
- Mortalidad (casos que se restan).
Sin embargo, cuando una población ha estado expuesta a un factor, que
puede ser considerado de riesgo, es necesario estimar la probabilidad que
tiene esa población de que en ellas aparezcan o no los efectos producidos
por ese factor. En este caso, se estiman tres medidas: Riesgo Absoluto,
Riesgo Relativo, Riesgo atribuible; las cuales no indican que todas aquellas
personas expuestas al factor de riesgo desarrollarán la enfermedad, sino que

150
tienen mayor probabilidad que los no expuestos.
Riesgo Absoluto.- Es similar a la incidencia, y se utiliza para calcular
los otros dos valores. Para ello se calcula la tasa de incidencia de la enfer­
medad en el grupo de individuos expuestos al riesgo y en la de los no ex­
puestos (Cañedo, 1 987).
Riesgo Relativo. - Expresa la incidencia de la enfermedad en el grupo de
expuestos al factor, con respecto al grupo de los no expuestos.

Riesgo relativo =
Incidencia en el grupo expuesto al riesgo
Incidencia de los no expuestos

Un riesgo relativo alto sugiere que el factor puede ser el causante de la


enfermedad (por lo tanto la conveniencia de eliminar o controlar ese factor
de riesgo).
Riesgo Atribuible.- Expresa la cantidad de casos nuevos atribuibles a
un factor en particular. Se calcula mediante la diferencia entre el grupo de
los expuestos y los no expuestos.
R.A. = Incidencia en grupo expuesto - Incidencia en grupo NO expuesto.
Ejemplo 5 . 1 6 :
E n una intoxicación alimentaria ocurrida en una escuela de Caracas, se
supo que los escolares habían consumido panquecas con jamón, el cual se
sospechaba estaba en mal estado.
Para el estudio epidemiológico de la situación, la población se distribuyó
de la manera siguiente:
Escolares Intoxicados NO intoxicados Total
Expuestos al factor de riesgo
(consumieron panq. con jamón). 540 380 920
NO expuestos al factor de r.
70 1 10 1 80
TOTAL
(NO consumieron panq. con j.)
610 490 1 . 1 00
Calculando los riesgos absolutos, relativos y atribuibles, se tiene:
. . N º de enfermos
Tasa de Inc1denc1a = x 1 00
Población Total

15 1
540
R. absoluto (grupo expuesto) = - x 100 = 58,69 %
9 20

70
R. absoluto (grupo NO expuesto) = - x 100 = 38,8 9 %
180
. . 58,69 %
R1esgo relatlvo = = 1,..,,
38,8 9 %
Riesgo atribuible = 58, 6 9 % - 38,8 9 % = 19 ,8 %
Adicionalmente, en estos estudios epidemiológicos se utiliza la prueba
de Chi cuadrado (X2) para estimar si existe asociación entre el factor de
riesgo y la aparición de la enfermedad. Los datos se presentan en tablas de
contingencia de 2 x 2 de la siguiente manera:
Aparición de la enfe rmedad
Expuestos a riesgo Total
SI NO
SI
NO
TOTAL
Cómo calcular e interpretar el chi cuadrado se explicará en el capítulo
VIII.

EJERCICIOS PARA RESOLVER:


1) Observe la siguiente información:

Cuadro N º 1
Pacientes con osteoporosis, distribuidos por edad. Valencia, 1998
Edad en años Nº de pacientes
30 - 40 10
41 - 50 62
51 - 60 97
61 - 70 59
71 - 85 22
TOTAL 250
Fuente: Archivo de consulta privada: CEMET y CMGM. 1 993- 1 998.

152
Con esta información calcule:
A) Media aritmética (X) y Desviación estándar (s). Interpretación.
B) Mediana (Md), Percentil 25 y 75. Interprete los resultados.
C) Los intervalos de clase y los centros de clase de cada una. Indique su
significado.
2) Observe la siguiente información:
Mortalidad por ACV, según edad. C.H.E.T. Valencia. 1 995 - 1997.
EDAD en años Frecuencia absoluta
20 - 33 5
34 - 44 1
45 - 52 8
53 - 60 4
61 - 68 16
69 - 76 10
77 - 84 2
85 y más 6
TOTAL 52
Fuente: Archivo central de C.H.E.T.

CALCULE:
A) La medida de tendencia central adecuada para esta distribución. In­
terprete el resultado.
B) La medida de dispersión apropiada a esta serie. Exprese su significa­
do.
C) Los intervalos de clase y los centros de clase de cada una.
3 ) Observe la siguiente información:

1 53
Escolares con enfermedades infecto-contagiosas,
distribuidos por años de edad.
Escuela Básica "Carabobo " Valencia, 1998.
EDAD Nº de escolares
7 años 14
�.

8 años 16
9 años 16
10 años 24
1 1 años 20
1 2 años 9

De esta serie calcule:


A) Media aritmética (X) y desviación estándar.
B) Mediana (Md) e Intervalo intercuartil.
C) Moda (Mo).
D) Interprete los resultados de cada una de ellas.
4) Calcule la medida de tendencia central y de dispersión apropiada para los
cuadros de distribución de frecuencias elaborados como ejercicios en el
capítulo IV (Ejercicios 1 , 2 y 3 ).

BIBLIOGRAFÍA
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Cañedo D., Luis. ( 1 989). Investigación clínica. México, D.F: Nueva Edito­
rial Interamericana.
Escotet, M. A. ( 1 973). Estadística Psicoeducativa. México, D.F.: Editorial
Trillas.
Hernández Sampieri, R., Fernández, C. y Batista, P. ( 1 99 1 ). Metodología
de la Investigación. Bogotá: McGraw-Hill.

154
CAPÍTULO VI
Probabilidades y Curva Normal
Teoría de las probabilidades. Propiedades de las probabilidades. Principios. Pro­
babilidades simples. Probabilidades de eventos mutuamente excluyentes. Proba­
bilidades de eventos no excluyentes. Probabilidades de eventos independientes.
Probabilidades de eventos dependientes. Probabilidades condicionales. Distribu­
ción de probabilidades. Distribución Binomial. Distribución Normal. Tabla de
áreas de la curva normal. Problemas.

155
PROBABILIDADES, DISTRIBUCIONES DE PROBABILIDADES.
CURVA NORMAL

TEORÍA DE LA PROBABILIDAD
La teoría de probabilidades representa el fundamento de la inferencia es­
tadística. El primer concepto manejado sobre las probabilidades, es el cono­
cido como probabilidad clásica o apriori, atribuido a los matemáticos Pas­
cal y Fermat. De acuerdo a este concepto, la probabilidad de un evento se
conoce antes de realizar el experimento.
Posteriormente aparece un nuevo concepto propuesto por Bernoulli y se
fundamenta en la frecuencia relativa. Según este autor, al realizar un expe­
rimento un elevado número de veces, la frecuencia relativa se aproxima a su
probabilidad. A este tipo de probabilidad se le conoce como probabilidades
a posteriori. En estas se encuentran incluidas las tasas.
El concepto más reciente, es el llamado personalista o subjetivo según el
cual la probabilidad es una medida de confianza personal acerca de una pro­
posición particular. La base axiomática de la probabilidad fue presentada
por el ruso Andres Kolmogorov, dándole así el carácter teórico a la misma.
Estos diversos enfoques o conceptos de probabilidades no son incompa­
tibles entre sí, siendo de utilidad en diversas disciplinas.
Definición: Probabilidad es una medida matemática de la posibilidad
de que se produzca un acontecimiento o un hecho, en una serie de ensayos
repetidos en condiciones similares y con determinada frecuencia (Wein­
traub. 1985, 61).
En términos matemáticos, la probabilidad de que un evento "favorable"
ocurra, viene dado por la razón geométrica entre el número de "casos espe­
rados o favorables" ("a") y la totalidad de casos, posibles" ("n"); suponien­
do igualdad de condiciones y posibilidades de ocurrencia, para todos los
elementos de un espacio muestral dado.
_ Número de resultados favorables al evento A _ a
P(A) - --
Número total de casos posibles n

1 57
PROPIEDADES DE LAS PROBABILIDADES
Cuando se calculan las probabilidades de que ocurra un determinado
evento, su resultado siempre será:
1 - Un valor de signo positivo, y
2- Un valor que oscila entre cero y uno (O P 1 ).
(el "cero" corresponde a la imposibilidad de ocurrencia, y el "uno" a la
certeza absoluta de la probabilidad de dicha ocurrencia).
Además, la suma de las probabilidades de ocurrencia de un evento "fa­
vorable" más las probabilidades de los "no favorables" es igual a la totali­
dad (a + b= 1). Simbolizándose igualmente como "p" los casos favorables
y "q" los no favorables (p + q = 1 ).

Cuadro # 1
Intoxicaciones en menores de 6 años. 150 casos
distribuidos según edady sexo. Valencia, 1998.

SEXO
Edad TOTAL
Masculino Femenino
O- 1 20 15 35 -�

�-
2-3 55 22 77
--
4-5 30 8 38
TOTAL 105 45 150
Fuente: Historias Médicas.

Del espacio muestral descrito en el cuadro # 1 , CALCULAR:


A.- La probabilidad de que al extraer una Historia Médica de esta muestra,
corresponda a un niño menor de 6 años.
150 =
P=�= l
n 150
B.- La probabilidad de que al extraer una Historia Médica de esta muestra,
corresponda a un niño mayor de 6 años.

P = � = _!!__ = O
n 150

158
C. - La probabilidad de que al extraer una Historia Médica de esta muestra,
corresponda a una niña.
a 45
n 150
P = - = - = 0,30

D. - La probabilidad de que al extraer una Historia Médica de esta muestra,


NO corresponda a una niña.
1 05 =
P = !!_ = 0,70
n 1 50
E. - La probabilidad de que al extraer una Historia Médica de esta muestra,
corresponda a una niña o a un niño.
a b _ 45 + 1 05 _ 150 _
p_ + 1
n n 150 150 150
Ya se ha dicho que la probabilidad de que un evento ocurra varía entre O
y 1 , por lo tanto el resultado siempre será un número positivo y fraccionado
(a excepción de la imposibilidad y de certeza absoluta), el cual puede ser
multiplicado por cien para manejarlo en porcentaje, y facilitar su interpreta­
ción.

PRINCIPIO DE LAS PROBABILIDADES


Cuando se tiene un espacio muestras definido, son múltiples las probabi­
lidades de los eventos aleatorios que en ese espacio muestra! pueden ocu­
rrir. En tal sentido, se calcularán las probabilidades de eventos simples, mu­
tuamente excluyentes, o no excluyentes, eventos independientes, depen­
dientes y condicionados.
Para la mejor comprensión de estos conceptos, se utilizará como ejem­
plo la información referida al espacio muestra! presentado en el siguiente
cuadro estadístico:

159
Cuadro # 2
Partos prematuros. 200 casos distribuidos según
Tipo de parto y lugar de atención. Valencia, 1997.
CENTRO HOSPITALARIO
Tipo de
Clínica TOTAL
parto Público I.V.S.S.
Privada
Vaginal 65 38 40 143
Cesárea "--
1 5 � -"
32 10 57
TOTAL 80 70 50 200
Fuente: Historias clínicas.

1.- Probabilidades Simples.-


Se refiere a la probabilidad de que ocurra sólo un evento en un solo expe­
rimento. Si "A" es un evento cualquiera en un espacio muestral "n", enton­
ces la probabilidad de "A" es igual a:
a
n
) =­
p( A

Ejemplo 6.1.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que una mujer de esa muestra haya tenido un parto
por vía vaginal.
a 143
P = - = - = 0 72
A
( ) n 200 '
Esta probabilidad también puede expresarse en forma de porcentaje, por
lo tanto, existe un 72 % de probabilidades de que al extraer por azar una his­
toria médica de esa muestra, corresponda a una mujer que haya tenido un
parto por vía vaginal.
B) La probabilidad de que una mujer de esa muestra haya sido atendida en
un hospital público.

P = !!_ = = O 40 ó 40 %
80
(A ) n 200 ,

1 60
2.- Probabilidades de eventos mutuamente excluyentes
Denominada también probabilidades completas o totales. Se entiende
por eventos mutuamente excluyentes aquellos donde al ocurrir un evento
determinado, impide que ocurra simultáneamente su complemento, en un
solo experimento. En tal caso, cuando se busca como acierto, un evento "a"
entre varios resultados que son mutuamente excluyentes, la probabilidad de
ese acierto es igual a la suma de las probabilidades de cada evento por sepa­
rado. Se utiliza la regla de suma o de adición de las probabilidades.
p( A o B ) = P( A ) + P(B)

Ejemplo 6.2.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que una mujer de esa muestra haya sido atendida en
un hospital público o en el l. V.SS.
p( A o B ) = p(A ) + p(B )

P(A o B ) = - + - = - + - = 0,40 + 0,25 = 0,65


a b 80 50
n n 200 200
B) Calcule la probabilidad de que una mujer de esa muestra haya tenido un
parto por vía vaginal o por cesárea.

3.- Probabilidad de eventos N O excluyentes.-


Existe una variante en la suma de probabilidades, en la cual los eventos
se superponen o se intersectan. Cuando se busca la probabilidad de que ocu­
rra el evento A o el evento B o ambos eventos conjuntamente, se suman al­
gebraicamente los eventos posibles; por lo tanto, las probabilidades del
acierto es igual ala suma de las probabilidades separadas, menos el intersec­
to de los dos eventos.
p(A o B ) = P( A ) + P(B) - P( A y B )

Ejemplo 6.3.-
De la información presentada en el cuadro # 2, Calcular:
A. ) La probabilidad de que una mujer de esa muestra haya sido atendida en
el l. V.S.S. o tenido un parto por vía vaginal.
p( A o B ) = P( A ) + P(B) - P(A y B )

16 1
50 143 40
º B ) = - + - - - = 0,25 + 0,72 - 0,20 = 0,77
200 200 200
p( A

B. ) Calcule la probabilidad de que a una mujer de esa muestra se le haya


practicado una cesárea o fuese atendida en una clínica privada.
4.- Probabilidad de eventos independientes
También denominada probabilidades compuestas. Si el evento A no de­
pende del evento B, y B no depende de A, entonces A y B son independien­
tes, es decir, la ocurrencia de uno no influye sobre la probabilidad de ocu­
rrencia del otro. Cuando se busca conocer la probabilidad de que ocurran si­
multáneamente, dos o más eventos, donde uno NO depende del otro, esa
probabilidad es igual a la multiplicación de las probabilidades separadas.
p( A y B ) = P( A ) X p(B )

Ejemplo 6.4.-
De la información presentada en el cuadro # 2, Calcular:
A) La probabilidad de que de dos mujeres de esa muestra, una haya sido
atendida en un hospital público y la otra haya tenido un parto por vía
vaginal.
P( A ) X p( B)
=
p( A y B )

80 143
-' = - X - = 0,40 x 0,715 = 0,286
200 200
p(A · B )

B) Calcule la probabilidad de que al extraer simultáneamente tres histo­


rias clínicas de esa muestra, una de las historias corresponda a una mu­
jer que fue atendida en el J. V.S.S., otra en una clínica y a la última se le
haya practicado una cesárea.
5.- Probabilidad de eventos dependientes
En una situación donde los experimentos no ocurren simultáneamente
y se realizan sin reposición, también se aplica la regla de multiplicación o
de probabilidades compuestas para conocer la probabilidad de que ocurra
un evento, cuando previamente ha ocurrido otro que le afecta. En tal caso, la
ocurrencia del evento va reduciendo el espacio muestral.
Ejemplo 6.5.-
De la información presentada en el cuadro # 2, Calcular:

162
A. ) La probabilidad de que al extraer tres historias (una a una y sin reposi­
ción), la primera corresponda a una mujer que tuvo un parto por vía va­
ginal, la segunda sea de una mujer atendida en una clínica, y la tercera
también.
p( A y B y C ) = p( A ) X p(B) X p(C )

= 1 43 X 70 X 69 = 0,7 1 5 X 0,35 X 0,348 = 0,087


200 1 99 1 98
p( A y B y C )

B. ) Calcule la probabilidad de que al extraer cuatro historias (una a una y


sin reposición), todas correspondan a mujeres que fueron sometidas a
cesáreas.
5.- Probabilidades condicionales.
Cuando se busca la probabilidad de que un evento ocurra, dependiendo
de una condición específica previamente establecida, el espacio muestral se
limita exclusivamente al sub-total de los posibles resultados del evento, que
presentan dicha condición específica. Se trabaja con un sub-conjunto del
conjunto general. En tal caso, se busca la probabilidad de que ocurra "A
dado que se cumple B ". Se simboliza como: P (A/B), y se calcula mediante
la expresión:
= p( A y B)
p( A I B )
p(B)

P(A y BJ es la probabilidad conjunta de los eventos A y B.

Ejemplo 6.6.-
De la información presentada en el cuadro # 2, Calcular:
A. ) La probabilidad de que a una mujer de esa muestra se le haya practica­
do una cesárea, dado que fue atendida en una clínica privada.
(# cesárea en clínica) / n
, . !(.ltmca
p(Cesarea .. ) =
(
atendz.das en c/zmcas
' . )/n

3 2 / 200 = 32 =
= 0 46
A
= p( y B )
70 / 200 70 '
p( A I B )
pB

1 63
B.) La probabilidad de que una mujer de esa muestra haya tenido un parto
por vía vaginal, dado que fue atendida en una clínica privada.

DISTRIBUCIONES DE PROBABILIDADES
Uno de los objetivos del cálculo de probabilidades es determinar distri­
buciones que puedan servir de modelos a los variados fenómenos aleatorios
que se presentan en las ciencias experimentales y sociales.
Existen dos tipos de distribuciones que son importantes en las aplicacio­
nes prácticas, las discretas y las continuas. Una distribución Discreta surge
al contar (el número de hijos, de partos, de caries, accidentes, etc.), una con­
tinua aparece cuando se mide la temperatura, los valores de glicemia, úre�,
hemoglobina, hematocrito, etc. Se tratará, por ahora de las distribuciones
unidimensionales.
Se estudiará la binomial como distribución discreta y la normal como
distribución continua, siendo ésta última una de las más aplicadas en el
campo de la salud. Todas estas distribuciones tienen sus probabilidades cal­
culadas, por lo cual se consideran distribuciones teóricas o modelos mate­
máticos.
Esas probabilidades suelen compararse con las obtenidas de forma em­
pírica según el tipo de variable, y de esta manera puede determinarse el tipo
de distribución teórica que sigue un conjunto de datos empíricos, a lo cual
se les denomina ajuste; así una variables discreta, de acuerdo a su probabili­
dad y al número de repeticiones del experimento, se puede ajustar al mode­
lo binomial o al normal.

Distribución Binomial
Propiedades:
µ = np ; cr2 = npq ;
Condiciones para las aplicaciones:
Si n es grande, la distribución binomial tiende hacia la normal y la proba­
bilidad del evento se puede obtener tipificando la variable mediante la ex­
presión:
z = X - µ / cr

164
Si la probabilidad del evento es muy pequeña, (P < O, 1, y np < 5), las ci­
fras decimales resultan muy largas, y al redondear se cometen errores signi­
ficativos, por lo cual se recomienda ajustar la binomial a otro modelo.
Un ejemplo de distribución binomial se muestra a continuación:
X f p
o 11 1 1/1 83
1 134 1 34/1 83
2 22 22/ 1 83
3 11 1 1/1 83
4 3 3/1 83
5 2 2/1 83
1 83 1 ,00

Es de hacer notar que todos los valores de p, son probabilidades empíri­


cas. Para calcular las probabilidades teóricas en una distribución binomia­
les necesario desarrollar el Binomio de Newton.
Ejemplo 6.7. -
Se tiene una muestra formada por mujeres, que son madres de 5 hijos
cada una. Se busca conocer la probabilidad de que al elegir una por azar,
ésta sea madre de: a) 3 varones y 2 hembras. b) por lo menos 3 varones. c)
entre 2 y 5 varones. d) que no tenga varones.
La probabilidad de que sea varón es igual a la de que sea hembra, en este
caso, 50 % para cada uno.
p = probabilidad de que sea varón; q = probabilidad de que sea hembra
( p + q ) 5 = p 5 + 5 p 4 q +10p 3 q 2 +10p 2 q 3 + 5 pq 4 + q 5 =
= (050) 5 + 5 (050)4 (050) + 10(050) 3 (050)2 + 10(050)2 (050) 3
+ 5 (050)4 + (050) 5 =
= (0.0315) + 5 (0.0625)(050) + 10(0.125)(025) + 10(025)(0.125)
+ 5 (050)(1.0625) + (0.03125) =
= 0.03125 + 0.15 625 + 0.3 125 + 0.3125 + 0.15625 + 0.03125 = 1

165
a) Se busca la probabilidad de elegir por azar una mujer con 3 varones (3
p ó p3 ) y 2 hembras (2 q ó q2) = p q , lo cual corresponde al tercer tér­
mino de la ecuación, por lo tanto, esa probabilidad es de 0,3125, o de
3 2

31,25 %.
b) Por lo menos 3 varones: 0,03125 + O, 15625 + 0,3125 = 0,5
c) Entre 2 y 5 varones: 0,3125 + 0,3125 + 0,15625 + 0,03125 = 0,8125
d) Que no tenga varones: 0.03125
Ejemplo 6.8.-
Se sabe que al 3 6% de los pacientes con urolitiasis, vistos por primera
vez en la consulta de urología infantil del Hospital Universitario "Angel
Laralde", en el transcurso del año se les realizó exámenes de creatinina. Si
se toma una muestra de 5 pacientes, calcule:
a) la probabilidad que a ninguno se le haya realizado dicho examen.
b) la probabilidad que se le haya practicado el examen a entre 2 y 3 pa­
cientes, ambos inclusive.
c) la probabilidad que se le haya realizado el examen a más de 3 pacien­
tes.
Para encontrar el valor de dicha probabilidades se desarrolla el Binomio
de Newton.
Si se designa por "p", la condición de paciente con examen de creatinina,
y por "q" los pacientes sin ese examen, se tiene que el binomio toma la for­
ma:
( p + q Y = ( p + q) s

p 5 + 5 p 4 q +10 p 3 q 2 + 10 p 2 q 3 + 5 pq 4 + q 5
En este caso, la probabilidad de p y q no son iguales; el ejemplo plantea
que:
p = 36 % q = 100 - 36 = 64 % . Expresado en proporción, se tiene:
p = 0,36 y q = 0,64.
Sustituyendo "p" y "q" por su valor:
(0,36)5 + 5(0,36)4 (0,64) + 10(0,36)3 (0,64)2 + 10(0,36)2 (0,64)3 +

1 66
5 (0,36)(0,64)4 + (0,64)5=
= 0,006 + 0,054 + 0, 1 9 1 1 + 0,3397 + 0,30 + 0, 1 07 = 1 ,00.
a) La primera pregunta formulada se refiere a la probabilidad de que a
ninguno de los pacientes se le haya practicado examen de creatinina,
lo cual corresponde a q5 , por lo tanto, la probabilidad = 0, 107.
b) 0, 1 9 1 1 + 0,3 397 = 0,5308
c) 0, 1 9 1 1 + 0,054 + 0,006 = 0,25 1 1
Ejemplo 6.9.-
Se sabe que al 3 8% de los pacientes con urolitiasis, vistos por vez prime­
ra en la consulta de urología infantil del HUAL, en el trimestre anterior, se
les practicó examen de glicemia. Si se toma una muestra aleatoria de 6 pa­
cientes. Calcule: a) la probabilidad que se le haya realizado el examen a más
de 2. b) la probabilidad que se le haya practicado a menos de 5. c) la proba­
bilidad de que entre 3 y 5 pacientes, ambos inclusive, hayan sido examina­
dos.
Ejemplo 6. 1 0.-
Si al 29% de los pacientes del ejemplo anterior se le ha practicado el exa­
men de fósforo sérico, y se toma una muestra de7 de ellos, cuál es la proba­
bilidad de que: a) a 2 se les haya realizado dicha prueba?. b) entre 2 y 5 ha­
yan sido examinados?.
Ejemplo 6. 1 1.-
En una muestra aleatoria de 1 O pacientes, al 45% de ellos se le practicó
urocultivos, calcule la probabilidad que: a) a 3 se le haya realizado dicho
examen. b) entre 3 y 7 hayan sido examinados. c) a más de 4 personas se les
haya practicado el examen. d) hayan sido examinados menos de 7.

Distribución normal
Cuando "n" es grande y "p" se aproxima a 0,50, el modelo de la distribu­
ción binomial se aproxima a otro modelo teórico denominado distribución
normal. La importancia de esta distribución es que muchos fenómenos
tienden a seguir este modelo, el cual presenta sus propias características, ta­
les como:

167
campana, originando así la curva normal.
1 .- La distribución normal es simétrica y al graficarla tiene forma de

2- La media, la mediana y la moda, coinciden en su centro y la dividen en


dos partes iguales.
3 .- Es asintótica con respecto al abscisa, teóricamente se extiende desde
-oo hasta +oo.
4.- La media es cero y la desviación estándar es l .
5 .- Se simboliza mediante la expresión N(O, l).
El área total comprendida bajo la curva normal y el eje horizontal es
igual a 1 (unidad cuadrada), y representa la totalidad ( 1 00 %) de las proba­
bilidades de ocurrencia de un fenómeno determinado. Debido a la simetría
de esta curva, al trazar una ordenada en su centro, que toque la parte más
alta de ella, la divide en dos partes, donde el 5 0 % del área queda a la dere­
cha y el 5 0 % restante hacia la izquierda. A esta ordenada se le conoce como
ordenada máxima.
Si paralela a la ordenada máxima se traza otra ordenada en cualquier
punto de la abscisa y bajo la curva, puede calcularse el área comprendida

que ellos han sido obtenidos y presentados en la tabla de áreas de la curva


entre ambas ordenadas, sin embargo, tales cálculos no son necesarios dado

normal
Para aplicar una distribución normal a una distribución empírica se
tipifica la variable en estudio (x), mediante el cambio a la variable z. z =
(X - X)ls.
En una distribución normal típica, z indica la dirección y grado en que un
valor individual (x) se aleja del promedio. Si el valor de x es mayor a la me-

168
dia, z es de signo positivo, y se encuentra en el lado derecho de la curva nor­
mal. Si por el contrario, x es un valor inferior a la media, z es de signo nega­
tivo y se ubica en el área izquierda.

Tabla de áreas de la curva normal.


Es una tabla de doble entrada, donde la primera columna contiene las
desviaciones sigmas (o valores z). En ella aparecen estas desviaciones des­
de 0,0 hasta 3,0. En la primera fila está el complemento de dichas desviacio­
nes, de tal manera que puedan manejarse con dos fracciones decimales. El
cuerpo de la tabla contiene el área de la curva correspondiente a las desvia­
ciones sigmas desde 0,00 hasta 3,09. Dado que la curva es simétrica, en la
tabla sólo se muestra la mitad del área (0,5000 ó 50 %), es decir, un solo
lado, entendiéndose que la otra mitad es igual. Estas áreas pueden demar­
carse a partir de la ordenada máxima (lugar donde se encuentra la media
aritmética de la distribución) hasta cualquier otra ordenada que se trace pa­
ralela a ésta, dependiendo de cuantas desviaciones sigmas se aleja la segun­
da ordenada con respecto a la ordenada máxima.
Ejemplo 6. 1 2.-
Dada una distribución normal, encontrar el área de la curva normal,
comprendida entre:
a) La µ y 1 , 54 sigmas

O 1 ,54

Se busca directamente en la tabla de áreas de la curva normal, abordán­


dola por 1 ,54, y se localiza en el cuerpo de la tabla el área buscada; en este
caso, el área que le corresponde es de 0,4382; el cual puede ser expresado
en porcentaje, y se tiene un 43,82 % es el área comprendida entre la µ y 1 ,54
sigmas.

1 69
b) La µ y -1 ,73 sigmas

o
L_
1

- 1 ,73

Area izquierda, dado que z es negativa.


·�·

En la tabla, 1 , 73 sigmas corresponde un área de 0,4582. Igual a 45,82 %.


c) Entre -1 ,32 y 1 , 1 5 sigmas.
•����� �--�������� � ��

- 1 ,32 o 1 ,1 5

En la tabla se obtiene:
para -1 ,32 � 0,4066
para 1 , 1 5 � 0,3749
Se suman las dos áreas, dado que limitan a ambos lados la ordenada má­
xima: 0,4066 + 0,3749 = 0,78 1 5. En porcentaje = 78, 1 5 %. Entre -1 ,32 y
1 , 1 5 sigmas se encuentra el 78, 1 5 % del área central de una curva normal.
d) Entre 0,66 y 1 ,78 sigmas.
- -

O 0,66 1 ,78

En la tabla se obtiene:

1 70
para 1, 78 � 0,4625
para 0,66 � 0,2454
Estas áreas corresponden a la zona que va desde la ordenada máxima
hasta 1, 78 sigmas y desde la ordenada máxima hasta 0,66 sigmas. Dado que
el área buscada no limita la ordenada máxima, debe descartarse la zona
comprendida entre ésta y 0,66 sigmas, de tal manera que sólo quede el área
comprendida entre 0,66 y 1, 78 sigmas.
0,4625 - 0,2454 = 0,217 1 .
Expresado en porcentaje se tiene que entre 0,66 y 1, 78 sigmas se encuen­
tra el 21, 71 % del área de la curva normal.
e) Por encima de 2,00 sigmas.

o 2,00

En la tabla, 2,00 � 0,4772, el cual es el área desde la ordenada máxima


hasta 2,00 sigmas. Dado que se busca el extremo de la curva, se resta de
0,5000 el área obtenido en la tabla:
0,5000 - 0,4772 = 0,0228. En porcentaje: 2,28 %
Por encima de 2,00 sigmas se encuentra el 2,28 % del área de la curva
normal.
6.13) Determinar a cuantas desviaciones sigmas se encuentra el percen­
til 77.
---,

O 0,74

171
Hasta la mitad de la curva hay un área de 50 %, por lo cual, sólo habrá
que buscar en el cuerpo de la tabla a cuantas sigmas se aleja la ordenada que
limita el 27 % (50 + 27 = 77) por encima de la ordenada máxima. Al buscar
0,2700 en el cuerpo de la tabla, este valor no aparece, por lo cual, se toma el
valor más próximo a él, siendo 0,2704, correspondiéndole O, 74 sigmas.
El percentil 77 se encuentra a 0,74 sigmas.
6. 1 4) ¿A cuántas sigmas se encuentra el percentil 20?

30%

-0,84 O

20 % es el área correspondiente a la cola izquierda de la curva normal.


No limita a la ordenada máxima, por lo tanto, debe restarse de 50 (ó 0,5000
- 0,2000) para conseguir la zona que sí la limita, y luego buscar la diferencia
(0,3000 o un valor próximo a éste) en la tabla. Como 0,3000 no aparece en
ella se utliza 0,2995, correspondiéndole 0,84 sigmas. Dado que se busca un
área de la izquierda, sigma es de signo negativo.
El percentil 20 se encuentra a - 0,84 sigmas en una curva normal.
6. 1 5.) ¿A cuántas sigmas se levantan las ordenadas que limitan el 70 %
central de una curva normal?

- 1 ,04 o 1 ,04

En virtud de que el 70 % es central se divide este valor entre 2 para luego


buscar esa área en el cuerpo de la tabla. Esta división es necesaria dado que
la tabla sólo contiene la mitad de la curva.

1 72
El 35 % ó 0,3500 se extiende hasta 1,04 sigmas; por lo tanto, el 75 %
central se encuentra entre -1,04 y 1,04 sigmas.
Así mismo estas características de la curva normal pueden ser aplicadas
a una variable empírica mediante el cambio de esa variable a z, utilizado la
fórmula:
(X - X )
z = ---
s
Ejemplo 6.16.-
En una investigación acerca del estado nutricional de los escolares de
1ro a 3er grado en las escuelas de la Vivienda Rural de Bárbula, se encontró
que los niveles de hemoglobina se distribuyeron siguiendo una curva nor­
ma, con una media aritmética de 12,39 gr./100cc y una desviación típica de
3,22 gr./100 ce. Si el tamaño de muestra fue de 64 escolares, se desea saber:
a) la probabilidad de que al seleccionar un escolar, éste presente un valor
de hemoglobina igual o menor que JO gr./100 ce.

P(X<lO)

10 1 2,39
----�---- ----- -------- - - - - - -�

10 - 12,.39 =
z= -0,74 s1gma
3,22
En la tabla, 0,74 sigma corresponde a un área de 0,2704, pero al ser una
zona extrema, perteneciente a una cola, se resta de 0,5000.
0,5000 - 0,2704 = 0,2296 ó 22,96 %
Existe 22,96 % de probabilidades de seleccionar por azar un niño con va­
lores de hemoglobina igual o inferior a 1O, mg/100 ce. en la muestra de es­
colares estudiados.
b) probabilidad de encontrar escolares que presenten valores de hemoglo­
bina entre 11, 5 y 12, 7.

173
P(l 1 ,5 < X < 1 2,7)

1 1 ,5 1 2,39 1 2,70

l l,5 - l 2,3 9 =
z= -0,28 sigma (0, 1 103 en la tabla)
3,22

1 2 7 - l 2,3 9 =
z1 = • OJ O sigma (0,0398 en tabla)
3,22
0, 1 1 03 + 0,0398 = 0, 1 50 1 ó 1 5,0 1 %
e) probabilidad de que al seleccionar un estudiante, en forma aleatoria,
presente niveles de hemoglobina iguales o mayores que 12.

P(X < 12)

12 1 2,39
---- ---------- ------ -------· --- ------

1 2 - 1 2,3 9 =
-

z= -OJ 2 sigma (0,04 7 8 en la tabla)


3,22
0,047 8 + 0,5000 = 0,5478 ó 54,78 %
d) probabilidad de que un estudiante seleccionado al azar, presente valo­
res de hemoglobina entre 9, 6 y 11, 6.

¡---------
1
------
P(9,6 < X < l l ,6)

1 9,6 1 1 ,6 1 2, 39
�--- ------ - -- - -

1 74
9,6 - 1 2,.39
z= = -0 '87 . z = l l,6 -12,.39 = -0,25 ·
3,22 ' 3,22
En la tabla a 0,87 sigmas le corresponde 0 ,3 0 78;

y a 0 ,25 le corresponde � 0 ,0987.

Debido a que están del mismo lado de la curva se restan


0 ,3 078 - 0, 0987 = 0,2091; o 20,91 %.
d) ¿ A cuántas sigmas se encuentran los niños que tienen 11,39 gr/100 ce de
hemoglobina?

1 1 ,39 1 2,39

1 1,.39 -12,.39 = - 1,00 = -


z= 0 ,.3 l sigma
3 ,22 3,22
e) ¿A cuantas sigmas se encuentra el 20 % de los escolares que tienen los
menores valores de hemoglobina?

30%
o
Como el 20 % es un área extrema de la curva, se resta de 5 0 %, y la dife­
rencia se busca en el cuerpo de la tabla, para conocer a cuantas sigmas se
encuentra.
50% - 20% = 30%, se busca en la tabla, 0,3000, o un valor aproximado.
En este caso, el valor más próximo es 0,2995, al cual le corresponde sig­
ma = 0,84. Se utiliza con signo negativo por cuanto se refiere a un área de la

175
izquierda de la curva.
Existe un 20 % de probabilidades de que quienes tienen menores valores
de hemoglobina estén a - 0,84 sigmas.
f) ¿ Qué valores de hemoglobina tiene el 20 % de los niños que presentan
menores valores de hemoglobina?
Por el resultado del ejercicio anterior se sabe que el 20 % de los niños
con menores valores de hemoglobina se encuentran a - 0,84 z.
Como z es un valor conocido, se puede despejar X (valor buscado) de la
fórmula:
X -X
z = ---
s

X = X + ( z · s)
Por lo tanto, sustituyendo en la fórmula se tiene:
X = 1 2,39 + (- 0,84 x 3.22) = 1 2,39 - 2.70
X = 9,69 gr/100 ce
g) ¿A cuantas sigmas se encuentra el 40 % de los escolares que tienen los
valores mayores de hemoglobina?

o
50% - 40% = 1 0%, se busca en el cuerpo de la tabla O, 1 000, al cual le co­
rresponde 0,25 sigmas.
Existe la probabilidad de que el 40 % de los escolares con altos valores
de hemoglobina se encuentren a 0,25 sigmas, con respecto a X.
h) ¿ Qué valores de hemoglobina tienen los escolares que se encuentran a
1,25 sigmas?

1 76
1 ,25

X = X + (z · s)
X = 1 2,39 + (1 ,25 x 3,22) = 1 2,39 + 4.03
X = 1 6,42 gr/100 ce
i) ¿ Qué valores de hemoglobina tienen los escolares que se encuentran a
-1, 50 sigmas?

-1 ,50
�.J
X = X + (z · s)
X = 1 2,39 + ( -1 .50 x 3.22) = 1 2,39 - 4.83
X = 7.56 gr/l OOcc
j) ¿ Qué valores de hemoglobina le corresponde al percentil 80?

¡ --
El percentil 80 se encuentra a 0,84 sigmas. Se buscó en la tabla el área
0,3000 (diferencia de 80 % - 50 % = 30 %, y luego transformado en propor­
ción).

1 77
X = X + (z · s)
X = 1 2,39 + (0,84 x 3 . 22) = 1 2,39 + 2,70
X = 1 5 ,09 gr/l OOcc.
k) ¿ Qué porcentaje de escolares tiene valores de hemoglobina entre 9 y
13, 5 gr/100 ce. ?

9 1 3,50

900 - 1 2,39 = -3 ,3 9 = .
z1 = ' - - -1,05 sigma (0.353 1 en la tabla)
3,22 3 ,22
1 3,.50 - 1 2,39 = 1,1 1 =
z2 = - 0,3 4 sigma (0. 1 33 1 en la tabla)
3,22 3 ,22
Se suman estas dos áreas, dado que están a ambos lados de la curva:
0.353 1 + 0. 1 33 1 = 0.4862. Expresado en porcentaje indica que existe la
probabilidad de que el 48,62 % de estos niños tengan valores de hemoglobi­
na entre 9 y 1 3,5 gr/1 00cc.
1) ¿ Qué porcentaje de escolares tiene más de 13,5 gr/100 ce?

1 3,50
__J
1 3,.50 - 1 2,39 =
L_________ ____ _ _ _ _ �
_ _____

z= 0,34 sigma (0. 1 3 3 1 en la tabla. Igual a 1 3,3 1 %)


3,22
Como se busca un área extrema se resta de 50 %:

1 78
5 0 % - 13,31 % = 3 6,69 %
Existe la probabilidad que el 36,69 % de esos escolares tengan valores de
hemoglobina superiores a 13,5 0 gr/l OOcc.
m) ¿Qué porcentcefe de escolares tiene más de 11,39 gr/100 ce?

1 1 ,39

z = l l,39 - l 2,39 = - l,OO = -0,31 (0 .1217 en la tabla)


3,22 3,22
12,17 % + 5 0 % = 62.17 %
Al porcentaje (12,17%) encontrado en la tabla se le ha sumado 50% dado
que quienes tienen valores de hemoglobina superiores al promedio también
son parte de la respuesta al problema planteado.
n) ¿Qué porcentaje de escolares tiene menos de 10,39 gr/100 ce?

1 0,39
---- - �------- ·----- ----- ----�- -

z = 10,3 9 - l 2,39 = -2,00 = -O 62 (0.2324 en la tabla)


'
3,22 3,22
0 .5 000 - 0.2324 = 0.2676 X 100 = 26.76 %
Existe la probabilidad que el 26,76 % de estos niños tengan valores de
hemoglobina inferiores a 10,39 gr/l OOcc.
o) ¿ Cuántos escolares tiene menos de 10, 39 gr/100 ce?

179
Por el ejercicio anterior se sabe que el 26, 76 % de los escolares tienen va­
lores de hemoglobina inferiores a 10.39 gr/l OOcc. Asimismo, los datos
aportados en el problema indican que se utilizó una muestra de 64 escola­
res. Por lo tanto, puede calcularse cuántos niños representan ese 26, 7 6 % de
64 escolares.
(26,76 X 64) / 100 = 7,16
Existe la probabilidad de que 7 escolares tengan valores de hg. inferiores
a 10.39 gr./100 ce.
6.17 Ejemplo:
Se sabe que los valores de hemoglobina en un grupo de 7-1O años, de es­
colares de l ro a 3 er grado, de la Vivienda Rural sigue una curva normal con
una media aritmética de 9,72 mg/lOOcc. y una desviación estándar de 2,3 1
mg/100cc. El número de estudiantes de dicha escuela es de 720. Se requiere
saber la probabilidad de que al seleccionar un estudiante, éste presente va­
lores de hemoglobina:
a) Igual o menor que 9.
b) Mayor o igual a 11.
c) Entre 8 y 13.
d) Igual a 10.
f) ¿Qué valores de hemoglobina le correspondió como máximo al 20%
de los estudiantes que presentaron los niveles más bajos?
g) ¿Qué valores de hemoglobina le correspondió como mínimo, al 30%
de los estudiantes que presentaron los niveles más altos?
h) ¿Qué valor de Hemoglobina le correspondió a los percentiles 27; 60 y
75?
i) ¿Cuántos estudiantes presentaron los niveles de hemoglobina igual o
menor de 13?
Ejemplo 6.17:
Se sabe que los valores de hemoglobina en 64 escolares, seleccionados
al azar, en el Ciclo Básico "M. V. Romero García", se distribuyen normal­
mente con una media de 14,04mg/100cc y una desviación estándar de 1,8
mg/l OOcc. Se requiere saber la probabilidad de que al seleccionar un estu-

180
<liante, presente niveles de hemoglobina:
a) Superiores a 1 3.
b) Menores a 1 5 .
c) Entre 1 1 y 14,5, ambos inclusive.
d) Igual o menor a 1 4,75.
e) Igual o mayor a 1 O.
f) Igual a 1 2.
g) ¿ Cuántos estudiantes presentan valores de hemoglobina entre 8 y 1 4?
h) ¿Qué valores de hemoglobina les corresponde a los percentiles 30, 40,
60?
Ejemplo 6. 1 8:
Se sabe que los niveles de Hematocrito en lactantes alimentados con le­
che materna en el Centro Materno Infantil "La Guacamaya", en el transcur­
so de estos años sigue una curva normal. Al seleccionar por azar a 32 lac­
tantes, se encuentra una media aritmética de 3 1 ,4 con una desviación están­
dar de 3,08; determine la probabilidad de que al seleccionar un lactante,
presente niveles de hematocrito:
a) Igual o menor a 28.
b) Entre 28 y 25, ambos inclusive.
c) Igual o mayor a 30.
d) Igual a 32.
e) ¿Qué niveles de hematocrito le corresponden como máximo, al 1 0%
de los lactantes que presentaron los niveles más bajos?
f) ¿Qué valores les corresponden a los percentiles 30, 40 y 60?
Ejemplo 6. 1 9:
Se ha determinado que la edad de pacientes con E. T. S, que asistieron a la
Unidad Sanitaria de Valencia durante los dos últimos años, se distribuyen
normalmente con una media aritmética de 27,5 años y una desviación es­
tándar de 7,7 años. Si el número de pacientes fue de 1 23, determine la pro­
babilidad que al seleccionar un paciente éste tenga una edad:
a) Igual o mayor a 20 años.

181
b) Entre 20 y 49 años.
c) Igual a 30 años.
d) Igual o menor a 15 años.
e) ¿ Cuál es la edad máxima del 20% de los pacientes más jóvenes?
f) ¿Qué edad le corresponde a los percentiles 40, 58 y 76?

BIBLIOGRAFÍA
Daniel, W. (1977). Bioestadística. México, D.F.: Limusa.
Remington, R. y Schork, A. (1977). Estadística Biométrica y Sanitaria. Se­
gunda edición. México, D.F.: Prentice/Hall Internacional.
Weintraub, J., Douglas, Ch. y Gillings, D. (1985). Bioestadística en Salud
bucodental. Carolina del Norte. U.S.A.: Publicación de OPS.

182
Areas de la curva normal

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
.O .0000 .0040 .0080 . 0 1 20 .0160 .0199 .0239 .0279 .03 1 9 .0359
.1 .0398 .0438 .0478 .05 1 7 .0557 .0596 .0636 .0675 .0714 .0753
.2 .0793 .0832 .087 1 .09 1 0 .0948 .0987 . 1 026 . 1 064 . 1 103 . 1 141
.3 . 1 1 79 .1217 . 1 255 . 1 293 . 13 3 1 . 1 368 . 1406 . 1 443 . 1 480 .1517
.4 . 1554 . 1 59 1 . 1 628 . 1 664 . 1 700 . 1 736 . 1 772 . 1 808 . 1 844 . 1 879

.5 .1915 . 1 950 . 1 985 .201 9 .2054 .2088 .2123 .2 1 57 .2 190 .2224


.6 .2257 .229 1 .2324 .2357 .2389 .2422 .2454 .2486 .25 17 .2549
.7 .2580 .26 1 1 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
.8 .2881 .291 0 .2939 .2967 .2995 .3023 .305 1 .3078 .3 106 .3 1 33
.9 .3159 .3 1 86 .3212 .3238 .3264 .3289 .33 1 5 .3340 .3365 .3389

1 .0 .34 1 3 .3438 .3461 .3485 .3508 .353 1 .3554 .3577 .3599 .362 1
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1 .2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .401 5
1 .3 .4032 .4049 .4066 .4082 .4099 .41 1 5 .41 3 1 .4147 .4162 .41 77
1 .4 .4192 .4207 .4222 .4236 .41 5 1 .4265 .4279 .4292 .4306 .43 1 9

1 .5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .44 1 8 .4429 .4441
1 .6 .4452 .4463 .4474 .4484 .4495 .4505 .45 1 5 .4525 .4535 .4545
1 .7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .461 6 .4625 .4633
1 .8 .4641 .4649 .4656 .4664 .4621 .4678 .4686 .4693 .4699 .4706
1 .9 .47 1 3 .47 1 9 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767

2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .48 12 .48 1 7
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .49 1 1 .4913 .49 1 6
2.4 .49 1 8 .4920 .4922 .4925 .4927 .4929 .493 1 .4932 .4934 .4936

2.5 .4938 .4940 .494 1 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .498 1
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986

3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4890 .4890

183
CAPÍTULO VII
Estadística Inferencia/
Inferencia estadística. Distribución muestra!. Distribución de la Media de la
muestra. Error estándar. Estimación de los parámetros. Estimación por puntos.
Estimación de intervalos. Estimación de la Media poblacional. Estimación de una
proporción poblacional. Prueba de hipótesis. Nivel de significación. Selección de
estadísticos a prueba. Regla de decisión. Pruebas de Hipótesis para una media de
población. Para un porcentaje de población. Para diferencia entre dos Medias de
Población. Diferencia entre dos Proporciones poblacionales. t de Student.
Ejercicios.

1 85
1 86
ESTADÍSTICA INFERENCIAL
El presente capítulo trata de los procedimientos inferenciales necesarios
para llegar a conclusiones valederas sobre poblaciones, tomando como
base, la información obtenida en una muestra. La función primordial de la
inferencia estadística es apoyar el razonamiento para llegar a decisiones só­
lidas a pesar de la falta de un conocimiento verdadero del universo, y real­
mente es tan importante esta función que se suele hablar de la estadística
como "el estudio de decisiones ante la incertidumbre". La inferencia puede
ser deductiva o inductiva.
La primera es un juicio o generalización basado en axiomas o premisas,
de las cuales se deriva una conclusión mediante un razonamiento dialécti­
co, a priori. La inferencia inductiva por su parte, es un juicio o generaliza­
ción derivado de observaciones empíricas o experimentales, y la conclu­
sión se obtiene de un procedimiento a posteriori. La inferencia estadística
es por tanto inductiva y llega a generalizaciones sobre las características de
una población basándose en observaciones empíricas realizadas en mues­
tras aleatorias.
Es frecuente que las medidas obtenidas en una muestra (estadísticos)
sean diferentes al parámetro de la población. A la diferencia entre estas dos
medidas se le denomina error. Determinar el tamaño de ese error sólo sería
posible si se conociera el parámetro de la población, pero éste, por lo gene­
ral, se desconoce. La única forma de conocer dicho valor sería realizando
todas las observaciones posibles de todo el universo, lo cual es sumamente
dificil e impráctico en función del costo y tiempo. De esta dificultad surge
la inferencia estadística la cual permite presumir las características del uni­
verso a partir de las muestras.
De la media de una muestra se hacen inferencias sobre la media de la po­
blación, por supuesto no se sabe la diferencia entre esas dos medias, que
como se dijo anteriormente, la última es desconocida en la mayoría de los
casos; lo que se conoce es la probabilidad de que esta diferencia no sea ma­
yor, por ejemplo de tres o dos errores típicos.
El valor obtenido en una muestra (estadístico) puede considerarse como
un estimador del parámetro de la población. Un estimador es una función de
las puntuaciones de la muestra que da lugar a un valor, el cual suministra in­
formación sobre el parámetro. Un estadístico que se calcula partiendo de

187
una muestra al azar es una variable aleatoria y por consiguiente, tiene una
distribución de probabilidades propias, la cual es conocida como distribu­
ción muestral de un estadístico. Así puede tenerse una distribución muestra!
de medias, cuando el estadístico es la media aritmética; distribución mues­
tral de proporciones, cuando el estadístico es una proporción o porcentaje, y
así sucesivamente.

DISTRIBUCIÓN MUESTRAL
Una distribución muestral es una distribución de probabilidades de un
estadístico calculado a partir de todas las muestras posibles de tamaño n,
elegidas al azar en una población determinada. Si de una población se selec­
cionan sucesivas muestras de tamaño n, y a cada una de esas muestras se les
calcula un estadístico, distribuido en forma normal, se tendrán distribucio­
nes de frecuencias de los valores promedios de esa variable, en cada una de
las muestras. Al representar gráficamente esos valores muestrales (Media
aritmética, por ejemplo), se encontrará que también siguen una forma de
curva normal.

DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA


Todo estadístico de una variable· continua tiene una distribución mues­
tral, donde:
1 . - La media de las medias de las muestras es igual a la media de la po­
blación.
2.- La varianza de las medias de las muestras es igual a la varianza de la
población, dividida entre el tamaño de las muestras (n).
3 . - La distribución de las medias muestrales tiene forma de curva nor­
mal.
Se tiene el siguiente ejemplo:
De un universo hipotético formado por cinco (5) sujetos, cuyas edades
son: 1 O - 1 2 - 1 4 - 1 6 - 1 8 años, con una media poblacional de 14 años y una
varianza poblacional de 8 años (cr2 = 8 años) se tomaron todas las muestras
posibles (con reemplazo) de tamaño 2 (n = 2) obteniéndose los siguientes
resultados:

188
X 10 12 14 16 18
10 1 0 + 10 1 0 + 12 1 0 + 14 10 + 16 10 + 18
(X + 1 0) (X = 1 1 ) (X = 1 2) (X = 1 3) (X = 1 4)
(S2 = O) (S2 = 1 ) (S2 = 4) (S2 = 9) (S = 1 6)

12 1 2 + 10 1 2 + 12 1 2 + 14 12 + 16 12 + 18
(X = 1 1) (X = 1 2) (X = 1 3) (X = 14) (X = 1 5)
(S2 = 1 ) (S2 = O) (S2 = 1) (S2 = 4) ( S = 9)

14 14 + 1 0 14 + 12 1 4 + 14 14 + 1 6 14 + 18
(X = 1 2) (X = 1 3) (X = 14) (X = 1 5) (X = 1 6)
(S2 = 4) (S2 = 1 ) (S2 = O) (S2 = 1 ) ( S = 4)

16 16 + 10 16 + 12 16 + 14 16 + 16 1 6 + 18
(X = 1 3 ) (X = 1 4) (X = 1 5) (X = 1 6) (X = 1 7)
(S2 = 9) (S2 = 4) (S2 = 1 ) (S2 = O) (S = 1 )

18 18 + 10 18 + 12 18 + 14 18 + 16 1 8 + 18
(X = 1 4) (X = 1 5) (X = 1 6) (X = 1 7) (X = 1 8)
(S = 1 6) (S = 9) (S = 4) (S = 1 ) (S = O)

Distribución muestral de estas medias:


x # de Muestras j

10 1 __ I
14
--
11 2 13 14 15
12 3 12 13 14 15 16
13 11 12 13 14 15 16 17
4
10 11 12 13 14 15 16 1 7 18
--
14 5
X = 14
---
15 4
16 3
17 2 --

18 1 ¡I

Total 1
25 ji

189
- = ¿ ( Xi · fi) 380 = _
X = - 14 anos
n 25
En esta distribución muestra}, de 25 muestras posibles, de tamaño dos, la
media aritmética es igual a 14 años, (X = 14 años) y la varianza es de 4 años
(S2 = 4 años).

L ( dm 2 . fi)
si = [ioo = J4 años
n
=
�25
Lo cual confirma la teoría de que en una población distribuida en forma
normal, la X de las medias = µ de la población (X = 14 años y µ = 14 años) y
que la varianza de las medias de la muestra (S2 = 4 años) es igual a la varian­
za de la población dividida entre el tamaño de las muestras (cr 2 = 8; 8/2 = 4
años).
Sin embargo, estas condiciones no se cumplen cuando las muestras se
forman sin reemplazo o la población no está distribuida normalmente, en
cuyo caso, se aplica un teorema matemático conocido como Teorema del
Límite Central el cual contempla que:
"Dada una población con una media µ y varianzafinita cr2, la dis­
tribución muestra/ de X calculada a partir de muestras de tamaño n
de esa población, está distribuida aproximadamente en forma nor­
mal con media µ y varianza cr2In, cuando el tamaño de la muestra es
grande. "
Cuando la población es finita y las muestras se toman sin reposición, y n
< 30, es necesario utilizar el factor de corrección �( N - n) / ( N -1); por lo
cual, la expresión es:
cr2
N- n
n N -I
- - --

El teorema del límite central permite tomar muestras de poblaciones no


distribuidas normalmente, con la garantía de que los resultados obtenidos
serán aproximadamente los mismos que se obtendrían si la población se
distribuyera en forma normal, siempre que se utilice una muestra grande.

190
ERROR ESTÁNDAR
Teóricamente en una distribución muestral las medias se distribuyen en
forma normal alrededor del promedio, de la misma manera como se distri­
buyen los valores individuales en una distribución de frecuencias. Allí, la
medida de dispersión es la desviación estándar, y en la distribución mues­
tra! es el error estándar, el cual no es más que el promedio de los errores
muestrales. Ello significa que las distintas medias de la distribución mues­
tra! contienen una fracción de error en sus estimaciones con respecto a la
media poblacional.
El error estándar puede definirse como la diferencia que existe entre el
valor estimado en la muestra (estadístico) y el verdadero valor representati­
vo de la población (parámetro), por lo tanto, mientras menor sea el error es­
tándar mayor será la aproximación del estadístico al parámetro.
Al error estándar también se le conoce como error por muestreo y está en
función del tamaño de la muestra. Mientras mayor sea la muestra, menor es
la magnitud del error estándar.
En teoría pueden existir distribuciones muestrales para los diferentes es­
tadísticos conocidos: media aritmética, desviación típica, mediana, porcen­
tajes, etc. por lo cual es posible calcular el error estándar para cada uno de
estos estadísticos obtenidos en las muestras.

Cálculo del error estándar


Dado que el error estándar es una desviación estándar en una distribu­
ción muestral se simboliza como "S " acompañado del símbolo del estadís­
tico respectivo; por ejemplo: S x ; SrpJ , para el error estándar de media y de
proporción respectivamente.
Para calcular el error estándar de la media se utiliza la fórmula:

(1) S- = _!_
X ¡;;
Donde:
s = Desviación estándar de la muestra.
n = Tamaño de la muestra.
S x = Error estándar.

191
Para calcular el error estándar de una proporción o porcentaje:

(2) S (P) = ��
-----;;-
Donde:
p = porcentaje de sujetos con la característica en estudio.
q = ( 1 00 - p) porcentaj e de sujetos sin la característica en estudio.
n = tamaño de la muestra utilizada.
Para calcular el error estándar diferencial:
(3)

Usos del error estándar.-


En función de la definición del error estándar y de las propiedades de la
distribución muestral, es posible:
a.- Estimar los valores representativos de una población.
b.- Tomar decisiones en función de pruebas de hipótesis.
c. - Calcular el tamaño de una muestra, cuando se espera una determinada
precisión entre el estadístico y el parámetro.

ESTIMACIÓN
En páginas anteriores se ha dicho que la inferencia estadística permite
hacer generalizaciones hacia el universo a partir de la información obtenida
en una muestra. En este sentido, mediante la inducción, es posible obtener
un valor representativo de la población, el cual se conoce con el nombre de
estimador.
Para que resulte de mayor utilidad, un buen estimador debe tener: Con­
sistencia, ausencia de sesgo y eficiencia.
1 .- Consistencia: Un estimador consistente es aquel que tiende a aproxi­
marse al valor del parámetro de la población, en la medida que el tamaño
de la muestra crece.
2.- Ausencia de sesgo: Se dice que un estimador es insesgado si la media de
la distribución de medias de las muestras, es igual al valor del parámetro

192
estimado. La media X es un estimado insesgado de µ.
3.- Eficiencia: Se refiere a la precisión con la cual tales medidas pueden es­
timar un parámetro. Es más eficiente aquel estimador que tenga menor
error típico.
Estimación es un proceso mediante el cual, en una muestra se obtiene un
determinado valor, denominada estadístico, para luego, en función de él,
calcular (estimar) su valor en la población correspondiente. Este valor po­
blacional recibe el nombre de parámetro.
La estimación puede efectuarse por puntos o por intervalo.
Estimación por puntos
La estimación por puntos plantea un solo valor numérico como paráme­
tro del universo, estimado a partir de una muestra. Es probable que al consi­
derar un solo punto como estimador de un parámetro se cometa un error, ya
que, la muestra no es más que una pequeña parte de un conjunto mucho más
grande, por lo tanto, es aventurado afirmar que el valor correspondiente a la
población sea el mismo valor calculado para la muestra. Pero si el número
de observaciones es suficientemente grande, se obtendrá una medida muy
similar a la del parámetro. Sin embargo, a menudo hay limitaciones en
cuanto a recursos y tiempo, por lo cual es necesario decidir sólo sobre la
base de algunas observaciones, y determinar cuanta probabilidad existe de
que el valor estimado en la muestra coincida con el valor del parámetro. En
este caso, no se estará utilizando el método de estimación puntual sino de
intervalo.
Estimación de intervalo:
Consiste en estimar dos valores numéricos extremos, los cuales confor­
man un intervalo, entre cuyos límites se considera está incluido el paráme­
tro, según el nivel de confianza o de acierto, previamente establecido.
Una estimación de intervalo de un parámetro, es un segmento en el con­
tinuo de la escala de números, donde en algún punto del cual se supone se
halla el valor del parámetro considerado. Es decir, en lugar de tener un solo
punto como estimación de un parámetro, se tiene ahora todo un conjunto de
puntos adyacentes, esto es, un intervalo entre cuyos puntos, probablemente
alguno coincida con el valor del parámetro, con nivel de probabilidades de
acierto conocido. Fijando de esta manera lo que se denomina intervalo de

193
confianza; el cual se obtiene mediante la fórmula general:
Estimador ± (valor crítico x Error estándar)
Antes de continuar, es necesario recordar que el valor crítico o desvia­
ción sigma, tal como se vio en la unidad anterior, es un valor que indica la
distancia (en sigmas) que existe desde la ordenada principal hasta cualquier
otra ordenada paralela, en una curva normal. Dichos valores se encuentran
en las tablas de áreas de la curva normal, y permiten conocer la probabilidad
de que un evento ocurra por azar.

ESTIMACIÓN DE LA MEDIA DEL UNIVERSO


Para estimar este parámetro se requiere conocer la media aritmética de la
muestra, así como su desviación estándar y ftjar el nivel de confianza, el
cual indica la probabilidad de que el valor del parámetro se encuentre den­
tro de los límites del intervalo establecido. La expresión matemática queda
de la siguiente manera:
s s
X - Z- < µ < X + Z Fn
- -
Fn
o de manera más sencilla:
X ± (Z . Es) = intervalo de confianza,
s
Siendo Es = -
Fn
De donde:
X = media aritmética de la muestra
Z = Valor crítico o valor sigma. Se busca en la tabla de áreas de la
curva normal, según el nivel de confianza establecido.
Es = Error estándar.
s = desviación estándar de la muestra
n = tamaño de la muestra
Ejemplo:
7.1) En una investigación acerca del estado nutricional de los escolares de
primero a tercer grado, se encontró que los niveles de hemoglobina en
ayunas, se distribuyen en forma normal, con una media aritmética de

194
12,38 gr %, y una desviación estándar de 0,8 7 gr %. Se desea conocer,
con 95% de corifianza, el valor promedio de hemoglobina para esa po­
blación de escolares, de donde se extrajo la muestra aleatoria de 144 ni­
ños.
DATOS:
X = 12,3 8 gr %
s = 0, 8 7 gr %
n = 144 niños
nivel de confianza = 95 % (a =0,05), el cual equivale a 1,96 sigma (cr).

Aplicando la fórmula X ± ( Z · Fn ) = Intervalo de confianza

0•8 7 gr%
= 12,.3 8 gr% ± (1,96 · )
M4
= 12,.3 8 gr% ± (1,96 · 0,07 )
12,52 gr% (como límite superior)
= 12,.3 8 gr% ± 0,14 {
12,24 gr% (como límite inferior)

Conclusión: En esa población de escolares, la media aritmética de hemo­


globina no debe ser menor de 12,24 gr%, ni mayor de 12,52 gr%. Se hace tal
afirmación con 95 % de probabilidades de estar en lo cierto, (nivel de con­
fianza) o con un 5% de riesgo de no acertar o de equivocación (Nivel de sig­
nificación).

ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL


Con frecuencia se necesita estimar la proporción de sujetos que en una
población poseen determinadas características. Por ejemplo, a un planifica­
dor le interesaría conocer la proporción o porcentaje de niños menores de
un año, o menores de 5 años, o el porcentaje de mujeres en edad reproducti­
va, de esa población. Un nutricionista necesitaría conocer el porcentaje de
niños desnutridos en la población en la cual trabaja, etc. En tales casos, se
estiman esos porcentajes del universo a partir de muestras aleatorias, tal
como se procedió en el caso anterior, para estimar la media del universo.

195
Para estimar una proporción o porcentaje poblacional, se extrae del uni­
verso de interés, una muestra aleatoria, en la cual se calcula el porcentaje de
sujetos con la característica en estudio, y luego se aplica la fórmula general
para estimar intervalo de confianza:
Estimador ± (valor crítico x Error estándar)
En el caso específico para estimar una proporción o porcentaje, pobla­
cional, la fórmula expresa:

--
-
- - < P < p + Z · {p-q
p - Z · {p-q -
� -;; � -;;
n
o de manera más sencilla:
p ± (Z. Es) = Intervalo de confianza
p q
Siendo Es = � �

De donde:
Es = Error estándar
p = porcentaje de sujetos con la característica en estudio.
q = ( 1 00 - p) porcentaje de sujetos SIN la característica en estu­
dio.
n = tamaño de la muestra. •
Z = valor crítico o valor sigma (cr), según el nivel de confianza.
Ejemplo:
7.2) Del mismo trabajo de donde se extrajeron los datos del ejemplo 7. 1, el
investigador encontró que en esa muestra de 144 niños, el 7 %de ellos
presentaba algún grado de desnutrición. Se desea conocer, con 99 % de
confianza, cuál es el porcentaje de niños desnutridos en esa población
de escolares.
DATOS
n = 144 niños
p=7%
q = ( 1 00 - p)= 93 %
nivel de confianza = 99 %, el cual equivale a 2,58 sigmas (cr)

196
7% ± (2,58 · t;� 3
) � Intervalo de confianza

7% ± ( 2.ss - �) �

7% ± (2,.58 X 2) 3) =
1 2,.50% (como límite superior)
7% ± 5,.5 0 = {
1,50% (como límite inferior)

Conclusión: En esa población de escolares, el porcentaje de niños desnu­


tridos, no debe ser menor de 1,50 % ni mayor de 1 2,50 %. Tal afirmación se
hace con un 99 % de confianza de estar en lo cierto, o con 1 % de riesgo de
equivocación.
7.3.- Ejemplo para resolver:

Cuadro N º 1
Distribución de Medias aritméticas y error estándar, de las variables:
Peso, Frecuencia cardíaca y Porcentaje de antecedentes
En una clínica En el hogar
Variables
(n = 50) (n = 3 5)
Peso 70,6 Kgs ±.1,5 Kgs 81,3 Kgr ± 1,9 Kgs
Frecuencia cardíaca
72,3 l/m ± 1 .6 l/m 82,9 l/m ± l .9 1/m
(latidos p/minuto)
Antecedentes familia-
34.8 % ± 4.1 % 41,7 % ± 6.8 %
res positivos

Para cada una de las variables presentadas en el cuadro, estime los res­
pectivos parámetros de tales variables en la población. Utilice niveles de
confianza de 95 % y 99 %.

PRUEBA DE HIPÓTESIS O CONTRASTE DE HIPÓTESIS


Otro aspecto de la inferencia estadística es la prueba de hipótesis o Doci­
masia de hipótesis, la cual se basa en los conceptos de probabilidad y distri-

1 97
bución muestral y hace posible la toma de decisiones acerca de una pobla­
ción, según la información obtenida en una muestra.
Por lo general, en el campo de la salud, el investigador busca conocer si
un determinado factor (variable) es o no la causa de un efecto. Podría pen­
sarse que con sólo observar y comparar la frecuencia de aparición de tal
efecto, en un grupo expuesto a riesgo y en otro no expuesto, sería más que
suficiente. Sin embargo, el rigor científico exige la comprobación de que
las diferencias observadas entre los dos grupos no se deben al azar, dado
que las muestras utilizadas están conformadas por sujetos con tales caracte­
rísticas. Es necesario demostrar que esas diferencias son estadísticamente
significativas, con lo cual podría atribuírsele la diferencia al factor en estu­
dio, y no al azar. Normalmente las hipótesis tratan de explicar esas diferen­
cias.
Una hipótesis se define como una afirmación que está sujeta a verifica­
ción o comprobación; o una conjetura sobre la posible relación entre va­
riables (Kerlinger. 1 985: 1 8); o como la define McGuigan (1977: 53) una
afirmación comprobable de una relación potencial entre dos o más varia­
bles. Para Van Dalen y Meyer ( 1 98 1 ), una hipótesis es una explicación po­
sible o provisional que tiene en cuenta los factores, sucesos o condiciones
que el investigador procura comprender.
Todas estas definiciones presentan a las hipótesis como una afirmación o
suposición y no un hecho establecido. Tales suposiciones o posibles rela­
ciones entre las variables se denominan hipótesis de trabajo o hipótesis de
investigación; las cuales pueden ser descriptivas, correlacionales, de dife­
rencias entre grupos, de causalidad. Se simbolizan como Hi.
Dado que las hipótesis de investigación no pueden ser sometidas a prue­
bas estadísticas, el investigador se vale de las hipótesis nulas para la com­
probación empírica de las primeras.
La Hipótesis nula niega la relación entre las variables dependiente y la
independiente, por lo cual, se considera el reverso de las hipótesis de inves­
tigación. Una hipótesis nula es simplemente un planteamiento de "ninguna
diferencia". Se simboliza como Ho.

1 98
PROCEDIMIENTO METODOLÓGICO PARA LA PRUEBA DE
HIPÓTESIS
En la comprobación o prueba de hipótesis se siguen los siguientes pasos
metodológicos:
1 .- Planteamiento de las hipótesis: Hi y Ho.
2.- Fijación del nivel de significación o del nivel de confianza.
3.- Selección del Estadístico a Prueba.
4.- Regla de decisión para rechazar Ho.
5.- Cálculos del estadístico a prueba.
6.- Decisión Estadística.
7.- Conclusiones.

PLANTEAMIENTO DE LAS HIPÓTESIS


La hipótesis de investigación e hipótesis nula suelen expresarse median­
te símbolos estadísticos. En tal caso se les denomina hipótesis estadísticas.
Según la intención de la investigación pueden plantearse de diferentes ma­
neras:
A) Hi: µ = un valor dado o Hi: µ 1 -::/:. µ2 o Hi: P l -::/:. P2
Ho: µ * un valor dado o Ho: µ 1 = µ2 o Ho: PI = P2
En este caso, el interés es determinar si existe o no diferencia significati­
va entre ambos parámetros. La hipótesis no plantea dirección de la diferen­
cia. Por lo tanto, la prueba es bilateral:

A.
Cuando se establecen hipótesis donde uno de los valores es menor, me­
nos eficaz, o inferior que otro; o el caso contrario, uno de los valores es ma­
yor, más eficaz, o superior; las pruebas son unilaterales, y por lo tanto las
hipótesis se plantean de la siguiente manera:

1 99
B) Hi: µ < a un valor, o Hi: P l < P2, o Hi: µ 1 < µ 2.
C) Hi: µ > a un valor, o Hi: P l > P2, o Hi: µ 1 > µ2.
Ho: µ = a un valor, o Ho: P l = P2, o Hi: µ 1 = µ2.
En estos casos las pruebas son unilaterales o de una sola cola.

B . (Cola de la izquierda) C. (Cola de la derecha)

Puede notarse que los símbolos empleados en el planteamiento de las hi­


pótesis estadísticas son símbolos paramétricos, lo cual se debe al interés del
investigador de llegar a conclusiones sobre las poblaciones y no sobre las
muestras. Por ejemplo, en el estudio donde se utilizó una muestra para pro­
bar la efectividad de la vacuna de Salk contra la poliomielitis, no se buscaba
conocer si la vacuna protegía o no a los niños de la muestra, sino si protegía
a todos los niños de la población. Es ésta la esencia de la inferencia estadís­
tica, llegar a conclusiones válidas para la población.

NIVEL DE SIGNIFICACIÓN
El nivel de significación o de significancia es la probabilidad de equivo­
carse (riesgo de equivocación) que tiene el investigador al tomar la decisión
de rechazar o no una hipótesis nula.
Dado el carácter aleatorio de las observaciones muestrales, es posible
que el estadístico pueda desviarse tanto de lo esperado, que se decida des­
cartar la hipótesis de nulidad (aun siendo cierta). Es deseable que sea pe­
queña esa probabilidad de descartar una hipótesis nula que es cierta. De allí
que los investigadores utilicen con mayor frecuencia los niveles de signifi­
cación de 0,05 ó 0,0 1 .
En el nivel de significación d e 0,05 el investigador tiene un 5 % de riesgo
de equivocación, mientras que cuenta con un 95 % de seguridad (nivel de
confianza) de llegar a una conclusión correcta. De igual manera, el nivel de
significancia de 0,01 implica un 99 % de probabilidad de estar tomando una
conclusión correcta y sólo un 1 % de riesgo de error, al formular esa conclu-

200
sión. Aún cuando el uso de estos niveles son arbitrarios (0,01 y 0,05), puede
decirse que están basados en la experiencia y en el razonamiento lógico de
investigador.
A la magnitud de la probabilidad del riesgo de equivocación se le deno­
mina nivel de significancia o de significación.
El complemento al nivel de significación es el nivel de confianza, por lo
cual, según esta óptica, el área de la curva normal queda dividida en dos
partes: una zona de NO rechazo de la Ho, y una (o dos) zona de rechazo de
Ho.
La ubicación de la zona de rechazo, depende de lo expresado en la hipó­
tesis de trabajo (Hi). Si ésta no indica la dirección de la diferencia, la zona
de rechazo estará ubicada en ambos extremos de la curva (prueba bilateral o
de dos colas).

zona
No rechazo
zona de réé o de Ho Ho zona de hazo de Ho

o
a = 0,05/2 = 0,025

Si la hipótesis de trabajo plantea la dirección de la diferencia (menor que


o mayor que), la zona de rechazo estará en un solo extremo de la curva (a la
izquierda o a la derecha según el caso), y la prueba será unilateral o de una
sola cola.

zona de zona de
aceptación aceptación
de Ho de Ho

a = 0,05
El término significancia se refiere a que la diferencia entre el valor hipo­
tético y el resultado muestra! se considera importante, es decir, demasiado
grande para atribuírsele al azar (es decir, al simple hecho de que por azar se
haya utilizado esa muestra y no otra, con valores diferentes).

20 1
SELECCIÓN DEL ESTADÍSTICO A PRUEBA
Un estadístico a prueba es un valor numérico que se calcula a partir de
los datos de una muestra y es utilizado para tomar la decisión de rechazar o
no una hipótesis nula.
Los estadísticos de prueba utilizados dependen del tamaño de la muestra
y de si se conoce o no la varianza de la población.
Si los datos provienen de una población distribuida normalmente con va­
rianza conocida, se utiliza como estadístico la prueba Z.
X -µ
Z = -­
Es
Cuando el muestreo se hace de una población normalmente distribuida y
se desconoce su varianza, el estadístico de prueba a utilizar para compro­
bar la media poblacional es t.
X -µ
t=
Es
Cuando n es grande, la distribución t se aproxima a la distribución nor­
mal y se puede utilizar como estadístico de prueba Z, aún cuando se desco­
nozca la varianza de la población.

REGLA DE DECISIÓN
Para establecer la regla de decisión es necesario conocer el valor crítico
o valor en unidades sigmas donde se levanta la ordenada que limita las zo­
nas de rechazo y aceptación, dependiendo del nivel de significación, en las
curvas de probabilidades.
Reglas de Decisión, refiriéndose a la distribución normal:
- Se rechaza Ho si, -Zc > Z > +Zc, (para pruebas bilaterales).
- Se rechaza Ho si, -Zc > Z (para prueba unilateral de cola iz-
quierda).
- Se rechaza Ho si, Z > +Zc (para prueba unilateral de cola dere­
cha).
Los valores críticos (Z) se hallan en las tablas de áreas de la curva nor­
mal. Zc es el valor de Z calculado mediante la fórmula planteada en el punto

202
anterior.
Comparar los resultados obtenidos en la prueba estadística y la regla de
decisión permite rechazar o no la hipótesis nula. Al tomar tal decisión se
plantean cuatro posibilidades:
a) Rechazar una hipótesis que esfalsa (decisión correcta)
b) Aceptar una hipótesis que es cierta (decisión correcta)
c) Rechazar una hipótesis que es cierta (error tipo I)
d) Aceptar una hipótesis que esfalsa (error tipo 11)
El siguiente cuadro resume las situaciones anteriores:
Ho es: Acepta Rechaza
Cierta: No hay error Error tipo I (a)
Falsa: Error tipo II (B) No hay error

Por lo tanto, al rechazar o no una hipótesis nula, se corre el riesgo de co­


meter alguno de los dos errores: a o B. Es prudente que en una situación de­
terminada se trate de minimizar la probabilidad de cometer el error más se­
rio. En muchas áreas de investigación resulta difícil evaluar la seriedad de
cada uno de ellos; por lo cual se selecciona un valor pequeño para a (a =
0.00 1 ; 0,0 1 ; 0,05 ó 0, 1 0).
La elección de oc refleja la opinión del investigador sobre la seriedad de
cometer el error tipo l. Mientras más serias se consideren las consecuencias
de éste, menor será el valor de a. Es evidente que tan sólo la experiencia y
un sólido conocimiento teórico del tema investigado, orienta al científico
en la selección del nivel de significación.

CÁLCULOS Y CONCLUSIONES
Utilizando las fórmulas del error estándar (fórmulas 1; 2 ó 3, según sea el
caso) y del estadístico de prueba, se determina si el error de muestreo es tan
grande como para concluir que "las diferencias NO son estadísticamente
significativas", por lo cual se NO se rechaza la hipótesis nula. O ese error
es tan pequeño, que NO afecta los resultados, y se puede concluir que "las
diferencias son estadísticamente significativas ", por tanto, se "rechaza la
hipótesis nula ", y se tienen elementos para considerar como válida la hipó-

203
tesis de trabajo.
Resumiendo, en el proceso de comprobación de hipótesis se siguen los
siguientes pasos:
1 - Formulación de hipótesis
2- Establecer el nivel de significación
3- Selección del estadístico a prueba
4- Establecer la regla de decisión
5- Realizar los cálculos necesarios
6- Decisión estadística. Interpretación.
7- Conclusiones.

En la práctica, las pruebas de hipótesis se utilizan en las siguientes si­


tuaciones:

I) DIFERENCIA ENTRE UN PARÁMETRO Y UN ESTADÍS­


TICO: Cuando de una población se toma una muestra, es de esperar que
ésta sea representativa de la población, por lo tanto, al medir en ella una va­
riable, ese valor (estadístico) debe ser similar al valor considerado como
normal en esa población (parámetro); o en todo caso, estar dentro de los lí­
mites de confianza estimados para el parámetro. De no ser así, cabe la posi­
bilidad que esa muestra posea algún elemento o factor particular, al cual
pueda atribuírsele el valor atípico del estadístico calculado.
Cualquier estadístico puede ser sometido a una prueba de hipótesis, sin
embargo, en este capítulo sólo se tratará la comparación de medias y de pro­
porciones o porcentajes:
1-1) Contraste de hipótesis de una media poblacionaL
1-2) Contraste de hipótesis de una proporción poblacional.

11) DIFERENCIA ENTRE DOS ESTADÍSTICOS de muestras in­


dependientes: Muchas investigaciones realizadas en el campo de la salud,
en especial aquellas donde se busca conocer la eficiencias de un tratamiento
sobre otro, requiere de la conformación de dos grupos, los cuales deben ser
totalmente similares en todas las variables independientes. Al grupo al cual
se le administra la variable en estudio se le denomina "Grupo experimen-

204
tal" , y el otro, donde está ausente dicha variable, se considera Grupo con­
trol.
En este caso, se trata de conocer los valores representativos (estadísti­
cos) obtenidos en ambos grupos, y al compararlos determinar si existe dife­
rencia significativa entre los dos estadísticos.
Si la diferencia resulta significativa, ella puede ser consecuencia de la
variable en estudio, en cuyo caso se rechaza la hipótesis nula. Pero, si la di­
ferencia no es significativa, se le atribuye al proceso de azar, al cual fueron
sometidos los sujetos al momento de elegirlos para formar las muestras.
Con este propósito se aplican pruebas de hipótesis para comparar las me­
dias de dos muestras, y las proporciones o porcentaj es de dos muestras in­
dependientes.
11-1) Contraste de hipótesis de los promedios de dos muestras indepen­
dientes.
11-2) Contraste de hipótesis de las proporciones de dos muestras inde­
pendientes.
Todos estos planteamientos pueden comprenderse mejor al resolver el
siguiente ejercicio, donde se someten a prueba cada una de las cuatro moda­
lidades de contraste mencionadas.
Ejemplos:
7.4) En un estudio realizado en el "Hospital Universitario Angel Larra/­
de ", para conocer las medidas antrométricas de los recién nacidos, du­
rante los últimos años, se encontraron los siguientes datos:
PESO (kgs) ESTATURA (cms)
VARONES: 256
n=
X= 4,300 Kgs. 55 cms
s= 0,550 Kgs. 2,5 cms
µ= 3,500 Kgs. 5 1 cms
HEMBRAS: n = 225
X= 3,900 Kgs. 53 cms
s= 0,500 Kgs. 2,2 cms
µ= 3,000 Kgs. 50 cms

205
De acuerdo con estos datos, se quiere probar que:
a) Las niñas nacidas en ese centro tienen una estatura significativamente
superior a 50 cms, considerados como normal para esa población. Ni­
vel de confianza: 99 %.
b) La diferencia en el peso promedio de los varones es estadísticamente
significativa con respecto a su promedio normal. Nivel de significa­
ción: 0,0 1 .
c) En ese centro hospitalario, el porcentaje de nacimientos de hembras es
menor al porcentaje esperado (50%). Nivel de confianza: 95 %.
d)La estatura promedio de los varones es significativamente superior a la
de las hembras, nacidas en ese centro. Nivel de significación: 1 O %
e) Estadísticamente es significativa la diferencia entre el porcentaje de
nacimiento de varones con respecto al porcentaje de nacimiento de
hembras, en ese centro.

1.1- PRUEBA DE HIPÓTESIS DE UNA MEDIA POBLACIONAL.


En este caso se compara la media aritmética de la población con la media
aritmética obtenida en una muestra. El planteamiento "a" del problema 7.4
corresponde a este tipo de prueba de hipótesis.
a) Las niñas nacidas en ese centro tienen una estatura significativamen-
te superior a 50 cms, considerados como normal para esa población.
DATOS:
X = 53 cms.
S = 2,2 cms.
µ = 50 cms.
N = 225 niñas
Nivel de confianza = 99 %.
1 - Hipótesis a prueba:
Hi: µ > 50 cms.
Ho: µ < 50 cms.
2- Nivel de significación: a = 0,0 1 .
La prueba es unilateral, dado que el interés del investigador es conocer si
la diferencia observada entre las dos medias es significativamente mayor.

206
Por lo tanto, la zona de rechazo se ubica en la cola derecha de la curva; en un
área de 0,0 1 . Para saber a que valor crítico corresponde esta zona, se recurre
a la tabla de áreas de la curva normal. Como esta tabla sólo presenta la mi­
tad de la curva (0,5000), se resta de ella el área crítica:
0,5000 - 0,0 1 = 0,4900
En el cuerpo de la tabla se busca el 0,4900 (o el más próximo a él) para
saber a cuantas desviaciones sigmas (cr) corresponde, y con ello fijar poste­
riormente la regla de decisión.
3- Estadístico a prueba: Z.
(Aun cuando se desconoce la varianza de la población, puede utilizarse
"Z", dado que la muestra es grande).
X -µ
Z = --
s/--Jn
4- Regla de decisión:
Se rechaza Ho si Z calculada es mayor a 2,33. (Zc < 2,33).
5- Cálculos del estadístico a prueba:
X - µ 53 - 50 3 3
s/--In 2;2./ Jm 2;2./15 0)47
Z= = = -- = __ = 20 4 1
'

zona de
No rechazo
de Ho

o 2,33
6- Decisión: Dado que la Z calculada (20,4 1 ) es mayor a 2,33, se rechaza
la hipótesis nula. La diferencia encontrada no podría ser explicada por el
azar. Tal diferencia es estadísticamente significativa. Por lo cual se tienen
suficientes evidencias para considerar la posibilidad de que sea cierta la hi­
pótesis de trabajo, con más de 99 % de confianza.
7-Conclusión:

207
Las niñas nacidas en los últimos años en el Hospital Universitario "An­
gel Larra/de ", tienen una estatura promedio superior a lo considerado
como normal para esa población.

El planteamiento "b" del problema 7.4 también compara la media arit­


mética de una muestra con la media de la población.
b) La diferencia en el peso promedio de los varones es estadísticamente
significativa con respecto a su promedio normal.
DATOS
X= 4,300 Kgs
s= 0,550 Kgs.
n= 256 niños
µ= 3,500 Kgs.
Nivel de confianza = 99 %
1- Hipótesis:
Hi: µ * µ
Ho: µ = µ
2- Nivel de significación: a = 0.01
El planteamiento de la hipótesis de esta investigación no indica direc­
ción en la diferencia; sólo se habla de una diferencia significativa, por lo
tanto, se trata de una prueba bilateral, en cuyo caso, la región crítica o la
zona de rechazo de la hipótesis nula, ocupa los dos extremos de la curva.
En este caso el área de significación (región de rechazo de la hipótesis
nula) se divide entre dos:
0,01: 2 = 0,005
Indicando este valor que en ambas colas de la curva, la zona de rechazo
de Ho corresponde a 0,005. Para saber a que valor crítico corresponde esta
zona, se recurre a la tabla de áreas de la curva normal. Pero como esta tabla
sólo presenta la mitad de la curva (0,5000), se resta de ella el área crítica:
0,5000 - 0,005 = 0,4950
En el cuerpo de la tabla se busca el 0,4950 (o el más próximo a él) para
saber a cuantas desviaciones sigmas (cr) corresponde, y con ello fijar la re­
gla de decisión.

208
3- Estadístico a prueba: Z
4 - Regla de decisión:
Se rechaza Ho si Z calculada es menor a -2,575, o mayor a 2,575.
(-2,575 < Zc < 2,575).
5- Cálculos del estadístico a prueba:
z= X - µ = 4,.3 00 - 3,.5 00 = 0,800 =
23,25
0 ,.5 50/-fis6 0 ,.55 0/16 0,0344

zona de
No rechazo
de Ho

-2,575 o 2,575
6- Decisión:
Dado que la Z calculada (23.25) es mayor a 2,575 se rechaza la hipótesis
nula, con más de 99 % de probabilidades de certeza. La diferencia observa­
da no podría ser atribuida al azar; es estadísticamente significativa, por lo
tanto hay evidencias para considerar que lo planteado en la hipótesis de tra­
bajo pueda ser cierto.
7 - Conclusiones:
Es significativa la diferencia observada entre la estatura de los varones
nacidos en el Hospital Universitario Angel Larralde, en los últimos años,
con respecto al promedio considerado como normal para esa población.

1.2.- PRUEBA DE HIPÓTESIS DE UNA PROPORCIÓN DE LA PO­


BLACIÓN
En este caso se compara la Proporción o el porcentaje de la población
con la proporción o el porcentaje obtenido en una muestra. El planteamien­
to "c" del problema 7.4 corresponde a este tipo de prueba de hipótesis.
c) En ese centro hospitalario, el porcentaje de nacimientos de hembras
es menor al porcentaje esperado (50%).

209
DATOS
Total de nacimientos = 481
Nacimiento de niñas = 225 niñas
nacimiento de hembras 255
p= x 1OO = x 1OO = 4 ?%
Total de nacimientos 481
P = 50 % (porcentaje normal del universo)
Q = 50 %
Nivel de confianza = 95 %.
1- Hipótesis a prueba:
Hi: P < 50 %
Ho: P = 50 %
2- Nivel de significancia: a = 0.05
Prueba unilateral de cola izquierda, por lo tanto:
0,5000 - 0,05 = 0,4500
3- Estadístico a prueba: Z
P-p
Z = --
Es
(P Q )
Es = � �

4- Regla de decisión:
Se rechaza Ho si Z calculada es menor de -1,645
(-1,645 < Zc)
5- Cálculos del estadístico a prueba: Z;
Pero antes es conveniente calcular el error estándar.
(P · Q ) = (50% x 50%) = .[1T,Ji
Es = �
n 225
Es = 3,33
z= p - P = 47% - 50% = -3% = -0,90
Es 3,33 3,33

2 10
zona
No rechazo
Ho

-1 ,645 -0,90 0
6- Decisión:
Dado que el valor Z calculado (Z= -0,90) es mayor al valor crítico esta­
blecido (-1,645), no se rechaza la hipótesis nula. Con una confianza de 95
%, se puede afirmar que la diferencia no es estadísticamente significativa.
Esta diferencia pudo ser por azar; podría ser por la muestra utilizada.
7 - Conclusión:
La proporción de niñas nacidas en los últimos diez años en el Hospital
Universitario Angel Larralde, no fue menor a lo normal.

11.1.- PRUEBA DE HIPÓTESIS DE LA DIFERENCIA ENTRE DOS


MEDIAS.
En este caso se compara la media aritmética de una muestra con la media
aritmética de la otra muestra, buscando la diferencia entre dos estadísticos
de muestras independientes. El planteamiento "d" del problema 7.4 corres­
ponde a este tipo de prueba de hipótesis.
d) La estatura promedio de los varones es significativamente superior la
de las hembras, nacidas en ese centro.
DATOS:
X 1 = 55 cms. X2 = 53 cms.
s 1 = 2,5 cms. s2 = 2,2 cms
n 1 = 256 niños n2 = 225 niñas
Nivel de significancia = 10 % (nivel de confianza = 90)
1- Hipótesis a prueba:
Hi: µ 1 > µ2
Ho: µ 1 = µ2
2- Nivel de significancia: a = 0,10

211
La Prueba es unilateral, hacia la cola derecha:
0,5000 - O, 1 O = 0,4000
3- Estadístico a prueba: Z;
4- Regla de decisión:
Se rechaza Ho si Z calculada es mayor de 1 ,28. (Zc > 1 ,28)
5- Cálculos del estadístico a prueba: pero antes conviene calcular el error
estándar de la diferencia.
µ1 - µ2
Es<difl
Z=

si s
F:
Es1 = -- Es2 = -2-
.¡;;;
Esl = -- = 0,1 5625 Es2 = -- = 0,1 4666
2,2
ms
2,5
Í256
Aplicando la fórmula del Error estándar de la diferencia, se tiene:
Es(difl = �(0,1 5625) 2 + (0,14666) 2

Es<difl = .J0,0244 1 4 + 0,02 1 509 = .J0,04592

Es(difl = 0,2 1
5 5 cms - 53 cms 2 cms
Z= = = 9,523
0,21 0,2 1

zona de
aceptación
de Ho

o 1 ,28 9,523

6- Decisión: Dado que el valor de Z calculada es mayor (9,523) al valor crí­


tico ( 1 ,28), se puede afirmar con más de 90 % de confianza, que la dife­
rencia entre las dos medias comparadas, es estadísticamente significati­
va. Se rechaza la Hipótesis nula.

2 12
7- Conclusión:
Se tienen evidencias para pensar que los niños (varones) nacidos en el
H.U.A.L. durante los últimos años, tienen una estatura superior a las ni­
ñas nacidas en ese centro.

11.2.- PRUEBA DE HIPÓTESIS DE LA DIFERENCIA ENTRE DOS


PROPORCIONES
En este caso se compara el porcentaje o la proporción de una muestra
con el porcentaje o la proporción de la otra muestra, buscando la diferencia
entre dos estadísticos de muestras independientes. El planteamiento "e" del
problema 7.4 corresponde a este tipo de prueba de hipótesis.
e) Estadísticamente es significativa la diferencia entre el porcentaje de
nacimiento de varones con respecto al porcentaje de nacimiento de hem­
bras, en ese centro.
DATOS
Total de nacimientos = 481
Nacimiento de varones (n 1 ) = 256 niños
256
p(varones) = - x 1 00 = 53 %
48 1
Nacimiento de hembras (n2) = 225 niñas
225
p(hembras) = - x 100 = 47 %
481
En el universo, la probabilidad de nacimientos de varones es igual a la
probabilidad del nacimiento de hembras (50% para cada sexo).
P = 50 % ; Q = 50 %
Nivel de confianza = 95 %
1- Hipótesis a prueba:
Hi: P l -::;:. P2
Ho: P l = P2
2- Nivel significación: a = 0,05 (prueba bilateral)
0,05: 2 = 0,025 ; 0,5000 - 0,025 = 0,475
3- Estadístico a prueba: Z

2 13
4- Regla de decisión:
Se rechaza Ho si Z calculada es menor a - 1,96 o mayor a 1,96
5 - Cálculos del estadístico a prueba. Pero antes es conveniente obtener el
error estándar diferencial:

(P Q )
Es2 = � ·
n2
En esta fórmula, para calcular el error estándar se utilizan los porcentajes
de la población (parámetros).
(50% X 50%) (50% X 50%)
Es1 _ Es2 =
256 225
Es1 = .J9,7 656 Es2 = .Jl l) l l l
En este caso, no es necesario resolver la raíz cuadrada de estos errores
estándares, dado que la fórmula del error estándar de la diferencia los eleva
al cuadrado nuevamente.

Es<dif) = �(,J9,7 65 6 y + (,JI 1) 111y = .J20,8767

Es(difl = 4,569
53% - 47 % = 6% =
Z= l,3 l
4,569 4,569

zona de
No rechazo
de Ho na de
�!><.i-������-4-������-!-!.l>!:ll!!..!!azo de Ho
-1 ,96 o 1 ,31 1 ,96

6- Decisión:
Como el valor calculado de Z (1,31) es un valor inferior a 1,96 no se re­
chaza la Ho. Se tienen evidencias para creer que la diferencia observada

2 14
entre los porcentajes no es estadísticamente significativa, con 95 % de
confianza.
7- Conclusión:
En el H.U.A.L., en la última década no ha habido diferencia significativa
entre la proporción de nacimiento de varones y de hembras.

El profesor Fayad Camel ( 1 979) señala que para calcular el error están­
dar de la diferencia, algunos textos utilizan los porcentajes de la primera
muestra para obtener su error estándar, y los porcentajes de la segunda
muestra para conocer el error estándar de ésta; y aun cuando puedan dar va­
lores muy cercanos a los obtenidos con la fórmula correcta, no debe caerse
en ese error, dado que en ocasiones, especialmente cuando el tamaño de las
dos muestras es muy diferente, puede darse el caso que lafórmula correcta
señale diferencias estadísticamente significativas, y que laformula comen­
tada, indique falta de significancia en los resultados (p 244).
En la fórmula correcta se utilizan los porcentajes (P, Q) de la población,
y no los obtenidos en las muestras.
Otro ejemplo de diferencia de dos proporciones poblacionales:
7.5.- En un estudio sobre una dermatitis se sometieron a investigación
200 pacientes afectados por este problema. Para efectos del estudio se dis­
tribuyeron aleatoriamente en dos grupos con características similares. El
primer grupo quedó conformado por 1 04 pacientes, quienes recibieron un
nuevo medicamento, logrando en un mes la curación de 82 pacientes. El se­
gundo grupo, de 96 pacientes, fue tratado con un medicamento ya conoci­
do, lográndose en el mismo tiempo la curación de 72 pacientes. Los investi­
gadores se preguntan si estos resultados indican que el nuevo medicamento
es mejor que el tradicional. Desean una confianza de 99 % al realizar sus
conclusiones.
Datos:
Grupos: n curados porcentaje
Experimental 104 82 78,85 %
Control 96 72 75,00 %
Desarrollo en forma metodológica:

2 15
1. -Hipótesis:
Ho: P l = P2
Hi: P l > P2
2. - Nivel de significancia: a = 0,01 (prueba unilateral)
p - P2
3 . - Estadístico a prueba: Z = 1
Es
4. - Regla de decisión: Se rechaza Ho si Z calculada es mayor a 2,3 3 .
5. - Cálculo del estadístico a prueba:
p1 - P2
Z=
�(Es1 ) 2 + (Es2 ) 2

Antes se debe obtener el Error Estándar de la diferencia (Es).

Como se dijo anteriormente, para la aplicación de esta fórmula del error


estándar de la diferencia de porcentajes, es necesario utilizar los porcenta­
jes de la población (P y Q). Cuando éstos no se conocen se estiman median­
te las dos muestras (grupos) extraídas de esa población.
Grupos: n curados
Experimental 104 82
Control 96 72
TOTAL (N) 200 152
152
P= x 100 = 77%
200

Q = 100 - P; Q = 100 - 77; Q = 23%

2 16
= (J1 7 ,0288 y + (J1 8,4479 y = .J35,4767 = 5:)65

z = 78,85% - 75% = 3,85 =


0 645
5:)65 5:)65 '

zona de
No rechazo
de Ho

o 2,33

6.- Decisión: Dado que el valor de Z calculado (0,64) es menor que Z de la


tabla, NO se rechaza la Hipótesis nula.
7.- Conclusión: Estadísticamente no se puede afirmar que el nuevo trata­
miento sometido a prueba sea mejor que el tradicionalmente utilizado
contra la dermatitis.

PRUEBA t PARA MUESTRAS PEQUEÑAS Y PARA MUESTRAS


RELACIONADAS.
Los conceptos desarrollados en los puntos anteriores son aplicables
cuando se dispone de información obtenida en muestras grandes (mayores
de 30 sujetos), dado que los valores de sus desviaciones relativas se distri­
buyen aproximadamente en una curva normal; no sucediendo la misma dis­
tribución en muestras menores de 30 datos. En ellas el cálculo de la desvia­
ción estándar se ve afectado por el reducido número de datos cuantitativos
que intervienen en su obtención. La prueba t toma en cuenta esta limitación.
La distribución de las muestras pequeñas también posee forma simétri­
ca, similar a la curva normal, diferenciándose de ésta en las colas, donde po­
see un área mayor. Sin embargo, en la medida en que aumenta el tamaño de
la muestra, el área de sus extremos se reduce, aproximándose a la curva nor­
mal. Por tal motivo, en un estudio donde se desconozca la varianza de la po­
blación, pero se utilicen muestras grandes, puede emplearse la prueba Z, en
lugar de la prueba t, como correspondería. En cuyo caso, siendo la muestra
grande, la distribución t coincide con la distribución normal.

2 17
Este planteamiento hace entender la existencia de una familia de curvas
de distribuciones t, dado que existe una curva diferente para cada tamaño de
muestra o posibles grados de libertad.
Como modelo matemático la distribución t está calculado en una tabla,
donde se presenta su valor, según los grados de libertad (n-1) y el nivel de
significación. Dicho modelo es producto del trabajo realizado por W.
Gosset, bajo el seudónimo de "Student ". Se calcula con valores correspon­
dientes a variables cuantitivas, mediante la fórmula:
X -µ
t = -­
Es

APLICACIONES PRINCIPALES DE LA DISTRIBUCIÓN t


De manera reiterada se ha mencionado que cuando el tamaño de la
muestra es inferior a 30 sujetos y se desconoce la varianza de la población,
se utiliza la distribución t para la
A.- Estimación de la media poblacional.
B.- Comparación de dos medias aritméticas, en muestras independientes.
C.- Comparación de medias aritméticas de muestras relacionadas.
A.- ESTIMACIÓN DE LA MEDIA POBLACIONAL, en muestras pe­
queñas:
En páginas anteriores se describió el procedimiento para estimar pará­
metros, utilizando muestras grandes. En cuyo caso se destaca la necesidad
de conocer la media aritmética (estadístico) de la muestra y el error están­
dar, para construir el intervalo o límites de confianza, entre los cuales puede
encontrarse el valor del parámetro, según el nivel de confianza utilizado en
el cálculo.
Con muestras pequeñas el procedimiento es similar. La diferencia radica
en que en éstas se sustituye el valor crítico de Z por el valor crítico de t, que­
dando la expresión matemática:
X ± ( t · Es ) = Intervalo de confianza

Ejemplo7.6:

2 18
Un investigador está interesado en obtener una estimación del nivel pro­
medio de nitrógeno excretado en muestras de orina de 24 horas de pacientes
que han recibido yodo radiactivo como terapia. Para ello tomó la informa­
ción de 1 6 pacientes sometidos al tratamiento, y obtuvo una media de 7 ,87
grs por 100 ce, y una desviación estándar de 1, 65 gr. Establezca el intervalo
de confianza para µ, con sólo 5 % de riesgo de equivocación.
Datos:
X = 7,8 7 grs.
s = 1 ,65 grs.
n = 1 6 pacientes.
Nivel de confianza: 9 5 %, el cual equivale a un a = 0,05 .
Dado que la curva es bilateral, se divide alfa entre dos, y se tiene un ries­
go de equivocación de 0,02 5 a ambos lados de la curva. Se busca en la tabla
de distribución t, bajo la columna 0,02 5 (ó 0,975 ) en la fila de 1 5 gl (grados
de libertad = n - 1 ; en este caso, 1 6 - 1 = 1 5 gl), donde se encuentra un valor t
= 2, 1 3 1.
Se aplica la fórmula para calcular el intervalo de confianza:
X ± ( t · Es) = Intervalo de confianza
Antes de sustituir los términos por sus valores, es conveniente calcular el
error estándar.
1,65 1,65
Es = _!__ = = =O 413
,,¡;, Íl6 4 '
Sustituyendo los términos en la formula, se tiene:
7 ,8 7 ± (2,1 3 1 x 0,4 1 3) = Intervalo de confianza
8 75 s
6;)9 grs
7 ,8 7 ± 0,88 { ' gr

Conclusión: El nivel promedio de nitrógeno excretado en orina de 24 ho­


ras, para los pacientes que recibieron este tratamiento no debe ser menor de
6,99 grs ni mayor de 8, 75 grs por 1 00 ce de orina, con 5 % de riesgo de equi­
vocación.

2 19
B.- COMPARACIÓN DE DOS MEDIAS, en muestras pequeñas inde­
pendientes.
En el contraste de hipótesis de muestras pequeñas se sigue la misma me­
todología empleada para muestras grandes, diferenciándose de ésta sola­
mente en el estadístico a prueba utilizado, en cuyo caso se calcula la prueba
t.
Igualmente pueden plantearse pruebas de hipótesis unilaterales o bilate­
rales, dependiendo de si en la hipótesis de investigación se estima o no la di­
rección de la diferencia.
- Prueba de hipótesis de una media poblacional
Ejemplo 7.7:
En un grupo de 1 O personas mayores de 65 años se realizó un estudio con
el propósito de conocer el promedio de una enzima en la población de an­
cianos. En esta muestra se obtuvo un valor promedio de la enzima igual a
22, con una desviación estándar de 6, 71. Con este hallazgo, ¿el investigador
podría concluir que el nivel promedio de esta enzima en los ancianos es di­
ferente de 25, considerado como normal para la población adulta?. Alfa =
0,05 .
1.- Hipótesis a prueba:
Hi: µ i= 25
Ho: µ = 25
2.- Nivel de significación: a = 0,05.
Pero siendo la prueba bilateral, se tiene 0,05: 2 = 0,025.
. X-M
3 .- Estad,1sttco a prueba: t = ---
Es
4.- Regla de decisión: Se rechaza Ho si la t calculada es menor de -2,262 o
mayor de 2,262 (valor buscado en la tabla de distribución t, en la colum­
na 0.025 (ó 0.975) prueba bilateral, con fila 9 gl).
22 - 25
5.- Cálculos de t =
Es

220
6,7 1 6 71
Es = � = = , = 2J 2
� ../10 3 J 6
-3
t = - = -1 41 5
2J 2
6.- Decisión: No se rechaza la Ho, dado que la t calculada (- 1 ,4 1 5) es mayor
a -2,262 (t de la tabla).
7. - Conclusión: El investigador no tiene base estadística para afirmar que el
valor promedio de la enzima en estudio es diferente, significativamente
en esa población de ancianos.
C.- COMPARACIÓN DE D OS MEDIAS, en muestras relacionadas.
Cuando se usan muestras pequeñas, frecuentemente el grupo experi­
mental puede ser su propio control. En estos estudios las muestras no son
independientes, ya que están constituidas por los mismos individuo, lo cual
hace presumir la existencia de cierto grado de dependencia o de correlación
entre las dos medias. Se trata de estudios donde se busca una diferencia en­
tre las mediciones de un fenómeno ANTES Y DESPUÉS de determinado
evento.
Para calcular t en este caso, se determinan las diferencias entre los valo­
res anteriores y posteriores, considerándolas siempre en la misma direc­
ción. Se obtiene así el valor medio de las diferencias, la cual se somete a
prueba para determinar si es significativamente diferente de cero. Este pro­
cedimiento conduce a establecer la desviación estándar de las diferencias y
luego, error estándar.
Ejemplo 7.8:
En un estudio sobre artrosis femoropatelar, se probó una nueva técnica
de intervención a fin de mejorar la movilidad del miembro lesionado. El
propósito de la intervención fue reducir el ángulo Q. Se estudiaron 1 1 ca­
sos, de quienes se obtuvo la siguiente información:

22 1
Grados del ángulo valores de las diferencia
ANTES DESPUÉS entre el Pre y Post operatorio
20 16 4
18 14 4
22 16 6
22 15 7
17 4
24 16 8
13

15 11 4
8 5 3
14 4
20 14 6
10

16 11 5
Media del ángulo antes de la intervención:
- 1 96 =
X = - 1 7 82 grados
11
Media del ángulo después de la intervención:
- 141 =
X = - 1 2'82 grados
11
La Desviación estándar se obtiene a partir de las diferencias encontradas
entre los valores de "Antes y después".
2
(d) (d)
4 16
4 16
6 36
7 49
4 16
8 64
4 16
3 9
4 16
6 36
5 25
r= 299

222
Desviación estándar en datos directos:
(d) 2 = 299 = .J
s=� � 2 9$ = 5,4 7
n-1 1 1 -1
s = 5,47 grados.
Una vez obtenidos los promedios y la desviación estándar, ya se dispone
de la información necesaria para realizar la prueba de hipótesis.
1 . - Hipótesis a prueba:
Hi: µ1 > µ2
Ho: µ 1 = µ2
2. - Nivel de significación: a = 0,05. (prueba unilateral)
. X A - XD
3 . - Estad'1stlco a prueba: t = ----
Es
4. - Regla de decisión: Se rechaza Ho si la t calculada es mayor de 1,8 1 25.
17 ,82 - 12,82
5 .- e a, lculos de t = ---
Es
- -

5,47 = 5,47 =
Es = _!.._ = 165
,f;; .Ju 3,.32 '
5
1 '65
t = - = 3 03

6. - Decisión: Se rechaza la Ho, dado que la t calculada (3,03) es mayor a


1 ,812 5 (t de la tabla). La diferencia encontrada es estadísticamente signi­
ficativa.
7. - Conclusión: Según los resultados obtenidos se puede concluir que la in­
tervención resulta efectiva para mejorar la movilidad de los miembros
lesionados.

EJERCICIOS PARA RESOLVER:


1) Se sabe que el suero haptaglobina tiene un valor medio aproximado de
1 00 mg/ 1 00 ml en la población normal, con una desviación estándar de

223
40 mg/ 1 00 ml. En una muestra de 1 2 1 pacientes con cáncer, se encontró
un valor promedio de haptaglobina de 1 55 mg/ 1 00 ml. ¿Este hallazgo
haría pensar que en los pacientes con cáncer hay una concentración ma­
yor de haptaglobina?
2) El valor promedio normal de protombina es aproximadamente de 20
mg/1 00 de plasma. En una muestra de 400 pacientes con deficiencia de
vitamina K, quienes presentaron un valor promedio de protombina de 1 7
mg/1 00 ml; con una varianza de 1 6 mg/100 ml. ¿Estos resultados podrían
sugerir que la carencia de Vitamina K reduce los niveles de protombina
en plasma?
3) Se sabe que el valor normal de hematocrito en lactantes es de 34 % apro­
ximadamente, con una desviación estándar de 3 .08. ¿Cuál es la probabi­
lidad de que al tomar una muestra de 25 lactantes, la media sea igual o
mayor de 3 1 %?
4) En una muestra de 557 adolescentes de 1 4 años se calculó una media de
tensión arterial de 85, 1 0 mm de Hg, y una desviación estándar de 1 1 ,09
mm de Hg. Determine el intervalo de confianza para la media de la po­
blación con una probabilidad de 99 %.
5) Un investigador desea estimar el valor promedio de hemoglobina de los
estudiantes del C.B. "M. V. Romero". Para ellos seleccione a una mues­
tra aleatoria de 64 estudiantes, encontrando una media de 1 4.04 gr/1 00cc
y una desviación estándar de 1 ,8 gr/ l OOcc. Con una confianza de 95 % se
quiere saber cuáles son los límites de confianza para la media de la po­
blación.
6) Se quiere estimar el porcentaje de niños desnutridos que asisten al servi­
cio de pediatría del H.U.A.L. en 1 994, para ellos se tomó una muestra
aleatoria de 48 historias médicas y se encontró que a 9 de se les diagnos­
ticó desnutrición grados l. Con 95 % de confianza, determine el porcen­
taje de niños desnutridos que asisten a ese servicio.
7) En una muestra de 400 personas se encontró que el peso promedio era de
67 Kgs, con una desviación estándar de 2,5 kgs. Calcule los límites entre
los cuales se encuentra al peso verdadero, con un nivel de confianza de
95,46 %.
8) De los ingresos a un hospital en el transcurso de este año se tomó una
muestra de 1 00 historias, encontrándose un porcentaje de curación de 20

224
%. Estime el porcentaje de curación en dicho hospital, con 95,46 % de
confianza.
9) Un grupo de odontólogos ha diseñado una nueva técnica para tratamien­
to de conducto con la cual éste se realiza en un tiempo promedio de 30
minutos, con una desviación estándar de 5 minutos, en una muestra de
1 44 pacientes. ¿Este equipo de odontólogos podría concluir que su nue­
va técnica reduce de manera significativa el tiempo de trabajo, con res­
pecto a la técnica habitualmente empleada en estos caso, la cual requiere
de un promedio de 60 minutos por paciente?
1 O) Un odontólogo evaluó el estado de salud bucal de los ancianos residen­
tes de dos geriátricos de Valencia. Diagnosticó un índice periodontal por
paciente, tal como se presenta en el siguiente cuadro:
Residencia "A" (n = 36 ancianos) Residencia "B" (n = 49 ancianos)
Xa = 1,7 Xb = 2,5
Sb = 0,6 Sb = 1,2
Según estos resultados, ¿se puede afirmar que existe una diferencia sig­
nificativa entre el índice periodontal promedio de los dos grupos geriá­
tricos? Nivel de p = 0,05.
11.- En un internado para señoritas, un grupo de 140 jóvenes participaron
en una investigación para probar dos nuevas vacunas anticaries. De és­
tas, 70 recibieron la vacuna denominada "Cariestal", y a las 70 restantes
se les administró la vacuna "Carident". Un año después, al examinar a
estas internas, 1 7 presentaban caries, de donde 7 habían sido vacunadas
con "Cariestal", y 1O con "Carident".
Dado que al realizar la vacunación ninguno de las jóvenes tenían caries,
y habían mantenido hábitos higiénicos similares, ¿podría concluirse con
99 % de confianza que la vacuna "Cariestal" da mayor protección contra
la caries?
1 2.- En unas jornadas de trabajo de campo sobre salud bucal, en una pobla­
ción costeña se pudo detectar que de 1 80 personas examinadas, el 62%
presentó caries, lo cual hace pensar que en esa comunidad la prevalencia
de caries es inferior al 73% reportado por diversos investigadores, como
el porcentaje frecuentemente diagnosticado en la población. Trabaje con
una p = 0,01 para probar esta hipótesis.

225
1 3.- En una muestra de 64 niños de una escuela pública se encontró un pro­
medio de índice de tártaro simplificado de 0,35 y un error estándar de
0,02. Así mismo, en una muestra de 8 1 niños de un colegio privado, se
encontró un índice de tártaro promedio de 0,3 1 y una desviación están­
dar de 0,05. Estos hallazgos indican que el índice promedio de tártaro es
menor en los niños de las escuelas privadas que en los de las públicas.
Pruebe esta hipótesis con 99% de confianza.
14.- En una investigación realizada en una comunidad sobre niveles de pro­
teínas totales en la sangre, se tomó una muestra de 1 5 individuos, elegi­
dos al azar de esa comunidad, cuyos resultados fueron:
X = 5,64 s = 0,72
¿Cuál será el verdadero promedio de proteínas totales en la sangre para
la población de donde fue extraída esa muestra?
Niveles: 95% y 99% de confianza.
15.-En una investigación realizada en dos grupos de individuos normales,
del mismo sexo, edades similares y condiciones socioeconómicas simi­
lares, se tomaron los datos relativos de la actividad de la colinesterasa en
el suero, obteniéndose los siguientes resultados:
Grupo A Grupo B
2,29 1 ,59
2,67 1 ,09
3,09 2,02
2,65 2,26
2,52 2,60
1 ,75 1,16
2, 12 2,76
1 ,59 2, 14
1 ,94 2,76
1 ,82 2,00
Procediendo en forma metodológica, se desea saber si la diferencia ob­
servada entre los grupos (apreciada por su medida central) tiene signifi­
cación estadística o es razonablemente explicable por el azar.

226
16.- En un estudio realizado sobre niveles de inmunoglobulina se conoció
que en un grupo de 28 niños entre 1 2 y 72 meses de edad, de bajas condi­
ciones socioeconómicas, la inmunoglobulina A tenía los siguientes va­
lores:
X = 1 77 mg/100 ml. y s = 54,26 mg/100 ml.
Se quiere saber si este valor difiere significativamente del valor 108
mg/1 00 ml, considerado como normal para este grupo etario.
Proceda metodológicamente.
17.- Se determina la hemoglobina corpuscular media, calculada en micro­
gramos para dos grupos de lactantes de diez meses de edad.
Los grupos eran comparables respecto a todos los factores conocidos
que podrían conducir a una deficiencia de hierro. En un grupo, los cordo­
nes umbilicales fueron ligados luego que la placenta comenzó a descen­
der a la vagina, y en el otro los cordones umbilicales fueron ligados in­
mediatamente después del nacimiento.
Los resultados en ambos grupos fueron:
Hemoglobina corpuscular media en microgramos en lactantes de diez
meses de edad

Individuos
Lactantes cuyos cordones fueron
Lactantes cuyos cordones fueron
ligados después que la placenta co-
ligados después del nacimiento
1 7, 1 3 1 ,5
menzó a descender a la vagina

2 25,6 20,3
3 3 1,1 26,5
4 1 7,3 23,3
5 1 8, 1 27, 1
6 20,9 21,1
7 22,2 30,5
8 1 5,8 26,3
9 29,8 36,1
10 22,0 30,0
11 23,9 24,0
12 27,8 25,0
13 1 7,3 28,7
14 1 7,9
15 20,0

227
Se pregunta: ¿Hay diferencia significativa entre la hemoglobina corpus­
cular media de ambos grupos?
Niveles: 95% y 99% de confianza
Proceda metodológicamente
1 8.- En un estudio realizado sobre los tiempos de supervivencia en ratas sin
alimentos, se encontró que algunas de ellas morían en 4 días mientras
que otras sobrevivían 26 días o más.
Tratando de descubrir qué condiciones contribuyen a esta variación, se
consideró el efecto de la temperatura ambiente para lo cual se dejó morir
de hambre a 1 4 ratas a una temperatura constante de 30 ºc, mientras que a
otras 7 se dejaron morir de hambre a una temperatura que fluctuaba alre­
dedor de los 20 ºc. Los resultados fueron:
Días de supervivencia a 30 ºc. Días de supervivencia a 20 ºc.
4 4
7 8
10 8
11 10
14 10
16 12
16 12
21 12
23
25
26
26
26
30
Se desea saber si a l bajar la temperatura ambiente, desciende significati­
vamente el tiempo promedio de supervivencia.
Niveles: 95% y 99%
Proceda metodológicamente.
1 9.- A un grupo de mujeres embarazadas (primer trimestre) se les ha deter­
minado la albúmina circulante. En la primera determinación los valores
resultaron patológicos y fueron sometidos a un tratamiento durante un

228
lapso de tiempo. Luego se les practicó un nuevo examen. Estas determi­
naciones se dan a continuación:
Individuo Albúmina Total Circulante (gramos)
Número Antes del tratamiento Después del tratamiento
1 1 89 1 19
2 1 93 1 33
3 1 98 121
4 1 86 1 29
5 1 95 1 36
6 1 99 138
7 1 94 1 43
8 1 87 123
Determinar si la diferencia observada en el grupo es significativa o no.
¿Resultó efectivo el tratamiento aplicado? Proceda metodológicamente.
Niveles: 95% y 99%
20.- En un experimento para comprobar si la ingestión de alimentos tiene
algún efecto sobre la velocidad con que el hígado elimina sulfobromfta­
leina inyectada en la corriente sanguínea, obteniéndose los siguientes re­
sultados:
En ayunas Alimentados
1 6,2 9,5
1 6,7 1 1 ,3
1 6,3 9,5
1 8,5 1 3,5
1 5,9 8,8
1 6, 1 9,3
1 6,5 10,4
1 5,9 1 1,7
1 7,5 10,8
1 6,4 9,8

229
Se desea saber si la diferencia entre los resultados(representada por sus
valores promedios) es significativa.
Niveles: 95% y 99%
Proceda metodológicamente
21.- Se ha realizado una investigación para determinar:
1.- Los efectos de la distensión abdominal por ascitis sobre la capacidad
de ventilación pulmonar.
2.- Los mecanismos por los cuales la distensión abdominal produce dis­
nea.
3.- Establecer sin el alivio producido por la reducción en la distensión
está acompañado por un cambio medible en la función pulmonar; los
pacientes fueron estudiados antes del tratamiento y después de una
acentuada reducción de ascitis durante un régimen de dieta pobre en
sodio y ditpéticos mercuriales por un período de diez días.
Se dan a continuación los datos para un grupo de 7 pacientes con en­
fermedad cardíaca reumática y artericaótica en relación con su máxi­
ma capacidad respiratoria.
Capacidad respiratoria
Pacientes
Antes del tratamiento Después del tratamiento
l 102 1 34
2 89 118
3
-�

32 50
4 82 82
5 36 61
6 56 64
7 79 92

¿Indican estos datos que el cambio en la máxima capacidad respiratoria


que acompaña a la disminución de la ascitis como consecuencia del tra­
tamiento, es significativo?
Niveles: 95% y 99%
Proceda metodológicamente

230
22.- En una investigación realizada en una comunidad sobre niveles de cal­
cio en el suero de individuo adultos normales, se tomaron dos muestras
cuyos resultados fueron los siguientes:
s
12 8,45 mgrs/100 ce 1 ,23 mgrs/100 ce
N
Grupo A
Grupo B 15 10,34 mgrs/100 ce 1 ,75 mgrs/100 ce
Se desea saber al 98% de confianza si la diferencia observada entre los
promedios de ambos grupos es significativa estadísticamente o es expli­
cable por azar.
Proceda metodológicamente
23.- En un preparado alimenticio infantil se especifica que según análisis
garantizado, el contenido mínimo de proteínas es de 42%. Para compro­
bar lo mencionado se tomó una muestra de 1 O preparados, los cuales fue­
ron analizados encontrándose un promedio de proteínas de 40%, y una
desviación estándar de 3,5%. Con estos datos, ¿se puede sostener lo es­
pecificado, para un alfa de 0,05, suponiendo normalidad en la distribu­
ción de la variable contenido proteico?
24.- A 1 0 pacientes que sufren incapacidad física, se les pidió que realiza­
ran determinada tarea, computándose el tiempo empleado para realizar­
la. El tiempo promedio consumido fue de 7 minutos, con una desviación
estándar de 2 minutos. Suponiéndose normalidad, construya los interva­
los de confianza al 90, 95 y 99%, para tiempo promedio verdadero para
que este tipo de pacientes realice esta tarea.
25. - En una muestra de 1 6 individuos normales se encontró un promedio de
proteínas totales en la sangre = 6,2 grs, con una desviación estándar de
0,80 grs. ¿Cuál será el parámetro de esa variable en la población de don­
de se extrajo la muestra? Niveles de confianza: 95%.

23 1
Tabla ll
Percentiles de la distribución t
g.l. f90 f95 f975 f99 [995
3.078 6.3 138 12.706 3 1 .821 63.657
2 1 .886 2.9200 4.3027 6.965 9.9248
3 1 .638 2.3534 3 . 1 825 4.541 5.8409
4 1 .533 2.13 1 8 2.7764 3.747 4.6041
5 1 .476 2.0150 2.5706 3.365 4.0321
6 1 .440 1 .9432 2.4469 3. 143 3.7074
7 1 .415 1.8946 2.3646 2.998 3.4995
8 1 .397 1 .8595 2.3060 2.896 3.3554
9 1 .383 1 .8331 2.2622 2.821 3.2498
10 1 .372 1 . 8 1 25 2.2281 2.764 3.1693
11 1 .363 1 .7959 2.2010 2.71 8 3.1058
12 1 .356 1 .7823 2. 1 788 2.681 3.0545
13 1 .350 1 .7709 2. 1 604 2.650 3.0123
.1 4 1 .345 1 .7613 2. 1448 2.624 2.9768
15 1 .341 1 .7530 2.1315 2.602 2.9467
16 1 .337 1 .7459 2. 1 199 2.583 2.9208
17 1 .333 1 .7396 2. 1 098 2.567 2.8982
18 1 .330 1 .734 1 2. 1 009 2.552 2.8784
19 1 .328 1 .729 1 2.0930 2.539 2.8609
20 1.325 1 .7247 2.0860 2.528 2.8453
21 1 .323 1 .7207 2.0796 2 .5 1 8 2.8314
22 1 .321 1.7171 2.0739 2.508 2.8 1 88
23 1.319 1 . 7 1 39 2.0687 2.500 2.8073
24 1.318 1 .7 1 09 2.0639 2.492 2.7969
25 1.316 1 .708 1 2.0595 2.485 2.7874
26 1.315 1 .7056 2.0555 2.479 2.7787
27 1.314 1 .7033 2.05 1 8 2.473 2.7707
28 1.313 1 .70 1 1 2.0484 2.467 2.7633
29 1.31 1 1 .6991 2.0452 2.462 2.7564
30 1.310 1 .6973 2.0423 2.457 2.7500
35 1 .3062 1 .6896 2.0301 2.438 2.7239
40 1 .303 1 1 .6839 2.02 1 1 2.423 2.7045
45 1 .3007 1 .6794 2.0141 2.412 2.6896
50 1.2987 1 .6759 2.0086 2.403 2.6778
60 1 .2959 1 .6707 2.0003 2.390 2.6603
70 1 .2938 1 .6669 1 .9945 2.38 1 2.6480
80 1 .2922 1 .6641 1 .9901 2.374 2.6388
90 1 .2910 1 .6620 1 .9867 2.368 2.63 16
100 1 .2901 1 .6602 1 .9840 2.364 2.6260
120 1 .2887 1 .6577 1 .9799 2.358 2.6175
140 1.2876 1 .6558 1 .9771 2.353 2.6 1 1 4
160 1 .2869 1 .6545 1 .9749 2.350 2.6070
180 1 .2863 1 .6534 1.9733 2.347 2.6035
200 1 .2858 1 .6525 1 .9719 2.345 2.6006
00 1 .282 1 .645 1 .96 2.326 2.576

232
BIBLIOGRAFÍA
Bancroft, H. (1979). Introducción a la Bioestadística. Buenos Aires: Eude­
ba.
Camel, Fayad. (1979). Estadística Médica y de Salud Pública. Cuarta edi­
ción. Mérida, Venezuela: Talleres gráficos Universitarios.
Cañedo D., L. (1987). Investigación clínica. México, D.F.: Interamericana.
Daniel, W. (1981). Estadística con aplicaciones a las Ciencias Sociales y a
la Educación. Bogotá: Editorial McGraw-Hill.
Haber, A. y Runyon R. (1973). Estadística general. México, D.F.: Fondo
Educativo Interamericano.
Hemández Sampieri, R., Femández, C. y Baptista, P. (1991). Metodología
de la Investigación. Bogotá: McGraw-Hill.
Polit, D. y Hungler, B. (1987). Investigación Científica en Ciencias de la
Salud. Tercera edición. México, D.F: Interamericana.
Schefler, W. (1981). Bioestadística. México, D.F.: Fondo Educativo Intra­
mericano.

233
CAPÍTULO VIII
Técnica de Análisis Bivariado
Medidas de asociación. Coeficiente de correlación de Pearson. Coeficiente de de­
terminación, Coeficiente de correlación de Spearman. Chi cuadrado. Su uso en
Prueba de independencia, de bondad de ajuste, de homogeneidad. Pruebas no pa­
ramétricas. Ejercicios. Tabla de chi cuadrado. Bibliografia.

235
MEDIDAS DE ASOCIACIÓN
Cuando se plantean estudios correlacionales es indispensable contar con
pruebas estadísticas apropiadas para conocer si existe relación o indepen­
dencia entre dos variables, que podrían estar asociadas. Tales pruebas están
dentro del renglón de las pruebas paramétricas (Ej. Coeficiente de correla­
ción de Pearson) o de las NO paramétricas (Coeficiente de correlación de
Spearman, Coeficiente de correlación de Kendall, Chi cuadrado, etc.).

COEFICIENTE DE CORRELACIÓN DE PEARSON.


Cuando se busca analizar la relación entre dos variables medidas en es­
calas de intervalo o de razón, es adecuado el uso del coeficiente de Pearson
para conocer tal relación, sin que ello _implica causalidad.
Características de este coeficiente de correlación:
1 .- Se utiliza cuando se dispone de dos series de datos numéricos tomados
de los mismos sujetos u objetos de estudio, o en pares de individuos que
tengan alguna forma de relación.
2.- Los coeficientes de correlación toman valores con un rango comprendi­
do entre -1 y + 1 ; indicando estos extremos una correlación perfecta en­
tre las dos variables. El valor cero indica la ausencia de relación, o la au­
sencia de relación lineal entre las variables.
3.- Un valor alto y de signo positivo del coeficiente, significa que quienes
obtienen valores altos en la variable X, también logran valores altos en la
variable Y; o quienes obtienen valores bajos en una variable, logran tam­
bién valores bajos en la otra variable. A este resultado se la conoce como
correlación directa. A mayor X mayor Y; o a menor X menor Y.
4.- Un valor alto y de signo negativo del coeficiente significa que aquellos
individuos que lograron valores altos en una variable, obtuvieron valo­
res bajos en la otra variable. Es una correlación inversa A mayor X me­
nor Y, o a menor X mayor Y.
A manera de orientación para la interpretación del coeficiente, y sólo
como una referencia, se puede utilizar la siguiente tabla:

237
- 1 ,00 correlación negativa perfecta + 1 ,00 correlación positiva perfecta
- 0,90 correlación negativa muy fuerte + 0,90 correlación positiva muy fuerte
- 0,75 correlación negativa considerable + 0,75 correlación positiva considerable
- 0,50 correlación negativa media + 0,50 correlación positiva media
- 0,10 correlación negativa débil + 0, 10 correlación positiva débil
0,00 no existe correlación entre las variables, o de existir, ésta no es lineal. (Hemández Sampieri,
1 .991 , p 384)

Los programas de análisis estadísticos, mediante computadoras, repor­


tan si el coeficiente es o no significativo, de la manera siguiente:
s = 0.001 significancia - 0.8462 valor del coeficiente.
Si s es menor de 0.05 se entiende que el coeficiente es significativo a un
nivel de 95% de confianza (95 % de probabilidades de que la correlación
sea verdadera y 5 % de probabilidades error).
La interpretación de los resultados, no puede ser absoluta y total. Es más
prudente la interpretación del valor del coeficiente obtenido, en función del
conocimiento teórico sobre el tema en estudio y la trascendencia de las va­
riables que se relacionan.

Cálculo del coeficiente de Pearson (r):


La literatura especializada en esta área ofrece diferentes fórmulas para
obtener este estadístico. En este capítulo se utilizará el método de desvia­
ciones medias para su cálculo, por considerar que es una de las fórmulas
más fácil de emplear.
¿ (X - X) · ( Y - Y)
r = ----;::==============
�( ¿ DmX 2 ) · ( ¿ DmY )
2

En donde:
X = media aritmética de la variable X.
X = cada uno de los valores de la variable X.
Y = media aritmética de la variable Y.
Y = cada uno de los valores de la variable Y.
DmX = Desvíos medios de X = (X- X).

238
DmY = Desvíos medios de Y = (X-Y)
Ejemplo 8. 1 :
Los siguientes datos corresponden a las edades y presión sistólica de 1 O
muJeres.
Edad en años (X) Presión sist. (Y)
42 1 30
46 1 15
42 148
76 158
80 1 56
72 1 58
64 1 55
75 170
55 1 50
48 1 30
Hi: A mayor edad, mayor presión.
Se aplica la fórmula del coeficiente de Pearson para probar la hipótesis
de trabajo.
1 .- Calcular las medias aritméticas de las variables X y Y.
Y = -- = 1 74 anos
- = 600
X - = 60 anos _ - 1 470 _
10 10
2.- Calcular los desvíos medios de la variable X y de la variable Y, teniendo
especial cuidado en los signos de estas operaciones (+ o -). Desvío me­
dio es igual a la diferencia de cada valor menos la media.
(X - X) y ( Y - Y )
3.- Se multiplica cada desvío medio de X por el respectivo desvío medio de
Y. Teniendo especial cuidado con los signos negativos y positivos, pro­
ducto de estas operaciones.
4.- Se suman ALGEBRAICAMENTE los productos de estas multiplicacio­
nes de los desvíos medios. Esta sumatoria representa el numerador en la
fórmula, y el signo de éste determina el signo del resultado final del coe­
ficiente.

239
5.- Luego se elevan al cuadrado cada uno de los desvíos medios de X.
6.- Igualmente se elevan al cuadrado cada uno de los desvíos medios de Y.
7. - Se suman todos los desvíos medios calculados. Tanto los de X como los
de Y.
8.- Se multiplican entre sí los resultados de estas dos sumatorias. Este valor
representa el denominador en la fórmula.
9.- Se extrae la raíz cuadrada del producto de esta multiplicación. Este re­
sultado es el denominador en la fórmula.
10.- Se divide el resultado de la sumatoria algebraica de los desvíos medios
de X por lo de Y (obtenidos en el paso 4) entre el resultado de la raíz cua­
dra, obtenida en el paso 9.
X Dm = (X - X) y Dm = (Y_ - Y) (Dm X . Dm Y) (X - X)2 (Y - Y}2
42 -18 1 30 -17 306 324 289
46 -14 1 15 -32 448 1 96 1 .024
42 -18 1 48 1 -18 324 1
76 16 1 58 11 1 76 256 1 2 1--
80 20 1 56 9 1 80 400 8 1 --
72 12 1 58 11 132 1 44 121
64 4 1 55 8 32 16 64

__?_µ_
55
15
-5
1 70
1 50
23
3
345
-15
225
25
529
9
--
48 -12 130 -17 204 1 44 289
600 1 .470 1 .790 2.054 2.528

¿ (Dm X - DmY) 1.790 1.790


r= = =
�( ¿ Dmx ) - ( ¿ DmY
2 2
) �2.054 X 2528 --.
�5.1=9=
2s=1=
2

1.790 =
r= 0 7855
2278,71
Según este resultado se acepta la hipótesis de trabajo, considerando que
existe una correlación positiva considerable entre la edad y presión sistóli­
ca.
Coeficiente de determinación.- Al elevar al cuadrado el valor del coefi­
ciente de Pearson se puede conocer el porcentaje de la variación de una va-

240
riable debido a la variación de la otra. A este estadístico se le conoce como
Coeficiente de determinación:
En el ejemplo anterior, el coeficiente de correlación es 0.7855, por lo
cual, el coeficiente de determinación es (0,7855)2 = 0,61 7. Significa esto
que la variación de la edad contribuye a explicar casi el 62 % de la variación
de presión.

Coeficiente de correlación por rango de SPEARMAN


Cuando se extrae una muestra al azar de n partes de una población biva­
riada, donde por lo menos una de las mediciones está hecha en escala ordi­
nal, el grado de correlación no puede calcularse mediante la prueba vista
anteriormente. Si una de las variables se mide en escala ordinal, y la otra en
otra escala numérica, ésta última debe convertirse en rango. Para ello se le
asigna el orden 1 a la observación de menor valor, y los demás se van asig­
nando a partir de éste. Si se repiten algunos de los valores, se promedian los
lugares que ocuparían tales valores.
Una vez que ambas variables están expresadas en rango, se obtienen las
diferencias entre los pares de rango para cada sujeto. Luego cada uno de las
diferencias se elevan al cuadrado, y se aplica la siguiente fórmula:
6 · """' D
2
rho = 1 - -=L.
n(n
�_
2

Donde:
6 es constante.
D = Diferencia entre los pares de rango para cada sujeto.
n = número de observaciones o de sujetos observados.

Ejemplo 8.2:
En un estudio donde se busca conocer la relación entre irritabilidad de
las personas y número de cigarrillos consumidos diariamente. La variable
irritabilidad fue medida mediante un test validado para medir esta variable,
en un rango creciente de 1 a 1 O, indicando éste último el mayor grado de
irritabilidad. Los resultados son los siguientes:

24 1
Nº de cigarrillos diarios Nivel de irritabilidad
4 2
6 2
20 8 1

18 5 --�
15 3 --�
40 8
20 6
40 10

Hi: A mayor número de cigarrillos fumados por día, mayor nivel de irri­
tabilidad.
El nivel de irritabilidad es una variable medida en escala ordinal o de
rango, mientras que la variable número de cigarrillos fumados por día está
medida en una escala de razón, por lo tanto, ésta última debe transformarse
en una escala de rango. Por ello se procede a asignarle un orden jerárquico a
los valores de esta última escala.
-
Nº de cigarrillos Transformación Nivel de Diferencia entre Diferencias
---- �-
diarios a Escala de rango irritabilidad dos escalas (D) al cuadrado
4 1 2 -1 1
6 2 2 o ---
o
20 .
5,5 8 - 2,5 6,25--
-
--
18 4 5 ------
-1 1 --

15 3 -
3 o o -�

40 7,5 8 -0 , 5 ·-· - �--_Q,_��


20 5,5 6 - 0,5 0,25
40 7,5 10 - 2,5 6,25 1

1 5,00 !

6 " D2
rho = l - º L.,¿2 = 1 - 6 x l 5 = 1 - 90 = 1 - 0 1 78 5 = 0 82 1 5
n (n - 1) 8 (64 - 1) 504 '

242
Se puede concluir que existe una correlación positiva considerable entre
el número de cigarrillos y los niveles de irritabilidad. Se acepta la hipótesis
de trabajo: a mayor número de cigarrillos fumados por día, mayor irritabili­
dad.

DISTRIBUCIÓN CHI CUADRADO


En el campo de la salud existen variables que se clasifican en categorías,
como es el estado nutricional, sexo, síntomas, antecedentes familiares, gru­
pos sanguíneos, etc., donde tal clasificación, en la mayoría de los casos, es
más cualitativa que cuantitativa. En tal sentido, las comparaciones y las in­
ferencias estadísticas se efectúan sobre la base de las proporciones de las
categorías antes mencionadas, en cuyo caso, la prueba estadística más apro­
piada para tal fin es la denominada distribución chi cuadrado, la cual se ca­
racteriza porque su valor depende de los grados de libertad y el nivel de sig­
nificación. Esta distribución se basa en las llamadas probabilidades condi­
cionales, y constituye en sí misma una familia de distribuciones, pues toma
valores diferentes, según los grados de libertad, por lo tanto, es una variable
aleatoria.
Un investigador en el área de la salud puede estar interesado en conocer
si existe relación entre el consumo de LSD y la aparición de células anor­
males en los individuos de una población, y formula la hipótesis que existe
tal relación. Si ambas variables se miden en escalas nominales, entonces la
prueba de Chi cuadradro permite determinar, con cierta probabilidad, la
existencia o no de dicha asociación.
Antes de entrar en la aplicación de Chi cuadrado, es necesario definir al­
gunos términos de uso muy frecuente en este campo.
Grados de libertad (gl) se refiere a los cambios que deben hacerse, de
manera arbitraria, en los valores de un conjunto de datos, sin que varíe algu­
no o algunos de los estadísticos calculados para esos datos. Ejemplo:
Suponiendo que se tienen los siguientes datos: a = 1 , b = 6, c = 4, d = 5.
La media aritmética de esta serie es igual a 4, es decir: (1 + 6 + 4 + 5) / 4.
Tres de estos valores pueden cambiar arbitrariamente, sin que se modifique
la media ya calculada; por ejemplo: a = 7, b = 2, c = 2, entonces, necesaria­
mente el valor d debe ser 5, para que la media siga siendo 4, es decir, pueden
variar tres valores, pero el otro está predeterminado, indicando esto que se

243
tienen tres grados de libertad. Al haber calculado 1 estadístico en un con­
junto de datos se tienen n - 1 grados de libertad.
Niveles de significación.- De este término ya se ha hablado en los capítu­
los anteriores. Las conclusiones que se establecen en función a un análisis
estadístico, se formulan en términos de probabilidades. Esto implica la pro­
babilidad de equivocarse, de cometer errores. Así como se mide la probabi­
lidad de acertar, también se mide la de equivocarse. En las pruebas de hipó­
tesis existen dos probabilidades de equivocación: una es rechazar la hipóte­
sis nula, cuando es realmente cierta; y la otra es aceptar la hipótesis nula,
cuando es falsa. El primer error se denomina "error tipo I", y la probabili­
dad de cometerlo se conoce como nivel de significación, y se designa con la
letra griega alfa (a). Cuando se dice que a = 0,05, se corre el riesgo de co­
meter un error tipo I en cinco de cada cien oportunidades. El otro error, el
Tipo II se refiere a la probabilidad de aceptar una hipótesis nula siendo fal­
sa, y se designa como beta (f3). El nivel de significación sirve como referen­
cia para rechazar o aceptar una hipótesis.
Condiciones para el uso de Chi cuadrado
Aún cuando es una prueba de fácil cálculo, es conveniente utilizarla con
cautela, porque presenta algunas limitaciones que deben tomarse en cuenta,
en el momento de su uso.
1 .- El tamaño de la muestra debe ser mayor de 20 casos. Si es inferior, se
debe emplear la Prueba de Fisher.
2.- Si !amuestra tiene entre 20 y 40 casos distribuidoss en tablas de 2 x 2,
puede usarse el chi cuadrado si todas las frecuencias esperadas son ma­
yores que 5. Si esta condición no se cumple, se recomienda utilizar en su
lugar la Prueba de Fischer.
3.- Ninguna de las frecuencias esperadas puede ser menor de 1 , y no más del
20 % de ellas, debe ser inferior de 5, en tablas con más de 1 grado de li­
bertad.
4.- No debe utilizarse esta prueba cuando alguna de las casillas está vacía.
Aplicación del Chi cuadrado (X2)
Al igual que las pruebas estadísticas vistas en el capítulo anterior, el X2
se utiliza como prueba de hipótesis, aun cuando ésta debe se formulada de

244
manera diferente según la información que se desea obtener. En este senti­
do, el chi cuadrado puede ser utilizado como prueba de independencia,
como prueba de homogeneidad o de proporciones o como prueba de bon­
dad de ajuste. En cada caso, la hipótesis de trabajo debe evidenciar el uso
dado a la prueba.
PASOS METODOLÓGICOS PARA LA APLICACIÓN DE X2
1.- Planteamiento de las hipótesis: Ha y Hi.
2.- Determinar el nivel de significación (a).
3 .- Establecer la regla de decisión, en función de los grados de libertad
(g. l. ).
4.- Calcular el valor del chi cuadrado.
5.- Decisión de rechazar o no Ha, en función del valor obtenido y lo estable­
cido en la regla del paso número 3.
6.- Conclusión, en función del paso anterior y lo establecido en las hipótesis
planteadas en el paso 1 .

Elementos generales a considerar en cada uno de los pasos anteriores.


El planteamiento de las hipótesis depende específicamente del uso que
se le dé a la prueba.

Cuando se emplea como prueba de independencia, en términos genera­


les, la esencia de las hipótesis serán:
Hi: Las variables están asociadas.
Ha: Las variables son independientes.

Cuando se utiliza como prueba de homogeneidad:


Hi: Las poblaciones no son homogéneas, en cuanto a la variable en estu­
dio.
Ha: Las poblaciones son homogéneas en cuanto a la variable en estudio.

Cuando se aplica como prueba de bondad de ajuste:


Hi: La muestra utilizada no proviene de una distribución teórica deter­
minada.

245
Ho: La muestra utilizada proviene de una distribución teórica determina­
da (normal, binomial o de Poisson).

Como regla de decisión se puede utilizar la expresión de:


Rechazar Ho si X2 calculado es mayor al X2 tabulado, según nivel de sig­
nificación y grados de libertad.
Los grados de libertad (g.l.) se obtienen de manera diferente, según cada
situación. En pruebas de bondad de ajuste a una distribución teórica, para
calcular los grados de libertad se utiliza la expresión:
g. /. = k - 1, donde
k es el número de categorías de la variable o de clase en que
ésta se encuentra dividida.
En cuadros de asociación, empleados para la presentación de los datos
para pruebas de independencia o pruebas de homogeniedad, se utiliza la uti­
liza la expresión:
g.l. = (e - 1) (f- 1), donde
e es el número de columnas de frecuencias observadas del
cuadro, y f es el número de filas del cuadro.
Para calcular el chi cuadrado como estadístico a prueba se emplea la si­
guiente fórmula:

= (fo - fe)
2

fe
x2

donde: fo son las frecuencias absolutas observadas en el cuadro,


fe son las frecuencias teóricas o esperadas, las cuales deben cal­
cularse.
Dado que chi cuadrado se calcula para variables discretas, puede aplicár­
sele el factor de corrección de Y ates, cuando se tienen cuadros de contin­
gencia de 2 x 2, En tal caso, la fórmula se modifica a:

= (l fo - fel ) - 0 ,5 )
2

fe
x2

lfo - fe l es el valor absoluto de la diferencia.

246
Sin embargo, algunos autores consideran que en muestras grandes el uso
de esta corrección no tiene efecto. Y otros, aún más drásticos están en con­
tra de su uso. Wayne Daniel ( 1 977, p. 347) señala:
En general, se ha convenido en que no se necesita corrección al­
guna para tablas de contingencia más grandes. Aunque la correc­
ción de Yates ha sido usada con amplitud en el pasado, investigado­
res recientes, por ejemplo Grizzle, Lancaster, Pearson y Plackett
han cuestionado su uso. El trabajo de Grizzle, en particular, ha re­
forzado el caso contra el uso de la corrección, basándose en que con
demasiada.frecuencia, conduce a una prueba muy conservadora, es
decir el uso de la corrección, con demasiadafrecuencia, conduce al
no rechazo de la hipótesis nula. Como resultado, algunos médicos,
por ejemplo, Remington y Schork, están en contra de su uso. Aparen­
temente ésta es una recomendación que es razonable aceptar ".
Luego de calcular el valor de chi cuadrado, se confronta éste con la regla
de decisión, para determinar si se acepta o se rechaza la Ha.
Chi cuadrado como Prueba de independencia.-
Uno de los usos más frecuentes de este estadístico es como prueba de in­
dependencia. Se aplica cuando se tiene una sola muestra y se desea probar si
dos criterios de clasificación son independientes. La hipótesis nula plantea
que existe independencia entre los dos criterios, es decir, las variables son
independientes en la población de estudio.

Ejemplo 8.3.

Cuadro 8.1
Pacientes que recibieron antibioterapia profiláctica
y el motivo que justificó su empleo.
Maternidad del C.H.E.T. Valencia, Junio - Agosto 1997
Pacientes que recibieron antibioterapia
Causa TOTAL
SI NO
PARTO VAGINAL 23 655 678
ABORTO 39 1 83
CESÁREA 57 1 39
144
82
TOTAL 1 19 1
88 1 1 .000

247
1.- Hipótesis:
Hi: las variables están asociadas.
Ho: las variables son independientes.
2.- Nivel de significación: a = 0,05
3- Regla de decisión: Rechazar Ho si X2 calculado es mayor a 5,991

4- Cálculo de la estadística a prueba: X 2 = (fo - fe )


2

fe
Para aplicar la fórmula anterior, es necesario calcular las frecuencias es­
peradas de cada casilla; las cuales se obtienen multiplicando los sub-totales
de las filas por los sub-totales de las columnas respectivas, y luego dividien­
do este producto entre el gran total. Por ejemplo, para conocer la frecuencia
esperada de la primera casilla, formada por la intersección de la primera co­
lumna por la primera fila, se multiplica el sub-total de la primera columna
por el subtotal de la primera fila y el producto se divide entre el gran total.

En el cuadro Nº 8 .1, para buscar las frecuencias esperadas de la primera


columna, se tiene:
Subtotal de l ra. columna por subtotal l ra. fila entre gran total
119 x 678 = 80.682 : 1.000 = 80,682, luego
subtotal de l ra columna por subtotal 2da fila entre gran total
119 x 183 = 21.777 : 1.000 = 21,777, y así sucesivamente.
119 X 139 = 16.541 : 1.000 = 16,541.

Para la segunda columna será:


f.e.
881 X 678 = 597. 3 18 : 1.000 = 597,318
881 X 183 = 161.223 : 1.000 = 161,223
881 X 139 = 122.459 : 1.000 = 122,459

248
Pacientes que recibieron antibioterapia
Causa SI NO TOTAL
fo (fe) fo i (fe)
PARTO VAGINAL 23 (80,68) 655 (597,32) 678
ABORTO 39 (21 ,78) 144 ( 1 6 1 ,22) 1 83
CESÁREA 57 (1 6,54) 82 (1 22,46) 1 39
TOTAL 1 19 ( 1 1 9 00) 881 (88 1 00) 1.000
Aplicando la fórmula:
( fo - fe) 2 =
X2 =
fe

= (23 - 80,68) + (39 - 21,78) + (57 - 1 6,.54) + (655 - 597,32) +


2 2 2 2

80,68 21,78 1 6,.54 597,32


(144 - 1 6 1,22)2 (82 - 1 22,46) 2
+ + - ---
1 6 1,22 1 22,46
x 2 = 4 1,237 + 1 3,6 1 4 + 98,972 + 5,.5 69 + 1,839 + 1 3,367 = 1 74,.598
Decisión: Dado que el X2 calculado es mayor al X2 tabulado, se rechaza
Ho.
Conclusión: Las variables no son independientes. Hay asociación entre
el tipo de intervención y el uso de la antibioterapia.

Ejemplo 8.4:
En el mes de agosto del presente año, un grupo de 30 niños participantes
en un campamento vacacional, sufrieron una intoxicación alimentaria lue­
go de haber ingerido el almuerzo preparado para esa ocasión. Al efectuar un
estudio epidemiológico de la situación se obtuvo la siguiente información:
Consumieron en- INTOXICADOS
Total
salada con atún SI NO
SI 11 5 16
NO 6 8 14
Total 17 13 30

249
Se sospecha que la ensalada con atún fue el alimento que produjo la into­
xicación.
1 .- Hipótesis:
Hi: Las variables están asociadas:
Ho: Las variables son independientes.
2.- Nivel de significación: a = 0,05
3.- Regla de decisión: Rechazar Ho si X2 calculada es mayor a X2 tabular
(0,05. 1 g.l.) 3,8 1 1
4.- Calcular X2
Se puede utilizar la fórmula con factor de corrección de Y ates.
= (1 /o - /el )
2
2
fe
X

Calculando las frecuencias esperadas (fe):


Para la primera casilla: 1 7 x 1 6 = 272: 30 = 9
La teoría de chi cuadrado establece que la suma de las frecuencias espe­
radas es igual a la suma de las frecuencias observadas.
Partiendo de esta premisa, el subtotal de la primera columna (de frecuen­
cia esperada) debe ser 1 7. Si se resta a este subtotal (17) la frecuencia espe­
rada ya conocida (9) se pueden obtener las otras frecuencias esperadas.
17 -9 =8
16-9 = 7
14-8 =6
INTOXICADOS
Consumieron
SI NO Total
ensalada con atún �--
(fo ) (fe ) (fo) (fe)
SI 11 (9) 5 (7) 16
NO 6 (8) 8 (6) 14
Total 17 ( 1 7) 13 ( 1 3) 30
(11 1 - 91 -0,5) 2 ( 15 - 71-0,5) 2 (16 - 81-0,5) 2 ( 18 - �-0,5) 2
X2 =
9 7 8 6
+ + + -'---'----

250
x 2 = 0,25 + o,32 + 0,2s + 0,375 = 1,225
Decisión.- Dado que el valor del X2 calculado (1 ,227) es menor al X2 ta­
bulado (3,8 1 1 ) no se rechaza Ho.
Conclusión. No hay asociación entre el consumo de ensalada y la intoxi­
cación alimentaria. Son independientes.
Prueba de bondad de ajuste.-
El uso de chi cuadrado como prueba de bondad de ajuste es una prueba
de concordancia entre una distribución empírica y una distribución hipoté­
tica. Resulta apropiada cuando se desea conocer si una distribución de fre­
cuencias observadas se ajusta a un modelo teórico, tales como distribución
binomial, normal o de Poisson.
Ejemplo 8.5:
Prueba de bondad de ajuste a la binomial.- Este tipo de prueba es de uso
frecuente en el área de la genética, de donde tomamos el siguiente ejemplo.
En un laboratorio, del cruce de ratones heterocigotos negros (B) y pardos
(b) han nacido 26 ratones pardos y 1 4 ratones negros. De acuerdo con las le­
yes de la genética, este cruce producirá descendientes de la siguiente mane­
ra:

.•138· negros·

Por lo tanto, de cada 4 ratones que nazcan, es de esperarse una razón de


fenotipo de 3 ratones pardos y 1 negro (3: 1 ), lo cual indica que de los 40 ra­
tones nacidos en el laboratorio, teóricamente deberían nacer 30 ratones par­
dos (3/4 x 40) y 1 O ratones negros ( 1/4 x 40), lo cual representa una diferen­
cia con respecto a lo ocurrido el laboratorio, por lo tanto, ¿podría pensarse
que esa diferencia es significativa? 95 % de confianza.

25 1
Ratones f. observadas f. esperadas
Pardos 26 30
Negros 14 10
Total 40 40

Hipótesis:
Hi: La distribución observada no se ajusta a la distribución binomial.
Ho: La distribución observada se ajusta a la distribución binomial.
Nivel de significación: a = 0,05
Regla de decisión: Rechazar Ho si X2 calculada es mayor a 3,811 (X2 ta­
bulado, 0,05. 1 g.1)
x z = ( fo - fe) (26 - 30) 2 (14 -10) 2 =
+ 0,.533 + 16 = 2) 3 3
2

fe 30 10
Decisión: E1 X2 calculado (2,133) es menor a1 X2 tabulado (3, 8 1 1), por lo
tanto, no se rechaza Ho.
Conclusión: No es significativa la diferencia entre las frecuencias obser­
vadas y las esperadas. La distribución se ajusta a la distribución binomial.
Prueba de homogeneidad.
Así como en las pruebas de independencia se busca conocer si son inde­
pendientes los dos criterios de clasificación de los sujetos de la muestra, en
las pruebas de homogeneidad se desea probar si las muestras extraídas pro­
vienen de poblaciones que son homogéneas con respecto a algún criterio de
clasificación. En este caso, la hipótesis nula plantea que las muestras pro­
vienen de la misma población; por lo tanto, las muestras son homogéneas,
en cuanto a la variable en estudio.
El procedimiento, para esta prueba es similar a los pasos planteados en
las pruebas de independencia.

PRUEBAS NO PARAMÉTRICAS.
En las pruebas paramétricas, es necesario suponer que en la población, la
variable en estudio tiene una distribución normal. Por ser normal, puede es-

252
timarse el error que se comete al realizar deducciones o inferencias sobre la
población, en función de los datos muestrales. Cuando la población no si­
gue una distribución normal, el error puede ser grande y no es posible esti­
marlo. Esta situación plantea la necesidad de contar con pruebas estadísti­
cas, en las cuales no sea necesario partir de una suposición fuerte acerca de
la distribución de la población. A estas pruebas se les denomina Pruebas no
paramétricas.
Las pruebas no paramétricas cumplen con los siguientes requisitos:
1.- No es necesario suponer que en la población, la variable en estudio tiene
una distribución normal, ni ninguna otra suposición fuerte acerca de la
distribución de la población. Por este motivo, a este tipo de prueba tam­
bién se les denomina "pruebas libres de distribución".
2. - Se utilizan con datos correspondientes a escalas nominales (categóricas)
y ordinales u ordenadas por rango.
Entre las pruebas no paramétricas más conocidas están:
- Chi cuadrado.
- Coeficiente de correlación de rango de Spearman.
- Prueba McNemar. Se utiliza para conocer si existe independencia
entre dos variables categóricas provenientes de dos muestras depen­
dientes o conocer si hay cambios significativos entre "ante" y "des­
pués" de un tratamiento. Requisitos para su uso: Variables nominales
y dicotómicas.
- Prueba de signos. Se utiliza para medir la dirección de los cambios,
sin importar las magnitudes, en los experimentos de "antes y des­
pués". Esta prueba no está sujeta a las restricciones de la prueba t de
Student. En ella se calcula la mediana y no la media. Requisito: Escala
de rango dicotomizada.
- Wilcoxon. Puede utilizarse para medir dirección y magnitud de los
cambios, en una variable estudiada en muestras dependientes, bien
sean grandes o pequeñas. Requisitos: Variable medida en escala ordi­
nal.
- Prueba de Mano Whitney. Se utiliza cuando se quiere comparar si
dos muestras independientes provienen de una misma población. Re­
quisitos: Variables en escala ordinal.

253
- Prueba de Kolmogorov-Smirnov. Se utiliza como prueba de bondad
de ajuste. Requisitos: Escala ordinal.
- Prueba de Kruskal-Wallis. Se utiliza para análisis de varianza, con
un solo criterio de clasificación por rangos. Sustituye al análisis de va­
rianza al comparar dos o más grupos independientes, resumidos a par­
tir de la mediana.
Coeficiente de correlación de Kendall. Para escalas ordinales.

EJERCICIOS PARA RESOLVER:


1.- A continuación se presenta la información de l O primigestas, sobre las
variables EDAD de las pacientes y SEMANA DE GESTACIÓN cuando
acudió a la primera consulta prenatal. La información fue tomada de una
investigación sobre "La importancia de la consulta prenatal."
Edad en años Semana de gestación
28 6
20 14
17 18
24 10
25 10
22 15
29 9
20 13
23 12
20 15
La hipótesis de la investigación plantea que las mujeres primigestas de
------ - - ---

mayor edad acuden a su primera consulta prenatal en las primeras sema­


nas de embarazo, con respecto a las primigestas de menor edad.
¿Puede aceptarse esta hipótesis?
2.- En una investigación interesada en medir la velocidad de reacción (me­
diante una prueba válida para ello) en sujetos que en tres horas habían
consumido x cantidad de tragos de un determinado licor, se plantea la hi­
pótesis de que a mayor cantidad de tragos, menor velocidad de reacción.

254
Los datos obtenidos en la investigación se muestran a continuación:
Nº de tragos velocidad de reacción
5 2
7 3
8 7
9 16
10 8
11 11
14 12
15 10
16 12
15 13

¿Permiten estos datos aceptar la hipótesis de la investigación?


3 . - Se planificó un estudio para investigar si existe relación entre peso y pre­
sión sanguínea diastólica de hombres adultos cuyas edades oscilan entre
1 9 y 50 años.
PRESIÓN
PESO EDAD
SANGUÍNEA
63 76 28
56 80 40
78 76 35
56 74 20
60 80 42
55 90 46
59 74 43
65 75 19
83 90 50
75 76 37
Pruebe esa relación entre las variables: peso y presión; y entre edad y
presión.
4.- Los efectos del tabaco sobre el desarrollo del feto fue el propósito de un
estudio realizado en una muestra de 262 mujeres en el C.H.E. T., en el

255
cual se tuvo como hipótesis de trabajo que es más frecuente el nacimien­
to de niños prematuros de mujeres fumadoras que en las no fumadoras.
La investigación arrojó los siguientes resultados:
Nacimiento Mujeres Mujeres
Total
de niños fumadoras No fumadoras
Prematuros 70 61 1 39
No premah!ros __ 54--- - - ·· 69 123
TOTAL 1 32 1 30 262
Según estos datos, ¿se puede aceptar la hipótesis de trabajo, a un nivel de
95 % de confianza?
5.- De una investigación sobre osteoporosis y fracturas espontáneas, se to­
maron los siguientes datos:
Pacientes No Sedentarios Sedentarios Total
Con fracturas 10 19 29
Sin fracturas 16 16 32
TOTAL 26 35 61
Según estos datos ¿es posible asociar el sedentarismo con la aparición de
fracturas espontáneas en pacientes con osteosporosis? Nivel de confian­
za: 95 %.
6.- En un estudio acerca de lo informado que están los hipertensos sobre los
riesgos de salud a los cuales están sometidos al sufrir esta enfermedad, se
logró la siguiente información de un grupo de 228 pacientes con esta ca­
racterística
con
Pacientes sin conocimientos Total
---- --·--- ------
conocimientos
--· - - --
controlados 75 56 131
no controlados 68 29 97
TOTAL 143 85 228
¿Podría pensarse que existe asociación entre el hecho de poseer conoci­
mientos sobre los riesgos de la hipertensión y el control que tienen los
pacientes sobre su situación?
7.- Observe la siguiente información:

256
Cuadro N º 6
Evaluación nutricional de pacientes menores de 1 2 años, distribuidos
según estado nutricional y sexo. Ambulatorio Rural, La Aguadita, Edo.
Cojedes. Marzo, 1 997.
Femenino Masculino
Estado Nutricional Total
f -- -
f
--------------

Sobre la norma 2 3 5
Normal 18 13 31
Desnutrición leve 8 4 12
Desnutrición moderada 5 3 8
Desnutrición �g�ra
_v_e____ 3 4
Total 36 24 60
Fuente: Archivo de Historias Médicas. Ambulatorio Rural II, La Aguadita, Edo. Ca­
rabobo.

Según esta información, ¿podría afirmarse que existe asociación entre el


estado nutricional y el sexo?

257
Esquema de Coeficiente de Correlación según tipo de Variable
N
V,

Variables o Escalas Coeficientes

Dos Cuantitativas (Intervalo o de Razón) Coeficiente de Correlación de Pearson

Cuantitativas y Ordinal o Dos Ordinales Coeficiente de Correlación de Spearrnan

Dos Nominales o Nominal y Cuantitativa Coeficiente de Contingencia

Cuantitativa y Cuantitativa con dicotomía artificial Coeficiente de Correlación "Biserial"

Cuantitativa y Cualitativa con dicotomía auténtica Coeficiente de Correlación Punto Biserial

Dos Nominales de dicotomía auténtica Coeficiente fi

Dos de Dicotomía Artificial (Con n mayor de 100) Correlación Tetracónica


Tabla 4
2
Valores de X a los niveles de Confianza de 0.05 y .01
Grados d e libertad (gl) .05 .01
1 3.8 1 1 6.635
2 5.991 9.2 10
3 7.8 1 5 1 1 .345
4 9. 1 88 1 3 .277
5 1 1 .070 1 5.086

6 12.592 1 6.8 12
7 14.067 1 8.475
8 1 5 .507 20.090
9 1 6. 9 1 9 2 1 .666
10 1 8.307 23.209

11 19.675 24.725
12 2 1 .026 26.2 17
13 22.362 27.688
14 23.685 29. 141
15 24.996 30.578

16 26.296 32.000
17 27.587 33.409
18 28.869 34.805
19 30. 144 36. 1 9 1
20 3 1 .410 37.566

21 32.67 1 38.932
22 33.924 40.289
23 35. 1 72 4 1 .638
24 36.41 5 42.980
25 37.652 44.3 14

26 38.885 38.932
27 40. 1 1 3 46.963
28 41 .337 48.278
29 42.557 49.588
30 43.773 50.892

35 49.802 57.342
40 55.758 63.691
45 6 1 .656 69.957
50 67.505 76. 1 54
60 79.082 88.379

70 90.531 100.425
80 1 0 1 .879 1 1 2.329
90 1 1 3.1 15 124. 1 1 6
100 124.342 135.807

259
BIBLIOGRAFÍA
Camel, F. ( 1 979). Estadística Médica y de Salud Pública. Cuarta edición.
Mérida, Venezuela: Talleres Gráficos Universitarios.
Cañedo, L. ( 1 987). Investigación clínica. México, D.F.: Nueva Editorial
Interamericana.
Escotet, M. A. ( 1 973). Estadística Psicoeducativa. México, D. F.: Editorial
Trillas.
Hemández Sampieri, R., Femández, C. y Baptista, P. ( 1 .99 1 ). Metodología
de la Investigación. Bogotá: McGraw-Hill.

260
ÍNDICE

PRÓLOGO . . . . . 5

CAPÍTULO I
Uso de la Estadística en el campo de la Salud . . . . . . . . . . . . 7
l. DEFINICIONES BÁSICAS . . . . . . . . . . . . . . . . . . . 9
11. USO DE LA ESTADÍSTICA EN EL CAMPO DE LA SALUD . 14
- APLICACIÓN DE LA ESTADÍSTICA EN LA ADMINIS­
TRACIÓN SANITARIA . . . . . . . . . . . . . . . . . . . 18
- APLICACIÓN DE LA ESTADÍSTICA EN LA INVES-
TIGACIÓN . . . . . . . . . . . . . . . 20
III. ETAPA DE PLANIFICACIÓN . . . . . . 20
- PLANTEAMIENTO DEL PROBLEMA 22
- MARCO TEÓRICO . . . . . . . 25
- MARCO METODOLÓGICO . . 29
- MARCO ADMINISTRATIVO . 34
BIBLIOGRAFÍA 40

CAPÍTULO II
Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
l. UNIVERSO Y POBLACIÓN . 45
- Universos finitos e infinitos 45
- Poblaciones cautivas . . . . 45
11. MUESTRAS . . . . . . . . . 46
- Desventajas de las muestras 47
- TIPOS DE MUESTRA: Probabilísticas y no Probabilísticas. 48
- TIPOS DE MUESTRAS PROBABILÍSTICAS . . . . . . . 49
- TÉCNICAS DE AZAR: . . . . . . . . . . . . . . . . . . . 52
- MUESTRAS NO PROBABILÍSTICAS . . . . . . . . . . 53
- CARACTERÍSTICAS DE UNA BUENA MUESTRA . . . 54

26 1
CAPÍTULO 111
Recolección de información 63
I. EL PROCESO DE RECOLECCIÓN DE LOS DATOS . 65
11. FUENTES DE INFORMACIÓN . . . . . . . . . . . . 66
III. INSTRUMENTOS DE RECOLECCION DE DATOS . 68
IV. TÉCNICAS DE RECOLECCIÓN DE DATOS. 74
BIBLIOGRAFÍA 78

CAPÍTULO IV
Procesamiento y Presentación de los datos . . . . . . . . . . . . . 79
ETAPA DE ELABORACIÓN
O PROCESAMIENTO DE DATOS . 81
CUADROS ESTADÍSTICOS . . . . 90
- Partes de un Cuadro Estadístico 90
- Tipos de Cuadros Estadísticos . 92
GRÁFICOS ESTADÍSTICOS . . . . 97
- Gráficos de Barras Simples. . . 99
- Gráfico Circular o Diagrama Sectorial . 1O 1
- Histograma y Polígono de Frecuencias. 103
- Curva Integral o Diagrama de Frecuencias Acumuladas . 105
- Polígono de Frecuencia para Cuadros de Asociación con Va-
riable Numérica como Variable Principal 107
- Barras Proporcionadas . . . . . 109
- Gráfico de Líneas de Tendencia 112
- Recomendaciones Finales . 116
EJERCICIOS . . 116
BIBLIOGRAFÍA 120

CAPÍTULO V
Técnicas de Análisis Univariado 121
EL PROCESO DE ANÁLISIS ESTADÍSTICO 123

262
- Medidas de Tendencia Central . . . . . 1 23
- Medidas de Dispersión o Variabilidad . 1 32
- Medidas de Posición . . . . . . . . . . 138
EL ÍNDICE ENDÉMICO. . . . . . . . . . . 1 43
TÉCNICAS DE ANÁLISIS DESCRIPTIVO PARA VARIABLES
CUALITATIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . 1 45
- Tasas Generales Brutas: Tasa General de Mortalidad, Tasa
General de Fecundidad, Tasa de Natalidad . 1 46
EJERCICIOS . . 152
BIBLIOGRAFÍA 1 54

CAPÍTULO VI
Probabilidades y Curva Normal . . . . . . . . . . . . . . . . . . . 155
TEORÍA DE LA PROBABILIDAD . . . . . . . . . . 157
- PROPIEDADES DE LAS PROBABILIDADES 1 58
- PRINCIPIO DE LAS PROBABILIDADES . 159
DISTRIBUCIONES DE PROBABILIDADES. 1 64
- Distribución binomial 1 64
- Distribución normal 1 67
EJERCICIOS . . . . . . . 1 80
BIBLIOGRAFÍA . . . . . 1 82
TABLA DE ÁREAS DE LA CURVA NORMAL 1 83

CAPÍTULO VII
Estadística Inferencial 185
ESTADÍSTICA INFERENCIAL . . . . . . . . . . . . 1 87
DISTRIBUCIÓN MUESTRAL . . . . . . . . . . . . 1 88
DISTRIBUCIÓN DE LA MEDIA DE LA MUESTRA . 1 88
- Error Estándar . . . . . . . . . . . . 191
ESTIMACIÓN . . . . . . . . . . . . . . . 1 92
- Estimación de la Media del Universo. 1 94

263
- Estimación de la Proporción Poblacional . . . . . . . . . 1 95
PRUEBA DE HIPÓTESIS O CONTRASTE DE HIPÓTESIS . . 1 97
- Procedimiento Metodológico para la Prueba de Hipótesis . 1 99
- Prueba de Hipótesis o de una Media Poblacional. . . . 206
- Prueba de Hipótesis de una Proporción de la Población . . 209
- Prueba de Hipótesis de la Diferencia entre dos Medias . . . 21 1
- Prueba de Hipótesis de la Diferencia entre dos Proporciones. 213
PRUEBA t PARA MUESTRAS PEQUEÑAS Y PARA MUES-
TRAS RELACIONADAS . . . . . . . . . . . . . . . . 217
EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . 223
TABLA DE PERCENTILES DE LA DISTRIBUCIÓN t 232
BIBLIOGRAFÍA . . . . . . . . . . . . . . . . . . . . 233

CAPÍTULO VIII
Técnica de Análisis Bivariado 235
MEDIDAS DE ASOCIACIÓN . . . . . . . . . . . . . 237
COEFICIENTE DE CORRELACIÓN DE PEARSON . . . . . . . . 23 7
- Cálculo del coeficiente de Pearson (r) . . . . . . . . . . . . . 238
COEFICIENTE DE CORRELACIÓN POR RANGO DE SPEAR-
MAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1
DISTRIBUCIÓN CHI CUADRADO. 243
PRUEBAS NO PARAMÉTRICAS. 252
EJERCICIOS . . . . . . . 254
TABLA VALORES DE X 2 . 259
BIBLIOGRAFÍA 260

ÍNDICE . . . . . 261

264
Bioestadística, Herramienta de la Investigación de Eddy Puertas López, Jesús
Urbina M., M. Elvira Blanck, Daisy Granadillo, Maritza Blanchard, José
Antonio García, Pedro Vargas V. y Ana Chiquito, se terminó de imprimir en
mayo de 1998 en Compugráfica (tlf. 234765-245256-235537) en su primera
edición de 500 ejemplares, utilizándose papel Bond 20 y fuentes Times New
Roman en su composición.

You might also like