You are on page 1of 10

Adaptacin y validacin de cuestionarios Artculo de revisin

Adaptacin cultural y validacin


de cuestionarios de salud: revisin
y recomendaciones metodolgicas
Jos Mara Ramada-Rodilla, MD, MOH,(1,2) Consol Serra-Pujadas, MD, PhD,(1,2,3)
George L Delcls-Clanchet, MD, MPH, PhD.(2,3,4)

Ramada-Rodilla JM, Serra-Pujadas C, Ramada-Rodilla JM, Serra-Pujadas C,


Delcls-Clanchet GL. Delcls-Clanchet GL.
Adaptacin cultural y validacin de cuestionarios de salud: Cross-cultural adaptation and health questionnaires validation:
revisin y recomendaciones metodolgicas. revision and methodological recommendations.
Salud Publica Mex 2013;55:57-66. Salud Publica Mex 2013;55:57-66.

Resumen Abstract
La traduccin simple de un cuestionario puede dar lugar a The simple translation of a questionnaire may lead to misin-
interpretaciones errneas debido a diferencias culturales y terpretation due to language and cultural differences. When
de lenguaje. Cuando se utilicen cuestionarios desarrollados using questionnaires developed in other countries and lan-
en otros pases e idiomas en estudios cientficos, adems de scientific studies it is necessary, besides the transla-
guages in
traducirlos, es necesaria su adaptacin cultural y validacin. tion, to carry out a cross-cultural adaptation and validation.
El objetivo de este trabajo es revisar la literatura sobre la Our objective was to review the literature on cross-cultural
traduccin, adaptacin cultural y validacin (TACV) de cues- adaptation and validation (CCAV) of health questionnaires,
tionarios de salud, y sintetizar y proponer recomendaciones and to synthesize and propose recommendations based on
basadas en la literatura cientfica que faciliten este proceso. the scientific literature to facilitate this process. The CCAV
La TACV debe seguir un proceso sistematizado, por lo que should follow a systematic process. Two steps are recom-
se recomiendan dos etapas: a) adaptacin cultural: traduc- mended: 1) cross-cultural adaptation: direct translation,
cin directa, sntesis, traduccin inversa, consolidacin por synthesis, back translation, expert committee consolidation
comit de expertos y pre-test, y b) validacin (con hasta and pre-testing, and 2) validation (with up to seven steps):
siete pasos): evaluacin de la consistencia interna, fiabilidad assessment of internal consistency, reliability, intra- and inter-
intra e interobservador, validez lgica, de contenido, criterio observer reliability, face, content, criterion and construct
y constructo. La falta de equivalencia de los cuestionarios validity. Lack of equivalence between questionnaires limits
limita las posibilidades de comparacin entre poblaciones con the comparability of results among populations with different
idiomas o culturas diferentes y el intercambio de informacin cultures and languages and the exchange of information in
en la comunidad cientfica. the scientific community.
Palabras clave: cuestionarios; escalas; encuestas de salud; Key words: questionnaires; scales; health survey; cross-cul-
comparacin transcultural; estudios de validacin; confia- tural comparison; validation studies; reliability and validity
bilidad y validez

(1) Servicio de Salud Laboral, Parc de Salut MAR. Barcelona, Espaa.


(2) Centro de Investigacin en Salud Laboral (CiSAL), Universidad Pompeu Fabra. Barcelona, Espaa.
(3) CIBER de Epidemiologa y Salud Pblica (CIBERESP). Barcelona, Espaa.
(4) Epidemiology, Human Genetics and Environmental Sciences Division, The University of Texas School of Public Health. Houston, Texas, EUA.

Fecha de recibido: 2 de enero de 2012 Fecha de aceptado: 21 de septiembre de 2012


Autor de correspondencia: Jos Ma. Ramada Rodilla. Centro de Investigacin en Salud Laboral, Universidad Pompeu Fabra.
Dr. Aiguader, 88, 08003-Barcelona, Espaa.
Correo electrnico: jramada@parcdesalutmar.cat

salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013 57


Artculo de revisin Ramada-Rodilla JM y col.

V aldra la pena imaginar a un investigador que se


encuentra aplicando un cuestionario britnico a
una muestra de peatones alemanes. En el cuestionario
El grado de cumplimiento de los pasos metodol-
gicos que se recomiendan en la literatura internacional
para la realizacin de la TACV es bajo. Para deobjetivar
se pregunta sobre la costumbre de mirar a la derecha esta afirmacin, se recuperaron todos los artculos, sin
antes de cruzar una va de doble sentido de circulacin. lmite temporal ni de idioma, publicados en cinco de las
Es probable que se detecte una carencia en la formacin revistas de epidemiologa y salud pblica con mayor fac-
vial de los peatones alemanes, ya que stos no miran a tor de impacto en Amrica Latina y en Espaa -Revista
la derecha cuando cruzan. Sin embargo, este resultado Panamericana de Salud Pblica, Revista de Sade Pbli-
estar ms bien relacionado con una inadecuada adap- ca, Salud Pblica de Mxico, Gaceta Sanitaria y Revista
tacin cultural del cuestionario porque en Alemania se Espaola de Salud Pblica-, usando los trminos MeSH:
circula por la derecha y, por tanto, se mira a la izquier- cuestionarios, escalas, encuestas de salud, comparacin
da antes de cruzar. transcultural, estudios de validacin, confiabilidad y
La traduccin simple de un cuestionario puede con- validez.
ducir a una interpretacin errnea debido a diferencias Se incluyeron aquellos artculos cuyo objetivo fue la
culturales y de lenguaje. Si el proceso de traduccin, TACV de un cuestionario a un idioma diferente del ori-
adaptacin cultural y validacin (TACV) no se realiza ginal. Se excluyeron aquellos que perseguan el diseo
correctamente pueden producirse errores de ndole y validacin de un cuestionario o bien la validacin del
diversa dependiendo del objetivo del cuestionario. mismo, partiendo de un cuestionario cuya adaptacin
Una inadecuada TACV de cuestionarios como cultural haba sido publicada en un estudio anterior.
el Goldberg (GHQ), 1 el Nordic Occupational Skin Se obtuvieron en total 32 artculos que se analizaron en
Questionnaire (NOSQ),2 el Test de Control de Asma su versin completa. De ellos, 25% sigui menos de la
(ACT)3 o del Michigan Alcohol Screening Test (MAST),4 mitad de los pasos recomendados; 72% sigui menos de
provocaran errores de clasificacin en el despistaje de 80% de dichos pasos, y slo 6% de los artculos sigui
pacientes con trastornos ansioso-depresivos, dermatosis la totalidad de stos (cuadro I).
profesionales, asma o alcoholismo. No se ha identificado ninguna revisin en la li-
Deficiencias en la TACV de cuestionarios como el teratura que integre y sistematice todo el proceso de
Work Ability Index (WAI),5 o el Work Role Functioning TACV, por lo que el objetivo de este trabajo fue revisar
Questionnaire (WRFQ),6 podran dar lugar a errores en y sintetizar la literatura proponiendo recomendaciones
la evaluacin del grado de capacidad para el trabajo, que faciliten el proceso de TACV para su aplicacin en
afectando la orientacin de las medidas preventivas. cuestionarios de salud.
Una TACV poco sistemtica de cuestionarios para la
vigilancia epidemiolgica de enfermedades y exposicio-
nes, como el Cuestionario de Deteccin Epidemiolgica
Material y mtodos
para Artritis Reumatoide,7,8 el Cuestionario Nrdico Se realiz una revisin bibliogrfica exhaustiva para
Estandarizado para la Deteccin de Sntomas Msculo- localizar la informacin disponible sobre la metodologa
esquelticos en Salud Ocupacional,9 o el Cuestionario de la TACV de cuestionarios de salud.
para la Deteccin Integrada de Obesidad, Diabetes La bsqueda bibliogrfica se inici con la revi-
e Hipertensin Arterial de la Secretara de Salud de sin de varios libros y monografas especializadas en
Mxico,10podra llegar a inducir el diseo y puesta en metodologa para el diseo, adaptacin y validacin
marcha de polticas pblicas inadecuadas. de cuestionarios publicados entre 1996 y 2007.11,16-21 A
La TACV es necesaria incluso cuando se desea partir de las citas bibliogrficas de dichas publicaciones,
aplicar un cuestionario en pases distintos que hablan un se recuperaron diversos artculos sobre la TACV de
mismo idioma. En ocasiones se asume que la adaptacin cuestionarios de salud y sus aspectos metodolgicos,
cultural a un idioma diferente garantiza las propiedades que estuvieran publicados en ingls, francs, italiano,
psicomtricas del cuestionario. Esto no siempre es as. espaol y portugus. Se seleccionaron las palabras cla-
Por ejemplo, las diferencias en cmo se realiza la acti- ve que agrupaban un mayor nmero de trminos y se
vidad laboral en los pases pueden modificar la validez contrastaron con el tesauro de Medline, identificando los
de un cuestionario de aplicacin en salud laboral.11-13 La trminos (MeSH terms): 1) health survey; 2) health
necesidad de intercambiar experiencias y llevar a cabo questionnaire; 3) scale; 4) cross cultural adaptation;
comparaciones entre poblaciones y pases distintos pre- 5) validation; 6) validity, y 7) reliability. Con la
cisa de versiones lingsticas adecuadamente adaptadas combinacin de estos trminos se realiz la bsqueda
y validadas de los instrumentos de medida.14,15 en Medline, de tal manera que se obtuvieron 214 citas.

58 salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013


Cuadro I
Cumplimiento de los pasos metodolgicos para la TACV de cuestionarios publicados en las revistas GS, RESP, SPM, RDSP, y RPSP, sin lmite temporal
ni de idioma, hasta el 1 de noviembre de 2011. Barcelona, Espaa, noviembre 2011

Artculo Revista Adaptacin cultural Validacin


Fiabilidad Validez
Traduccin Sntesis Traduccin Comit Pre-test Consistencia test- Fiabilidad Validez Validez Validez Validez
directa traducciones inversa expertos interna retest interobservador aparente contenido criterio constructo

Mas Pons 1998 RESP S S S S S No No NP No No No No
Lpez-Alvarenga 2001 SPM S No No No No No S NP No No S S
Amaral-Pinheiro 2002 RDSP S No No No S No No NP No S S No
Serra-Sutton 2002 RESP S S S S S No No NP No No NP No
Adaptacin y validacin de cuestionarios

Lpez-Vzquez 2004 SPM S No No No No S No No No No NP S


Guimaraes de Mello 2004 RDSP S S S S S S S NP No No No No
Melgar-Quionez 2005 SPM NP NP NP S S No No NP S S S No
Avanci 2005 RDSP S No S S No S S NP S S No S
Aymerich 2005 GS S S S S S S No NP S S No S
Torres 2005 RDSP S S S S S S S NP S S No No
Majdalani 2005 RPSP NP NP NP S S S S S S S S No

salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013


Rodriguez da Silva 2005 RDSP S No S S S S S No S No S S
Lpez-Carmona 2006 SPM NP NP NP S No S S NP No No S No
Carpio 2006 RPSP S No No No No No No S S S S S
lvarez 2006 SPM NP NP NP No S S No NP No No S S
Reichenheim 2007 RDSP S S S S S S S NP S S S S
Esteva 2007 GS S No S S S S S No S S No S
Pinto Guedes 2007 RDSP S S S S S No S NP S S NP S
Pea de Len 2007 RPSP S S S S S S No NP No No S S
Remor 2007 RDSP S S S No No S No NP No No S No
Aguirre Jaime 2008 RESP NP NP NP S No S No No S S S No
Gonzlez-Block 2008 SPM S No No No No No No No S S S No
Pedro Gmez 2009 RESP S No S S No S No NP No No NP S
Zurbarn 2009 RPSP S S S S S S No No No No S No
Martnez-Gmez 2009 RESP S No S S S S S NP S S S No
ShiNohara 2010 RDSP S S S S S S S NP No No S S
Silva 2010 RPSP S S S S S S S NP S S No No
de Souza-Machado 2010 RDSP S No No No S NP S NP No No No No
Garrido-Urrutia 2010 RESP S S No No No S S NP S S NP No
Gutirrez Snchez 2011 RESP S No S No No S No NP No No NP S
Amaral Saliba 2011 RPSP S S S S S S S NP S S S S
de Barrios Leite 2011 RDSP S S S S S No S NP No S No S

TACV: Traduccin, adaptacin cultural y validacin. GS: Gaceta Sanitaria . RESP: Revista Espaola de Salud Pblica. SPM: Salud Pblica de Mxico
Artculo de revisin

RDSP: Revista de Sade Pblica. RPSP: Revista Panamericana de Salud Pblica . S: Paso realizado. No: Paso no realizado. NP: No procede

59
Artculo de revisin Ramada-Rodilla JM y col.

Fueron criterios de inclusin que el artculo tratara Cuadro II


sobre aspectos metodolgicos de los procesos de TACV Glosario de trminos comnmente empleados
de cuestionarios de salud y que fueran publicados en en los procesos de traduccin y adaptacin cultural

los idiomas mencionados. Con base en estos criterios de cuestionarios. Barcelona, Espaa, noviembre 2011
y partiendo de la lectura de los resmenes, se selec- Adaptacin cultural (cross-cultural adaptation): tomar en consideracin el
cionaron 20 artculos que se analizaron en su versin contexto cultural, los giros idiomticos y las diferencias en la percep-
completa.12,13,15,22-38 cin de la salud y la enfermedad de aquellas poblaciones en las cuales
se desea aplicar.
Asimismo, se realiz una bsqueda de la literatura Consistencia interna (internal consistency reliability): es el grado de interrelacin
gris a travs de Internet, introduciendo como criterios y coherencia de los componentes (tems o variables) del instrumento
de bsqueda las palabras clave obtenidas, as como los de medida.
Constructo (construct): teora subyacente en el fenmeno o concepto que se
autores identificados en el proceso anterior. Finalmen- quiere medir. Se trata de una cualidad no observable en una poblacin
te, se incluyeron siete libros11,16-21 y 21 artculos.12-15,22-38 de sujetos.
A partir de esta revisin, se elabor una propuesta Criterio o prueba de referencia (gold standard): mtodo de medicin alternativo
equivalente, independiente de los resultados de un cuestionario, fiable,
con las recomendaciones metodolgicas sobre las que exacto, objetivo y ampliamente aceptado como medida vlida.
exista un mayor consenso entre los autores y se for- Escala (scale): graduacin utilizada en diversos instrumentos de medida para
mul un glosario con los trminos ms comnmente posibilitar la medicin de una magnitud.
Especificidad (specificity): capacidad para detectar a los individuos que no
empleados en los procesos de TACV de cuestionarios presentan el fenmeno de estudio.
(cuadro II). Fiabilidad (reliability): grado en que un instrumento es capaz de medir sin
errores. Es la proporcin de la variancia total atribuible a diferencias
verdaderas entre los sujetos.
Sntesis y recomendaciones Fiabilidad inter-observador (inter-rater reliability): mide el grado de acuerdo que
hay entre dos o ms evaluadores que valoran a los mismos sujetos con
Existe amplio consenso en recomendar dos etapas para el mismo instrumento.
Fiabilidad intra-observador o fiabilidad test-retest (test-retest reliability): mide la
el proceso de TACV: a) adaptacin cultural, donde es ne- estabilidad de las puntuaciones otorgadas por el mismo evaluador, en los
cesario tener en cuenta los giros idiomticos, el contexto mismos sujetos y con el mismo mtodo en momentos diferentes.
cultural, y las diferencias en la percepcin de la salud y tem (item): cada uno de los componentes o variables de un instrumento
de medida; cada una de las partes o unidades de que se compone una
la enfermedad de las poblaciones, y b) la validacin en el prueba, un test o un cuestionario.
idioma de destino, para evaluar el grado de preservacin Sensibilidad (responsiveness): capacidad de detectar y medir cambios, tanto en
de las propiedades psicomtricas. los diferentes individuos como en la respuesta de un mismo individuo
a travs del tiempo.
Traduccin (translation): expresar en una lengua algo que se ha expresado
Primera etapa: traduccin y adaptacin cultural anteriormente o que est escrito en otra diferente.
Traduccin directa (forward translation): es aquella que se realiza de un idioma
extranjero al idioma del traductor.
En esta etapa se traduce la herramienta partiendo de su Traduccin inversa (back translation): es la traduccin de un texto a su idioma
versin original y procurando mantener la estructura original partiendo de una traduccin de este texto realizada previamente
del cuestionario. El objetivo es conseguir que el instru- a otro idioma.
Traduccin literal (literal translation): es aquella en la que se respeta el sentido
mento resultante mantenga la equivalencia semntica, del texto original.
idiomtica, conceptual y experiencial con el cuestionario Validacin (validation): evaluacin del grado de preservacin de las propiedades
original.22,23 En la literatura existe consenso sobre cmo psicomtricas del cuestionario.
Validez (validity): capacidad que tiene el instrumento de medir aquel cons-
abordar esta primera etapa,12,13,22-27 recomendndose tructo para el que ha sido diseado.
una secuencia de cinco pasos (figura 1): Validez aparente (face validity): grado en que los tems de un cuestionario, a
juicio de los expertos y de los usuarios, miden de modo lgico o reflejan
adecuadamente el constructo que se quiere medir.
Traduccin directa: se realiza una traduccin conceptual Validez de contenido (content validity): grado en que el contenido de un
del instrumento. Deben participar, al menos, dos tra- instrumento es capaz de medir la mayor parte de las dimensiones del
ductores bilinges independientes cuya lengua materna constructo que se quiere estudiar.
Validez de constructo (construct validity): grado en que las mediciones que
sea el idioma de destino. Uno de los traductores deber resulten de las respuestas del cuestionario puedan considerarse como
conocer los objetivos y los conceptos considerados en el una medicin del fenmeno estudiado.
cuestionario, y tendr experiencia previa en la traduc- Validez de criterio (criterion validity): grado en que el resultado del cuestio-
nario predice o concuerda con algn criterio de valor real o gold
cin tcnica de textos. standard.
El otro u otros traductores no tendrn conocimientos Valor predictivo positivo (positive predictive validity): es la probabilidad de que est
previos sobre el cuestionario y desconocern los objetivos presente el fenmeno de estudio en un individuo cuando el resultado
del cuestionario es positivo.
del estudio. Estos traductores ofrecern una traduccin
Valor predictivo negativo (negative predictive validity): es la probabilidad de que
ms ajustada al lenguaje de uso coloquial, detectando no est presente el fenmeno de estudio en un individuo cuando el
las dificultades de comprensin y traduccin derivadas resultado del cuestionario es negativo.
del uso de vocablos tcnicos o poco comunes.

60 salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013


Adaptacin y validacin de cuestionarios Artculo de revisin

Todo el cuestionario, incluyendo las instrucciones, proceso de traduccin. Se determinar si la traduccin


los tems y las opciones de respuesta, se traducir utili- ha dado lugar a diferencias semnticas o conceptuales
zando este mtodo, recopilando todo en un informe. importantes entre el cuestionario original y la versin
Sntesis de traducciones: las traducciones sern compa- de sntesis obtenida en el paso anterior. Todo lo anterior
radas por los traductores. Se identificarn y se discu- se recopilar en un informe.
tirn las discrepancias entre las versiones traducidas
hasta alcanzar el consenso. En el caso de que no exista Consolidacin por un comit de expertos: se recomienda
consenso, se requerir la participacin del equipo de constituir un comit multidisciplinar, si es posible de
investigacin. Al final, se realizar un informe del expertos bilinges en el tema sobre el que trata el cues-
proceso en el que aparecer una nica traduccin del tionario: un experto en metodologa, un lingista y un
cuestionario que ser la versin de sntesis en el idioma profesional de la salud, adems de los traductores que
de destino. han participado en el proceso. El objetivo de este comit
ser llegar a un nico cuestionario consolidado pre-final
Traduccin inversa (retro traduccin): la versin de sntesis adaptado al idioma de destino.16,17
ser retro traducida al idioma original, al menos por En este paso se dispondr de las traducciones
dos traductores profesionales bilinges cuya lengua directas (paso 1), la versin de sntesis (paso 2) y las
materna sea la del cuestionario original. Los traducto- retrotraducciones (paso 3). Se identificarn y discu-
res trabajarn de forma independiente, estarn ciegos tirn las discrepancias encontradas. Se cerciorar de
para la versin original del cuestionario, no tendrn que la versin pre-final sea totalmente comprensible y
conocimientos previos sobre el tema y desconocern equivalente al cuestionario original. Se asegurar que
los objetivos del estudio.12,13 el cuestionario pre-final resulte comprensible para una
Los traductores debern subrayar las redacciones persona escolarizada con conocimientos equivalentes a
difciles y las incertidumbres encontradas durante el un individuo de 12 aos de edad.

Paso 1 Paso 2 Paso 3 Paso 4 Paso 5


T a c
P r d u
r Traduccin Sntesis de Traduccin Consolidacin Pre-test
a a l directa
i traducciones inversa comit expertos (viabilidad)
d p t
m u t u
e c a r
r c c a
a i i l

f n n
a Informes del proceso
s y
e

Versin traducida y adaptada culturalmente

S
e v 1. Consistencia interna
g a Fiabilidad 2. Fiabilidad intra-observador
u l 3. Fiabilidad inter-observador
n i
d Versin
d
a validada
a 1. Validez aparente o lgica
c
f i Validez 2. Validez de contenido
a 3. Validez de criterio
s n
4. Validez de constructo
e

Figura 1. Proceso de traduccin, adaptacin cultural y validacin (adaptado de referencia 22). Barcelona,
noviembre 2011

salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013 61


Artculo de revisin Ramada-Rodilla JM y col.

En el caso de que surjan incertidumbres se recurrir, Segunda etapa: validacin del cuestionario
de ser posible, con alguno de los autores del cuestionario en el idioma destino
para solicitar su participacin. Se elaborar un informe
que sintetice las decisiones del comit, incluyendo la La correcta traduccin y adaptacin cultural de un
versin consolidada. cuestionario no siempre garantiza la preservacin de
sus propiedades psicomtricas, por lo que es necesaria
Pre-test (aplicabilidad / viabilidad): su realizacin permi- su validacin en el idioma de destino.22
tir evaluar la calidad de la traduccin, la adaptacin Para que un cuestionario se considere vlido, debe
cultural y la aplicabilidad o viabilidad del cuestionario. de reunir las siguientes caractersticas: a) ser fiable y ca-
Asimismo permitir calcular si el tiempo de cumplimen- paz de medir sin error; b) ser capaz de detectar y medir
tacin se encuentra dentro de lmites razonables. cambios, tanto entre individuos como en la respuesta de
Investigadores como Durand y colaboradores,25 un mismo individuo a travs del tiempo; c) ser sencillo,
y Gallasch y colaboradores,26 realizaron el pre-test viable y aceptado por pacientes, usuarios e investiga-
durante el proceso de traduccin y adaptacin cultural dores; d) ser adecuado para medir el fenmeno que se
del Work Role Functioning Questionnaire (WRFQ-27) pretende medir, y e) reflejar la teora subyacente en el
con una muestra de 30-40 trabajadores, y se obtuvieron fenmeno o concepto que se quiere medir. Todas estas
resultados satisfactorios. Lo mismo realizaron De Sorez caractersticas estn relacionadas con dos propiedades
y colaboradores para el Work Limitations Questionnaire de los cuestionarios: la fiabilidad y la validez.14
(WLQ), incluyendo a 20 voluntarios.27 Beaton propuso La Sociedad Internacional para la Evaluacin de
incluir en la muestra entre 30 y 40 participantes, ba- la Calidad de Vida (en ingls, IQOLA)8,18,19 y otros in-
sndose en una revisin bibliogrfica de adaptaciones vestigadores como Aday,19 Lam,30 Mokkink,31-33 Ren,34
culturales.22 Se recomienda la realizacin del pre-test con Scott-Lennox35 y Wiesinger,36 han propuesto o emplea-
participantes de distintos niveles educativos y, si se trata do diferentes mtodos de evaluacin de la fiabilidad
de cuestionarios autocumplimentados, los participantes y validez de los cuestionarios. De acuerdo con esas
debern saber leer y comprender lo ledo. experiencias, se propone la validacin de cuestionarios
Para seleccionar la muestra, es importante definir con la siguiente secuencia (figura 1):
los criterios de inclusin y exclusin, as como el modo
en que sern reclutados los participantes. En el caso de 1. Fiabilidad: es el grado en que un instrumento es
cuestionarios de aplicacin en salud laboral, se reco- capaz de medir sin errores. Mide la proporcin
mienda incluir en el pre-test a trabajadores en activo, de variacin en las mediciones que es debida a
con una jornada mayor o igual a 10 horas semanales, la diversidad de valores que adopta la variable y
de ambos sexos, con edades entre 18 y 65 aos, con di- no al posible error sistemtico o aleatorio.14,33 La
ferentes niveles educativos y que hablen como primera fiabilidad determina la proporcin de la variancia
lengua, lean y comprendan el idioma de destino si se total atribuible a diferencias verdaderas entre los
trata de cuestionarios autocumplimentados. De cada sujetos.20,33,37
participante se recopilarn datos, al menos, sobre sus Dependiendo de las caractersticas del cues-
caractersticas sociodemogrficas, nivel educativo y tionario, su fiabilidad puede evaluarse para todas
ocupacin.25,26 o algunas de sus tres dimensiones: 1) consistencia
Se solicitar a los participantes que llenen la versin interna; 2) fiabilidad intra-observador o fiabilidad
consolidada y, mediante una entrevista estructurada, test-retest, y 3) fiabilidad inter-observador.
se les invitar a comentar cualquier aspecto que haya
resultado difcil de entender. Se recomienda grabar 1.1. Consistencia interna: es el grado de interrelacin
estas entrevistas as como la autorizacin previa de los y coherencia de los tems. A travs de este
participantes, con el fin de poder revisarlas tantas veces aspecto, se evala si los tems que miden un
como sea necesario. mismo constructo presentan homogeneidad
Al final, se realizar un informe donde se identi- entre ellos.33,39 Cuando la escala de un instru-
ficarn las posibles dificultades en la comprensin de mento es consistente, se garantiza que todos los
las instrucciones del cuestionario, las preguntas y las tems miden un solo constructo y, en general,
opciones de respuesta. Se recomienda la revisin de cual- se asegura la existencia de una relacin lineal
quier pregunta del cuestionario si al menos 15% de los entre la suma de las puntuaciones de los tems
participantes encuentran dificultades en la misma.27 y el constructo medido.

62 salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013


Adaptacin y validacin de cuestionarios Artculo de revisin

Un constructo es una cualidad latente o 1.2 Fiabilidad intra-observador o fiabilidad test-retest:


intangible de un sujeto o de una poblacin que este aspecto hace referencia a la repetibilidad
no se puede observar y medir directamente del instrumento, cuando se administra con el
con un instrumento de medida, ya que esta mismo mtodo a la misma poblacin en dos
cualidad tiene lugar dentro de una teora. Son momentos diferentes.14,33 Cuando la escala
ejemplos el estrs laboral, la motivacin, la dis- es cuantitativa, su anlisis se realiza median-
capacidad o el liderazgo. Evaluar la fiabilidad te el clculo del coeficiente de correlacin
de un instrumento no ofrece mayores proble- intraclase (CCI), y cuando es cualitativa se
mas cuando se trata de cuantificar cualidades realiza mediante el clculo del ndice Kappa
objetivas, como el peso o la talla. No obstante, de Cohen.21,37
para los constructos es necesario probar de El tiempo que debe transcurrir entre la pri-
forma emprica que el instrumento sirve para mera vez (test) y la segunda (retest) depender
medir aquello que se pretende medir. de lo que se est midiendo. No debe ser muy
La medicin de los constructos se realiza largo para evitar que el fenmeno observado
frecuentemente mediante cuestionarios donde sufra variaciones que alteraran el valor de la
se supone que cada tem est relacionado con repetibilidad y tampoco debe ser demasiado
la cualidad no observable de inters. Para corto para evitar el recuerdo de las respuestas
cada tem se suele solicitar una respuesta a (efecto aprendizaje).
la que se asigna una puntuacin. La suma de 1.3 Fiabilidad inter-observador: es el grado de acuer-
las puntuaciones proporciona la escala del do que hay entre dos o ms evaluadores que
cuestionario. En ocasiones, una escala puede valoran a los mismos sujetos con el mismo
estar compuesta por un grupo de subescalas. instrumento.33 Esta propiedad no es evaluable
Por ejemplo, el riesgo laboral psicosocial es cuando se trata de cuestionarios autocumpli-
un constructo que, a su vez, puede estar com- mentados, ya que es el propio individuo quien
puesto por varias dimensiones como el nivel proporciona las respuestas sin que exista inter-
de demanda del trabajo, las recompensas, el ferencia de los investigadores.
nivel de control y el apoyo social. Si se requiere su evaluacin, se reali-
El coeficiente alfa de Cronbach permite zar mediante el clculo del coeficiente de
cuantificar el nivel de fiabilidad de una escala correlacin intraclase (CCI) cuando la escala
si se cumplen dos requisitos: a) debe estar sea cuantitativa, y el ndice Kappa de Cohen
formada por un conjunto de tems, cuyas cuando sea cualitativa. Las limitaciones princi-
puntuaciones se suman para calcular una pales se deben a la posibilidad de que existan
puntuacin global, y b) todas las puntuacio- de acuerdos entre los observadores debidos
nes de los tems deben medir en la misma al azar y la posibilidad de que exista un error
direccin; por ejemplo, a mayor puntuacin sistemtico (sesgo de informacin) de alguno
mayor capacidad funcional o mayor bienestar de los evaluadores.
emocional.
El coeficiente alfa de Cronbach es la media 2. Validez: es la capacidad del cuestionario de medir
ponderada de las correlaciones entre los tems aquel constructo para el que ha sido diseado.19,33
que forman parte de una escala.39 Cuando el Puede evaluarse para todas o slo para alguna de
instrumento est compuesto por un grupo de sus cuatro dimensiones: validez aparente o lgica,
subescalas, debe calcularse el coeficiente alfa de contenido, de criterio y de constructo.
de Cronbach para los tems respecto de la pun-
tuacin global (correlacin tem-total) y para 2.1 Validez aparente o lgica: se refiere al grado en
los tems de cada subescala respecto del valor que un cuestionario, a juicio de los expertos y
de la misma (correlacin tem-subescala). de los usuarios, mide de forma lgica lo que
El coeficiente alfa de Cronbach no viene quiere medir.14,19
acompaado de ningn valor de p que permita Cuando se carece de validez aparente o
rechazar o no la hiptesis de fiabilidad de la lgica, los sujetos sometidos a estudio pueden
escala. Puede adoptar valores entre 0 y 1. Se no ver la relacin entre las preguntas que se les
considera que valores alfa superiores a 0.70 formulan y el objeto para el cual han accedido
son suficientes para garantizar la consistencia a contestar. Este hecho puede provocar el re-
interna de la escala. chazo de los participantes.

salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013 63


Artculo de revisin Ramada-Rodilla JM y col.

Esta dimensin de la validez debe evaluar- comparacin de los resultados obtenidos con
se en el momento de su diseo; no obstante, si el cuestionario y el GS.
en el proceso de TACV se detectan desajustes El anlisis de la validez de criterio con-
debidos al proceso de traduccin o adaptacin currente consiste en examinar la fuerza de
cultural, ser necesario corregirlos. la correlacin existente entre el resultado del
2.2 Validez de contenido: los constructos suelen cuestionario y el del GS y se puede cuanti-
estar compuestos por varias dimensiones. La ficar mediante el clculo del coeficiente de
validez de contenido es el grado en que la he- correlacin de Pearson (r). Otro enfoque para
rramienta es capaz de medir la mayor parte de cuantificar la validez de criterio concurren-
las dimensiones del constructo.14,19,33 Un cues- te consiste en analizar la sensibilidad y la
tionario con alta validez de contenido es aquel especificidad.19,21
que mide todas las dimensiones relacionadas La sensibilidad es la capacidad que tiene el
con el constructo que se quiere estudiar. cuestionario para detectar a los individuos que
Su evaluacin es un proceso formal que presentan el fenmeno de estudio. Se puede
siempre debe realizarse en un proceso de definir como la probabilidad de que un indi-
TACV y consiste en valorar si los tems del viduo que realmente tenga el fenmeno de es-
cuestionario son una muestra representativa tudio obtenga un resultado positivo cuando se
de aquello que se quiere medir. Se trata de le aplique el cuestionario. Se calcula mediante
una evaluacin emprica, basada en juicios de el cociente entre los verdaderos positivos (VP)
diferente procedencia, como son las opiniones y la suma de los VP y los falsos negativos (FN).
de los autores de la herramienta, los resultados De ah que tambin que se le conozca como
de estudios piloto, los razonamientos realiza- la fraccin de verdaderos positivos (FVP).
dos por el comit de expertos en un proceso Sensibilidad=VP/(VP+FN).
de TACV y el anlisis cualitativo de los comen- La especificidad es la capacidad de detec-
tarios realizados por los participantes durante tar a los que no presentan el fenmeno de estu-
el proceso de pre-test. dio, y es la probabilidad de que un individuo
2.3 Validez de criterio: establece la validez de un que no tenga el fenmeno de estudio obtenga
instrumento comparndola con algn cri- un resultado negativo cuando se le aplique
terio externo o prueba de referencia (gold el cuestionario. Se puede calcular mediante
standard,GS). Tiene dos dimensiones: 1) la el cociente entre los VN y la suma de los VN
validez concurrente o grado en que el resultado y los FP, y se le conoce como la fraccin de
del cuestionario concuerda con algn GS, y 2) verdaderos negativos (FVN); especificidad =
la validez predictiva o grado en que es capaz de VN/(VN+FP) (cuadro III).
pronosticar un determinado resultado.14,19,33 Cuanto ms alta sea la sensibilidad y
El GS debe ser un mtodo alternativo especificidad, y menor sea el porcentaje de
equivalente, independiente de los resultados FP y FN, mayor ser la validez concurrente.
del cuestionario, fiable, exacto, objetivo y am-
pliamente aceptado como medida vlida.14,19 Cuadro III
Cuando rene estos requisitos es capaz de dar Clculo de la sensibilidad, especificidad, valor
un resultado siempre positivo en presencia del predictivo positivo y valor predictivo negativo.*
fenmeno a estudiar y siempre negativo en Barcelona, Espaa, noviembre 2011.
ausencia del mismo. Por ejemplo, la electro-
Fenmeno de estudio (gold standard)
miografa realizada en condiciones adecuadas Resultado del cuestionario Presente Ausente Total
podra ser el GS frente a un cuestionario para
la evaluacin de la presencia del sndrome del Positivo VP FP VP+FP
tnel carpiano. Negativo FN VN FN+VN
Siempre que haya un GS, debera evaluar- Total VP+FN FP+VN
se la validez de criterio concurrente, siguiendo
Fuente: * Adaptado de referencia 21
cinco pasos: 1) seleccin del GS; 2) seleccin de VP: verdaderos positivos; FP: falsos positivos; FN: falsos negativos; VN:
una muestra de sujetos representativa de la verdaderos negativos
poblacin; 3) administracin del cuestionario Sensibilidad: VP/(VP+FN)
Especificidad: VN/(FP+VN)
y obtencin del resultado para cada individuo; Valor Predictivo Positivo (VPP): VP/(VP+FP)
4) evaluacin de cada individuo con el GE, y 5)

64 salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013


Adaptacin y validacin de cuestionarios Artculo de revisin

Se considera que un cuestionario tiene una al cuestionario original puede producir resultados no
sensibilidad y especificidad aceptable cuando fiables o confusos que podran limitar el intercambio de
stas son superiores a 0,80.20 A partir de aqu, informacin entre la comunidad cientfica.13,14,22-24
puede ser de inters conocer la validez predic- Esta propuesta para la TACV de cuestionarios de
tiva.21 El valor predictivo positivo (VPP) es la salud guarda coherencia con las recomendaciones de
probabilidad de que un individuo presente expertos como Alexandre,13 Beaton,22 Carvajal,23 Guille-
el fenmeno de estudio que se busca medir min12 y Herdman24 para la realizacin de traducciones
con el cuestionario si se obtiene un resultado y adaptaciones culturales.
positivo en el mismo. Se calcula mediante la El proceso de traduccin y adaptacin debe ir segui-
proporcin de participantes con un resultado do de un proceso de validacin en la lengua de destino,
positivo en el cuestionario y que finalmente lo cual permite minimizar el sesgo de informacin que
presentaban el fenmeno de estudio que se podra asociarse a la administracin de cuestionarios
intentaba medir: VPP = VP/(VP+FP). El valor en pases con idiomas y culturas diferentes. Por ello,
predictivo negativo (VPN) es la probabilidad se complementa el proceso proponiendo una serie de
de que no est presente dicho fenmeno cuan- pasos a seguir durante la etapa de validacin, coheren-
do el resultado del cuestionario es negativo: tes con las recomendaciones de expertos como Aday,19
VPN = VN/(FN+VN). Mokkink,31-33 Mller37 y Keszey.38
2.4 Validez de constructo: es el grado en que las
mediciones que resultan de las respuestas Declaracin de conflicto de intereses: Los autores declararon no tener conflicto
del cuestionario pueden considerarse una de intereses.
medicin del fenmeno estudiado.14,19,33 Su
evaluacin consiste en contrastar las hiptesis
que se han formulado sobre el comportamiento Referencias
de las puntuaciones de un instrumento en
1. Goldberg D, Bridges K, Duncan-Jones P, Grayson D. Detecting anxiety
situaciones diferentes. and depression in general medical settings. BMJ 1988; 297: 897-899.
Existen varios mtodos para su evaluacin, 2. Susitaival P, Flyvholm MA, Meding B, Kanerva L, Lindberg M, Svensson
que deben realizarse cuando el fenmeno a me- A, et al. Nordic Occupational Skin Questionnaire (NOSQ-2002): a new
dir es abstracto o no es posible comparar con un tool for surveying occupational skin diseases and exposure. Contact
Dermatitis 2003;49:70-76.
GE. El uso de tcnicas de anlisis de la validez
3. Melosini L, Dente FL, Bacci E, Bartoli ML, Cianchetti S, Costa F, et
para grupos conocidos es un procedimiento al. Asthma control test (ACT): comparison with clinical, functional, and
muy adecuado en cuestionarios de salud la- biological markers of asthma control. J Asthma 2012;49:317-323.
boral para medir el grado de capacidad fsica 4. Connor JP, Grier M, Feeney GF, Young RM. The validity of the Brief
o cognitiva para el trabajo. Permite comparar Michigan Alcohol Screening Test (bMAST) as a problem drinking severity
los resultados obtenidos mediante la aplicacin measure. J Stud Alcohol Drugs 2007;68:771-779.
5. Tuomi K, Ilmarinen J, Eskelinen L, Jrvinen E, Toikkanen J, Klockars M.
del cuestionario a grupos con un diagnstico Prevalence and incidence rates of diseases and work ability in different
clnico conocido de salud fsica o mental.19,20 work categories of municipal occupations. Scand J Work Environ Health
1991;17 (Suppl 1):67-74.

Conclusiones 6. Amick BC III, Lerner D, Rogers WH, Rooney T, Katz JN. A review
of health-related work outcome measures and their uses, and recom-
mended measures. Spine 2000; 25:3152-160.
La TACV de cuestionarios para su uso en otros idiomas 7. Scublinsky D, Gonzlez C, Iannantuono R, Somma LF, Rillo O, Casado
es un proceso que consume recursos; sin embargo, G et al. Adaptacin al espaol y validacin del cuestionario de deteccin
cuando se lleva a cabo de forma sistemtica permite epidemiolgica para artritis reumatoidea. Rev Argent Reumatol 2008;
obtener una herramienta de medicin equivalente a su 19:33-35.
8. Simonsson M, Bergman S, Jacobsson L, Petersson I, Svensson B.
versin original.
The prevalence of rheumatoid arthritis in Sweden. Scand J Rheumatol
El modo en que se realiza la TACV de cuestionarios 1999;28:340-343.
de salud es perfectible; as entonces, es importante se- 9. Kuorinka I, Jonsson B, Kilbom A, Vinterberg H, Biering-Srensen F,
guir las recomendaciones metodolgicas. Si el proceso Andersson G, et al. Standardised Nordic questionnaires for the analysis of
de TACV no se lleva a cabo de manera rigurosa, pueden musculoskeletal symptoms. Appl Ergon 1987; 18: 233-237.
10. Tapia-Conyer R, Velzquez-Monroy O, Lara-Esqueda A, Tapia-Olarte
producirse errores con implicaciones en el diagnstico,
F, Aurora-Jimnez R, Snchez-Montes J, et al. Gua de deteccin integrada
en las decisiones que deben tomarse con respecto a la de obesidad, diabetes e hipertensin arterial. [monografa en Internet].
terapia individual, en los registros epidemiolgicos e, Ciudad de Mxico, DF: Secretara de Salud de Mxico; [consultado 2012
incluso, en el diseo y puesta en marcha de polticas p- septiembre 18]. Disponible en: www.salud.gob.mx/unidades/cdi/documen-
blicas. Adems, el uso de herramientas no equivalentes tos/DOCSAL7482.pdf

salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013 65


Artculo de revisin Ramada-Rodilla JM y col.

11. Hutchinson A, Bentzen N, Konig-Zahn C. Cross cultural health out- 27. de Sorez PC, Kowalski CC, Ferraz MB, Ciconelli RM. Translation
come assessment: a users guide. The Netherlands: ERGHO, 1996. into Brazilian Portuguese and validation of the Work Limitations Ques-
12. Guillemin F. Cross-cultural adaptation and validation of health status tionnaire. Rev Panam Salud Publica 2007;22:21-28.
measures. Scand J Rheumatol 1995;24:61-63. 28. Bullinger M, Aonso J, Apolone G, et al. Translating health status
13. Alexandre NMC, Guirardello Ede B. Cultural adaptation of questionnaires and evaluating their quality: the IQOLA Project approach.
instruments utilized in occupational health. Rev Panam Salud Publica International Quality of Life Assessment. J Clin Epidemiol 1998;51:913-923.
2002;11:109-111. 29. Gandek B, Ware JE Jr, IQOLA Group. Methods for validation and
14. Garca de Ybenes MJ, Rodriguez-Salvans F, Carmona-Ortells L. norming translations of health status questionnaires: the IQOLA project
Validacin de cuestionarios. Reumatol Clin 2009;5:171-177. approach. International quality of life assessment. J Clin Epidemiol
15. Kulis D, Arnott M, Greimel ER, Bottomley A, Koller M. Trends in 1998;51:953-959.
translation requests and arising issues regarding cultural adaptation. 30. Lam CL, Gandek B, Ren XS, Chan MS. Tests of scaling assumptions
Expert Rev Pharmacoecon Outcomes Res 2011;11:307-314. and construct validity of the Chinese (HK) version of the SF-36 Health
16. Lobiondo-Wood G, Haber J. Reliability and validity. Nursing research: Survey. J Clin Epidemiol 1998;51:1139-1147.
methods, critical appraisal, and utilization. 4a. ed. St. Louis: Mosby, 1998 31. Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol
17. Burns N, Grove SK. The practice of nursing research: conduct, DL, et al. The COSMIN checklist for assessing the methodological quality
critique and utilization. 3a. ed. Philadelphia: Saunders, 1997. of studies on measurement properties of health status measurement in-
18. Ware JE Jr, Gandec B, Keller S, IQOLA Group. Evaluating instruments struments: an international Delphi study. Qual Life Res 2010;19:539-549.
used cross-nationally: Methods from the IQOLA Project. En: SpilkerB, ed. 32. Mokkink LB, Terwee CB, Knol DL, Stratford PW, Alonso J, Patrick
Quality of life and pharmacoeconomics in clinical trials. 2a. ed. Philadel- DL, et al. The COSMIN checklist for evaluating the methodological qual-
phia: Lippincort-Raven Publishers, 1996: 681-692. ity of studies on measurement properties: A clarification of its content.
19. Aday LA, Cornelius LJ. Designing and conducting health surveys: a com- BMC Med Res Methodol 2010;10: 22.
prehensive guide. 3a. ed. San Francisco, CA: Jossey-Bass publisher, 2006. 33. Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL,
20. Argimon-Pallas JM, Jimenez-Villa J. Mtodos de investigacin clnica y et al. The COSMIN study reached international consensus on taxonomy,
epidemiolgica. 3a. ed. Madrid: Elsevier Espaa, 2004. terminology, and definitions of measurement properties for health-related
21. Serra C, Company A. Vigilancia de la salud. En: Ruiz-Frutos C, Garca patient-reported outcomes. J Clin Epidemiol 2010;63:737-745.
AM, Delcls J, Benavides FG. Salud laboral, conceptos y tcnicas para la 34. Ren XS, Amik B III, Zhou L, Gandek B. Translation and psychometric
prevencin de riesgos laborales. 3a. ed. Barcelona: Masson, 2007: 255-264. evaluation of a Chinese version of the SF-36 Health Survey in the United
22. Beaton DE, Bombardier C, Guillemin F, Bosi-Ferraz M. Guidelines for States. J Clin Epidemiol 1998;51:1129-1138.
the process of cross-cultural adaptation of self-reports measures. Spine 35. Scott-Lenox JA, Wu AW, Boyer JG, Ware JE Jr. Reliability and validity
2000;25:3186-3191. of French, German, Italian, Dutch, and UK English translations of the
23. Carvajal A, Centeno C, Watson R, Martnez M, Rubiales AS. How is medical outcomes study HIV Health Survey. Med Care 1999;37:908-925.
an instrument for measuring health to be validated?. An Sist Sanit Navar 36. Wiesinger GF, Nhur M, Quitann M, Ebenbichler G, Wlfl G, Fialka-
2011;34:63-72. Moser V. Cross-cultural adaptation of the Roland-Morris questionnaire for
24. Herdman M, Fox-Rushby J, Badia X. A model of equivalence in the German-speaking patients with low back pain. Spine 1999;24:1099-1103.
cultural adaptation of HRQoL instruments: the universalist approach. 37. Mller R, Bttner P. A critical discussion of intraclass correlation
Qual Life Res 1998;7:323-335. coefficients. Stat Med 1994;13:2465-2476.
25. Durand MJ, Vachon B, Hong QN, Imbeau D, Amick BC III, Loisel P. 38. Keszei AP, Novak M, Streiner DL. Introduction to health measure-
The cross-cultural adaptation of the work role functioning questionnaire ment scales. J Psychosom Res 2010;68:319-323.
in Canadian French. Int J Rehabil 2004;27:261-268. 39. Cronbach, LJ. Coefficient alpha and the internal structure of tests.
26. Gallasch CH, Alexandre NM, Amick B 3rd. Cross-cultural adapta- Psychometrika 1951;16:297-334.
tion, reliability, and validity of the work role functioning questionnaire to
Brazilian Portuguese. J Occup Rehabil 2007;17:701-711.

66 salud pblica de mxico / vol. 55, no. 1, enero-febrero de 2013

You might also like