You are on page 1of 9

Immuno-analyse et biologie spcialise (2009) 24, 126134

STRATGIE DEXPLORATION FONCTIONNELLE ET DE SUIVI THRAPEUTIQUE

Estimation du risque de trisomie 21 ftale par


les marqueurs sriques maternels : impact
des erreurs analytiques sur le risque calcul
Foetal Down syndrome risk evaluation by maternal serum markers:
Inuence of analytical errors on computed risk

J.-F. Morin a,, V. Morin a, M.-P. Moineau b

a
Biostatistiques et informatique mdicale, facult de mdecine, 22, rue Camille-Desmoulins, 29200 Brest, France
b
Unit dimmunochimie, dpartement de biochimie et pharmacologie toxicologie, CHU de Brest,
5, boulevard Tanguy-Prigent, 29609 Brest cedex, France

Recu le 6 mars 2009 ; accept le 27 mars 2009


Disponible sur Internet le 26 mai 2009

KEYWORDS Summary Foetal Down syndrome risk computed on maternal serum markers has an accuracy
Down syndrome; which depends on the accuracy of measured concentrations. This study uses properties of mean
Maternal serum and variance to obtain formulas for risk variance in terms of concentrations analytical errors.
markers; Statistical distributions of likelihood ratio are also examined. Using two serum markers alone
Analytical error; and two markers with nuchal translucency is considered.
Variance on 2009 Elsevier Masson SAS. All rights reserved.
calculated risk

Rsum Limprcision du risque de trisomie 21 ftale calcul par les marqueurs sriques
MOTS CLS maternels dpend de limprcision sur les concentrations mesures. Utilisant les proprits
Trisomie 21 ; mathmatiques de lesprance et de la variance, cet article propose des formules estimant
Marqueurs sriques la variance du risque calcul en fonction des concentrations mesures et de leurs erreurs
maternels ; analytiques. Il discute galement des distributions statistiques du logarithme du rapport de
Erreur analytique ; vraisemblance. Lusage de deux marqueurs sriques seuls, ainsi que celui de deux marqueurs
Variance sur le risque joints la clart nucale sont tudis.
calcul 2009 Elsevier Masson SAS. Tous droits rservs.

Introduction

Toute mesure est affecte derreurs alatoires ; on peut


Auteur correspondant. en valuer limportance par un cart-type et/ou un CV.
Adresse e-mail : jean-francois.morin@univ-brest.fr (J.-F. Morin). Ces derniers sont obtenus partir de mesures rptes

0923-2532/$ see front matter 2009 Elsevier Masson SAS. Tous droits rservs.
doi:10.1016/j.immbio.2009.03.002
Trisomie 21 : estimation du risque par les marqueurs sriques maternels 127

sur des prlvements de concentrations varies, dans des suivantes :


conditions exprimentales prcises ; la moyenne et lcart-   2 
1 x n
type des rsultats de telles mesures permettent destimer yn = exp 0, 5 ; yp
n 2 n
limprcision de la technique pour ces diffrents niveaux de
  2
concentration et dobtenir des prols dimprcision, intra- 1 x p
et/ou inter-srie. = exp 0, 5
p 2 p
Dans le cas du calcul de risque de trisomie 21 (T21)
ftale, on mesure la concentration srique dau moins par le rapport L = yn /yp . En multipliant linverse du risque li
deux marqueurs. Ces concentrations sont introduites dans lge par ce rapport on obtient linverse du risque calcul,
un noyau de calcul qui fournit un rapport de vraisemblance ; mode de rendu habituel du risque.
en multipliant ce rapport par le risque li lge de la Ces fonctions dcrivent idalement la distribution des
patiente, on obtient le risque calcul. log(MoM), pour la premire, dans une population de femmes
La question pose est la suivante : quel est limpact non porteuses denfants atteints de trisomie (indice n pour
des erreurs analytiques sur le risque calcul ? Est-il non porteuse ) et, pour la seconde, dans une population
possible daccompagner le rsultat dun cart-type ou de femmes porteuses denfants atteints de T21 (indice p
dun intervalle de conance directement dduit du pro- pour porteuse ) ; et dsignent, avec leur indice res-
l dimprcision ? Quelques auteurs [1,8,9] ont abord ce pectif, la moyenne et lcart-type de ces populations de
problme de facon pragmatique, par dosages rpts de log(MoM).
srums et calcul des risques correspondants. Cette facon
de procder ne relie pas de facon vidente la concen-
tration et le prol dimprcision fourni par lindustriel Problme et solutions
ou tabli par le biologiste ; elle napporte de solu-
tion que pour quelques combinaisons de concentrations Problme
des marqueurs et ne permet donc pas un calcul de Soit C la concentration du marqueur srique mesurer ; C
lerreur et dintervalle de conance quelle que soit cette nest connue quaux erreurs alatoires prs. Ces erreurs
combinaison. alatoires sont supposes suivre une loi de Gauss de
Dans cet article nous proposons une mthode plus moyenne C et dcart-type C ; CV = C /C est le coefcient
gnrale. Par deux approches mathmatiques diffrentes de variation associ ces uctuations ; il est, avec C , une
nous proposons des formules pour lcart-type du risque mesure de limprcision de la technique de dosage en C.
calcul. Toutes ces formules ont t vries par simula- Les uctuations analytiques se rpercutent sur le MoM,
tions numriques et compares une approche numrique sur X = log(MoM), sur les ordonnes yn et yp , sur leur rapport
directe ; les formes des distributions statistiques permet- L(X) et enn sur le risque calcul R.
tant de proposer un intervalle de conance du risque Peut-on induire de ce CV analytique un CV pour le risque
calcul ont t tudies et compares la loi de calcul ?
Gauss. Il est vident que le CV du MoM est gal celui de
An de simplier la prsentation, nous avons dabord la concentration ; en effet, pour DG donn, le MoM est la
trait le cas dun seul marqueur srique, puis ensuite de concentration divise par une constante qui est la mdiane
deux et enn propos une solution pour deux marqueurs dduite du gnrateur ; dans ce travail, nous ntudions pas
sriques associs la clart nucale. les incertitudes induites par lestimation dun gnrateur de
mdianes ; une approche plus globale, base sur des simu-
lations, a dj fait lobjet de publications dans ce journal
[6,7].
Erreur sur le risque dans le cas dun seul Le problme consiste donc dduire du CV de la concen-
marqueur srique tration lerreur, cest--dire lcart-type x = log(MoM) sur le
log(MoM), puis lerreur sur le rapport L des ordonnes yn et
Principe du calcul de risque. Notations yp .
Les difcults destimation de cette erreur nale
Le principe est bien connu. Disposant de la dure de tiennent la transformation logarithmique du MoM,
grossesse (DG) de la femme au jour du prlvement, la lusage dun rapport de fonctions exponentielles de ce log
concentration du marqueur est transforme en multiple (lois de Gauss) faisant en outre intervenir ce log dans des
de la mdiane (MoM) ; cette transformation utilise un expressions quadratiques.
gnrateur de mdianes, fonction qui toute DG fait cor-
respondre une concentration mdiane (MedDG ) : lvolution Solution directe
des concentrations du marqueur en fonction de DG est ainsi Un moyen trs simple pour se faire une ide de limpact de
corrige du facteur DG [7]. limprcision analytique sur le risque calcul est dvaluer
La variable MoM est introduite, dans le noyau de cal- ce risque pour des carts de MoM autour de la valeur
cul, sous la forme de son logarithme [X = log(MoM)] car le moyenne dnie par C/Med et de calculer L pour ces carts.
logarithme permet de travailler sur des distributions quasi La Fig. 1 prsente, titre dexemple, les carts
gaussiennes. la valeur cible L(X) exprims en pour cent de L, pour
Dans le cas simpli de lutilisation dun seul mar- MoM 1,96MoM en fonction de MoM ; ces intervalles ont t
queur srique, le rapport de vraisemblance L(X) = L se valus pour des concentrations de CV 2, 5 et 8 %.
dduit des ordonnes des deux densits gaussiennes Cette premire approche permet de constater :
128 J.-F. Morin et al.

Estimation de la variance de Ln(L)

Lexpression du rapport de vraisemblance est donc :



2 
xn
1

n 2
exp 0, 5 n A exp[0, 5 U 2 ]
n
L=   2  = A exp[0, 5 V 2 ]
xp p
1

p 2
exp 0, 5 p

expression dans laquelle x = log(MoM) se dduit de la concen-


tration par log(C/MedDG ).
Pour simplier cette quation et faciliter les calculs,
considrons son logarithme nprien, soit :
Figure 1 Un seul marqueur ; mthode directe : intervalles
de conance, au risque 5 %, du rapport de vraisemblance L,
An
en fonction du MoM, pour des concentrations de CV 2, 5 et Ln(L) = f(U, V ) = Ln + 0, 5(V 2 U 2 )
8 % ; les limites des intervalles sont exprimes en pour cent Ap
de L.
Il sagit dune fonction de deux variables U, V et la for-
mule de propagation des erreurs est dans ce cas :

 2  2   
leffet amplicateur des fonctions exponentielles sur f f f f
lerreur analytique : ainsi, pour MoM = 1 et CV = 5 %, le Ln(L)
2
= U2 + V2 + 2 cov(U, V )
U V U V
risque calcul admet pour intervalle de conance 95 %
= U 2 U2 + V 2 V2 2UVcov(U, V )
un intervalle voisin de plus ou moins 20 % autour de la
valeur R calcule ;
que les intervalles de conance ne sont pas centrs sur x  
n x2
la valeur cible L, ce qui indique que les distributions sta- Or : U2 = Variance = et V2
tistiques des erreurs sur L ne sont pas symtriques par n n2
rapport cette cible ;  
x p x2
par une analyse plus complte, que lvolution de lerreur = Variance =
p p2
sur L en fonction des valeurs de MoM dpend aussi des
caractristiques (moyennes et carts-types) des log(MoM)
des populations normales et pathologiques ; les On en dduit aisment que :
paragraphes qui suivent permettront dexpliciter de facon  2
plus prcise cette dpendance ; x x
quenn, lerreur est fonction de la valeur du MoM, ce Ln(L)
2
= U V = (UU VV )2
n p
qui tait prvisible puisque le CV est suppos constant et
que, par suite, lerreur analytique est proportionnelle la
Le dveloppement de cette formule fait intervenir la cova-
concentration mesure donc au MoM ; bien videmment,
riance entre U et V ; elle est gale au produit U V , car U
lallure des courbes donnant lintervalle de conance
et V sont parfaitement corrles (rUV = 1) puisque dpendant
dpend du prol dimprcision de la technique de
lune et lautre de x = log(MoM) par des relations linaires.
dosage.
Une autre possibilit eut t dexprimer V en fonction de
U (ou U en fonction de V) et dappliquer la formule de
propagation des erreurs la fonction de la seule variable
U (ou V). Cette dmarche, peine plus longue, aboutit
Estimation approche de la variance de Ln(L)
videmment la mme expression pour la variance de
par la formule de propagation des erreurs Ln(L).
Disposant ainsi dune estimation de lcart-type Ln(L) on
Formule de propagation des erreurs peut en dduire, pour Ln(L), un intervalle de conance au
risque 5 % : [Ln(L) 1,96 Ln(L) ; Ln(L) + 1,96 Ln(L) ] pour tout
Considrons, trs gnralement, une fonction de deux x, sous rserve cependant (cf. infra) que la distribution de
variables alatoires Y = f(X1 , X2 ). Lorsque le CV de chacune Ln(L) soit au moins approximativement gaussienne et que
des variables est faible, par exemple infrieur 10 %, on lon sache calculer x = log(MoM) (ces rserves seront traites
dmontre, par dveloppement limit, que la variance de Y au paragraphe discussion). Un intervalle de conance pour L,
est approximativement [2,3] : et donc pour le risque, sen dduit alors par exponentiation
des bornes de lintervalle de Ln(L).
 2  2    La Fig. 2 illustre les intervalles de conance plus ou
f f f f moins 1,96 cart-type pour le rapport de vraisemblance L
Y2 = X1
2
+ X2
2
+2 cov(X1 , X2 )
X1 X2 X1 X2 en fonction du MoM ; ces courbes ont t traces pour des
CVC de 2, 5 et 8 %.
Trisomie 21 : estimation du risque par les marqueurs sriques maternels 129

Expression de la variance de L

Expressions de var(U2 ) et Var(V2 )


On peut dmontrer [5] que la variance du produit de deux
variables alatoires W et Z est :
Var(WZ) = 2W Z Cov(W, Z) + 2W Z2 + 2Z W
2

+ Z2 W
2
+ [Cov(W, Z)]2
Si lon pose Z = W, on en dduit la variance du carr de W
compte tenu que dans ce cas la corrlation entre W et Z est
1 et que la covariance est alors le produit des carts-types
de W et Z, cest--dire la variance de W. On obtient ainsi :
Figure 2 Un seul marqueur ; propagation des erreurs : inter- Var(W 2 ) = 2[22W + W 2 2
]W .
valles de conance, au risque 5 %, du rapport de vraisemblance En appliquant cette formule U2 = (x n / n )2 puis
L, en fonction du MoM, pour des concentrations de CV 2, 5 et V2 = (x p / p )2 , on obtient :
8 % ; les limites des intervalles sont exprimes en pour cent de
   
x n 2 2 x2
L. Var(U ) = 2 2
2
+ x2
n n n2
2 x4
= 4U 2 x2 +2 = 4U 2 U2 + 2U4
La comparaison de ces intervalles ceux donns par la n n4
  2
mthode directe prcdente montre que la mthode par x p 2 x2
propagation des erreurs surestime lgrement la borne inf- Var(V ) = 2 2
2
+ x2
p p p2
rieure de lintervalle de conance et sous-estime un peu plus
la borne suprieure de cet intervalle. titre dexemple, x2 4
pour une technique de CV 5 % et un MoM de 4,5, lcart est = 4V 2 + 2 x4 = 4V 2 V2 + 2V4
p2 p
de 3,5 % pour la borne infrieure et de 4,7 % pour la borne
suprieure. Ces carts se rduisent 1,5 et 1,7 % pour un CV
de 2 %. Expression de Cov(U2 , V2 )
La dnition gnrale de la covariance permet dcrire pour
toute variable U et V :
Estimation de la variance de Ln(L) partir des
variances et de la covariance des variables Cov(U 2 , V 2 ) = E(U 2 V 2 ) E(U 2 )E(V 2 )

Principe Dune part, on dmontre [5] que :

Comme vu prcdemment, le logarithme du rap- E(U 2 V 2 ) = 2U 2V + 2U V2 + 2U V2 + 4U V Cov(U, V )
port de vraisemblance a pour expression : Ln(L) = Ln + 2[Cov(U, V )]2 + U2 V2
(An /Ap ) + 0,5(V2 U2 ) o U et V sont des fonctions de la
variable X = log(MoM). La variance dduite de la formule de
propagation des erreurs est une approximation base sur un Dautre part, la dnition dune variance permet
dveloppement limit au premier ordre de cette fonction dcrire :
de U et V.
Lobjectif est cette fois de trouver, avec le moins E(U 2 ) = U2 + 2U et E(V 2 ) = V2 + 2V
dapproximations possibles, une expression de la variance
de L en faisant appel aux proprits des variables alatoires. Par suite :
Dans ce qui suit, nous dsignerons trs classiquement
lesprance dune variable X par E(X) ou X et sa variance E(U 2 )E(V 2 ) = (U2 + 2U )(V2 + 2V )
par Var(X) ou par x2 . = U2 V2 + 2V U2 + 2U V2 + 2U 2V
Daprs les proprits dune combinaison linaire de
variables alatoires on peut crire :
Do lexpression suivante pour la covariance :

Var[Ln(L)] = 0, 25 [Var(U 2 ) + Var(V 2 ) 2cov(U 2 , V 2 )] Cov(U 2 , V 2 ) = 4U V Cov(U, V ) + 2[Cov(U, V )]2

En exprimant les deux variances et la covariance de cette Comme les deux variables U et V intervenant dans le cal-
dernire formule en fonction des quantits connues : n , p , cul du risque sont totalement corrles (cest--dire, r = 1)
n , p , x , il est possible dobtenir une estimation de la alors Cov(U,V) =  U  V et donc, daprs lexpression prc-
variance de Ln(L) et donc une estimation de la variance de dente :
L pour tout MoM et pour toute valeur de la prcision de la
technique de dosage. Cov(U 2 , V 2 ) = 4U V U V + 2U2 V2
130 J.-F. Morin et al.

Expression de var[Ln(L)] Les variables intervenant dans le calcul de risque sont


En reportant ces valeurs dans lexpression de la variance du au nombre de quatre ; nous utiliserons la notation U pour
logarithme de L on obtient nalement : les non-T21 (population n ) et V pour les T21 (population
p ), notations indices 1 ou 2 selon le marqueur.
Var[Ln(L)] = 0, 25[Var(U 2 ) + Var(V 2 ) 2Cov(U 2 , V 2 )] Ces variables sont donc les suivantes :
2
x   x  
= (UU VV )2 + 0, 5(U2 V2 ) U1 =
1 1n
, U2 =
1 2n
,
1n 2n
   
Disposant ainsi dune estimation de lcart-type Ln(L) de x1 1p x2 2p
V1 = et V2 =
Ln(L), on peut en dduire, pour Ln(L), un intervalle de 1p 2p
conance au risque 5 % : [Ln(L) 1,96 Ln(L) ; Ln(L) + 1,96
Ln(L) ], toujours sous rserve que la distribution de Ln(L) Les valeurs x sont les log(MoM) dduits des concentra-
soit au moins approximativement gaussienne et que lon tions C1 et C2 ; et sont les moyennes et carts-types des
sache dduire x de lerreur analytique sur la concentra- distributions de log(MoM) dans les populations (n) et (p).
tion. Lintervalle de conance pour L, et donc pour le risque, Les coefcients de corrlation entre les log(MoM) de deux
en dcoule par exponentiation des bornes de cet intervalle. marqueurs sriques sont nots simplement n et p .
Les intervalles de conance calculs par cette dernire for-
mule pour des CV de 2, 5 et 8 % et des MoM allant de Le rapport de vraisemblance
0,1 4,5 ne diffrent, tout au plus, que par la seconde Le rapport de vraisemblance est toujours :
dcimale de ceux obtenus par la formule provenant de la L = (fn [x1 ,x2 ]/fp [x1 ,x2 ]), soit ici :
propagation des erreurs ; cette diffrence inme tient au
  2  2 
1
exp 1
0,5
2
x1 1n
1n
2n x11n x22n + x2 2n
2n
21n 2n 1n2 n 1n 2n
L=   2  2 
x1 1p x1 1p x2 2p x2 2p
1  exp 1
0,5
2 1p
2p 1p 2p
+ 2p
21p 2p 1p2 p

ou plus simplement :
2
fait que le terme 0, 5(U2 V2 ) donne, pour nos erreurs
analytiques, des valeurs ngligeables face au terme An exp{Bn [U12 2n U1 U2 + U22 ]}
(UU VV )2 qui est lexpression de la variance de Ln(L) L=
Ap exp{Bp [V12 2p V1 V2 + V22 ]}
donne par la propagation des erreurs.
Solutions proposes
Erreur sur le risque dans le cas de deux
marqueurs sriques Mthode directe
La rsolution est plus complexe que dans le cas dun seul
Problme et notations marqueur srique car il faut dnir lintervalle de conance
pour L, non plus partir dune seule erreur gaussienne,
Fonction de Gauss deux variables mais dun couple derreurs gaussiennes centres sur MoM1
Le problme est le mme que prcdemment : trouver un et MoM2 .
intervalle de conance pour le risque mesur ; mais il est Comme ces erreurs analytiques e1 et e2 sur les MoM des
plus complexe du fait que la fonction permettant le calcul marqueurs sont indpendantes et gaussiennes, elles consti-
du risque est une densit de Gauss deux variables x1 et x2 tuent des couples dont la loi de densit, produit de leurs
dont lexpression gnrale est la suivante : densits, est :
  2
   1 e1 MoM1
1 0, 5 x1 1 2 f(e1 , e2 ) = 0, 5
f(x1 , x2 ) =  exp 2MoM1 MoM2
exp
MoM1
21 2 1  2 1 2 1
 x  2   2 
x 1  1 x2  2 2 2 e2 MoM2
2 + +
1 2 2 MoM2

Cette fonction dnit dans lespace une surface de rvo-


Les erreurs analytiques et les variables lution autour dun axe perpendiculaire au plan des variables
Il faut ici considrer deux sources derreurs analytiques (e1 , e2 ) et passant par le point de cordonnes (MoM1 , MoM2 )
puisquil y a deux dosages, par exemple hCG (indice 1) et des MoM cibles. La surface est en forme de cloche ; elle est
FP (indice 2) lorsque le calcul est fait au deuxime tri- asymptotique au plan des axes (e1 , e2 ) dans toutes les direc-
mestre. tions. Une section de cette surface par un plan parallle au
Nous supposerons ces erreurs de nature gaussienne, de plan (e1 , e2 ) est un cercle (ce serait une ellipse sil y avait
moyennes gales aux concentrations cibles C1 et C2 que lon une corrlation non nulle entre les erreurs). Tout volume
veut mesurer, dcart-type connu et indpendantes (cest- entre cette surface et le plan (e1 , e2 ) est une probabilit, le
-dire non corrles, ce qui implique C1C2 = 0). volume total entre surface et plan est gal un et le produit
Trisomie 21 : estimation du risque par les marqueurs sriques maternels 131

Comme dans le cas dun seul marqueur, cette premire


approche permet de constater encore :

dune part, leffet amplicateur des fonctions expo-


nentielles sur lerreur analytique : ainsi, pour MoM1 = 1,
MoM2 = 0,5 et CV = 0,05 pour les deux techniques, le
risque calcul admet pour intervalle de conance 95 %
lintervalle [27,2 ; 35,9] ; cet intervalle devient [17,8 ;
20,5] pour MoM2 = 2 ;
dautre part, que lerreur est fonction de la valeur des
MoM, ce qui tait prvisible puisque les CV sont supposs
constants et quen consquence les erreurs analytiques
sont proportionnelles aux concentrations mesures, donc
aux MoM ;
enn, par une analyse plus complte, que lvolution de
lerreur en fonction des valeurs de MoM dpend troite-
ment des caractristiques (moyennes et carts-types) des
log(MoM) des populations non porteuse et porteuse .
Ces intervalles de conance sont donc propres un sys-
tme de mesure des concentrations et un noyau de
calcul et ne peuvent tre utiliss tels quels pour un autre
logiciel de calcul de risque.

Solution utilisant la formule de propagation des


erreurs

Figure 3 a : deux marqueurs ; mthode directe : intervalles Nous avons, comme dans le cas dun seul marqueur, recher-
de conance, au risque 5 %, du rapport de vraisemblance L ch une estimation de la variance de Ln(L), partir du
pour des techniques dont le CV des concentrations est 2 %. logarithme de lexpression suivante :
Lintervalle, exprim en pour cent de L, est dissymtrique par
rapport laxe des abscisses et dautant plus large que MoM2 An exp{Bn [U12 2n U1 U2 + U22 ]}
est faible et que MoM1 est lev ; b : deux marqueurs ; mthode L=
Ap exp{Bp [V12 2p V1 V2 + V22 ]}
directe : intervalles de conance, au risque 5 %, du rapport de
vraisemblance L pour des techniques dont le CV des concen-
trations est 5 %. Lintervalle, exprim en pour cent de L, est cest--dire de :
dissymtrique par rapport laxe des abscisses et dautant plus  
An
large que MoM2 est faible et que MoM1 est lev. Ln(L) = f(U1 , U2 , V1 , V2 ) = Ln
Ap

Bn (U12 2n U1 U2 + U22 ) + Bp (V12 2p V1 V2 + V22 )


dp = f. de1 .de2 est la probabilit dobtenir simultanment un
couple derreurs dans les intervalles de1 et de2 centrs sur Cette expression est une fonction de quatre variables U1 , U2 ,
e1 et e2 . V1 etV2 . Lapplication de la propagation des erreurs donne :
tout couple (e1 , e2 ) correspond une seule valeur de L ;  2  2  2
mais une valeur de L peut rsulter de couples diffrents. f f f
Ln(L)
2
= U1
2
+ U2
2
+ V2 1
An dtablir la distribution des probabilits de la variable U1 U2 V1
L MoM1 et MoM2 donns et e1 , e2 variables, nous avons  2   
procd aux calculs des couples L et dp et tabli ainsi la loi f f f
+ V2 2 + 2cov(U1 , V1 )
de distribution des probabilits de L. Enn, nous en avons V2 U1 V1
dduit les valeurs limites Linf et Lsup ayant des probabilits au   
f f
plus gale 2,5 % dtre dpasses, par valeurs infrieures + 2cov(U2 , V2 )
pour la premire et par valeurs suprieures pour la seconde, U2 V2
dnissant ainsi un intervalle de conance 95 % pour L. La
recherche de ces limites a t effectue pour des techniques Les covariances entre U1 et U2 dune part et entre V1 et V2
de CV variables. dautre part sont nulles puisque les erreurs sur les mesures
Les Fig. 3a et b illustrent les intervalles de conance de deux marqueurs sriques sont supposes indpendantes
obtenus dans lhypothse de deux techniques de CV iden- entre elles.
tiques de 2 % puis de 5 % ; en abscisses, les valeurs de MoM1 ; On peut aussi procder plus simplement en exprimant V1
en ordonnes la variation relative du rapport de vraisem- en fonction de U1 et V2 en fonction de U2 . On ramne ainsi
blance ; pour un MoM1 donn, le MoM2 va dcroissant lorsque lexpression une fonction de deux variables, U1 et U2 , non
lon sloigne de laxe des abscisses. corrles. Cest ce choix que nous avons fait. La variance
132 J.-F. Morin et al.

cherche est alors : variables V (ou U) en fonction de U (ou V) de mme indice,


voici lexpression qui permet le calcul dun intervalle de
 2  2
f f conance pour le rapport de vraisemblance :
Ln(L)
2
= U1
2
+ U2
2
U1 U2
Ln(L)
2
= 4{[Bn (n U2 U1 )U1 + Bp (V1 p V2 )V 1 ]2
avec : + [Bn (n U1 U2 )U2 + Bp (V2 p V1 )V 2 ]2 }
f 1n + 2(Bn U1
2 2
Bp V2 1 ) + 2(Bn U2
2 2
Bp V2 2 )
= 2Bn (n U2 U1 ) + 2Bp (V1 p V2 )
U1 1p
f 2n + 4(Bn n U1 U2 Bp p V 1 V 2 )2
= 2Bn (n U1 U2 ) + 2Bp (V2 p V1 )
U2 2p
On reconnat dans le premier terme de lexpression la
En levant ces drives au carr, puis multipliant la pre- variance donne par la mthode de propagation des erreurs ;
mire par U12
et la seconde par U2
2
en tenant compte de les trois termes supplmentaires sont des termes correctifs
ce que U = (p /n )V pour les marqueurs 1 et 2, on obtient dont nous avons pu vrier, pour le noyau de calcul utilis
lexpression suivante : et les CV et MoM explors, quils sont quasi ngligeables.
Ln(L)
2
= 4{[Bn (n U2 U1 )U1 + Bp (V1 p V2 )V 1 ]2
Discussion
+ [Bn (n U1 U2 )U2 + Bp (V2 p V1 )V 2 ]2 }
Sur lobtention de lcart-type du log(MoM)
Les intervalles de conance pour L recoupent, moins
de 2 % prs au maximum, ceux donns par la mthode que Lexploitation numrique des formules estimant la variance
nous avons qualie de directe . de Ln(L) ncessite de calculer la valeur x = Ln(MoM) partir
de lcart-type ou du CV de la concentration correspon-
Estimation de la variance de Ln(L) partir des dante. Nous avons choisi pour x la valeur du CV de la
variances et covariance des variables concentration (ou de celle du MoM qui lui est gale), mul-
tiplie par 0,4343 pour passer aux logarithmes dcimaux. Il
sagit l dune approximation dduite de la formule de pro-
Principe pagation des erreurs et lon doit sinterroger sur les limites
de cette approximation.
Nous avons repris ici le principe expos pour un seul mar- Pour cela, nous avons procd des simulations num-
queur srique et cherch exprimer la variance du rapport riques de MoM de CV allant de 1 20 % et compar
de vraisemblance L en fonction des donnes du problme. lcart-type des log(MoM) simuls celui prvu par la for-
Cest toujours partir du logarithme de L, soit : mule de propagation.
  Les rsultats indiquent, comme le soulignent de nom-
An
Ln(L) = Ln Bn (U12 2n U1 U2 + U22 ) breux auteurs, que lapproximation est valide jusque pour
Ap
un CV de 10 % : lerreur faite dans lestimation de la variance
+ Bp (V12 2n V1 V2 + V22 ) de log(MoM) pour ce CV nest alors voisine que de 1,2 % ; pour
un CV du MoM (et donc de la concentration) de 20 %, cette
erreur est en revanche plus importante : de lordre de 6 %.
que nous avons cherch une formulation pour la variance du Comme toutes les techniques de dosage actuellement
rapport de vraisemblance. utilises pour lestimation du risque de T21 ftale ont
des CV intra-srie infrieurs 10 % ou mme 5 %, on peut
Expression accepter sans rserve la formule estimant lcart-type du
log(MoM).
Daprs lexpression prcdente, cette variance est : Cette approximation est toujours valide, mme utilise
deux fois comme cest le cas dans lusage de deux marqueurs
Var[Ln(L)] = Var[Bn (U12 2n U1 U2 + U22 )
sriques. Elle est cependant lorigine de lgres diff-
+ Bp (V12 2n V1 V2 + V22 )]. rences observes entre les intervalles de conance calculs
par la mthode directe et par les deux autres mthodes.
Le travail consiste donc exprimer en fonction des carac-
tristiques des populations et de lerreur analytique de deux Sur la validit des expressions proposes pour la
marqueurs : variance de Ln(L)

les variances des six variables U12 , U1 U2 , U22 , V12 , V1 V2 et V22 ; Les expressions proposes pour estimer la variance du loga-
les 15 covariances qui tiennent compte des corrlations rithme du rapport de vraisemblance dcoulent de calculs
entre elles. assez simples quand on ne considre quun seul marqueur.
En revanche, pour deux marqueurs, les calculs sont plus
Sans entrer dans le dtail des calculs particulire- complexes comme nous lavons dj soulign, tout parti-
ment fastidieux, qui peuvent tre allgs en exprimant les culirement pour lapproche reposant sur les variances et
Trisomie 21 : estimation du risque par les marqueurs sriques maternels 133

covariances de la combinaison linaire dnissant Ln(L) :


titre dinformation chacune des 15 covariances dveloppes
se compose de dix termes.
Cest pourquoi nous avons voulu vrier les formules
proposes, non seulement en les comparant ceux don-
ns par la mthode directe , mais aussi par simulations
dchantillons de MoM allant de 0,1 5 et pour des CV allant
de 1 10 % ; les variances des chantillons simuls, de taille
5000, sont en plein accord ( 0,001 prs) avec les rsultats
donns par les expressions proposes.

Sur la distribution statistique des valeurs de Ln(L)

Calculer un intervalle de conance au risque 5 % pour


le logarithme du rapport de vraisemblance L partir de Figure 4 Ajustement gaussien 2000 valeurs de Ln(L) obte-
lexpression : Ln(L) 1,96 Ln(L) suppose en toute rigueur nues par simulation numrique. Lapproximation gaussienne se
que les valeurs Ln(L) se dispersent selon une loi de Gauss. De rvle sufsante pour dnir classiquement un intervalle de
la mme manire, un rsultat accompagn dun cart-type conance pour le risque.
est gnralement interprt par le lecteur comme dnis-
sant un intervalle symtrique autour de la valeur trouve.
On peut admettre sans difcult que les concentrations
Sur le choix de la mthode retenir
mesures et les MoM qui sen dduisent suivent la loi des
erreurs de Gauss. Mais, dans les calculs, cest x = log(MoM)
qui intervient, et de surcrot, dans des expressions quadra- La mthode directe, qui peut ici servir de rfrence, est
tiques U2 ,V2 ,U1 U2 et V1 V2 . simple dans son principe et donne directement un intervalle
Lanalyse de U2 montre que cette variable prsente une de conance fonction des caractristiques des techniques de
dissymtrie droite trs prononce ( limage dune loi du dosage et de celles des populations T21 et non-T21. Elle est
Khi2 ) lorsque x = n ; le rsultat est le mme pout V2 lorsque dusage difcile pour deux marqueurs ou plus.
x = p . En dehors de ces valeurs, la combinaison linaire La mthode par propagation des erreurs fournit une trs
de lune ou lautre de ces deux variables est quasi sym- bonne approximation, sufsante pour accompagner le risque
trique ; de plus, comme x ne peut avoir simultanment calcul dun intervalle de conance ou simplement dun
les deux valeurs prcdentes, on constate que la combi- cart-type.
naison linaire est quasi symtrique quelles que soient les La mthode exacte aboutit une formule plus
valeurs de x. De fait, un intervalle de conance calcul complexe qui ne prsente pas un rel avantage par rapport
partir de lexpression usuelle Ln(L) 1,96 Ln(L) recoupe la prcdente pour les MoM explors et avec le noyau de
quelques pour cent prs celui obtenu directement partir calcul utilis.
de la mthode que nous avons qualie de directe .
Dans le cas de deux marqueurs, la combinaison linaire
qui exprime Ln(L) fait intervenir en outre des variables Le cas de trois marqueurs du premier
produits (U1 U2 et V1 V2 ) dont les distributions statistiques, trimestre
en accent circonexe , sont trs diffrentes du modle
gaussien ; cependant, leurs participations la combinaison Actuellement, au premier trimestre de grossesse, deux
linaire restent modestes du fait que ces variables sont mul- marqueurs sriques (FhCG et PAPP-A) et un marqueur cho-
tiplies par des coefcients de corrlation (n et p ) de graphique (CN : clart nucale) sont utiliss. Comme le calcul
valeurs voisines de zro. au premier trimestre remplace progressivement celui du
Finalement, les simulations dans la zone des MoM1 deuxime trimestre, il est donc indispensable, pour tre
et MoM2 explors (0,1 5) montrent que lon peut complet, de proposer ici une estimation de lerreur sur le
admettre lapproximation gaussienne et utiliser lexpression risque calcul partir de ces trois marqueurs.
Ln(L) 1,96 Ln(L) pour dnir un intervalle de conance Cette estimation est facilite par le fait que le marqueur
pour Ln(L) et donc pour L et enn pour le risque. La Fig. 4 chographique nest pas corrl aux marqueurs sriques. En
illustre une distribution de 2000 valeurs simules de Ln(L) ; consquence, le rapport de vraisemblance calcul (L) nest
bien que lgrement dissymtrique, comme le prouvent les rien dautre que le produit du rapport de vraisemblance de
tests statistiques, elle montre une adquation sufsante deux marqueurs sriques par celui de la CN, soit : L = L12 LCN .
la loi de Gauss pour calculer un intervalle de conance selon Prenant le logarithme de cette expression, on obtient :
le mode usuel. Ln(L) = Ln(L12 ) + Ln(LCN ). Comme la variance dune somme de
Ainsi, titre dindication numrique, pour des techniques variables alatoires indpendantes est la somme de leurs
de CV 2 %, lutilisation de lcart-type donne des intervalles variances respectives, on a donc :
de conance dont le dcalage, positif par rapport ceux
dduits de la mthode directe et des simulations, ne
dpasse pas 2 %. Ln(L)
2
= Ln(L12)
2
+ Ln(LCN)
2
134 J.-F. Morin et al.

Ln(L12)
2
se dduisant de lexpression de la variance don- cette amplication peut laisser sceptique quant lintrt
ne pour deux marqueurs biologiques corrls et Ln(LCN)
2
de de multiplier le nombre de marqueurs pour valuer le risque.
la variance propose pour un seul marqueur, ici chogra- Si les intervalles de conance dpendent bien videm-
phique. On en dduit alors un cart-type puis un intervalle ment du prol dimprcision des techniques, il est bon de
de conance pour le rapport L et enn pour le risque calcul. rappeler quils dpendent aussi des caractristiques des
Cette facon de procder pourrait tre applique un populations de log de MoM : les valeurs numriques annon-
marqueur supplmentaire, non corrl aux autres. Dans le ces dans cet article et la forme des courbes traces sont
cas dune corrlation, il faudrait dvelopper des calculs plus propres au choix fait, pour simplication, dun CV constant ;
complexes. elles dpendent donc aussi du noyau de calcul exploit ;
mais comme les noyaux de calcul diffrent peu dun logiciel
lautre, il faut sattendre trouver gnralement, CV
Conclusion gaux, des intervalles de conance proches de ceux donns
dans cet article.
Cest la demande de plusieurs biologistes agrs, dsireux
de disposer dun moyen pour calculer lincertitude sur le Conits dintrts
risque de T21 ftale calcul, que nous avons entrepris ce
travail, suivant en cela les recommandations du groupe de Aucun.
travail de la Socit francaise de biologie clinique [4].
Nous avons voulu procder une analyse aussi complte
que possible du problme et proposer plusieurs solutions
Remerciements
donnant aux biologistes ainsi quaux concepteurs de logiciels
plusieurs approches possibles pour estimer lerreur statis- Les auteurs remercient la socit Brahms-France et les bio-
tique sur le risque calcul. logistes du club Kryptor qui ont encourag et sollicit ce
Nous avons voulu galement une dmarche didactique travail.
montrant comment il est possible datteindre une valeur
approche dun cart-type lorsque le rsultat dnitif Rfrences
rsulte dun calcul qui peut tre relativement complexe
comme cest le cas du rapport de vraisemblance. [1] Benn AP, Collins R. Evaluation of effect of analytical impreci-
Les formules dveloppes permettent daccompagner le sion in maternal serum screening for Downs syndrome. Ann Clin
risque calcul dun cart-type dduit des erreurs analy- Biochem 2001;38:2836.
tiques sur les marqueurs. Elles permettent aussi, par un test [2] Besnard JC, Morin JF. Immunostat. Outils statistiques en
statistique, de comparer entre eux des risques calculs immuno-analyse. Nucleon 1997.
[3] Commissariat lnergie atomique. Statistique applique
partir de techniques identiques ou diffrentes et de dter-
lexploitation des measures. Masson; 1978.
miner si la diffrence observe est imputable aux seules
[4] Giroud C, Dumontel M, Vassault A, Braconnier F, Frard G.
erreurs analytiques. Enn, dans le cas o un risque calcul Recommandations relatives lexpression de lincertitude de
est proche de la valeur seuil, elles peuvent ventuellement mesure des rsultats quantitatifs en biologie mdicale. Ann Biol
aider le biologiste dcider du contrle du rsultat par un Clin 2007;65:185200.
nouveau dosage. [5] Goodman LA. On the exact variance of products. J Am Statist
Les rsultats obtenus soulignent combien lerreur analy- Ass 1960;55:708.
tique des dosages est amplie lorsque lon passe au risque [6] Morin V, Morin JF, Moineau MP, Codet JP. Lvaluation du risque
calcul : une erreur de 5 % sur chacun des deux dosages de trisomie 21 explore par simulation numrique alatoire.
nimplique pas une erreur nale de 10 % sur le risque cal- Immunoanal Biol Spec 1999;14:16674.
[7] Morin V, Morin JF, Moineau MP, Codet JP. Dtermination par
cul partir de deux marqueurs comme pourrait le penser
rchantillonnage bootstrap de la statistique des mdianes
un esprit peu averti, mais peut atteindre des valeurs de
utiles au calcul de risque de trisomie 21 laide des marqueurs
30 % ou plus selon les MoM observs. Cette amplication sriques maternels. Immunoanal Biol Spec 1999;14:4016.
des erreurs analytiques, dj souligne dans la littrature [8] Serdar MA, Ttnc L, Olgun A, Hasimi A, Ozgurtas T, Erbil MK.
[8,9], montre combien le biologiste doit soigner ses mesures The effects of analytical factors on second trimester risk esti-
et tre exigeant vis--vis des fabricants de ractifs : les CV mations. Int J Gynecol Obstet 2006;93:2832.
intra-srie ne doivent pas dpasser quelques pourcents et [9] Spencer K. The use of risk as a QC parameter in Downs syndrome
les CV inter-srie doivent tre bien matriss ; par ailleurs, screening programs. Clin Biochem Rev 1993;14:343.