Études
Publié le 31 aoû 2010Lecture 11 min
Un lexique simple pour décrypter les essais cliniques
L. MONNIER, C. COLETTE, Institut universitaire de recherche clinique, Montpellier.
Un médicament est toujours un produit chimique dont l’utilisation doit avoir le maximum d’effets bénéfiques (efficacité) et le minimum d’effets secondaires (sécurité). L’évaluation du rapport bénéfice/risque est particulièrement importante lorsqu’il s’agit de médicaments destinés au traitement des maladies chroniques et des perturbations métaboliques susceptibles d’entraîner des pathologies dégénératives comme les maladies cardiovasculaires en particulier. Les traitements par antidiabétiques, hypolipidémiants ou antihypertenseurs répondent à ce type de préoccupation car leur prescription est en général programmée sur de nombreuses années. Les évaluer par des essais thérapeutiques est donc une impérieuse nécessité.
C'est pour cette raison que les grandes revues médicales internationales à haut point d’impact (New England Journal of Medicine, JAMA, Lancet, etc.) sont en permanence inondées par des articles comparant plusieurs médicaments entre eux (en général deux) ou un médicament contre un placebo. Les essais randomisés, en double aveugle, sont pratiqués en général sur un grand nombre de sujets (parfois plusieurs milliers) étudiés sur une longue période de temps (quelques années). L’évaluation porte en général sur des critères forts : réduction de la mortalité globale et cardiovasculaire, baisse de la morbidité jugée en général sur la fréquence de survenue d’accidents médicaux sévères (cardiovasculaires).
L’évaluation ne doit pas se limiter aux seuls critères d’efficacité, mais elle devrait être élargie à d’autres critères d’évaluation que l’on peut regrouper sous le vocable général d’efficience. Il convient de savoir que l’efficience d’un médicament est la somme de 5 paramètres : efficacité + sécurité + satisfaction du patient + qualité de vie du patient + rapport bénéfice/prix.
Dans la plupart des cas, les grands essais thérapeutiques sont focalisés sur les deux premiers paramètres dont l’évaluation est relativement aisée. L’analyse de la satisfaction du patient, de sa qualité de vie et le rapport bénéfice/prix est rarement réalisée en première intention car trop subjective pour les deux premiers ou trop longue à mettre en œuvre pour les considérations économiques.
C’est donc sur les deux premiers critères que nous focaliserons notre propos en essayant de donner quelques informations simples permettant aux médecins praticiens d’interpréter les données.
Le but est de leur permettre de saisir les messages essentiels de l’essai clinique, tout en évitant de tomber dans les pièges tendus par la propagation de données tronquées. Ces dernières peuvent être à charge ou à décharge pour le médicament. Ainsi, il n’est pas rare de voir certaines propriétés accessoires d’un médicament (effets pléiotropes) être mises en exergue pour le valoriser par rapport à un concurrent qui a la même action sur le critère principal mais qui aurait des effets pléiotropes nuls ou moindres. Ce type d’argument a longtemps été utilisé pour la promotion de certaines statines par rapport à d’autres. À l’inverse, certains effets secondaires sont parfois minorés dans les essais thérapeutiques randomisés qui excluent les sujets souffrant de plusieurs pathologies et soumis à des multithérapies.
Au terme de cette introduction, les essais thérapeutiques sont indispensables, mais leurs conclusions doivent être interprétées avec attention. Pour offrir un lexique clair, nous envisagerons l’essai clinique avant et au moment de sa mise en œuvre, et lors de l’analyse des résultats et de leur publication.
L’essai clinique avant sa mise en œuvre
Les études cliniques appartiennent à plusieurs grandes catégories selon leur niveau de preuves dicté par la médecine factuelle ou « evidence based medicine ».
Le niveau de preuves
Il est dit fort, de niveau A, dans les études d’intervention randomisées, de longue durée, le résultat étant évalué sur un critère fort du type accident cardiovasculaire mortel ou non mortel. Il est dit moyen, de niveau B ou C, dans les suivis de cohortes, les études courtes, les études épidémiologiques et physiopathologiques.
Les études observationnelles sont en général jugées comme ayant un faible niveau de preuves. C’est pourtant grâce à l’observation pure qu’ont été réalisées de grandes découvertes : la découverte de la pénicilline par Fleming en est un exemple. Plus récemment, l’identification des encéphalopathies spongiformes transmissibles d’origine animale a été faite par Gajdusek (prix Nobel de médecine 1976) pour sa description du Kuru dans des tribus de Nouvelle Guinée se livrant au cannibalisme rituel sur les personnes venant de décéder.
Les études de niveau A sont donc le « gold standard » des essais cliniques. Le plus souvent, il s’agit de comparer deux traitements A et B ou plus rarement aujourd’hui de comparer un médicament (principe actif) contre un placebo (principe inactif par définition). Pour que l’étude soit méthodologiquement irréprochable, plusieurs conditions doivent être remplies.
Conditions à remplir
La randomisation
Elle peut être réalisée en « aveugle » ou en double « aveugle ». En double aveugle, ni le médecin ni le patient ne connaissent le bras (thérapeutique ou placebo) dans lequel le patient a été tiré au sort. Dans les essais en aveugle, le patient n’est pas au courant tandis que le médecin est informé. Dans certains cas, l’aveugle est impossible, par exemple quand il y a tirage au sort entre deux schémas thérapeutiques insuliniques : schéma prandial versus schéma basal1. Le malade et le médecin doivent connaître le groupe d’affectation du patient dans la mesure où le nombre d’injections et l’adaptation des doses dépendent du schéma thérapeutique. D’autres études comme les comparaisons de deux statines, de deux antihypertenseurs ou de deux antidiabétiques oraux peuvent être parfaitement conduits en double aveugle.
Le choix du comparateur
Le médicament à tester doit être évalué soit par rapport à un autre médicament, soit par rapport à un placebo, c’est-à-dire à un comparateur. Le choix du comparateur n’est donc pas anodin dans la mesure où l’étude est en général faite pour démontrer la supériorité du médicament à tester par rapport à un placebo ou à un autre médicament. Dès lors, deux attitudes diamétralement opposées peuvent être envisagées. Pour le scientifique rigoureux, le mieux est de choisir comme comparateur celui qui est connu comme étant le plus actif avec le moins d’effets secondaires. Dans ce cas, on tente de démontrer la supériorité du médicament à tester par rapport à ce qui se fait de mieux dans le domaine. Ce concept, qui paraît logique, n’est pas toujours appliqué parce que les industriels, qui sont le plus souvent les bailleurs de fonds des essais cliniques médicamenteux, ont tendance à choisir comme comparateur un médicament grâce auquel la comparaison a des chances d’être à l’avantage du médicament à tester.
Le choix de la population étudiée
Il dépend de la nature de l’essai clinique et du type de médicament à tester. Quand il s’agit de tester un médicament permettant théoriquement de prévenir les maladies cardiovasculaires (antidiabétique oral, hypocholestérolémiant, antihypertenseur, etc.), la population doit avoir un risque suffisant pour développer un accident cardiovasculaire dans les années à venir afin que les données soient interprétables à la fin de l’étude, au bout de quelques années.
Si le risque de départ est trop faible, le nombre d’accidents sera faible à la fin de l’étude et la comparaison des deux groupes (médicament à tester vs comparateur) sera difficilement possible sauf si on augmente considérablement le nombre de sujets dans chaque groupe. À l’inverse, si le risque de départ est trop fort, le nombre d’accidents sera trop élevé et l’effet du médicament à tester sera noyé dans le bruit de fond élevé du nombre d’accidents observés dans la population choisie.
En pratique, cela signifie que la population choisie doit être suffisamment âgée mais pas trop. De nombreuses études sont conduites chez des sujets dont l’âge moyen se situe aux alentours de 60-65 ans. Le choix de la population est, bien sûr, guidé par le type d’intervention (prévention primaire, prévention secondaire, etc.) ou par le type de médicaments. Il va de soi qu’un essai de prévention primaire sera effectué chez des personnes exemptes de tout signe de pathologie cardiovasculaire alors qu’un essai de prévention secondaire s’adressera à des patients déjà porteurs d’une pathologie cardiovasculaire.
De même le type de médicament conditionne le choix des patients à inclure dans l’essai : hypertendus, diabétiques, hyper- cholestérolémiques, selon que l’essai concerne des antihypertenseurs, des antidiabétiques oraux ou des hypolipidémiants.
Le niveau de départ des perturbations cliniques (hypertension artérielle) ou biologiques (HbA1c, taux de LDL-cholestérol) conditionne également le choix de la population étudiée. En général, comme pour les autres paramètres, tels que l’âge, les perturbations cliniques doivent être à un niveau moyen. Pour l’HbA1c, la moyenne au départ se situe souvent aux alentours de 8 %.
La notion de risque absolu
Au niveau de la population, les événements médicaux sont des phénomènes probabilistes (régis par la loi du hasard) et non déterministes. Si nous considérons l’effet d’un médicament sur le risque de présenter un événement donné, par exemple un accident cardiovasculaire, le risque doit être envisagé à deux niveaux :
– au niveau individuel, ce risque est régi par une loi du « tout ou rien » ;
– au niveau collectif, pour un groupe d’individus, ce risque est régi par des lois statistiques.
Il faut donc définir la probabilité pour un individu du groupe de faire un événement donné. Cette probabilité (P) s’exprime par le rapport P = n/N où N est le nombre total de sujets et n est le nombre de sujets qui vont présenter l’événement sur une période de temps donnée. Cette probabilité est encore appelée incidence de l’événement ou risque absolu (RA). Son mode d’expression est en pourcentage. On dira par exemple que, dans telle population, le risque absolu de réaliser un accident cardiovasculaire mortel ou non mortel est de 10 %, ce qui signifie que sur 100 sujets (N), 10 (n) feront statistiquement un accident cardiovasculaire. Le risque absolu dépend évidemment de la période de temps : 5 ans, par exemple.
La notion d’intervalle de confiance (en général à 95 %)
La probabilité (P) de faire un événement donné est une quantité statistique, ce qui signifie que, toutes choses étant égales par ailleurs, le résultat va être dispersé de manière statistique autour d’une moyenne ou d’une médiane. Cette dispersion peut être évaluée par plusieurs index : la déviation standard, l’intervalle de confiance. Dans les essais thérapeutiques, c’est le plus souvent l’intervalle de confiance (IC) à 95 % qui est utilisé.
Pour mieux comprendre la signification de l’IC à 95 %, considérons 100 populations de 1 000 sujets chacune ayant exactement les mêmes caractéristiques démographiques, cliniques et biologiques. Si on suit ces populations pendant 5 ans, le risque absolu de faire un événement donné (accident cardiovasculaire) sera différent dans chaque population :
– P1 = n1/1 000 pour la première population ;
– P2 = n2/1 000 pour la deuxième population ;
– P100 = n100/1 000 pour la centième population.
La moyenne des résultats P1, P2… P100 sera par exemple égale à 10 % et, autour de cette moyenne, 95 % des résultats obtenus seront par exemple compris entre 6 et 14 %. Le risque absolu de la population est ainsi défini par sa moyenne 10 % et son intervalle de confiance à 95 % [6-14 %].
Pour déterminer ces deux quantités, il faudrait donc suivre pendant 5 ans 100 populations de 1 000 sujets, soit 100 000 personnes. Pour éviter ce type de détermination qui nécessite un nombre de sujets considérable, il est possible de calculer le risque absolu moyen approximatif en suivant une seule population de 1 000 sujets et en calculant l’IC à 95 % à partir d’une formule que nous ne donnerons pas mais où l’intervalle de confiance est inversement proportionnel au nombre N de sujets qui ont été inclus dans le suivi : IC = f(k/N)2. Ainsi, à partir d’une seule étude (sur 1 000 sujets par exemple), il est possible de calculer le risque absolu moyen et l’IC à 95 %.
Toutefois, il convient de noter que l’IC à 95 % dépend du nombre de sujets N. L’IC est d’autant plus petit que le nombre de sujets est élevé et d’autant plus grand que le nombre de sujets est faible. Ce dernier point est important pour le calcul du nombre de sujets à introduire dans un essai thérapeutique.
La notion de risque relatif et le calcul du nombre de sujets
Le risque relatif (RR) est défini par le rapport des risques absolus de développer un événement (accident cardiovasculaire, par exemple) dans deux groupes de sujets traités, l’un par le médicament à tester et l’autre par un comparateur.
Supposons que le nombre de sujets inclus dans le groupe médicament à tester soit égal à N1 et que le nombre d’événements au bout de 5 ans soit égal à n1, on en déduit que l’incidence des événements, ou risque absolu des événements, dans le groupe 1 (médicament à tester) est égal à n1/N1 = RA1.
Dans le groupe comparateur (groupe 2), le risque absolu est RA2 = n2/N2.
Le rapport des deux risques absolus [n1/N1]/[n2/N2] = RA1/RA2 est le risque relatif de développer un événement dans le groupe 1 par rapport au groupe 2 de référence.
Le risque est égal dans les groupes 1 et 2 lorsque le rapport (risque relatif) est égal à 1. Un risque inférieur à 1 indique que le risque de développer un événement donné est plus faible dans le groupe 1 que dans le groupe 2 (par exemple 0,7) (figure). La réduction du risque relatif (RRR) dans le groupe 1 par rapport au groupe 2 s’exprime par la différence entre 1 et le risque relatif observé quand le groupe 1 est comparé au groupe 2. Dans l’exemple ci dessus, la RRR est égal à 1 – 0,7 soit 0,3 par rapport au groupe 2 (30 %) (figure).
Pour que cette réduction du risque ait une signification statistique, encore faut-il que l’IC à 95 % du RR ne « morde » pas sur la ligne de neutralité qui est égale à 1. Reprenons l’exemple précédent. Le risque relatif du groupe 1 par rapport au groupe 2 est égal à 0,7. Comme le risque absolu, le risque relatif est une grandeur statistique dont on peut calculer l’IC à 95 %. Supposons que les valeurs extrêmes de l’IC soient 0,6 et 0,8 pour le risque relatif (figure). Dans ce cas, la réduction du risque relatif est significative. Si le résultat avait été 0,5 et 1,05, la réduction du risque relatif (- 30 %) n’aurait pas été significative mais elle aurait pu le devenir en augmentant le nombre de sujets inclus dans les deux groupes de l’essai thérapeutique. En augmentant le nombre de sujets, on diminue l’IC à 95 % puisque le calcul de l’IC à 95 % est régi par la formule IC = f (k/N).
C’est ainsi qu’une étude non significative avec 1 000 sujets peut le devenir avec 10 000.
L’inconvénient vient du fait que certaines études peuvent nécessiter un nombre considérable de sujets avec des coûts de plus en plus exorbitants. Lorsque la différence de RA entre les groupes 1 et 2 est faible, la réduction du risque relatif est modeste. Dans ces conditions, on a intérêt à avoir des IC à 95 % faibles. C’est ce qui explique que les études actuelles qui tentent de démontrer des effets bénéfiques pour un médicament à tester peu différent du comparateur aient besoin d’un nombre important d’individus. Les premiers essais thérapeutiques comme WOSCOPS3 (pravastatine en prévention primaire) ou 4S4 (simvastatine en prévention secondaire) avaient besoin de 3 000 à 4 000 sujets. Les études actuelles dépassent les 10 000 sujets et l’escalade est loin d’être terminée.
Figure. Risque relatif (RR), intervalle de confiance (IC) à 95% et réduction du risque relatif.
Cas n° 1 : La réduction du risque relatif est significative (c’est-à-dire en faveur du médicament à tester) car le risque relatif est inférieur à 1 et l’intervalle de confiance ne coupe pas la ligne de neutralité (RR = 1). Cas n° 2 : La réduction du risque relatif n’est pas significative car, bien que le RR soit < 1, l’IC coupe la ligne de neutralité.
Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.
pour voir la suite, inscrivez-vous gratuitement.
Si vous êtes déjà inscrit,
connectez vous :
Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :