Thérapeutique
Publié le 31 mar 2015Lecture 15 min
Évaluation des médicaments : faut-il encore raisonner en termes de risque relatif ?
L. MONNIER, C. COLETTE, Institut universitaire de recherche clinique, Montpellier
L’effet des médicaments est de plus en plus jugé sur des études d’intervention randomisées consistant à comparer un médicament à tester contre un comparateur actif (médicament considéré comme référence) ou un placebo. Dans le domaine des maladies chroniques comme le diabète sucré ou dans les états dyslipidémiques, ces études revêtent une grande importance car elles sont nécessaires pour justifier l’utilisation au long cours d’un médicament hypoglycémiant ou hypolipidémiant. Leur prescription n’est justifiée que si leur efficacité est prouvée sur des critères dits « durs » : réduction de l’incidence des complications micro- et macroangiopathiques dans le diabète sucré, diminution du risque de survenue d’accidents cardiovasculaires mortels ou non mortels dans les dyslipidémies.
Une observation fondamentale
L’interprétation d’un résultat dépend de son mode d’expression
Dans les années 90, les statines ont commencé à être testées chez des sujets hypercholestérolémiques en prévention primaire et secondaire(1-5). Ces études d’intervention, conduites avec la simvastatine, la pravastatine et la lovastatine sur de larges populations, ont montré que les statines entraînent une baisse des taux plasmatiques de cholestérol total et de LDL-C. Cette diminution est accompagnée d’une réduction du risque relatif (RR) de survenue d’événements cardiovasculaires mortels ou non mortels (figure 1). Les résultats indiqués sur cette figure suscitent une première remarque. Quel que soit le type d’intervention, primaire (dans l’étude WOSCOPS(1) et AFCAPS/TexCAPS(2)) ou secondaire (dans les études 4S(3), LIPID(4) ou CARE(5)), la réduction du risque relatif (RRR) était du même ordre de grandeur (aux alentours de 30 %) en dépit de quelques différences d’une étude à l’autre. En revanche, les résultats deviennent très différents (figure 2) lorsque les résultats sont exprimés en nombre de sujets à traiter (Number needed to treat, NNT) par simvastatine, pravastatine ou lovastatine pour éviter un accident cardiovasculaire mortel ou non mortel chez l’un d’entre eux. Cette analyse montre que le nombre de sujets hypercholestérolémiques à traiter est nettement plus faible dans les études de prévention secondaire que dans les études de prévention primaire.
Figure 1. Diminution du risque relatif d’événement cardiovasculaire mortel ou non mortel dans 5 études d’intervention randomisées (statine versus placebo). Les études 4S, LIPID et CARE sont des études de prévention secondaire chez des patients ayant une hypercholestérolémie franche dans l’étude 4S(3) ou modérée dans l’étude LIPID(4). Dans l’étude CARE(5), aucun des patients recrutés ne présentait d’hypercholestérolémie. Les études WOSCOPS(1) et AFCAPS/TexCAPS(2) sont des études de prévention primaire. Dans l’étude WOSCOPS, les sujets étaient tous hypercholestérolémiques alors que le cholestérol total était subnormal dans l’étude AFCAPS/TexCAPS.
Figure 2. Relation entre le risque cardiovasculaire absolu avant traitement (x) et le nombre de sujets à traiter (y) par statine pour prévenir la survenue d’un accident coronarien mortel ou non mortel chez l’un d’entre eux. Synthèse des études 4S ; LIPID, CARE (études de prévention secondaire), WOSCOPS et AFCAPS/TexCAPS (études de prévention primaire).
Cette première remarque indique clairement que la « rentabilité » du traitement est plus forte quand on fait une prévention ciblée sur des sujets déjà porteurs de complications cardiovasculaires. En revanche, la « rentabilité » du traitement devient beaucoup plus faible quand le traitement est prescrit à un sujet cliniquement exempt de signes d’affection cardiovasculaire.
Cette observation peut être quantifiée en établissant la relation entre le nombre de sujets à traiter pour éviter un accident cardiovasculaire (NNT) et le risque absolu, c’est-à-dire l’incidence des événements cardiovasculaires dans la population sélectionnée, si elle n’était pas traitée par statine (figure 2). En effet, il est évident que le risque absolu est proportionnel au degré de l’hypercholestérolémie et qu’il est beaucoup plus élevé chez les sujets déjà porteurs de complications cardiovasculaires. La relation inverse entre le nombre de sujets à traiter pour éviter un accident et le risque absolu, indiquée sur la figure 2, montre clairement que les personnes les plus « fragiles », c’està- dire celles qui sont en prévention secondaire (4S, LIPID et CARE), sont celles qui ont le plus de chance de bénéficier d’un traitement par statines. À l’inverse, le nombre de sujets requis pour éviter un accident cardiovasculaire est plus élevé dans les études de prévention primaire (WOSCOPS et AFCAPS/TexCAPS). De plus, à l’intérieur des 2 grandes catégories d’études (prévention primaire ou secondaire), il convient de distinguer celles dans lesquelles les sujets ont des taux plasmatiques de cholestérol, soit élevés, soit subnormaux.
Le risque absolu d’accident vasculaire est plus élevé dans les études où les sujets sont hypercholestérolémiques en prévention secondaire. C’est dans ce type de population que le nombre de sujets à traiter est le plus faible pour éviter un événement chez l’un d’entre eux. En revanche, le risque absolu d’accident vasculaire est plus faible pour les sujets en prévention primaire ayant un taux de cholestérol normal ou subnormal. C’est dans ce type de population que le nombre de sujets à traiter est le plus fort pour éviter un événement chez l’un d’entre eux.
C’est pour cette raison que dans le groupe prévention primaire (3 études) on observe l’échelle de « rentabilité » suivante : l’étude 4S (CT 2,13 et 3,10 g/l) est plus « rentable » que LIPID (CT 1,55 et 2,71 g/l) qui ellemême est plus rentable que CARE (CT < 2,40 g/l au moment de l’introduction dans l’étude) (figure 2). Dans les 2 études de prévention primaire, l’échelle de « rentabilité » est la suivante : les statines ont montré une meilleure rentabilité dans WOSCOPS (sujets recrutés sur la base d’un CT > 2,4 g/l) que dans l’étude AFCAPS/TexCAPS où le recrutement a porté sur des personnes dont les taux plasmatiques de CT étaient compris entre 1,80 et 2,64 g/l (figure 2). Bien que ces études soient relativement anciennes (une vingtaine d’années environ), leurs résultats n’ont jamais été démentis par les essais ultérieurs d’intervention par statines.
Ces observations, faites dans le domaine de la prévention cardiovasculaire chez des personnes ayant une hypercholestérolémie, sont-elles extrapolables à d’autres pathologies comme le diabète sucré ? En d’autres termes, chez les patients diabétiques, quel critère devrait-on prendre en compte pour établir le rationnel d’une stratégie thérapeutique ou d’un médicament antidiabétique : la réduction du risque relatif ? Le nombre de sujets à traiter ? Ou une combinaison des 2 critères ?
Avant d’envisager cette discussion sur le choix du critère, il convient de rappeler de manière brève la méthode de calcul de la réduction du risque relatif et du nombre de sujets à traiter par un médicament donné pour éviter un événement chez l’un d’entre eux.
Le lexique de décryptage des essais cliniques randomisés avec comparaison d’un médicament donné contre un comparateur
Mesure du risque absolu d’événement cardiovasculaire dans une population donnée
Le risque absolu (RA) est défini comme la probabilité (P) pour un individu d’un groupe donné d’être touché par un accident, cardiovasculaire, par exemple. Dans ces conditions, si on considère un groupe constitué par N individus et si, au bout d’un temps t, n sujets ont fait un accident cardiovasculaire, le RA est égal à n/N.
Mesure du risque relatif d’événement dans un groupe d’individus par rapport à un autre
Le risque relatif (RR) de réaliser un événement cardiovasculaire dans un groupe d’individus 1 par rapport à un groupe 2 est le rapport des risques absolus dans les deux groupes : RA1/RA2. Le plus souvent, le calcul du RR du groupe 1 par rapport au groupe 2 est utilisé pour comparer un groupe de sujets traités par un traitement dont on souhaite évaluer l’efficacité (groupe 1) et un groupe de sujets (groupe 2) traités par un comparateur (traitement actif ou placebo). Si le groupe 1 fait moins d’accidents cardiovasculaires que le groupe 2, on exprime cette différence par la réduction du risque relatif égale à (1-RA1/RA2) x 100 (figure 3).
Figure 3. Représentation schématique de la réduction du risque relatif (RRR). Dans le cas présent, le risque relatif (RR) du traitement 1 par rapport au traitement 2 (rapport des risques absolus de 1 par rapport à 2) est égal à 0,3 ; la réduction du risque relatif est de -70 %. L’intervalle de confiance à 95 % (IC95 %) ne coupe pas la ligne de neutralité (RR = 1). Le résultat est considéré comme significatif. Le traitement 1 est supérieur au traitement 2. Si le rapport RA1/RA2 était > 1, ceci signifierait que le traitement 2 est supérieur au traitement 1.
Pour mieux appréhender le concept de risque absolu et de risque relatif, prenons l’exemple de l’étude WOSCOPS(1). Cet essai d’intervention a été réalisé chez 6 595 sujets ayant une hypercholestérolémie (CT > 2,4 g/l) mais exempts de toute manifestation cardiovasculaire au moment de l’entrée dans l’essai thérapeutique. Les sujets sélectionnés ont ensuite été tirés au sort pour être affectés soit au groupe 1 traité par pravastatine (n1 = 3 302) soit au groupe 2 (placebo, n2 = 3 293). Au bout de 5 ans, les nombres d’infarctus du myocarde et de décès d’origine cardiovasculaire (critère principal d’évaluation finale) ont été respectivement égaux à n1 = 174 et n2 = 248 dans les groupes 1 et 2. Les risques absolus dans les 2 groupes sont respectivement égaux à 174/3 302 = 5,2 % et 248/3 293 = 7,5 %. Ces valeurs brutes nécessitent toutefois une petite correction liée aux « perdus de vue » en cours d’étude. Cette correction dite de Kaplan-Meier (voir notre article paru dans le n°29 de Diabétologie Pratique, décembre 2010) conduit à des risques absolus ajustés à 5,5 % (RA1) dans le groupe 1 et à 7,9 % (RA2) dans le groupe 2. Dans ces conditions, le risque relatif du groupe 1 (pravastatine) par rapport au groupe 2 (placebo) est égal à 5,5/7,9 = 0,69 (figure 1) et la réduction du risque relatif en faveur de la pravastatine par rapport au placebo est donnée par le calcul suivant : (1-0,69) x 100 = 31 %.
Pour établir le caractère significatif ou non significatif de cette réduction du risque relatif, encore faut-il que la dispersion des résultats du risque relatif autour de la moyenne soit évaluée grâce à la mesure de l’intervalle de confiance à 95 % (IC95 %). La significativité statistique des réductions du risque relatif n’est observée que si l’intervalle de confiance ne coupe pas la ligne verticale de neutralité (RR = 1). Dans l’étude WOSCOPS, les deux limites inférieure et supérieure de l’IC à 95 % étaient respectivement égales à 0,57 et 0,83 (figure 1). Ces résultats permettaient de confirmer que la pravastatine par rapport au placebo entraînait une réduction significative (p < 0,001) du risque d’accidents vasculaires.
Le calcul du NNT
Ce calcul ne peut être envisagé que si la diminution du risque relatif est significative. Dans le cas contraire, il n’aurait aucune valeur. En revanche, lorsqu’un traitement prouve sa supériorité par rapport à un comparateur, il devient important d’évaluer la « rentabilité » exacte de ce traitement en calculant le nombre de sujets à traiter. Ce calcul simple repose sur la formule suivante :
Nombre de sujets à traiter pour éviter un événement = 100/(RA2-RA1) où RA2-RA1 est la différence des risques absolus (exprimés en pourcentages) entre le bras médicament à tester et le bras comparateur.
Dans l’étude WOSCOPS (prévention primaire), ce calcul conduit au chiffre de 41 sujets (100/7,9-5,5) à traiter par pravastatine pour éviter un accident cardiovasculaire majeur chez l’un d’entre eux (figure 2). Dans l’étude 4S (prévention secondaire), le calcul conduit à 13 sujets (figure 2).
À ce jour, nul n’a jamais défini de valeur seuil pour laquelle la « rentabilité » s’avère indiscutable. Toutefois il semble qu’il faille se poser des questions audelà d’un certain seuil, mais ce seuil doit-il être fixé à 50, 60 ou 100 sujets ? Dans la majorité des cas, et quelle que soit la nature de l’événement, le simple bon sens semble indiquer que le traitement testé n’a aucune rentabilité par rapport au comparateur quand le nombre de sujets à traiter pour éviter un événement chez l’un d’entre eux est supérieur à 100.
Application du calcul du NNT aux grandes études de prévention du risque de complications chez les patients diabétiques Limitons notre analyse aux 4 grandes études (UKPDS(6), ACCORD(7), ADVANCE(8) et VADT(9)) qui ont été publiées au cours des deux dernières décennies et qui ont comparé l’effet d’un traitement intensif versus un traitement conventionnel dans le diabète de type 2. Si on restreint l’analyse aux décès par accidents cardiovasculaires, il apparaît qu’en termes de réduction du risque relatif aucune d’elles n’atteint le seuil de signification statistique (figure 4). L’étude ACCORD(7) montre même une augmentation significative du risque de décès par accident cardiovasculaire dans le groupe soumis à un traitement intensif. Ce résultat paradoxal reste l’objet de débat plusieurs années après la publication de l’étude ACCORD. Certains auteurs relient cet effet délétère à l’augmentation de l’incidence des hypoglycémies dans le groupe intensif tandis que d’autres ont plutôt tendance à innocenter les épisodes hypoglycémiques.
Figure 4. Probabilité de décès par accident cardiovasculaire avec un traitement antidiabétique intensif par rapport à un traitement conventionnel chez des patients ayant un diabète de type 2 (d’après Turnbull et al. Diabetologia 2009 ; 52 : 2 288-98).
De toute manière, dans la mesure où, dans les 4 études précitées(6-9), le risque relatif n’est pas diminué dans les groupes intensifs par rapport aux groupes conventionnels, la première condition pour calculer un nombre de sujets à traiter intensivement pour éviter un événement chez l’un d’entre eux n’est pas remplie. Ce calcul serait donc inapproprié. Toutefois, une analyse plus fine des résultats de deux de ces études (UKPDS et ADVANCE) indique que, pour certains événements/ complications, une réduction du risque relatif a été observée, en particulier pour les complications microvasculaires. Dans l’étude ACCORD(7), ce risque n’a pas été analysé, ce qui élimine d’emblée cette étude de notre analyse en nombre de sujets à traiter pour éviter une complication microangiopathique (rétinopathie, néphropathie, etc.) chez l’un d’entre eux. Dans l’étude VADT(9), un seul événement (l’augmentation de l’albuminurie) est à la limite de la signification statistique (p = 0,05). Pour cette raison, nous ne retiendrons que les deux études UKPDS(6) et ADVANCE(8), qui ont montré des réductions significatives du risque d’événements microvasculaires pris isolément ou de manière combinée avec les événements macrovasculaires.
Dans l’étude UKPDS(6), les résultats significatifs concernent les complications liées au diabète et les complications microvasculaires. Dans l’étude ADVANCE(8), la réduction significative du risque relatif concerne l’ensemble des complications micro- et macrovasculaires analysées de manière globale, les événements microvasculaires majeurs et le risque de néphropathie. Ces résultats significatifs, sélectionnés à partir des tableaux fournis par les études UKPDS(6) et ADVANCE(8) sont indiqués sur la figure 5. Pour ce type d’événements/complications il est donc possible de calculer dans chacune des deux études le nombre de sujets à traiter pour éviter un événement indésirable chez l’un d’entre eux puisque la réduction du risque relatif est significative.
Figure 5. Probabilité de décès par accident cardiovasculaire avec un traitement antidiabétique intensif par rapport à un traitement conventionnel chez des patients ayant un diabète de type 2 (d’après Turnbull et al. Diabetologia 2009 ; 52 : 2 288-98).
Les résultats de cette analyse, exprimés en nombre de sujets à soumettre à un traitement intensif pour éviter un accident chez l’un d’entre eux (NNT) sont indiqués et détaillés étude par étude sur la figure 5. Un coup d’oeil d’ensemble sur les résultats montre que, dans l’étude UKPDS, il faut traiter moins de 50 sujets pour éviter chez l’un d’entre eux la survenue de complications liées au diabète analysées de manière globale (NNT = 31) ou l’apparition de complications microvasculaires (NNT = 43). En revanche, dans l’étude ADVANCE, le nombre de sujets à traiter est compris entre 52 et 91 pour toutes les complications pour lesquelles les investigateurs ont trouvé une réduction significative du risque relatif. On comprend que ce dernier résultat, un peu décevant, puisse faire l’objet de discussions, voire de débats. Nous avons toutefois souligné que la « rentabilité » d’une stratégie thérapeutique ne pouvait être mise réellement en cause que si le NNT est > 100. Ceci n’est pas le cas pour tous les résultats que nous avons analysés en NNT, aussi bien dans l’UKPDS que dans l’étude ADVANCE. Pour cette raison on peut considérer que les traitements intensifs sont justifiés, même s’il eut été souhaitable que la « rentabilité » des stratégies intensives soit établie de manière parfaite et indiscutable sur toutes les formes de complications, qu’elles soient micro- ou macrovasculaires. N’en déplaise à quelques « frondeurs », la recherche du bon contrôle glycémique doit rester un objectif prioritaire dans la prise en charge des diabétiques. L’analyse en NNT est là pour le prouver.
Application au calcul du NNT par une nouvelle insuline pour éviter les hypoglycémies nocturnes par rapport à une insuline de référence
Plusieurs études ont comparé les effets des insulines dégludec et glargine(10-13). Toutes deux sont des analogues prolongés. Le procédé utilisé pour obtenir l’effet retard est différent pour les deux insulines : modification du point isoélectrique pour l’insuline glargine et acylation de la chaîne B de l’insuline par un acide gras à 16 atomes de carbone pour l’insuline dégludec. Sans entrer dans le détail, la glargine est une insuline dont la durée d’action est de 24 heures, tandis que la dégludec a une durée plus longue, > 48 heures, avec un profil d’action plus étalé dans le temps que la glargine. En se basant sur ces données, certains ont émis l’hypothèse que le risque de survenue d’épisodes hypoglycémiques pouvait être plus faible avec la dégludec qu’avec la glargine.
Quatre études au moins ont montré que le taux d’hypoglycémies, en englobant les périodes diurnes et nocturnes, était identique avec la glargine et la dégludec bien que l’étude de Garber(12) dans le diabète de type 2 ait montré une légère diminution du risque d’hypoglycémies avec la dégludec comparée à la glargine. Pour les hypoglycémies nocturnes, 3 études sur 4 ont montré que le nombre d’hypoglycémies, exprimé en taux d’hypoglycémies par patient-année d’exposition au traitement, est inférieur avec la dégludec comparée à la glargine (tableau).
Trois études (3 dernières lignes) montrent une réduction significative du risque relatif d’hypoglycémie nocturne sous dégludec par rapport à la glargine. Le calcul du NNT pour éviter qu’un sujet ne fasse des hypoglycémies en remplaçant la glargine par la dégludec est indiqué dans la dernière colonne. Pour la première étude, le calcul du NNT n’aurait aucune valeur puisque la RRR n’est pas significative. Pour cette raison nous avons affecté cette étude du qualificatif NA (Non Applicable).
L’analyse en nombre de sujets à traiter par la dégludec pour éviter qu’un sujet ne fasse des hypoglycémies quand on remplace la glargine par la dégludec n’a pas été rapportée dans ces 4 études. Toutefois cette analyse est réalisable à partir des données fournies par les auteurs de ces 4 publications(10-13). Le calcul du NNT montre que, dans une seule étude(12), la substitution de la dégludec à la glargine va permettre d’éviter la survenue d’hypoglycémies nocturnes chez un sujet, même si cette substitution porte sur un nombre de sujets < 50 (NNT = 14, étude de Garber et coll.(12)). Dans deux autres études(11,13), il faudra remplacer la glargine par la dégludec chez 50 sujets ou plus pour obtenir la disparition des hypoglycémies nocturnes chez l’un d’entre eux (NNT = 71, étude de Zinman et coll.(11) et NNT = 50, étude de Heller et coll.(13)). Enfin, l’analyse en NNT n’est pas possible dans l’étude de Gouch et coll.(10) puisque la réduction du risque relatif d’hypoglycémies nocturnes n’est pas significatif (tableau).
Dans ces conditions, que penser du remplacement de la glargine par la dégludec pour éviter les hypoglycémies ? Le jeu en vautil la chandelle ? Au lecteur d’en juger en sachant qu’une hypoglycémie nocturne, même s’il s’agit d’un symptôme désagréable, n’a pas la même répercussion qu’une complication chronique micro- ou macrovasculaire. En effet, il paraît licite de préférer un traitement par rapport à un autre, même s’il ne permet d’éviter une complication dégénérative que chez un sujet sur 100. En revanche, il est plus contestable de dire que tel traitement insulinique est justifié s’il évite des hypoglycémies modérées chez 1 sujet sur 50.
Conclusion
Le nombre de sujets à traiter (NNT), paramètre incomparable pour juger de l’efficacité d’un traitement donné, nécessite d’être interprété en fonction de la gravité de l’événement que l’on a évité en prescrivant ce traitement.
Si l’événement est grave, on peut accepter qu’un NNT soit élevé, allant jusqu’à 100.
Pour des événements peu sévères, réversibles et a fortiori lorsqu’ils ne touchent qu’au confort du malade, on ne devrait privilégier tel ou tel traitement ou telle ou telle stratégie thérapeutique que si le nombre de sujets à traiter est jugé comme étant « rentable », c’est-à-dire au minimum 50.
D’un point de vue général, il est dommage que le NNT ne soit pas indiqué dans tous les essais d’intervention thérapeutique. Omission volontaire ou non ? La question mérite au moins d’être soulevée…
Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.
pour voir la suite, inscrivez-vous gratuitement.
Si vous êtes déjà inscrit,
connectez vous :
Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :