#M010 Un piège dans l’interprétation des courbes de survie

Bempedoic Acid and Cardiovascular Outcomes in Statin-Intolerant Patients. N Engl J Med 2023; 388:1353-1364. DOI: 10.1056/NEJMoa2215024

Pourquoi a-t-on choisi cet article ?

L’essai CLEAR-outcome publié dans NEJM le 13 avril 2023 permet de poursuivre nos discussions sur l’interprétation des courbes de survie.

Ce qu’en pense la SFPT

À la suite de la récente présentation au congrès de l’American College of Cardiology (ACC) et à la publication de l’essai CLEAR-outcome, plusieurs commentateurs ont mis en avant un bénéfice de l’acide bempédoïque qui augmenterait au cours du temps, en se basant sur l’observation visuelle que les courbes d’évènements cumulés divergeaient continuellement.
Cette interprétation est souvent faite devant ce type de constat de la divergence des courbes de survie (ou de taux cumulé d’évènement), mais cette divergence signe-t-elle vraiment une augmentation de l’efficacité du traitement au cours du temps ? où est-ce plus complexe ? et dans ce cas comment correctement appréhender si un effet traitement augmente ou se réduit en fonction du temps ?
Cette discussion va nous permettre aussi de revenir sur quelques concepts de bases des analyses dites « de survie » (« time to event »), comme le hazard et le hazard ratio.

Pour approfondir

L’essai CLEAR-outcome a comparé l’acide bempédoïque, dont l’action pharmacologique est de diminuer le LDL cholestérol, au placebo chez des patients intolérants aux statines. Le critère de jugement était les évènements cardiovasculaires.

PICOS de l'étude

Patients

 Intolérants aux statines à haut risque cardio-vasculaire

Intervention

Acide bempédoïque

Control

Placebo

Outcome

 Evénements cardiovasculaires majeurs (MACE)

Study design

Essai clinique contrôlé, randomisé, multicentrique, en double aveugle

Dates clés

Les patients ont été inclus de décembre 2016 à août 2019.Le suivi minimal était de 24 mois, et le suivi médian de 40.6 mois.

Une réduction de la fréquence des évènements cardiovasculaires mortels et non mortels (critère composite des MACE à 4 composantes) a été observée avec un hazard ratio de 0.87, statistiquement significatif.
Les courbes de Kaplan Meier sont représentées sur une durée de suivi de 60 mois (5 ans) bien que le suivi médian soit seulement 40.6 mois (mais peu importe, ce n’est pas l’objet du propos ici).
010 1

Devant le constat visuel indéniable que les courbes divergent continuellement, il est facile de conclure que l’effet du traitement se bonifie avec le temps. La différence de risque (qui correspond à la différence verticale entre les 2 courbes à un temps donné) est objectivement plus importante à 54 mois qu’à 24 mois (à vos doubles décimètres !). Ce qui a conduit à certains commentaires, comme par exemple :

« The Kaplan-Meier curves steadily diverged with time over the slightly less than 4-year follow-up. This is consistent with the notion that the benefit from exposure to lower LDL-C levels accrues over time. A longer trial would have likely showed greater benefit. » (https://www.medscape.com/viewarticle/989098)

Cette conclusion est cependant excessive si elle ne se base que sur l’observation des courbes, car il est attendu que ces courbes divergent continuellement alors que l’effet du traitement ne change absolument pas au cours du temps. C’est l’un des premiers pièges auxquels nous expose une interprétation trop naïve des courbes de survie (et il y en a bien d’autres).
En effet, il ne faut pas oublier que les courbes de Kaplan Meier représentent une fréquence cumulative (depuis le début du suivi des patients). Le nombre d’évènements à 10 mois dépend du nombre d’évènements observés avant, à 9, 8 mois, etc. La différence observée à un temps donné est la résultante de tout ce qui s’est produit avant ce temps et non pas une représentation, en instantané, de ce qui se passe chez les patients à ce temps donné et uniquement à ce temps.
Le modèle standard pour représenter ces phénomènes de temps jusqu’à événement est celui du risque instantané (le fameux hazard, qui est parfois traduit de façon erronée par risque) et qui est à la base du modèle de Cox qui estime le hazard ratio.
Le hazard, ou « risque instantané », représente la probabilité de survenue de l’évènement durant une courte période de temps, disons par exemple 1 mois, mais cela pourrait être 1 semaine, 1 jour, 1 minute, etc. Mathématiquement, le raisonnement est continu et non discret, mais ces concepts sont plus simples à appréhender en temps discret. En réalité, le hazard est le coefficient de vitesse d’une équation différentielle (donc vraiment un risque instantané).
Le hazard est donc la probabilité de faire l’évènement considéré durant la période de temps (1 mois) pour les patients exposés à ce risque en début de période (en début de mois). Ce nombre de sujets exposés en début de période correspond au nombre « at risk » traditionnellement représenté en bas des courbes. Le nombre moyen d’évènements survenant durant un mois est égal au produit du nombre de sujets à risque en début de mois par cette probabilité de faire l’évènement durant un mois (le hazard). A la fin du mois, le nombre de sujets toujours à risque de faire l’évènement (c’est-à-dire n’ayant pas encore fait l’évènement) est donc égal au nombre de sujets à risque en début de mois, moins le nombre d’évènements survenu durant le mois, et ce nombre est le nombre de sujets à risque en début de période suivante
Numériquement voici ce qui se passe. Imaginons que le hazard soit égal à 0.1 (une probabilité de 10% de faire l’évènement dans un mois). Considérons ce hazard constant au cours du temps (il est le même à 12mois qu’à 1 mois, cette hypothèse n’est pas nécessaire, mais elle simplifie les calculs).
Considérons que notre étude comprend 1000 patients initialement (au t0). Durant le premier mois (le mois 1), il est attendu 1000*0.1= 100 évènements (en moyenne). À la fin du M1, il restera 1000-100=900 patients à risque (n’ayant pas déjà fait l’évènement). À la fin de ce M1, le « taux de survie » (c’est-à-dire le pourcentage des patients initiaux n’ayant toujours pas fait l’évènement au terme de cette durée de suivi) est donc de 90% (900/1000). C’est ce « taux de survie » qui est représenté par la courbe de Kaplan Meier à 1mois (ou 1 moins cette valeur si la courbe est en fréquence cumulée d’évènements).
Pour le mois 2, le nombre à risque en début de mois est de 900, ce qui conduira en moyenne à 900*0.1=90 évènements durant ce mois (le hazard reste inchangé), et à un nombre à risque en début de mois suivant de 810 et à un « taux de survie » à M2 de 810/1000=81%. Et ainsi de suite.

010 2

La généralisation de ces calculs est disponible dans ce tableau Excel. Ce tableur est aussi utilisable pour manipuler les paramètre (hazard du groupe contrôle et hazard ratio) afin d’observer les conséquences sur les courbes.

Maintenant, regardons ce qui se passe lorsque l’on compare les 2 groupes d’un essai thérapeutique, réalisé avec un traitement qui réduit la fréquence des évènements. Dans ce cas le hazard, h1, du groupe traité sera plus faible que celui dans le groupe contrôle, h0, avec HR = h1/h0 tout simplement. Pour un hazard ratio de 0.8, h1 = h0 * 0.80.
Au passage on voit que le concept de hazard ratio est assez simple. Un hazard ratio inférieur à 1 veut dire que la probabilité de faire un évènement durant une courte période de temps a été réduite par le traitement (avec un coefficient multiplicateur qui est le HR) et que cette réduction est la même pour toutes les périodes de temps (il est souvent considéré, comme avec le modèle de Cox, que le hazard ratio est constant).
Comme h0 est plus élevé que h1, la probabilité de faire un évènement durant le mois est plus élevée dans le groupe contrôle que dans le groupe traité. Pour un mois donné, le delta de patients à risque entre le début et la fin du mois sera plus important dans le groupe contrôle que dans le groupe traité. La courbe de survie décroitra moins dans le groupe traité que dans le groupe contrôle, d’où une divergence des courbes durant cet intervalle. Et comme cela se reproduit à chaque intervalle, les courbes divergent continuellement (ou presque, voir la suite).

010 3

En fait, après avoir divergé initialement, les courbes vont se mettre à converger alors que l’effet du traitement est toujours le même. Cette convergence provient du fait que le delta dans le groupe contrôle va devenir moins important que celui du groupe traité, car le nombre de sujets à risque dans le groupe contrôle va être numériquement sensiblement inférieur à celui du groupe traité. De ce fait, bien que la probabilité de faire un évènement dans le groupe contrôle soit plus importante, elle s’applique à un faible effectif et débouche sur un faible nombre d’évènements durant la période. Dans le groupe traité, la probabilité est plus faible, mais s’applique à un nombre de sujets à risque bien plus important. Le delta dans le groupe traité est ainsi plus important que celui dans le groupe contrôle et les courbes convergent, bien que la taille de l’effet du traitement reste inchangée.
010 4

Cette convergence est aussi obligatoire pour que les 2 courbes se rejoignent avec le temps, quand la survie s’approche de zéro.
En pratique, cette 2ème partie des courbes, où elles convergent, est peu fréquemment observée sauf avec des pathologies à mauvais pronostique comme en oncologie.
Au total, il apparait ainsi que la dynamique « visuelle » des courbes de « survie » dans un essai clinique est complexe. Il n’est pas vraiment possible de déduire si l’effet du traitement augmente ou diminue au cours du temps simplement à partir de la divergence ou de la convergence des courbes. De plus, en pratique, une complexité supplémentaire s’ajoute avec les suivis censurés et les fluctuations d’échantillonnage. Mais les techniques statistiques couramment utilisées (estimateur de Kaplan Meier pour les courbes de survie, logrank et modèle de Cox) gèrent parfaitement cette complexité !
Alors existe-t-il un moyen de déterminer si l’effet du traitement augmente ou s’épuise au cours du temps ? La réponse est oui, mais à l’aide d’un outil spécifique qui est la visualisation de l’évolution du hazard ratio au cours du temps. Contrairement au modèle de Cox qui donne un hazard ratio unique, car il considère que celui-ci est constant par hypothèse (la fameuse hypothèse de proportionnalité des hazards), cette approche consiste à déterminer le hazard ratio dans « chaque période de temps » et à représenter ces valeurs en fonction du temps. On obtient une courbe (lissée) et son intervalle de confiance qui permet de connaitre l’évolution au cours du temps de l’effet du traitement (si l’intervalle de confiance n’est pas trop large et que l’on accepte un raisonnement purement inductif amenant à conclure sans hypothèse préalable). Cf livre blanc Dossier 1 – La démarche hypothético-déductive et les résultats post hoc

Cette approche commence à être utilisée en pratique. Un article récent (DOI: https://doi.org10.1016/j.jacc.2023.02.022) qui s’intéresse au temps d’apparition du bénéfice de la sotagliflozine base son analyse sur cette approche (cf. figure ci-dessous). L’interprétation de ces courbes doit cependant se faire avec précaution compte tenu de la complexité du concept du HR(t) (intrication entre puissance et dynamique de survenue du bénéfice, manque de robustesse des estimations de HR(t), etc.).
010 5
Figure extraite de Verma et al. JACC 2023

Au passage, il convient de remarquer que l’évolution au cours du temps de la différence des risques (la différente verticale entre les courbes) remet partiellement en cause le concept de bénéfice absolu du traitement (apprécié par la différence de risque ou le NNT). Il apparait ainsi que la différence de risque observé à un temps donné (souvent la fin de l’essai) n’est pas une caractéristique propre du traitement (ou de son utilisation dans la population incluse dans l’essai) étant donné que sa valeur va varier en fonction du temps de mesure (toute chose égale par ailleurs, c’est-à-dire à hazard constant et à effet relatif, hazard ratio, constant). Ainsi, pour les traitements des pathologies chroniques, « donnés à vie », la conséquence populationnelle du traitement (appréciée par le nombre d’évènements évités pour 1000 patients traités par exemple) ne peut pas être caractérisée par une valeur unique de différence de risque, car elle évolue constamment au cours du temps ! Ce point peut être facilement intuité, car si l’on se projette à un suivi très long tous les sujets auront présenté l’évènement (incluant le décès) et il n’y aura plus aucun évènement évité pour 1000 patients traités avec ce recul.
Ce paradoxe est souvent mis à profit dans la communication promotionnelle des résultats des essais qui réalisent des suivis ultérieurs des patients, après la fin de l’étude (comme c’est couramment le cas en oncologie). Régulièrement, la différence de risque obtenue à la fin du suivi supplémentaire est numériquement plus importante que celui relevé dans l’étude elle-même, amenant à des conclusions du type : le bénéfice du traitement est même plus important que celui que nous avions initialement estimé ; ou : le bénéfice augmente avec le temps. Bien sûr, si le suivi amène dans la zone où les courbes se mettent à converger, aucun commentaire n’est fait sur l’apparente réduction du « bénéfice » !

courbes de survie, surinterprétation