3 Finalité de la lecture critique d’un essai thérapeutique
5 Limites des autres types d’études pour l’évaluation de l’efficacité des traitements
6 Le contrôle du risque d’erreur statistique
6.1 Risque alpha (type I error rate )
6.2 Risque alpha global (overall type I error rate)
6.3 Multiplicité et inflation du risque alpha global global
6.4 Techniques de contrôle du risque alpha global gérant la multiplicité
6.4.2 Hiérarchisation (closed testing )
6.4.3 Combination des deux approches
6.5 Nouvelle politique de présentation des p value
6.6 Critères de jugement secondaires
6.6.1 Essai avec un critère de jugement principal unique
6.6.2 Essai gérant la multiplicité par un plan de contrôle du risque global
6.7 Les analyses en sous-groupes
6.7.3 Vérification de la généralisabilité du résultat
6.8 L’analyse finale et les analyses intermédiaires
6.9.1 Signification statistique et pertinence clinique
7 Évaluation du risque de biais
8 Lecture critique et fraude scientifique
10 Évaluation de la pertinence clinique (clinical relevance)
11 Le cas des essais « négatifs »
La signification statistique n’implique pas la pertinence clinique. Une réelle différence aussi petite soit-elle (et donc sans intérêt clinique) peut être rendue statistiquement significative en augmentant l’effectif de l’essai.
Un p très petit (« très significatif ») ne signifie pas que le traitement apporte un grand bénéfice en taille. Le paramètre conditionnant la pertinence clinique de l’importance du bénéfice est la taille de l’effet (effect size, effect magnitude ).
L’essai DAIS [ 10.1016/S0140-6736(00)04209-4 ] a évalué le fénofibrate en prévention secondaire chez des patients suivi pour une sténose d’une artère coronarienne. Le critère de jugement était l’évolution du diamètre de la sténose.
Un résultat statistiquement significatif a été observé « a significantly smaller decrease in minimum lumen diameter (−0·06 [0·016] vs −0·10 [0·016] mm, p=0.02) ». La taille de l’effet est cependant très faible et correspond à une différence intergroupe de 0.04 mm. Cette taille d’effet est sans intérêt clinique et, qui plus, a été obtenue sur un critère intermédiaire, lui-même sans pertinence clinique.