3 Finalité de la lecture critique d’un essai thérapeutique
5 Limites des autres types d’études pour l’évaluation de l’efficacité des traitements
6 Le contrôle du risque d’erreur statistique
6.1 Risque alpha (type I error rate )
6.2 Risque alpha global (overall type I error rate)
6.3 Multiplicité et inflation du risque alpha global global
6.4 Techniques de contrôle du risque alpha global gérant la multiplicité
6.4.2 Hiérarchisation (closed testing )
6.4.3 Combination des deux approches
6.5 Nouvelle politique de présentation des p value
6.6 Critères de jugement secondaires
6.6.1 Essai avec un critère de jugement principal unique
6.6.2 Essai gérant la multiplicité par un plan de contrôle du risque global
6.7 Les analyses en sous-groupes
6.7.3 Vérification de la généralisabilité du résultat
6.8 L’analyse finale et les analyses intermédiaires
6.9.1 Signification statistique et pertinence clinique
7 Évaluation du risque de biais
8 Lecture critique et fraude scientifique
10 Évaluation de la pertinence clinique (clinical relevance)
11 Le cas des essais « négatifs »
La détermination qu’un traitement à un effet sur un critère de jugement s’effectue en comparant la valeur du critère de jugement entre les 2 bras de l’essai pour chercher s’il y a une différence en faveur d’un effet bénéfique du traitement (moins de décès dans le groupe traité que dans le groupe contrôlé par exemple).
Or une telle différence peut survenir du fait des fluctuations aléatoires d’échantillonnage (liées purement au hasard) même si le traitement n’a aucun effet en réalité sur le critère de jugement.
Ainsi, si l’on ne prenait pas ce risque en compte, on pourrait conclure à tort à l’existence d’une différence dans les cas où le traitement n’a pas d’effet. C’est l’erreur statistique alpha (aussi appelé de première espèce ou de type 1, type I error ) : conclure à tort à une différence qui n’existe pas en réalité.
Cette erreur statistique a de lourdes conséquences dans le cadre d’un essai clinique, car elle conduit à conclure à tort que le nouveau traitement apporte un bénéfice aux patients et donc conduit à le recommander et à l’utiliser indument en pratique.
Pour limiter au maximum cette possibilité catastrophique on utilise un test statistique qui va limiter le risque de commettre une erreur alpha à une valeur faible (on parle de contrôle du risque alpha), 5% en bilatéral en général.
Ainsi on ne conclura que si la différence est statistiquement significative. Dans le cas où le traitement n’a pas d’effet sur le critère considéré, on ne conclura à une différence que dans 5% des cas.
N.B. : En absence de prise en considération du risque d’erreur alpha, on serait amené à utiliser tous les traitements qui n’apportent pas de bénéfice. En travaillant avec un seuil de la signification statistique à 5%, on n’accepte plus que 5% des traitements sans effet (en réalité 2.5%, car seule la moitié des différences dues au hasard sont en faveur du nouveau traitement et conduisent à l’utiliser).
L’utilisation de la signification statistique permet de réduire le risque de conclure à tort du fait du hasard, mais ne le réduit pas à zéro. Avec un seuil de signification à 5% bilatéral, on admet encore 2.5% des traitements sans effet. Un résultat significatif ne signifie pas qu’il est démontré avec certitude.