Accueil > Autre > Mathématiques > Mesure de phénomènes aléatoires. Exemple des profils de prescription.[version0.7

Mesure de phénomènes aléatoires. Exemple des profils de prescription.[version0.70 du 05/03/2009]

samedi 21 février 2009, par omedoc

A l’occasion d’une présentation mathématique des phénomènes aléatoires, j’en profite pour faire une analyse critique des profils de prescriptions.

J’y démontre que toute valeur dans un profil de prescription doit être au moins accompagnée de son intervalle de confiance.

Voir les fichiers joints pour une illustration pratique.

On va prendre pour exemple la prescription d’un antibiotique particulier (noté R) par un médecin [1].

On peut facilement calculer le nombre de ses prescriptions dans l’année.

Or, il y a une part aléatoire, c’est le nombre de patients de sa clientèle qui ont consulté pour une pathologie pouvant justifier la prescription de R.

Il y a une part non aléatoire c’est la "propension" du médecin a prescrire R pour une ou des pathologies déterminées.

Ce qui nous intéresse c’est de mesurer cette propension. Or nous n’avons accès qu’au nombre de ses prescriptions. Supposons que 10% de sa clientèle à reçu R alors que la moyenne départementale est de 8%. Peut-on dire qu’il surprescrit R ? A partir de quel pourcentage peut-on dire qu’il surprescrit R ?

Deux cas, soit il s’agit d’une pathologie saisonnière, et alors on peut estimer que d’une année sur l’autre la prescription de R va varier. parfois il sera en dessous, parfois au dessus de la moyenne. [2]

Soit il s’agit d’une pathologie récurrente chez certains patients de sa clientèle. Dans ce cas il faut plusieurs années pour voir une variation significative dans les prescriptions.

Quel est la loi aléatoire qui modélise la prescription de R ?

Trouver cette loi, permettrait de préciser un intervalle de confiance et donc de savoir qu’elle confiance on peut accorder à l’affirmation : ce médecin est un surprescripteur !

On peut considérer que la survenue d’une pathologie dans une clientèle est équivalent au tir au hasard dans une cible découpée en régions dont les surfaces sont fonction de l’importance de la clientèle. Ce qui est équivalent au tirage dans une urne contenant des boules blanches et noires, avec remise. Le nombre de tirages étant le nombre de clients du médecin.

On peut donc modéliser avec le même type de loi que celles correspondant au tirage dans une urne contenant des boules blanches et noires.

C’est la loi "binomiale" qui modélise cette expérience

Soit un tirage de 7 boules, quel est la probabilité d’avoir 3 boules noires ?
On peut avoir comme tirage par exemple bbnbnbn ou bnnbnbb. La probabilité de tels tirages est p3q4 avec p la proportion de boules noires et q=1-p. Il faut ensuite ajouter le nombre de possibilités différentes de tels tirages : il s’agit du nombre de combinaisons Ckn avec k = le nombre de boules noires désirées.
On a donc en définitive la probabilité d’avoir trois boules noires sur 7 tirages =C37p3q4, et de façon générale pour k boules noires sur n tirages : P(X=k)=Cknpk(1-p)(n-k) avec Ckn=n !/(k !(n-k) !) [3]

Dans notre exemple, n est le nombre de patients du médecin pouvant avoir potentiellement la pathologie. Si on analyse la prescription d’arrêts de travail, il faudra prendre pour n les patients ayant un travail. [4]

Le problème est d’évaluer p. Quel est le pourcentage de pathologies (par rapport à la clientèle) pouvant entraîner la prescription de R ? On ne peut déterminer ce pourcentage à partir de la prescription moyenne départementale r car R n’est en général pas systématiquement prescrit dans ses indications [5] Soit r ce pourcentage. La vrai valeur de p est donc r/e avec e le pourcentage de prescription de R dans la pathologie. Par exemple : les médecins du département rencontrent 10% de pathologies (% à leur clientèle) (variable aléatoire) justifiant la prescription de R et ne prescrivent R que dans 20% des cas (valeur constante non aléatoire). On a donc p =0,1 e=0,2 et r= pe = 0,1*0,2 = 0,02

On pourrait évaluer p à partir des médecins ayant une prescription systématique (e=1=100%) à condition que leur clientèle soit comparables à celle des autres médecins. Dans tous les cas p est supérieur ou égal au maximum des r (si clientèle semblable).

Supposons ce problème résolu. Comment interpréter la fréquence r’ de prescription d’un médecin particulier de l’antibiotique R ?
Comme je l’ai expliqué ci-dessus : plus n est grand, plus p’=r’/e’ tend vers la valeur p avec e’ la tendance personnelle (valeur constante non aléatoire) du médecin à prescrire le médicament R dans les situations ou cela le justifie, c’est à dire le pourcentage de prescription de R lorsqu’il y a une pathologie qui peut le justifier.
Par ailleurs il y a une variabilité de l’incidence des pathologies qui fait que r’ "varie" naturellement.

Ce qui nous intéresse c’est e’, ou plus précisément savoir si e’ est significativement différent de e. Un autre problème est de préciser ce qu’on définit comme "significativement".

En fait la probabilité P(X=k) [6] n’est pas intéressante en soi. De plus, plus n est grand plus les P(X=k) sont petits. Ils tendent vers zéro. [7]

Ce qui est intéressant c’est, sous l’hypothèse ou e=e’, de savoir si r’ peut s’expliquer par la simple variation naturelle de la survenue (incidence) de la pathologie. Il faut donc que r’ ne s’écarte pas trop de r. "Traditionnellement", on estime que r’ ne s’écarte pas trop (de r) s’il se trouve dans l’intervalle de variation de r qui regroupe 95% de la probabilité.

Si r’ est dans l’intervalle de confiance de r (r’=r) cela peut signifier soit que :
 on a bien e= e’
 on a e’ inf e et le médecin a eu plus de cas pathologiques (p’ > p).
 on a e’>e et le médecin a eu moins de cas pathologiques (p’inf p).

Si r’ est en dehors de l’intervalle de confiance de r (r’>r), cela peut signifier soit
 on a bien e’>e
 on a e’=e (ou même e’inf e) mais p’inf p c’est à dire que le médecin a eu beaucoup plus de pathologies pouvant justifier r.

Les variations de l’incidence d’une pathologie dans la clientèle (p’) entraîne des variations du nombre de prescriptions (r’).

En effet :

r’=p’e’ d’où (r’1-r’2)=e’(p’1-p’2)

Exemple :

Un contexte pathologique étant donné, un médecin prescrit dans 70% des cas l’antibiotique R alors que la moyenne départementale est de 60%. On a donc e=60% et e’=70%. quel écart entre p et p’ (l’incidence des pathologies dans le département et dans la clientèle du médecin) pour que r=r’ ?

on a p’x70=px60 d’où si p’ = 85% de p alors le médecin ne sera pas considéré comme un surprescripteur

Inversement considérons qu’un médecin est surprescripteur à partir d’un écart de 10% de prescription avec la moyenne départementale. Supposons qu’en fait le médecin ne prescrit que dans 60% des cas, comme la moyenne départementale, mais il a la "malchance" d’avoir eu beaucoup de malades où il pouvait prescrire R. A partir de quelle surincidence va-t-il être considéré comme surprescripteur à tort ?

on a (p’x60- px60)px60>10%

Pour une clientèle donnée n si on a 20 cas d’incidence selon la valeur de l’incidence départementale, alors 22 cas dans la clientèle du médecin le fera considéré comme surprescripteur à tort.
En effet 60% de 22 cas = 13,2 prescriptions [8] et 60% de 20 cas = 12 prescriptions or (13,2-12)/12=10%

Donc une variation de l’incidence de la pathologie de (20-22)/20 = 10% entraîne une variation de la prescription de 10%

Ce résultat est général. En effet il est facile de vérifier que :

(r’1-r’2)/r’1=(p’1-p’2)/p’1

A SUIVRE = intervalle de confiance pour r’

ci joint la loi binomiale

Faire varier n et p pour voir ce que cela donne.

On s’aperçoit que :
 pour n grand (>30) et np>5 la courbe peut être apporchée par une courbe de Gauss (loi normale).
 pour p petit, la courbe se déplace vers le zéro (puisque centrée sur la moyenne np) et ’devient en fait une courbe de poisson.

Dans l’exemple du fichier, on voit que pour une clientèle de 30 personnes (ce qui ne correspond pas à la réalité), dont 20% de malades pouvant justifier R au niveau départemental, alors un médecin peut "récolter" de 2 à 10 malades dans 96% des cas.

Selon la colonne B(p,n,k), on s’aperçoit que s’il prescrit R dans 80% des cas alors il peut avoir en fait 2 à 8 malades sous R alors que pour le département on a, pour une tendance (=e) à 50%, une moyenne de 3.

Même en étant un "surprescripteur" il peut être en dessous de la moyenne départementale.

Selon la colonne P(r,n,k), en ce qui concerne le nombre de prescriptions de r on s’aperçoit, toujours d’après le fichier joint, que pour une moyenne départementale de 3, il pourra avoir jusqu’à 6 patients sous R sans que cela puisse être considéré comme une surprescription : soit 100% de plus que ce qui est attendu...

Evidemment nous sommes ici dans des petits chiffres (n=30)

Voyons ce que cela donne pour des clientèles "normales".

Voir ce document (open office)

Voir la feuille n personnes.

On a pour :
 une clientèle de 800 personnes exposées,
 avec 20% de malades à l’échelle départemental
 une prescription de R dans 50% des cas au niveau département

Un profil de prescription entre 63 à 96 patients ne pourrait être considéré comme anormal.

Il est à noter que si le médecin a tendance à moins prescrire que le département (dans 45% des cas par exemple), il peut avec 87 patients sous R être considéré comme 9,8% au dessus de la moyenne (80).


[1On estime par exemple que cet antibiotique est trop prescrit

[2A noter que si on ne fait une "action de sensibilisation " qu’auprès des "surprescripteurs", elle sera obligatoirement efficace sur eux, du fait du biais de régression vers la moyenne. Il faut donc mesurer notre action sur l’ensemble des prescripteurs.

[3c’est à dire le nombre de permutations totales divisée par le nombre d’arrangement des boules noires et des boules blanches.

[4Et non pas le nombre des indemnités journalières

[5Il en est de même pour les arrêts de travail

[6c’est à dire la probabilité pour un médecin de prescrire k antibiotiques R

[7En effet leur somme (en faisant varier k de 1 à n) est égale à 1

[8évidemment on ne peut avoir qu’un nombre entier de prescriptions et donc soit 13 (et donc prescripteur normal) soit 14 et donc gros surprescripteur de 16% !). Il s’agit d’un biais possible d’interprétation.)