Petit cours d'épidémiologie mathématique
Temps de résidence dans les compartiments

Julien Arino

Department of Mathematics & Data Science Nexus
University of Manitoba*

Centre canadien de modélisation des maladies (CCDM/CCMM)
NSERC-PHAC EID Modelling Consortium (CANMOD, MfPH, OMNI/RÉUNIS)

* The University of Manitoba campuses are located on original lands of Anishinaabeg, Cree, Oji-Cree, Dakota and Dene peoples, and on the homeland of the Métis Nation.

Plan de ce cours

  • Juste ce qu'il faut de probabilité
  • Distributions utilisées ici
  • Un modèle simple de cohorte
  • Temps de séjour dans un modèle SIS
  • De l'exponentielle à l'Erlang
  • Risques compétitifs

Pourquoi considérer la stochasticité?

  • La vie résulte des interactions entre un nombre colossal de processus

  • Chaque processus contient un certain degré d'imprécision. Par exemple, lorsqu'un virus se réplique, il saute une base ici et là; quand une cellule se divise lors de la mitose, le matériau n'est pas partagé 50%-50% entre les cellules filles; vous rencontrez un autre être humain et (en ces temps de COVID-19) oubliez de ne pas lui serrer la main

  • Du fait de la répétition des ces imprécisions, il naît de l'incertitude

Déterministe Stochastique

  • Modèle déterministe: étant donné des conditions initiales et des paramètres, toutes les "réalisations" du processus sont identiques
  • Modèle stochastique (on revient sur ça plus tard): étant donné des conditions initiales et des paramètres, aucune réalisation n'est la même

Toutefois: déterministe ne veut pas dire "aucune prise en compte de la stochasticité".. la stochasticité est juste cachée

Étudier les temps de séjour dans les compartiments permet de révéler cette stochasticité cachée

Juste ce qu'il faut de probabilité

Quelques références

L'objet n'est pas ici de définir "proprement" les choses. Pour cela, on consultera par exemple:

Contexte général

Considérons un système qui peut être dans 2 états, et

  • : fonctionne, : cassé;
  • : vivant, : mort;
  • : infecté, : guéri;

Supposons que

  • au temps , est dans l'état
  • à un instant , quelque chose se passe, entraînant le passage de de l'état à l'état
  • l'état est absorbant, on ne peut pas le quitter

Une variable aléatoire (v.a.) est une variable qui prend des valeurs .. aléatoires

Appelons la variable aléatoire

temps que passe dans l'état avant de passer dans l'état

On veut un modèle pour

On prend une collection de systèmes dans l'état et cherche à obtenir une loi décrivant la distribution des temps passés par ces systèmes dans l'état , i.e., une loi pour

Pour ce faire, on conduit une infinité d'expériences et on observe le temps que le système prend, dans chaque cas, pour passer de en

On déduit un modèle, qui dans ce contexte est une distribution de probabilité

Variables aléatoires discrètes ou continues

On suppose que est une v.a. continue, i.e., prend des valeurs continues. Exemples:

  • taille ou age si mesuré avec une très grande précision
  • distance
  • temps

Un autre type de v.a. sont les v.a. discrètes, qui prennent des valeurs dans un ensemble dénombrable. Exemples:

  • pile ou face
  • résultat d'un jet de dé
  • taille d'une person en centimètres, âge en années (sans sous unités)

Densité de probabilité

Supposons v.a.continue; elle a une fonction de densité

center

Fonction de répartition

La fonction de répartition (ou fonction de distribution cumulative) est une fonction qui caractérise la distribution de , et est définie par

center

Propriétés de la fonction de répartition

  • Puisque est positive, est croissante
  • Puisque est une densité de probabilité, , et donc

center

Moyenne (espérance mathématique)

Pour une v.a. continue avec densité de probabilité , la moyenne (ou espérance mathématique) de , notée ou , est

Fonction de survie

Une autre façon de caractériser la distribution d'une variable aléatoire est en utilisant la fonction de survie

La fonction de survie d'une v.a. avec densité cumulative est donnée par

Ceci décrit le temps de séjour du système dans un état donné (le temps passé dans l'état)

est une fonction décroissante (puisque avec une densité cumulative), et si est une v.a. à valeurs positives

La durée moyenne de survie est

Puisque ,

Durée attendue de vie future

Distributions utilisées ici

La distribution exponentielle

La v.a. a une distribution exponentielle si sa densité est de la forme

avec . Alors la fonction de survie est de la forme , pour , et le temps moyen de séjour est

La distribution de Dirac

Soit donné. Si la survie prend la forme

alors a une distribution delta de Dirac delta , et le temps moyen de séjour est

avec une variance

La distribution Gamma

Une v.a. suit une loi Gamma de paramètre de forme et paramètre d'échelle (ou paramètre d'intensité ) (tous strictement positifs), et l'on note , si sa densité de probabilité est de la forme

et est la fonction Gamma d'Euler, définie, pour tout t.q. , par

Quelques propriétés de la Gamma

L'espérance mathématique est et la variance

La fonction de survie est

est une fonction gamma incomplète

Un modèle simple de cohorte

Un modèle pour une cohorte avec seulement de la mortalité

Considérons une population consistant d'individus nés au même instant (une cohorte), par exemple, la même année

Supposons

  • Au temps , il y a individus
  • On regroupe toutes les causes de mortalité
  • La durée de la vie d'un individu avant son décès est une variable aléatoire continue , avec densité et fonction de survie

Le modèle

Soit la population au temps . Alors

donne la proportion de la cohorte toujours vivante au temps , donc est le nombre d'individus dans la cohorte toujours vivants au temps

Cas où est distribuée exponentiellement

Supposons que a une distribution exponentielle de moyenne (ou de paramètre ), . Alors la fonction de survie est , et s'écrit

Remarquons que

avec

L'ODE fait (implicitement) l'hypothèse que l'espérance de vie à la naissance est distribuée exponentiellement

Cas où a une distribution delta de Dirac

Supposons que a une distribution delta de Dirac à , soit la fonction de survie

Alors s'écrit

Tous les individus survivent jusqu'au temps , puis ils meurent tous au temps

Ici, partout sauf lorsque , où la dérivée n'est pas définie

Temps de séjour dans un modèle SIS

SIS avec guérison "trafiquée"

Modèle SIS EDO traditionnel suppose guérison à un taux per capita (souvent noté )

Ici, on suppose que, des individus infectés au temps , une fraction reste infectée au temps

la fonction est une fonction de survie pour

Réduction de la dimension

On a

est constant (égal à la population totale au temps ), donc on peut déduire la valeur de , une fois connu, de l'équation

Donc on utilise uniquement

Modèle pour les individus infectieux

Équation intégrale pour le nombre d'individus infectieux:

  • nombre d'individus qui étaient infectieux au temps et le sont toujours au temps
    • positive, décroissante et t.q.
  • Terme intégral (page suivante): nouvelles infections et guérisons

Expression sous l'intégrale

Dans , le terme intégral

s'interprète comme suit:

  • taux auquel de nouveaux infectés sont crées au temps
  • proportion des infectés au temps qui sont encore infectés au temps

En intégrant sur , on obtient le nombre d'individus infectés au temps

Cas d'un temps de guérison exponentiellement distribué

Supposons que t.q. le temps de séjour dans l'état infecté a une distribution exponentielle de moyenne , i.e.,

Supposons du reste que la fonction de condition initiale s'écrit

avec le nombre d'infectieux au temps . Cela vient en considérant une cohorte d'individus initialement infectés et en employant un modèle comme

devient

Donc, si l'on dérive par rapport au temps, on obtient

qui est l'équation classique d'un modèle SIS en EDO en absence de démographie

Cas d'un temps de guérison Dirac distribué

Supposons que la durée d'infection a une fonction de survie

i.e., le temps de séjour dans le compartiment infecté est distribué selon une loi delta de Dirac de paramètre

Dans ce cas, devient

L'expression de est plus compliquée à obtenir ici. On suppose toutefois que disparaît pour

Quand on la différentie par rapport au temps, devient, pour

Puisque disparaît pour , on obtient l'équation différentielle à retard (EDR)

Ce que l'on sait à ce stade

  • Le temps de séjour dans les compartiments joue un rôle important dans la détermination du type de modèle que l'on considère
  • Tous les modèles EDO en compartiments, quand ils utilisent des termes de la forme , font l'hypothèse que le temps de séjour dans les compartiments est distribué exponentiellement avec moyenne
  • À l'autre extrémité du spectre, les EDR à retard discret font l'hypothèse d'un temps de séjour constant , égal pour tous les individus
  • Les deux sont probablement vrais parfois, mais la réalité est sans nul doute souvent quelque part entre les deux

De l'exponentielle à l'Erlang

JA & Portet. A simple model for COVID-19. Infectious Disease Modelling 5:309-315 (2020)

contain

Des problèmes de la distribution exponentielle

  • La survie tombe vite
  • La survie continue bien après la moyenne
  • Acceptable si ce qui compte c'est la durée moyenne du temps de séjour dans un compartiment (par exemple, dynamique à long terme)
  • Moins acceptable si on s'intéresse à une dynamique sur le court terme
  • Un autre problème: l'exponentielle avec paramètre a une espérance et un écart type , i.e., un paramètre unique contrôle la moyenne et la dispersion autour de la moyenne

Une "réparation" simple: faire des sommes

et 2 v.a. indépendantes et identiquement distribuées (i.i.d.) avec paramètres et . Alors la densité de la v.a. est donnée par la convolution

La distribution d'Erlang

Densité d'une distribution d'Erlang

paramètre de forme, paramètre d'intensité (parfois on utilise le paramètre d'échelle )

Donc, si , a la distribution

i.e., une Erlang avec paramètre de forme et paramètre d'intensité

On peut continuer

, , des v.a. exponentielles i.i.d. de paramètre

Alors

est Erlang distribuée avec paramètre d'intensité et paramètre de forme

Propriétés de la distribution d'Erlang

Une Erlang est une Gamma avec un paramètre de forme et récupère donc les propriétés de la Gamma. Densité paramètre de forme, paramètre d'intensité):

Moyenne , variance

Survie

Comment utiliser dans un modèle en compartiments?

  • Supposons un processus à modéliser avec une durée moyenne
  • Si on prend un compartiment

  • Temps moyen passé dans est
  • Supposons un processus à modéliser avec une durée moyenne
  • Si on prend compartiments avec temps moyen de résidence dans chaque

  • Temps moyen passé dans est
  • Temps moyen passé dans l'ensemble des compartiments est

si on prend , on a la même moyenne mais le temps passé dans l'ensemble des compartiments est Erlang-distribué au lieu d'être exponentiellement distribué

center

Risques compétitifs

Contexte

On considère un système initialement dans un état , et qui peut passer dans 2 états, ou

Ce sont des risques compétitifs

On s’intéresse à la survenue du premier évènement: si a lieu avant , ne peut pas avoir lieu, et vice versa

Taux de hasard (ou d'échec)

Le taux de hasard (ou taux d'échec) est

Donne la probabilité instantanée d'échec entre et , sachant qu'on a survécu jusqu'à

On a

Fonction de hasard cumulé

La fonction de hasard cumulé est donnée par

On a alors

ou encore

Donc on a une autre façon de caractériser une distribution

Taux d'échec par type d'évènement

Ici, on a deux (ou plus) risques et on doit considérer des taux d'échec pour chaque type d'évènement

est la probabilité d'échec due à la cause ( ici), i.e., est une v.a. discrete représentant l'évènement qui a lieu

Par la loi de la probabilité totale, puisque un seul des évènements peut avoir lieu, si on a risques, alors

ou, identiquement,

Par conséquent, si un processus est soumis à deux risques compétitifs exponentiels de distributions respectives et , alors le temps de séjour moyen dans l'état initial avant d'être soumis à l'un des deux risques est