Année 2023-24 - Equipe PEIPS (CMAP)

Groupe de Travail Discrete Random Objects: Limits and EStimates

Résumé de la séance 7 - Poissonisation

Orateur : Carl Graham (résumé par Igor Kortchemski)

Sommaire

Référence : Probability and Computing (Mitzenmacher, Upfal), Chapitre 5

Introduction

En quelques mots, le principe est de ramener des problèmes et calculs combinatoires à des problèmes et calculs sur des mesures/variables aléatoires de Poisson.

Un exemple type est d'étudier les statistiques d'occupation du problème de $m$ boules placées au hasard dans $n$ boîtes ($m$ pouvant dépendre de $n$), qui a eu un regain d'intérêt avec l'informatique.

Une borne supérieure

Des calculs d'ordre combinatoire permettent par exemple de montrer que si on met $n$ boules dans $n$ boîtes, la probabilité que la charge maximale dépasse $3 \ln(n)/ \ln \ln (n)$ est $O(1/n)$. Pour cela, on borne la probabilité qu'une boîte fixée ait au moins $M$ boules par $\binom{n}{M}/n^M$ et on fait une borne de l'union.

Poissonisation

La poissonisation consiste essentiellement à rendre aléatoire une quantité fixée en la remplaçant par une variable aléatoire de Poisson de même paramètre (pour "dépoissoniser" il s'agit ensuite de contrôler les écarts d'une variable aléatoire de Poisson à sa moyenne).

Un des intérêts est de faire apparaître de l'indépendance grâce à la propriété de marquage : si $X$ est une variable aléatoire de Poisson de paramètre $\mu$ (abrégé en $\mathcal{P}(\mu)$ dans la suite) et si $(\xi_i)_{i\geq 1}$ sont des variables aléatoires i.i.d. à valeurs dans $\{1,2,\ldots,r\}$, indépendantes de $X$, alors les variables aléatoires $$X_j=\sum_{i=1}^X 1_{\xi_i=j}, \qquad 1 \leq j \leq r$$ sont indépendantes et $X_j$ est une $\mathcal{P}( p_j \mu)$ avec $p_j=\mathbb{P}(\xi_1=j)$.

Cas des boules dans des boites

Dans le cas où on met $m$ boules dans $n$ boîtes uniformément au hasard, les variables aléatoires de Poisson apparaissent grâce au résultat suivant. Notons $X_i^{(m)}$ pour $1 \leq i \leq n$ le nombre de boules dans les boites et soit $(Y_i^{(m)})_{1 \leq i \leq n}$ des variables aléatoires i.i.d. de loi $\mathcal{P}(m/n)$.

Théorème La loi de $(Y^{(m)}_1,\ldots,Y^{(m)}_n)$ sachant que $Y^{(m)}_1+\cdots+Y^{(m)}_n=k$ est égale à la loi de $(X^{(k)}_1,\ldots,Y^{(k)}_n)$ (et ce pour toute valeur de $m$ !).

On en déduit aisément le résultat suivant.

Théorème

Ceci permet d'obtenir une minoration de la charge maximale : si on met $n$ boules dans $n$ boîtes, la probabilité que la charge maximale est au moins $ \ln(n)/ \ln \ln (n)$ est $1-O(1/n)$.