Théorème Central Limite
Contexte : La Somme de l’Aléatoire

Imaginez que vous répétiez une expérience aléatoire un grand nombre de fois. Par exemple, lancer un dé, mesurer la taille d’une personne prise au hasard, ou observer le rendement quotidien d’une action en bourse. Chaque résultat est une variable aléatoire.

Le théorème central limite s’intéresse à ce qui se passe lorsqu’on fait la moyenne d’un grand nombre de ces variables aléatoires, même si la loi de probabilité de départ n’est pas du tout une courbe en cloche.

Théorème Central Limite (TCL)

Soit $X_1, X_2, \dots, X_n$ un ensemble de $n$ variables aléatoires indépendantes et identiquement distribuées (suivant la même loi), avec une espérance $\mu$ et une variance $\sigma^2$ finies.

Alors, lorsque $n$ devient grand, la distribution de la moyenne de ces variables, $\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i$, se rapproche d’une loi normale (une courbe de Gauss).

Plus précisément, la variable centrée réduite $\frac{\bar{X}_n – \mu}{\sigma/\sqrt{n}}$ converge en loi vers la loi normale standard $\mathcal{N}(0, 1)$.

Interprétation : L’Ordre dans le Chaos

La conséquence la plus spectaculaire de ce théorème est que la loi de probabilité de départ n’a presque pas d’importance. Que vous lanciez un dé (loi uniforme), que vous jouiez à pile ou face (loi de Bernoulli) ou que vous mesuriez un phénomène suivant une loi exponentielle, la moyenne d’un grand nombre d’observations suivra toujours approximativement une loi normale.

  • Lancers de dés : Si vous lancez un dé, la probabilité d’obtenir chaque face est de 1/6 (loi uniforme). Mais si vous lancez 100 dés et que vous calculez la moyenne des résultats, la distribution de cette moyenne sera une magnifique courbe en cloche centrée sur 3.5.
  • Taille des individus : La taille d’un individu est le résultat de très nombreux facteurs aléatoires (génétiques, environnementaux…). La somme de tous ces petits effets aléatoires fait que la distribution des tailles dans une population suit une loi normale.

Le Pilier des Statistiques

Le TCL est la pierre angulaire des statistiques inférentielles. C’est grâce à lui que l’on peut :

  • Faire des sondages : En interrogeant un échantillon de 1000 personnes, on peut estimer l’opinion de millions de personnes. Le TCL nous garantit que la moyenne des opinions dans notre échantillon suit une loi normale, ce qui nous permet de calculer des intervalles de confiance et des marges d’erreur.
  • Contrôler la qualité dans l’industrie : En mesurant quelques pièces sorties d’une chaîne de production, on peut déduire si la machine est bien réglée.
  • Modéliser des phénomènes en finance et en physique : De nombreux phénomènes complexes sont la somme d’une multitude de petits événements aléatoires, ce qui justifie l’utilisation de la loi normale pour les modéliser.