Le point de départ est le théorème d’approximation de Weierstrass (1885), qui affirme que toute fonction continue sur un segment $[a, b]$ peut être approchée uniformément d’aussi près que l’on veut par une fonction polynomiale. On dit que l’ensemble des polynômes est dense dans l’espace des fonctions continues $C([a,b])$.
Le théorème de Stone-Weierstrass généralise cette idée de manière spectaculaire. Il donne des conditions suffisantes pour qu’un ensemble de fonctions (une « algèbre ») soit dense.
- Un espace compact est, en gros, un espace fermé et borné comme un segment $[a,b]$ ou un disque fermé dans $\mathbb{R}^n$.
- Une algèbre de fonctions $\mathcal{A}$ est un ensemble de fonctions stable par addition, multiplication par un scalaire et multiplication entre fonctions. L’ensemble des polynômes en est un exemple.
- Une algèbre $\mathcal{A}$ sépare les points si pour toute paire de points distincts $x \neq y$, il existe une fonction $f \in \mathcal{A}$ telle que $f(x) \neq f(y)$.
Soit $X$ un espace topologique compact. Soit $\mathcal{A}$ une sous-algèbre de l’espace $C(X, \mathbb{R})$ des fonctions continues de $X$ dans $\mathbb{R}$.
Si $\mathcal{A}$ sépare les points de $X$ et contient les fonctions constantes, alors $\mathcal{A}$ est dense dans $C(X, \mathbb{R})$ pour la norme de la convergence uniforme.
Autrement dit, toute fonction continue sur $X$ peut être approchée uniformément par une fonction de $\mathcal{A}$.
Version complexe : Pour les fonctions à valeurs complexes $C(X, \mathbb{C})$, il faut ajouter une condition : l’algèbre doit être stable par conjugaison (si $f \in \mathcal{A}$, alors $\bar{f} \in \mathcal{A}$).
Idée de la Démonstration
La preuve est élégante et repose sur la construction d’approximations de plus en plus fines.
- Stabilité par max et min : On montre d’abord que si une algèbre est fermée (pour la norme uniforme), elle est stable par les opérations $\max(f,g)$ et $\min(f,g)$. C’est une conséquence du fait qu’on peut approcher la fonction valeur absolue $|t|$ sur un segment par des polynômes.
- Approximation locale : Grâce à la propriété de séparation des points, on montre que pour n’importe quels points $x, y$ et n’importe quelles valeurs $a, b$, on peut trouver une fonction $f \in \mathcal{A}$ telle que $f(x)=a$ et $f(y)=b$.
- Argument de « patchwork » : On « recolle » ces approximations locales. Pour une fonction $g$ à approcher, on construit pour chaque point une fonction de l’algèbre qui majore $g$ et coïncide avec elle en ce point. En prenant l’enveloppe inférieure de ces majorants, on construit une approximation de $g$ par le haut. On fait de même par le bas, et on « pince » ainsi la fonction $g$ entre deux fonctions de l’algèbre, aussi proches que l’on veut.
Applications et Portée
- Polynômes trigonométriques : Le théorème prouve que toute fonction continue $2\pi$-périodique peut être approchée uniformément par un polynôme trigonométrique (une somme finie de sinus et cosinus). C’est le fondement de la théorie des séries de Fourier.
- Généralisation de l’analyse : Il montre que l’idée d’approximation par des fonctions « simples » (polynômes, etc.) n’est pas limitée aux intervalles de $\mathbb{R}$, mais s’applique à des espaces beaucoup plus abstraits et généraux, tant qu’ils sont compacts.
- Apprentissage automatique (Machine Learning) : Des versions du théorème sont invoquées pour justifier que les réseaux de neurones avec une couche cachée peuvent, en principe, approcher n’importe quelle fonction continue, leur conférant ainsi leur statut d' »approximateurs universels ».