Le Théorème de Schwarz
Lorsqu’on calcule les dérivées partielles secondes d’une fonction de plusieurs variables, une question naturelle se pose : l’ordre dans lequel on effectue les dérivations a-t-il une importance ? Autrement dit, est-ce que dériver d’abord par rapport à $x$ puis par rapport à $y$ donne le même résultat que dériver d’abord par rapport à $y$ puis par rapport à $x$ ? Le théorème de Schwarz (parfois appelé théorème de Clairaut) apporte une réponse positive à cette question, à condition que la fonction soit suffisamment « régulière ».
1. Énoncé du Théorème
Soit $f: U \subset \mathbb{R}^p \to \mathbb{R}$ une fonction définie sur un ouvert $U$. Soit $a \in U$.
On suppose que les dérivées partielles mixtes $\frac{\partial^2 f}{\partial x_j \partial x_i}$ et $\frac{\partial^2 f}{\partial x_i \partial x_j}$ existent sur l’ouvert $U$ et sont continues au point $a$.
Alors, ces dérivées partielles mixtes sont égales en ce point :
$$ \frac{\partial^2 f}{\partial x_j \partial x_i}(a) = \frac{\partial^2 f}{\partial x_i \partial x_j}(a) $$
Si une fonction $f$ est de classe C² sur un ouvert $U$, alors pour tout point $a \in U$ et pour toute paire de variables $(x_i, x_j)$, on a : $$ \frac{\partial^2 f}{\partial x_j \partial x_i}(a) = \frac{\partial^2 f}{\partial x_i \partial x_j}(a) $$ En effet, si $f$ est de classe C², ses dérivées secondes sont par définition continues sur tout l’ouvert $U$, donc l’hypothèse du théorème est toujours vérifiée.
2. Conséquence : Symétrie de la Matrice Hessienne
La conséquence la plus importante du théorème de Schwarz est la symétrie de la matrice Hessienne pour les fonctions de classe C².
Rappelons que la matrice Hessienne de $f$ est la matrice de ses dérivées secondes :
$$ H_f(a) = \left( \frac{\partial^2 f}{\partial x_i \partial x_j}(a) \right)_{1 \le i,j \le p} $$
Le théorème de Schwarz nous dit que le terme à la ligne $i$ et colonne $j$ est égal au terme à la ligne $j$ et colonne $i$.
Ceci signifie que la matrice Hessienne est une matrice symétrique ($H_f = H_f^T$). Cette propriété est fondamentale en optimisation, car elle garantit que les valeurs propres de la Hessienne sont réelles, ce qui est crucial pour déterminer la nature d’un point critique (minimum, maximum ou point selle).
Exemple de Vérification
Soit la fonction $f(x,y) = x^3y^2 + \sin(xy)$. Cette fonction est de classe C∞ sur $\mathbb{R}^2$, donc le théorème de Schwarz doit s’appliquer.
- Dérivées premières : $$ \frac{\partial f}{\partial x} = 3x^2y^2 + y\cos(xy) $$ $$ \frac{\partial f}{\partial y} = 2x^3y + x\cos(xy) $$
- Dérivées mixtes :
- Dérivons $\frac{\partial f}{\partial x}$ par rapport à $y$ : $$ \frac{\partial^2 f}{\partial y \partial x} = \frac{\partial}{\partial y}(3x^2y^2 + y\cos(xy)) = 6x^2y + (1 \cdot \cos(xy) + y \cdot (-x\sin(xy))) = 6x^2y + \cos(xy) – xy\sin(xy) $$
- Dérivons $\frac{\partial f}{\partial y}$ par rapport à $x$ : $$ \frac{\partial^2 f}{\partial x \partial y} = \frac{\partial}{\partial x}(2x^3y + x\cos(xy)) = 6x^2y + (1 \cdot \cos(xy) + x \cdot (-y\sin(xy))) = 6x^2y + \cos(xy) – xy\sin(xy) $$
On constate bien que $\frac{\partial^2 f}{\partial y \partial x} = \frac{\partial^2 f}{\partial x \partial y}$.
3. Importance de l’Hypothèse de Continuité
L’hypothèse de continuité des dérivées secondes est cruciale. Il existe des fonctions « pathologiques » pour lesquelles les dérivées mixtes existent mais ne sont pas continues, et dans ce cas, elles ne sont pas égales. Ces cas sont cependant rarement rencontrés en pratique. Pour la quasi-totalité des fonctions usuelles, l’ordre de dérivation peut être interverti sans problème.