Conditions Nécessaires du Premier Ordre
Dans la recherche d’extrémums locaux d’une fonction, la première étape n’est pas de tester chaque point, mais d’éliminer la grande majorité des points qui ne peuvent pas être des extrémums. Le calcul différentiel fournit une condition très puissante pour cela : le théorème de Fermat, qui stipule qu’en un extremum local d’une fonction différentiable, le gradient doit s’annuler.
1. Le Théorème de Fermat
Soit $f: U \subset \mathbb{R}^p \to \mathbb{R}$ une fonction définie sur un ouvert $U$.
Si $f$ est différentiable en un point $a \in U$ et si $f$ admet un extremum local (minimum ou maximum) en $a$, alors la différentielle de $f$ en $a$ est l’application nulle.
Cela équivaut à dire que le gradient de $f$ en $a$ est le vecteur nul :
$$ \nabla f(a) = \vec{0} $$
La preuve est une simple réduction au cas d’une variable.
Supposons que $f$ admette un extremum local en $a=(a_1, \dots, a_p)$.
Considérons la fonction partielle par rapport à la $i$-ème variable, $g(t) = f(a_1, \dots, t, \dots, a_p)$. Cette fonction d’une seule variable $t$ admet également un extremum local en $t=a_i$.
D’après le théorème de Fermat pour les fonctions d’une variable, sa dérivée en ce point doit être nulle : $g'(a_i)=0$.
Or, par définition, la dérivée $g'(a_i)$ n’est autre que la dérivée partielle de $f$ par rapport à $x_i$ au point $a$ :
$$ g'(a_i) = \frac{\partial f}{\partial x_i}(a) = 0 $$
Comme ce raisonnement est valable pour chaque variable $i \in \{1, \dots, p\}$, toutes les composantes du gradient sont nulles. Le vecteur gradient est donc le vecteur nul.
2. Interprétation Géométrique : le Plan Tangent Horizontal
Le gradient est nul signifie que toutes les dérivées partielles sont nulles. Géométriquement, cela veut dire que les pentes des tangentes dans les directions des axes sont nulles.
Le plan tangent au graphe de $f$ au point $(a, f(a))$ a pour équation :
$$ z = f(a) + \nabla f(a) \cdot (x-a) $$
Si $\nabla f(a) = \vec{0}$, l’équation se réduit à $z = f(a)$. C’est l’équation d’un plan horizontal.
La condition de Fermat signifie donc qu’en tout point d’extremum local (à l’intérieur du domaine), la « carte » locale de la fonction doit être plate.
3. L’Importance de la Condition
Ce théorème est fondamental car il transforme un problème de recherche sur un ensemble infini (l’ouvert $U$) en un problème de résolution d’un système d’équations. Les points qui vérifient $\nabla f(a) = \vec{0}$ sont appelés points critiques. Ce sont les seuls candidats possibles pour être des extrémums locaux.
Il est crucial de se rappeler que la réciproque du théorème de Fermat est fausse.
Un point critique (où le gradient est nul) n’est pas nécessairement un extremum local. Il peut être un point selle.
Le théorème de Fermat permet de trouver les candidats. Il ne dit rien sur leur nature. Pour déterminer si un point critique est un minimum, un maximum ou un point selle, une analyse d’ordre supérieur (avec la matrice Hessienne) est requise.