Problème d’Optimisation avec Contraintes
Jusqu’à présent, nous avons cherché les extrémums d’une fonction sur un domaine ouvert, où les variables étaient « libres ». Cependant, de nombreux problèmes réels imposent des contraintes sur les variables. Par exemple, maximiser la surface d’un enclos pour un périmètre donné, ou minimiser le coût de production pour un volume fixé.
On ne cherche plus les extrémums sur tout l’espace, mais seulement sur un sous-ensemble (une courbe, une surface) défini par une ou plusieurs équations de contrainte.
1. L’Intuition Géométrique : La Méthode de Lagrange
Considérons le problème de trouver le maximum de $f(x,y)$ sous la contrainte $g(x,y)=k$.
La contrainte $g(x,y)=k$ définit une courbe de niveau de la fonction $g$. On cherche le point sur cette courbe où la fonction $f$ est maximale.
Imaginons les lignes de niveau de la fonction $f$. En un point d’extremum, la ligne de niveau de $f$ qui passe par ce point doit être tangente à la courbe de contrainte. Si elles n’étaient pas tangentes, on pourrait se déplacer le long de la courbe de contrainte tout en traversant des lignes de niveau de $f$, et donc augmenter ou diminuer la valeur de $f$, ce qui contredirait le fait que l’on est en un extremum.
Or, nous savons que le gradient est orthogonal aux lignes de niveau. Si les deux courbes sont tangentes, leurs vecteurs normaux (leurs gradients) doivent être colinéaires.
En un point d’extremum de $f$ sous la contrainte $g=k$, il existe un scalaire $\lambda$ (le « multiplicateur de Lagrange ») tel que : $$ \nabla f(x,y) = \lambda \nabla g(x,y) $$
2. Formalisation : Le Lagrangien
La méthode de Lagrange transforme un problème d’optimisation avec contraintes en un problème d’optimisation sans contrainte sur une nouvelle fonction, le Lagrangien.
Pour optimiser une fonction $f(x_1, \dots, x_p)$ sous la contrainte $g(x_1, \dots, x_p)=k$, on définit la fonction Lagrangien $L$ qui dépend des variables initiales et d’une nouvelle variable $\lambda$ : $$ L(x_1, \dots, x_p, \lambda) = f(x_1, \dots, x_p) – \lambda (g(x_1, \dots, x_p) – k) $$
Les extrémums du problème initial se trouvent parmi les points critiques du Lagrangien $L$.
Méthodologie
On cherche les points critiques de $L$ en annulant son gradient :
$$ \nabla L = \vec{0} \iff \begin{cases} \frac{\partial L}{\partial x_1} = \frac{\partial f}{\partial x_1} – \lambda \frac{\partial g}{\partial x_1} = 0 \\ \vdots \\ \frac{\partial L}{\partial x_p} = \frac{\partial f}{\partial x_p} – \lambda \frac{\partial g}{\partial x_p} = 0 \\ \frac{\partial L}{\partial \lambda} = -(g(x_1, \dots, x_p) – k) = 0 \end{cases} $$Les $p$ premières équations se résument à $\nabla f = \lambda \nabla g$, la condition géométrique. La dernière équation, $\frac{\partial L}{\partial \lambda}=0$, redonne simplement la contrainte $g=k$.
Exemple : Maximiser une Aire
Quel est le rectangle de périmètre $P$ fixé qui a la plus grande aire ?
- Mise en équation : On cherche à maximiser la fonction Aire $A(x,y)=xy$ sous la contrainte Périmètre $2x+2y=P$, soit $g(x,y) = x+y = P/2$.
- Lagrangien : $L(x,y,\lambda) = xy – \lambda(x+y – P/2)$.
- Système de points critiques : $$ \begin{cases} \frac{\partial L}{\partial x} = y – \lambda = 0 \\ \frac{\partial L}{\partial y} = x – \lambda = 0 \\ \frac{\partial L}{\partial \lambda} = -(x+y-P/2) = 0 \end{cases} \implies \begin{cases} y = \lambda \\ x = \lambda \\ x+y = P/2 \end{cases} $$
- Résolution : Les deux premières équations impliquent $x=y$. En substituant dans la troisième, on obtient $x+x = P/2 \implies 2x=P/2 \implies x=P/4$. Donc $y=P/4$.
La solution est $x=y=P/4$, ce qui signifie que le rectangle d’aire maximale est un carré.