Différentiabilité des Fonctions Composées : La Règle de la Chaîne

Différentiabilité et Fonctions Composées

Tout comme pour la continuité, la différentiabilité est une propriété qui se comporte très bien avec la composition. La règle de dérivation d’une fonction composée, connue sous le nom de « règle de la chaîne », se généralise élégamment aux fonctions de plusieurs variables en utilisant les matrices jacobiennes.

1. Le Théorème de la Règle de la Chaîne

Le théorème stipule que la composée de deux fonctions différentiables est différentiable. De plus, il donne la formule pour calculer la différentielle (et donc la matrice jacobienne) de la fonction composée.

[Image d’un diagramme de composition g o f]
Théorème : Règle de la Chaîne

Soient $f: U \subset \mathbb{R}^p \to V \subset \mathbb{R}^n$ et $g: V \to \mathbb{R}^m$ deux fonctions.
Si $f$ est différentiable en un point $a \in U$, et si $g$ est différentiable au point $f(a) \in V$, alors la fonction composée $g \circ f : U \to \mathbb{R}^m$ est différentiable en $a$.

De plus, la différentielle de la composée est la composée des différentielles : $$ d(g \circ f)_a = dg_{f(a)} \circ df_a $$ En termes de matrices jacobiennes, cela se traduit par un produit matriciel : $$ J_{g \circ f}(a) = J_g(f(a)) \cdot J_f(a) $$

Cette formule est la généralisation directe de la formule bien connue pour les fonctions d’une variable : $(g(f(t)))’ = g'(f(t)) \cdot f'(t)$. Le produit de nombres est simplement remplacé par le produit de matrices.

2. Développement en Composantes

La formule matricielle est très compacte. On peut la développer pour obtenir la formule de la dérivée partielle de chaque composante de $g \circ f$.
Soit $h = g \circ f$. Notons $x = (x_1, \dots, x_p)$ les variables de $f$, $y = (y_1, \dots, y_n)$ les variables de $g$. On a donc $y_k = f_k(x_1, \dots, x_p)$.

La dérivée partielle de la $k$-ième composante de $h$ par rapport à la $j$-ième variable $x_j$ est donnée par : $$ \frac{\partial h_k}{\partial x_j}(a) = \sum_{i=1}^n \frac{\partial g_k}{\partial y_i}(f(a)) \cdot \frac{\partial f_i}{\partial x_j}(a) $$

3. Exemples d’Application

Cas 1 : Dérivée le long d’un chemin ($f: \mathbb{R} \to \mathbb{R}^p$, $g: \mathbb{R}^p \to \mathbb{R}$)

C’est un cas d’usage très fréquent. On a une fonction scalaire $g(x_1, \dots, x_p)$ et on évalue sa variation le long d’une courbe paramétrée $f(t) = (f_1(t), \dots, f_p(t))$.
La fonction composée est $h(t) = g(f(t))$. C’est une fonction d’une seule variable $t$.

  • $J_g(f(t))$ est la matrice ligne $(\nabla g(f(t)))^T = \begin{pmatrix} \frac{\partial g}{\partial x_1} & \cdots & \frac{\partial g}{\partial x_p} \end{pmatrix}$.
  • $J_f(t)$ est la matrice colonne $f'(t) = \begin{pmatrix} f’_1(t) \\ \vdots \\ f’_p(t) \end{pmatrix}$.

La règle de la chaîne donne : $$ h'(t) = J_h(t) = J_g(f(t)) \cdot J_f(t) = \begin{pmatrix} \frac{\partial g}{\partial x_1} & \cdots & \frac{\partial g}{\partial x_p} \end{pmatrix} \begin{pmatrix} f’_1(t) \\ \vdots \\ f’_p(t) \end{pmatrix} $$ Le résultat est un scalaire obtenu par le produit scalaire du gradient de $g$ et du vecteur tangent à la courbe : $$ h'(t) = \sum_{i=1}^p \frac{\partial g}{\partial x_i}(f(t)) \cdot f’_i(t) = \nabla g(f(t)) \cdot f'(t) $$

Exemple concret : Soit $g(x,y) = x^2y$ et la courbe $f(t) = (\cos t, \sin t)$. Calculons la dérivée de $h(t) = g(\cos t, \sin t)$.
$\nabla g(x,y) = (2xy, x^2)$. Donc $\nabla g(f(t)) = (2\cos t \sin t, \cos^2 t)$.
$f'(t) = (-\sin t, \cos t)$.
$h'(t) = (2\cos t \sin t, \cos^2 t) \cdot (-\sin t, \cos t) = -2\cos t \sin^2 t + \cos^3 t$.

Cas 2 : Coordonnées Polaires ($f: \mathbb{R}^2 \to \mathbb{R}^2$, $g: \mathbb{R}^2 \to \mathbb{R}$)

Soit $g(x,y)$ une fonction. On souhaite exprimer ses dérivées partielles par rapport aux coordonnées polaires $(r, \theta)$. Le changement de coordonnées est donné par $f(r, \theta) = (r\cos\theta, r\sin\theta) = (x,y)$. On veut dériver $h(r,\theta) = g(r\cos\theta, r\sin\theta)$.
La matrice jacobienne du changement de coordonnées est : $$ J_f(r, \theta) = \begin{pmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{pmatrix} = \begin{pmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{pmatrix} $$ La jacobienne de $g$ est $(\nabla g)^T = \begin{pmatrix} \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix}$.
La règle de la chaîne donne $J_h(r,\theta) = J_g(f(r,\theta)) \cdot J_f(r, \theta)$. $$ \begin{pmatrix} \frac{\partial h}{\partial r} & \frac{\partial h}{\partial \theta} \end{pmatrix} = \begin{pmatrix} \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} \begin{pmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{pmatrix} $$ En effectuant le produit matriciel, on obtient les dérivées partielles de $h$ : $$ \frac{\partial h}{\partial r} = \frac{\partial g}{\partial x}\cos\theta + \frac{\partial g}{\partial y}\sin\theta $$ $$ \frac{\partial h}{\partial \theta} = -\frac{\partial g}{\partial x}r\sin\theta + \frac{\partial g}{\partial y}r\cos\theta $$