Introduction à l’Anneau des Polynômes $K[X]$
En algèbre, l’étude des structures est fondamentale. Parmi les plus importantes, les anneaux occupent une place centrale. Un exemple d’anneau particulièrement riche et essentiel, tant en algèbre théorique qu’en analyse ou en géométrie, est l’anneau des polynômes à une indéterminée à coefficients dans un corps $K$. On note cet anneau $K[X]$.
La structure de $K[X]$ présente une analogie profonde et fructueuse avec celle de l’anneau des entiers relatifs, $\mathbb{Z}$. Tout comme dans $\mathbb{Z}$, on trouve dans $K[X]$ une division euclidienne, une notion de divisibilité, des « nombres premiers » (les polynômes irréductibles), un algorithme d’Euclide pour calculer le plus grand commun diviseur (PGCD), et un théorème de factorisation unique. Cette ressemblance fait de $K[X]$ un prototype pour l’étude des anneaux euclidiens, principaux, et factoriels.
L’objet de ce document est de construire rigoureusement l’anneau $K[X]$, de détailler ses propriétés arithmétiques fondamentales, d’étudier le concept de racines et de conclure sur des applications majeures comme la construction de nouveaux corps. Nous supposerons que $K$ est un corps commutatif (comme $\mathbb{Q}$, $\mathbb{R}$ ou $\mathbb{C}$).
Construction Formelle de $K[X]$
Intuitivement, un polynôme est une expression de la forme $a_n X^n + a_{n-1} X^{n-1} + \dots + a_1 X + a_0$. Pour construire une structure solide, il faut une définition plus formelle, qui ne dépende pas du symbole $X$ dont la nature est a priori floue. La bonne approche est de voir un polynôme comme la suite de ses coefficients.
Soit $K$ un corps commutatif. Un polynôme à une indéterminée à coefficients dans $K$ est une suite $P = (a_k)_{k \in \mathbb{N}}$ d’éléments de $K$ qui sont tous nuls à partir d’un certain rang. C’est-à-dire : $$ \exists n \in \mathbb{N}, \forall k > n, a_k = 0 $$ L’ensemble de ces suites est noté $K[X]$. Les éléments $a_k$ sont appelés les coefficients du polynôme.
Exemple
Le polynôme $P(X) = 3X^2 – X + 5$ à coefficients dans $\mathbb{R}$ correspond à la suite $(5, -1, 3, 0, 0, \dots)$. Le polynôme nul, noté $0_{K[X]}$, est la suite dont tous les termes sont nuls : $(0, 0, 0, \dots)$. Un polynôme constant $c \in K$ correspond à la suite $(c, 0, 0, \dots)$.
Opérations sur $K[X]$
On peut munir l’ensemble $K[X]$ de deux opérations : une addition et une multiplication, qui correspondent aux opérations que l’on effectue usuellement sur les polynômes.
Soient $P = (a_k)_{k \in \mathbb{N}}$ et $Q = (b_k)_{k \in \mathbb{N}}$ deux polynômes de $K[X]$.
1. Addition : La somme $P+Q$ est le polynôme $S = (s_k)_{k \in \mathbb{N}}$ défini par : $$ \forall k \in \mathbb{N}, \quad s_k = a_k + b_k $$
2. Multiplication (Produit de Cauchy) : Le produit $P \times Q$ est le polynôme $T = (t_k)_{k \in \mathbb{N}}$ défini par : $$ \forall k \in \mathbb{N}, \quad t_k = \sum_{i=0}^{k} a_i b_{k-i} = \sum_{i+j=k} a_i b_j $$
Il faut vérifier que ces opérations sont bien internes à $K[X]$. Si $a_k=0$ pour $k>n$ et $b_k=0$ pour $k>m$, alors $a_k+b_k=0$ pour $k>\max(n,m)$, et $\sum_{i+j=k} a_i b_j = 0$ pour $k > n+m$. Donc la somme et le produit sont bien des polynômes.
Muni de ces deux lois, $(K[X], +, \times)$ est un anneau commutatif unitaire.
- L’élément neutre pour l’addition est le polynôme nul $0_{K[X]} = (0, 0, \dots)$.
- L’élément neutre pour la multiplication est le polynôme unité $1_{K[X]} = (1, 0, 0, \dots)$.
De plus, si $K$ est un corps, l’anneau $K[X]$ est intègre, c’est-à-dire que pour tous polynômes $P, Q \in K[X]$: $$ P \times Q = 0_{K[X]} \implies P=0_{K[X]} \text{ ou } Q=0_{K[X]} $$
Degré d’un polynôme
Le degré est une notion fondamentale pour mesurer la « taille » d’un polynôme.
Soit $P = (a_k)_{k \in \mathbb{N}}$ un polynôme non nul. Le degré de $P$, noté $\deg(P)$, est le plus grand entier $n$ tel que $a_n \neq 0$. $$ \deg(P) = \max\{k \in \mathbb{N} \mid a_k \neq 0 \} $$ Le coefficient $a_n$ est appelé le coefficient dominant de $P$. Si le coefficient dominant est 1, le polynôme est dit unitaire.
Par convention, le degré du polynôme nul est $-\infty$. $$ \deg(0_{K[X]}) = -\infty $$
Soient $P, Q \in K[X]$.
- $\deg(P+Q) \le \max(\deg(P), \deg(Q))$. L’égalité a lieu si $\deg(P) \neq \deg(Q)$.
- $\deg(P \times Q) = \deg(P) + \deg(Q)$.
La deuxième propriété est cruciale. Elle est une conséquence directe du fait que $K$ est un corps (et donc intègre). Si $P$ et $Q$ sont non nuls, de degrés respectifs $n$ et $m$, leurs coefficients dominants sont $a_n \neq 0$ et $b_m \neq 0$. Le coefficient de degré $n+m$ de $P \times Q$ est $a_n b_m$. Comme $K$ est un corps, $a_n b_m \neq 0$, donc $\deg(P \times Q) = n+m$. C’est cette propriété qui prouve que $K[X]$ est intègre.
Avec la notion de degré, on peut enfin donner un sens au symbole $X$. On note $X$ le polynôme $(0, 1, 0, 0, \dots)$. En utilisant la définition de la multiplication, on trouve que $X^2 = X \times X = (0, 0, 1, 0, \dots)$, et plus généralement $X^k$ est le polynôme dont le $k$-ième coefficient est 1 et tous les autres sont nuls. Ainsi, le polynôme $P=(a_0, a_1, \dots, a_n, 0, \dots)$ s’écrit de manière unique : $$ P = \sum_{k=0}^{n} a_k X^k = a_n X^n + \dots + a_1 X + a_0 $$ C’est l’écriture habituelle des polynômes, qui est maintenant formellement justifiée.
Arithmétique dans $K[X]$
L’arithmétique dans $K[X]$ est l’étude de la divisibilité, des PGCD, et de la factorisation. Elle est dominée par un résultat central : l’existence d’une division euclidienne.
Division Euclidienne
Tout comme on peut diviser un entier par un autre pour obtenir un quotient et un reste, on peut faire de même avec les polynômes. Le degré joue le rôle de la valeur absolue pour comparer la « taille ».
Soient $A, B \in K[X]$ avec $B \neq 0_{K[X]}$. Alors il existe un unique couple $(Q, R)$ de polynômes dans $K[X]$ tel que : $$ A = BQ + R \quad \text{et} \quad \deg(R) < \deg(B) $$ $Q$ est appelé le quotient et $R$ le reste de la division euclidienne de $A$ par $B$.
Démonstration :
Existence : On procède par récurrence sur le degré de $A$. Soit $n=\deg(A)$ et $p=\deg(B)$.
Si $n < p$, on choisit $Q=0$ et $R=A$. On a bien $A = B \cdot 0 + A$ et $\deg(A) < \deg(B)$.
Supposons que le résultat soit vrai pour tout polynôme de degré strictement inférieur à $n \ge p$.
Soit $A(X) = a_n X^n + \dots$ et $B(X) = b_p X^p + \dots$.
Considérons le polynôme $A_1(X) = A(X) - \frac{a_n}{b_p} X^{n-p} B(X)$.
Le terme de degré $n$ de $\frac{a_n}{b_p} X^{n-p} B(X)$ est $\frac{a_n}{b_p} b_p X^n = a_n X^n$. Par construction, le terme de degré $n$ de $A_1$ s'annule, donc $\deg(A_1) < n$.
Par hypothèse de récurrence appliquée à $A_1$, il existe $(Q_1, R_1)$ tel que $A_1 = B Q_1 + R_1$ avec $\deg(R_1) < \deg(B)$.
On a alors $A = A_1 + \frac{a_n}{b_p} X^{n-p} B = (B Q_1 + R_1) + \frac{a_n}{b_p} X^{n-p} B = B (Q_1 + \frac{a_n}{b_p} X^{n-p}) + R_1$.
En posant $Q = Q_1 + \frac{a_n}{b_p} X^{n-p}$ et $R=R_1$, on obtient le résultat.
Unicité : Supposons qu’il existe deux couples $(Q, R)$ et $(Q’, R’)$. On a $BQ + R = BQ’ + R’$, donc $B(Q-Q’) = R’ – R$.
En passant aux degrés, $\deg(B) + \deg(Q-Q’) = \deg(R’ – R)$.
Or, $\deg(R’ – R) \le \max(\deg(R’), \deg(R)) < \deg(B)$.
On a donc $\deg(B) + \deg(Q-Q') < \deg(B)$. Ceci n'est possible que si $\deg(Q-Q') = -\infty$, c'est-à-dire $Q-Q' = 0$, donc $Q=Q'$.
Il s'ensuit que $R'-R=0$, donc $R=R'$. D'où l'unicité.
Exemple de division euclidienne
Divisons $A(X) = 2X^4 + X^3 – X^2 + 5X – 1$ par $B(X) = X^2 – X + 1$ dans $\mathbb{R}[X]$. On « pose » la division comme à l’école primaire :
2X^4 + X^3 - X^2 + 5X - 1 | X^2 - X + 1 -(2X^4 - 2X^3 + 2X^2) |-------------------- --------------------- | 2X^2 + 3X 3X^3 - 3X^2 + 5X -(3X^3 - 3X^2 + 3X) ------------------- 2X - 1
Le quotient est $Q(X) = 2X^2 + 3X$ et le reste est $R(X) = 2X-1$. On a bien $\deg(R) = 1 < \deg(B)=2$.
Divisibilité, PGCD et Théorème de Bézout
La division euclidienne est le pilier de toute l’arithmétique de $K[X]$.
Soient $A, B \in K[X]$. On dit que $B$ divise $A$, et on note $B | A$, s’il existe un polynôme $Q \in K[X]$ tel que $A=BQ$. Cela équivaut à dire que le reste de la division euclidienne de $A$ par $B$ est le polynôme nul.
Comme dans $\mathbb{Z}$, on peut définir le plus grand commun diviseur. La définition la plus propre passe par la notion d’idéal.
Soient $A, B \in K[X]$, non tous les deux nuls. Le plus grand commun diviseur de $A$ et $B$, noté $\text{pgcd}(A, B)$, est l’unique polynôme unitaire $D$ qui vérifie :
- $D$ divise $A$ et $D$ divise $B$.
- Tout polynôme divisant $A$ et $B$ divise aussi $D$.
L’existence et l’unicité d’un tel polynôme sont garanties par le fait que l’anneau $K[X]$ est principal (tout idéal est engendré par un seul élément). L’idéal $(A, B) = \{AU+BV \mid U,V \in K[X]\}$ est engendré par un polynôme $D$. En le choisissant unitaire, il devient unique.
En pratique, le PGCD est calculé à l’aide de l’algorithme d’Euclide, qui consiste en une succession de divisions euclidiennes.
$A = BQ_1 + R_1$
$B = R_1Q_2 + R_2$
$R_1 = R_2Q_3 + R_3$
…
Le dernier reste non nul, rendu unitaire, est le PGCD de $A$ et $B$.
Soient $A, B \in K[X]$ et $D = \text{pgcd}(A, B)$. Alors il existe deux polynômes $U, V \in K[X]$ tels que : $$ AU + BV = D $$ Ces polynômes $U$ et $V$ peuvent être trouvés en « remontant » l’algorithme d’Euclide.
Polynômes irréductibles et Factorisation
La notion de polynôme irréductible est l’analogue de celle de nombre premier pour les entiers.
Un polynôme $P \in K[X]$ est dit irréductible sur $K$ s’il est non constant et si ses seuls diviseurs sont les polynômes constants (non nuls) et les polynômes de la forme $c P$ où $c \in K^*$.
Autrement dit, si $P = QR$, alors soit $Q$, soit $R$ est un polynôme constant.
Exemples de polynômes irréductibles
- Tout polynôme de degré 1 est irréductible.
- Le polynôme $X^2+1$ est irréductible dans $\mathbb{R}[X]$ mais pas dans $\mathbb{C}[X]$, car $X^2+1 = (X-i)(X+i)$.
- Le polynôme $X^2-2$ est irréductible dans $\mathbb{Q}[X]$ mais pas dans $\mathbb{R}[X]$, car $X^2-2 = (X-\sqrt{2})(X+\sqrt{2})$.
La notion d’irréductibilité dépend crucialement du corps de base $K$.
Tout polynôme non constant $P \in K[X]$ se décompose de manière unique (à l’ordre des facteurs et à la multiplication par des constantes près) en un produit de polynômes irréductibles unitaires : $$ P = c \cdot P_1^{k_1} P_2^{k_2} \cdots P_r^{k_r} $$ où $c$ est le coefficient dominant de $P$, les $P_i$ sont des polynômes irréductibles unitaires distincts, et les $k_i$ sont des entiers $\ge 1$.
Ce théorème signifie que $K[X]$ est un anneau factoriel.
Racines d’un Polynôme
Jusqu’à présent, nous avons traité les polynômes comme des objets formels. On peut aussi les voir comme des fonctions.
À tout polynôme $P(X) = \sum a_k X^k \in K[X]$, on peut associer une fonction polynomiale $\tilde{P}: K \to K$ définie par $\tilde{P}(x) = \sum a_k x^k$ pour tout $x \in K$.
Un élément $\alpha \in K$ est une racine (ou un zéro) du polynôme $P$ si $\tilde{P}(\alpha) = 0$. On note souvent, par abus de langage, $P(\alpha)=0$.
Le lien entre la divisibilité et les racines est fondamental.
Soit $P \in K[X]$ et $\alpha \in K$. Alors $\alpha$ est une racine de $P$ si et seulement si le polynôme $(X-\alpha)$ divise $P$.
Démonstration : Effectuons la division euclidienne de $P$ par $(X-\alpha)$. On a $P(X) = (X-\alpha)Q(X) + R(X)$ avec $\deg(R) < \deg(X-\alpha) = 1$. Donc $R$ est un polynôme constant, disons $R(X)=c$. En évaluant en $\alpha$, on obtient $P(\alpha) = (\alpha-\alpha)Q(\alpha) + c = c$. Ainsi, $P(\alpha)=0$ si et seulement si $c=0$, c'est-à-dire si et seulement si $R=0$, ce qui signifie que $(X-\alpha)$ divise $P$.
Ce résultat simple a une conséquence majeure : un polynôme de degré $n$ ne peut avoir plus de $n$ racines distinctes. S’il avait $n+1$ racines $\alpha_1, \dots, \alpha_{n+1}$, alors $(X-\alpha_1)\cdots(X-\alpha_{n+1})$ diviserait $P$. Or, ce diviseur est de degré $n+1$, ce qui est impossible si $P$ est de degré $n$.
Multiplicité d’une racine et Dérivation Formelle
Soit $P$ un polynôme non nul et $\alpha$ une racine de $P$. La multiplicité de la racine $\alpha$ est le plus grand entier $k \ge 1$ tel que $(X-\alpha)^k$ divise $P$.
- Si $k=1$, la racine est dite simple.
- Si $k \ge 2$, la racine est dite multiple.
Pour caractériser les racines multiples, on introduit la notion de dérivée formelle.
Soit $P(X) = \sum_{k=0}^{n} a_k X^k$. La dérivée formelle de $P$, notée $P’$, est le polynôme : $$ P'(X) = \sum_{k=1}^{n} k a_k X^{k-1} $$
Soit $P \in K[X]$ et $\alpha \in K$.
Alors $\alpha$ est une racine multiple de $P$ (multiplicité $k \ge 2$) si et seulement si $P(\alpha) = 0$ et $P'(\alpha) = 0$.
Plus généralement, $\alpha$ est une racine de multiplicité $k$ si et seulement si : $$ P(\alpha) = P'(\alpha) = \dots = P^{(k-1)}(\alpha) = 0 \quad \text{et} \quad P^{(k)}(\alpha) \neq 0 $$
Le cas des corps $\mathbb{C}$ et $\mathbb{R}$
La structure des polynômes irréductibles dépend fortement du corps $K$. Pour les corps des nombres complexes et réels, les choses sont remarquablement simples.
Tout polynôme non constant à coefficients dans le corps des nombres complexes $\mathbb{C}$ admet au moins une racine dans $\mathbb{C}$.
Un corps vérifiant cette propriété est dit algébriquement clos.
Une conséquence directe de ce théorème est que les seuls polynômes irréductibles de $\mathbb{C}[X]$ sont les polynômes de degré 1. Tout polynôme $P \in \mathbb{C}[X]$ de degré $n \ge 1$ se factorise donc complètement en un produit de facteurs de degré 1 : $$ P(X) = c (X – \alpha_1) \cdots (X – \alpha_n) $$ où les $\alpha_i \in \mathbb{C}$ sont les racines de $P$, répétées selon leur multiplicité.
Pour $\mathbb{R}[X]$, la situation est légèrement différente.
Les polynômes irréductibles de $\mathbb{R}[X]$ sont :
- Les polynômes de degré 1.
- Les polynômes de degré 2 de la forme $aX^2+bX+c$ sans racine réelle, c’est-à-dire dont le discriminant $\Delta = b^2-4ac$ est strictement négatif.
Par conséquent, tout polynôme non constant de $\mathbb{R}[X]$ se factorise en un produit de polynômes de degré 1 et de polynômes de degré 2 à discriminant négatif.
Cette propriété provient du fait que si $\alpha \in \mathbb{C}$ est une racine complexe non réelle d’un polynôme $P \in \mathbb{R}[X]$, alors son conjugué $\bar{\alpha}$ est aussi une racine de $P$. Le produit $(X-\alpha)(X-\bar{\alpha}) = X^2 – (\alpha+\bar{\alpha})X + \alpha\bar{\alpha} = X^2 – 2\text{Re}(\alpha)X + |\alpha|^2$ est alors un polynôme de degré 2 à coefficients réels et à discriminant négatif qui divise $P$.