La Convexité affine constitue une propriété fondamentale des espaces affines réels, caractérisant les ensembles stables par barycentres à coefficients positifs et jouant un rôle central en analyse fonctionnelle et en optimisation. Cette notion géométrique repose exclusivement sur la structure affine sans nécessiter de métrique euclidienne.

Définition formelle d’un ensemble convexe

Soit $\mathcal{E}$ un espace affine réel de dimension quelconque. Une partie non vide $C \subseteq \mathcal{E}$ est dite convexe si, pour tout couple de points distincts $A, B \in C$, le segment $[AB]$ reliant ces deux points est entièrement inclus dans $C$.

Analytiquement, cette condition s’exprime par la stabilité sous combinaison convexe de deux points. Pour tous $A, B \in C$ et tout scalaire $t \in [0, 1]$ :

$$ (1-t)A + tB \in C $$

Où le point $M = (1-t)A + tB$ est le barycentre du système pondéré $\{(A, 1-t), (B, t)\}$. Si cette propriété est vérifiée, l’ensemble ne présente aucune « concavité » ni « trou » interne qui briserait la ligne droite entre deux de ses points.

Généralisation aux combinaisons convexes finies

Une propriété cruciale de la Convexité affine est sa stabilité par itération. Un ensemble $C$ est convexe si et seulement if il contient toute combinaison convexe finie de ses éléments.

Pour toute famille finie de points $(A_i)_{i=1}^n \subset C$ et toute famille de scalaires $(\lambda_i)_{i=1}^n$ tels que :

$$ \forall i, \quad \lambda_i \geq 0 \quad \text{et} \quad \sum_{i=1}^n \lambda_i = 1 $$

Le barycentre $G = \sum_{i=1}^n \lambda_i A_i$ appartient nécessairement à $C$. Cette caractérisation étend la définition du segment à des polytopes de dimension supérieure.

Preuve par récurrence : La propriété est vraie pour $n=2$ par définition. Supposons-la vraie au rang $n$. Soit une famille de $n+1$ points. Si $\lambda_{n+1}=1$, le résultat est trivial. Sinon, posons $\mu = \sum_{i=1}^n \lambda_i = 1 – \lambda_{n+1} > 0$.

On peut réécrire le barycentre : $G = \mu \left( \sum_{i=1}^n \frac{\lambda_i}{\mu} A_i \right) + \lambda_{n+1} A_{n+1}$. Le terme entre parenthèses est un barycentre de $n$ points (donc dans $C$ par hypothèse de récurrence). $G$ est alors un barycentre de deux points de $C$, donc $G \in C$. $\blacksquare$

Enveloppe convexe et théorèmes de structure

L’étude de la Convexité affine mène naturellement à la notion d’enveloppe convexe, qui est l’analogue convexe de l’enveloppe affine ou du sous-espace engendré.

Définition et existence de l’enveloppe convexe

Soit $S$ une partie quelconque de $\mathcal{E}$. L’enveloppe convexe de $S$, notée $\text{conv}(S)$, est définie comme le plus petit ensemble convexe contenant $S$.

Elle existe toujours et coïncide avec l’intersection de tous les ensembles convexes contenant $S$ :

$$ \text{conv}(S) = \bigcap \{ C \subseteq \mathcal{E} \mid S \subseteq C \text{ et } C \text{ est convexe} \} $$

Alternativement, $\text{conv}(S)$ est exactement l’ensemble de toutes les combinaisons convexes finies de points de $S$. C’est une construction purement affine.

Théorème de Carathéodory

Ce théorème fondamental borne le nombre de points nécessaires pour décrire un point de l’enveloppe convexe en fonction de la dimension de l’espace.

Énoncé : Soit $S \subset \mathbb{R}^d$ (ou un espace affine de dimension $d$). Tout point $x \in \text{conv}(S)$ peut s’écrire comme une combinaison convexe d’au plus $d+1$ points de $S$.

Implication : Dans le plan ($d=2$), tout point d’un ensemble convexe généré par un nuage de points appartient à un triangle formé par trois de ces points. Dans l’espace ($d=3$), il appartient à un tétraèdre.

Ce résultat simplifie considérablement l’étude algorithmique de la Convexité affine en réduisant la complexité combinatoire des représentations.

Propriétés topologiques et opérations ensemblistes

Bien que définie purement algébriquement, la Convexité affine interagit fortement avec la topologie usuelle des espaces vectoriels réels de dimension finie.

Stabilité par intersection et image affine

L’intersection d’une famille quelconque (finie ou infinie) d’ensembles convexes est un ensemble convexe. C’est la propriété clé garantissant l’existence de l’enveloppe convexe par intersection.

De plus, l’image d’un ensemble convexe par une application affine est convexe. Soit $f : \mathcal{E} \to \mathcal{F}$ affine et $C \subset \mathcal{E}$ convexe. Alors $f(C)$ est convexe dans $\mathcal{F}$.

Démonstration : Soient $y_1, y_2 \in f(C)$. Il existe $x_1, x_2 \in C$ tels que $f(x_1)=y_1$ et $f(x_2)=y_2$. Pour $t \in [0,1]$ :

$$ (1-t)y_1 + ty_2 = (1-t)f(x_1) + tf(x_2) = f((1-t)x_1 + tx_2) $$

Puisque $C$ est convexe, $(1-t)x_1 + tx_2 \in C$, donc son image appartient à $f(C)$.

Intérieur et adhérence d’un convexe

Dans un espace affine de dimension finie muni d’une topologie compatible (comme la topologie euclidienne), l’intérieur $\text{int}(C)$ et l’adhérence $\overline{C}$ d’un convexe $C$ sont eux-mêmes convexes.

Cependant, la frontière d’un convexe n’est généralement pas convexe (sauf cas triviaux comme un demi-espace). La connexité par arcs est garantie : tout ensemble convexe non vide est connexe par arcs, car le segment reliant deux points fournit un chemin continu.

Exemples concrets et contre-exemples

Illustrons la théorie de la Convexité affine par des exemples classiques et des configurations géométriques instructives.

Exemple 1 : Polyèdres et simplexes

Un simplexe est l’enveloppe convexe de $d+1$ points affinement indépendants dans un espace de dimension $d$. En dimension 2, c’est un triangle ; en dimension 3, un tétraèdre.

Tout polyèdre convexe borné (polytope) est l’enveloppe convexe de ses sommets. Par exemple, un cube est l’enveloppe convexe de ses 8 sommets. Tout point intérieur au cube s’écrit comme une combinaison convexe de ces sommets.

Ces objets sont centraux en programmation linéaire où la région des solutions réalisables est souvent un polyèdre convexe.

Exemple 2 : Boules et ellipsoïdes

Dans un espace euclidien, toute boule fermée $B(a, r) = \{ x \mid \|x-a\| \leq r \}$ est un ensemble convexe.

Preuve rapide : Par l’inégalité triangulaire de la norme. Si $\|x-a\| \leq r$ et $\|y-a\| \leq r$, alors pour $t \in [0,1]$ :

$$ \|(1-t)x + ty – a\| = \|(1-t)(x-a) + t(y-a)\| \leq (1-t)\|x-a\| + t\|y-a\| \leq (1-t)r + tr = r $$

Cette propriété s’étend aux ellipsoïdes, qui sont images affines de boules, conservant ainsi la convexité.

Contre-exemple : Couronnes et étoiles

Une couronne circulaire (ensemble des points entre deux cercles concentriques) n’est pas convexe. On peut choisir deux points diamétralement opposés dans la couronne tels que le segment les reliant traverse le trou central, qui n’appartient pas à l’ensemble.

De même, une forme en étoile à cinq branches n’est pas convexe : le segment reliant deux sommets de branches adjacentes passe à l’extérieur de la figure. La Convexité affine exige une absence totale de « creux ».

Applications en optimisation et analyse

La Convexité affine est le pilier théorique de l’optimisation convexe, garantissant l’existence et l’unicité relative des solutions globales.

Optimisation sur un domaine convexe

Si l’on cherche à minimiser une fonction convexe sur un ensemble convexe $C$, tout minimum local est automatiquement un minimum global.

Cette propriété remarquable élimine le risque de rester piégé dans des optima locaux non globaux, ce qui n’est pas garanti dans le cas non convexe. Les algorithmes de descente convergent vers la solution unique (si la fonction est strictement convexe).

Séparation des convexes (Théorème de Hahn-Banach géométrique)

Un théorème puissant affirme que deux ensembles convexes disjoints (sous certaines conditions de régularité) peuvent être séparés par un hyperplan affine.

Il existe une forme linéaire $\varphi$ et un réel $c$ tels que :

$$ \forall x \in C_1, \varphi(x) \leq c \quad \text{et} \quad \forall y \in C_2, \varphi(y) \geq c $$

Ce résultat est fondamental en économie mathématique (équilibres de marché) et en théorie du contrôle, permettant de distinguer géométriquement des états faisables et interdits.

Conclusion synthétique

La Convexité affine offre un cadre géométrique robuste où les propriétés de stabilité par barycentres positifs simplifient l’analyse des ensembles et des fonctions. De la définition élémentaire du segment aux théorèmes profonds comme celui de Carathéodory ou de séparation, cette notion structure une grande partie des mathématiques appliquées modernes.

Sa maîtrise est indispensable pour aborder la programmation linéaire et non linéaire, l’analyse fonctionnelle et la géométrie computationnelle, où elle garantit la cohérence et la tractabilité des problèmes d’optimisation.