Convexité et inégalités


Bertrand Hauchecorne

Les fonctions convexes se sont développées en analyse pour démontrer des inégalités

Cauchy et l’inégalité des moyennes

Dans son ouvrage Analyse algébrique, publié en 1821, Augustin-Louis Cauchy (1789–1857) énonce le théorème suivant : « La moyenne géométrique entre plusieurs nombres A, B, C, D… est toujours inférieure à leur moyenne arithmétique. »


En d’autres termes, en utilisant ses notations, on a la relation :

 

Sa démonstration est laborieuse et, de manière sous-jacente, cette propriété découle de la convexité de la fonction 

Dans un article publié en 1888, Leonard James Rogers (1862–1933) propose de démontrer beaucoup d’autres inégalités « par une légère extension du théorème bien connu concernant l’inégalité entre les moyennes géométrique et arithmétique de n nombres positifs ». Le mathématicien britannique généralise alors l’inégalité démontrée par Cauchy à des moyennes pondérées. Plus précisément, il prouve que si a1, a2an et b1, b2bn sont des quantités positives, alors :

En prenant tous les ai égaux à 1, on retrouve bien l’inégalité arithmético-géométrique. Rogers s’appuie sur ce résultat pour démontrer différentes inégalités, y compris sur des intégrales en passant par les sommes de Riemann, mais aussi une inégalité attribuée, fort injustement, à Hölder.

 

Hölder près du but


Dans un mémoire publié en 1889, Otto Ludwig Hölder (1859–1937) s’intéresse à une fonction φ dont la dérivée est strictement croissante et démontre que la moyenne arithmétique pondérée des valeurs prises par φ en des points quelconques est supérieure strictement à la valeur prise par cette fonction au point correspondant à la moyenne arithmétique pondérée des points concernés. Après avoir lu trois fois cette phrase, le lecteur sera convaincu qu’il s’agit de la formule suivante :

En prenant n = 2 et a1 + a2 = 1, on retrouve la définition usuelle d’une fonction convexe, à la différence près que Hölder travaille avec des inégalités strictes. Le mathématicien allemand utilise le théorème des accroissements finis pour démontrer sa formule pour n = 2.

Le mathématicien allemand démontre alors quelques inégalités en utilisant la convexité de la fonction exponentielle et la concavité de la fonction logarithme.

 

Enfin une définition !

Le 17 janvier 1905 pourrait être considéré comme la date de naissance de la notion de fonction convexe. Certes, certains avant cette date avaient utilisé des propriétés de fonctions convexes pour démontrer des inégalités mais, ce jour-là, le mathématicien danois Johan Jensen en donna une première définition lors d’une conférence donnée à la Société mathématique danoise. 

Pour lui, selon ses termes (il écrit en français), « lorsqu’une fonction φ, réelle, finie et uniforme de la variable réelle x satisfait dans un certain intervalle à l’inégalité
φ(x) + φ( y) ≥ 2 φ((x + y)/2),on dit que φ est une fonction convexe dans cet intervalle ».

La définition de Jensen est plus générale que celle utilisée aujourd’hui puisqu’elle correspond au cas α = 1/2 de celle utilisée classiquement (voir article « Des fonctions utiles en analyse »). En particulier, une fonction convexe au sens de Jensen peut ne pas être continue ; en utilisant l’axiome du choix, le mathématicien allemand Georg Karl Wilhelm Hamel (1877–1954) a donné un exemple de fonction g discontinue vérifiant, pour tous réels x et y, g(x) + g(y) = g((x + y)/2), donc convexe (et concave).

Peu après, en 1920, Wacław Franciszek Sierpiński (1882–1969) a montré qu’une fonction convexe, mesurable au sens de Lebesgue (catégorie englobant une « très large » classe de fonctions), est nécessairement continue sauf peut-être aux extrémités de l’intervalle de définition.

Remarquons que Georg Hamel fut un chaud partisan du nazisme, effroyable idéologie dont fut victime Sierpiński et nombre de ses collègues…