Le polymathe Benoît Mandelbrot s’est intéressé à bien des sujets avant de devenir célèbre grâce à ses travaux sur les fractales.
Les fréquences d’apparition
Une partie de sa thèse de doctorat publiée en 1952 est ainsi consacrée à la théorie de l’information et plus spécifiquement à la question de la fréquence des mots dans un texte donné.
Il s’agit d’une question fort ancienne puisque les premiers travaux sur le sujet datent des années 1380 avec le Liber Zifrorum de Cicco Simonetta. À l’époque, les cryptographes établissaient des tables de fréquences des lettres, des bi-grammes (suites de deux lettres consécutives) et tri-grammes pour une langue donnée. Voici le début de la table des fréquences des lettres en français contemporain :
12,1 % |
7,11 % |
6,59 % |
6,51 % |
6,39 % |
...
Lire la suite gratuitement