L'univers de Pi - Statistiques décimales

www.pi314.net

Histoire

Mathématiciens

Toutes les formules

Approx. numériques

Programmes

Algos perso/divers

Décimales

Poèmes

Articles/vidéos

Délires !

Pi-Day

Images/Fonds

Musique

Liens sur Pi

Bibliographie

Boris Gourévitch
L'univers de Pi - V2.57
modif. 13/04/2013

Accueil

Historique/Actu (Pi, site, moi)

Edito

Livre d'or

Pages en .pdf

Je me présente

Quelques photos

Remerciements

Page des nets d'or

Sites qui m'indexent

Derniers changements

Contact

Les décimales de Pi et la statistique

Ce dernier volet de la trilogie de l'aléatoire est consacré aux recherches infatigables pour, ENFIN, trouver quelque chose de particulier à Pi ! Car depuis que l'on s'intéresse à notre constante préférée, et que l'on viole l'intimité de ses décimales jusque-là protégées, il faut bien reconnaitre que cette suite de chiffres, comme sortie de nulle part, intrigue au plus haut point !
D'accord, Pi est irrationnel, on ne retrouvera pas les mêmes séquences périodiquement...
Mais avec quelques outils pas si compliqués, on peut peut-être trouver d'autres motifs ??
Comme les trois autres, cette page a vocation à s'enrichir au fil de ma collecte, et de vos contributions éventuelles !
N'hésitez pas si vous avez quelques idées ou exemples supplémentaires, prévenez-moi...

Voici les paragraphes abordés successivement :

A - La dimension fractale

1 - Estimation de la dimension fractale d'une courbe
2 - Méthode de l'échelle réduite

B - Les décimales au fourneau

1 - Khi2
2 - Mains au poker
3 - Somme des décimales

C - D'autres approches

1 - Constante de Khintchine
2 - Mais encore ??????

D - Bibliographie

A - La dimension fractale

Bon, après la page sur la théorie de l'aléatoire, il est entendu que l'on ne sait absolument rien sur les décimales de Pi en théorie !
D'accord, mais si l'on regarde les décimales directement maintenant, ne peut-on pas y déceler quelques structures bizarres, qui sortent un peu de l'ordinaire ?
Car tout de même, il doit bien se cacher quelque chose derrière les milliards de décimales que l'on a à disposition ! Comme le disait Gregory Chudnovsky, ce serait une catastrophe si les décimales ne montraient rien avant les 10⁷⁷ décimales que l'on est capable théoriquement de calculer si l'on utilisait chaque atome de l'univers ! Et l'on en est bien loin, vous imaginez, puisque l'on a simplement passé les 10¹¹ décimales en septembre 2000 (206 milliards).

Les Chudnovsky écrivaient en 1991 que les décimales de Pi apparaissaient plus aléatoire que ce qui serait généré à la main, mais peut-être tout de même pas assez aléatoires !
La loi du logarithme itéré de Chung décrite sur la page consacrée aux phénomènes aléatoires a suggéré à ces mêmes Chudnovsky de considérer une marche aléatoire de séquences de décimales (rappelons qu'avec le théorème de Donsker, une somme de marches aléatoires converge en gros vers un mouvement Brownien). A partir de là, on peut construire des objets fractales à partir des décimales de Pi, et pourquoi pas mesurer leurs dimension fractale ! Ben oui, ça c'est une bonne idée !
La dimension fractale d'un processus classique comme le mouvement Brownien est 1.5.
Vanouplines, de la Vrije Universiteit te Brussel (Belgique), a montré que la dimension de Pi est elle aussi très proche de 1.5.
Les fractales sont un très riche domaine des mathématiques, et ma page sur Mandelbrot indiquait que l'on pouvait même trouver Pi dans l'ensemble de Mandelbrot !
La définition d'un fractale, donnée par Mandelbrot lui-même dans son livre "The fractal geometry of nature" (1983) est, comme le dirait Weyl du "brouillard dans le brouillard" ! :

Un objet fractale est par définition un objet dont la dimension de Hausdorff-Besicovitch est strictement supérieure à la dimension topologique"

hum, merci...
Mandelbrot indique d'ailleurs un peu plus loin qu'il continue à penser que ce serait mieux sans définition... :-)

Côté dimension, la chose est un peu plus intuitive dans les espaces euclidiens : un point est bien sûr de dimension 0, une ligne est de dimension 1, un plan est de dimension 2, un volume de dimension 3, etc...
Seulement, ces dimensions sont entières... Peut-on imaginer des courbes de dimension rationnelle, voire réelle ?
En fait, de manière intuitive le plan est rempli d'une infinité de lignes. La ligne est d'épaisseur nulle, mais si on lui faisait prendre des virages dans tout les sens, et de plus en plus serrés, la ligne commencerait à occuper beaucoup d'espace, et c'est alors que sa dimension fractale dépasse 1, la limite étant donc le plan de dimension 2. Bref, plus la courbe est heurtée, et ceci à n'importe quel zoom, plus la dimension de la courbe sera supérieure à 1.

A.1 - Estimation de la dimension fractale d'une courbe

On utilise ici la méthode "box count" qui repose sur la seconde définition de Mandelbrot d'un objet fractal, toute aussi vague, mais plus intuitive :

Un objet fractal est une forme faite de parties similaires à l'ensemble.

Bref, de n'importe quelle échelle, l'objet fractale nous apparaît toujours de la même façon...
Prenons une côte sur une carte maritime... voilà un joli exemple de courbe fractale !
Bon, on se munit de papier millimétré de cases d'un millimètre de large, puis de papier de cases de 2 millimètres de large, de 4mm, et 8mm de large aussi. Vous l'avez compris, les tailles différentes de carrés servent à comparer le dessin à différentes échelles... C'est la cohérence de la forme aux différents zooms utilisés qui détermine le degré de complexité fractale d'un objet.

On prend pour chacun des papiers millimétrés une même zone rectangulaire et on la plaque ensuite sur le dessin côtier. On compte alors le nombre de carrés traversés par la courbe et on reporte cela dans un tableau du type de celui qui suit : (données fictives tirées de [6])

Taille des carrés

Nombre de carrés traversés

Taille des carrés*Nombre de carrés traversés
(longueur de la côté)

Logarithme décimal de la taille des carrés

Logarithme de la taille de la côté

Dimension fractale

1

6998

6998

0

3.845

1.39

2

2679

5358

0.301

3.729

1.35

4

1054

4216

0.602

3.625

1.32

8

424

3392

0.903

3.530

1.31

16

171

2736

1.204

3.437

1.33

32

68

2176

1.505

3.338

1.33

64

27

1728

1.806

3.238

1.44

128

10

1280

2.107

3.107

La longueur de la côte est plus élevée lorsque la précision est grande car on décèle alors plus de virages sur la côte. On voit alors que l'objet ne peut être d'une dimension fractale élevée, cependant celle-ci n'est pas non plus 1.
En traçant le logarithme de la taille de la côte (5e colonne) en fonction du logarithme de la taille des carrés, on obtient une droite de régression dont la pente est 1 - D, où D est la dimension fractale. Intuitivement, cela se comprend. En effet, si la pente était de 1, la taille de la côte serait proportionnelle à la précision souhaitée, donc il n'y aurait aucun caractère fractal dans cette courbe et D=0 dans ce cas. Ici, la pente est négative comme le montre la figure suivante, ce qui signifie que la taille des carrés augmente plus vite que la taille visible de la côte ne décroît. Dans le tableau ci-dessus, la dimension est évaluée pour chaque pente entre deux points.
Avec une pente de -0.339 de la droite de régression, on obtient une dimension fractale moyenne de D=1-(-0.339)=1.339.

Bon, maintenant que l'on sait ce qu'est une dimension fractale, l'idée est de tracer la marche aléatoire des décimales de Pi et d'estimer sa dimension fractale.
Voici le graphique où chaque décimale est reliée à la précédente et à la suivante par une ligne :

D'accord, mais il y a tout de même un sacré problème.... C'est que dans le cas de la côte maritime, l'échelle était la même en abcisse et ordonnée. Ici, ce n'est plus du tout le cas.... aïe !

A.2 - Méthode de l'échelle réduite

Mais nos amis les mathématiciens ont réfléchi à ce problème et ont sorti la méthode de "l'échelle réduite" si l'on peut dire (rescaled range) dans les années 60 avec Hurst, Mandelbrot et Wallis.
Hurst a posé les notations suivantes :

où Y_i est la i^e décimale de Pi-3.
Il définit ensuite les deux statistiques :

Et le plus fort, c'est que l'ami Hurst a remarqué que la statistique R/S prenait souvent une forme remarquable ! De manière empirique, on obtient :

où c est une constante souvent prise égale à 1/2 et H est l'exposant de Hurst. Ceci permet de garder l'échelle de l'abscisse et de réduire les observations des sommes cumulées des décimales selon cette échelle.
Mais comment raccrocher à la dimension fractale ?
Et bien en fait, la relation entre la dimension fractale D et le coefficient de Hurst H est

D=2-H

Ceci se comprend intuitivement puisque plus H est élevé, plus le rapport R/S augmente rapidement avec n. Ceci signifie que l'amplitude maximale augmente de plus en plus vite par rapport à la variation, ou plus prosaïquement que la variation augmente moins vite que l'amplitude maximale. Mais ceci n'est rien d'autre (pour moi !) que le fait que l'on a "zoomé" sur la courbe mais que la variation n'a pas suivi, et donc que la dimension fractale décroit.

Toujours avec les mains, un exposant H entre 0.5 et 1 montre des signes de persistence dans la courbe, c'est-à-dire que si elle a connu une croissance sur une période, celle-ci continuera probablement la période suivante. Pour des exposants inférieurs à 0.5 c'est exactement l'inverse avec des agitations plus chaotiques et moins prévisibles, ceci étant logique puisque la dimension fractale augmente alors. Il n'est donc pas étonnant que pour des processus indépendants de variance finie, cet exposant H soit de 1/2, (par exemple pour les mouvements Browniens, ce qui montre en passant que leur dimension fractale est 1.5).
D'ailleurs, et c'est très fort de retrouver encore Pi dans ce coin, Feder a montré en 1988 que pour ces processus, on a exactement :

Incroyable, non ??
Pour la plupart des phénomènes naturels, H=0.72 soit D=1.28.
Et pour notre ami Pi maintenant ?
Plutôt que les décimales de Pi elles-mêmes, la moyenne cumulée des décimales est une courbe plus "continue", qui ressemble plus à un processus aléatoire. En notant la i^e décimale de Pi, on considère donc le processus :

étant entendu que bien sûr avec des digits entre 0 et 9, la moyenne attendue est 4.5 et donc 2-9 devrait être proche de zéro en moyenne.
En fait, sur les 100 premières décimales, on obtient le graphique suivant de S_p :

Ben cela, si c'est pas du beau processus ?!
Pour 1.25 million de décimales, on obtient la courbe suivante de la dimension fractale (assortie d'intervalles de confiance) :

Une tendance claire, qui fournit par la pente la dimension fractale de 1.45. Eh oui, ce n'est pas un processus à accroissements totalement indépendants comme le mouvement Brownien ! Il existe une petite persistence (H=0.55), mais de là à trouver laquelle... hmmm...
Bref, tout la dimension fractale est un bon indicateur pour nous dire que visiblement, quelque chose ne va pas ! Mais cela ne nous dit pas quoi... Examinons donc un peu la répartition empirique des décimales :

B - Les décimales au fourneau

Le fait que les décimales de Pi traversent sans encombres les tests les plus classiques comme ceux du Khi2, des mains de poker, de la loi de l'arctan n'arrange pas les choses...
Euh.... mais qu'est-ce que tout ceci au fait ?
Bon, en fait les mathématiciens n'ont pas trouvé grand chose - ce n'est pas un reproche ! :-) - sur la répartition des décimales en étudiant le nombre Pi lui-même, à travers sa place dans les formules ou théories... La démarche non plus probabiliste mais statistique consistait donc à inverser la méthode et partir cette fois-ci des décimales pour trouver des singularités propres à Pi. Et force est de constater que ce n'est pas simple...

B.1 - Khi2

C'est le test le plus classique, et un des plus faibles... les statisticiens ont l'habitude de dire que tout passe avec un Khi2 :-)
C'est une statistique qui calcule la somme des écarts au carré des fréquences observées et des fréquences attendues. Sous l'hypothèse que les données suivent effectivement les répartitions attendues, elle suit comme son nom l'indique un Khi2 à n-1 degrés de liberté où n est le nombre de fréquences que l'on considère :

f_i est la fréquence attendue et On n'a pas n degrés de liberté puisque la dernière fréquence est forcément connue grâce aux autres (la somme des fréquences est le nombre de décimales utilisées, donc est connue !). Seules n-1 fréquences influencent donc véritablement le calcul de la statistique c'est pourquoi on attribue n-1 degrés de liberté à la loi. Tout ceci se démontre bien sûr, mais ce n'est pas l'objet de cette page ni de ce site !
Il suffit ensuite de comparer la valeur obtenue aux valeurs prises par la loi associée. Si cette valeur est inférieure au fractile d'ordre 0.95, cela signifiera que la probabilité d'observer dans dans la nature une valeur du Khi-deux supérieure à cette statistique est supérieure à 5%, etc... Bref, cela impliquerait que notre constante n'a rien
d'exceptionnelle...
Et devinez ce qui se passe !
Ben oui, rien.... :-)
Voici les fréquences observées pour les 200 premiers milliards de décimales de Pi-3 :

Chiffre Apparitions dans Pi Apparitions dans 1/Pi

0
20000030841

19999945794

1
19999914711

20000122770

2
20000136978

20000060451

3
20000069393

20000182235

4
19999921691

19999876817

5
19999917053

19999977273

6
19999881515

19999911742

7
19999967594

20000001035

8
20000291044

19999927489

9
19999869180

19999994394

Statistique du Khi-deux
8.09

4.18

Ces deux statistiques correspondent respectivement à des fractiles d'ordre 0.53 et 0.9. C'est-à-dire que l'on a respectivement 53% et 90% d'observer dans la nature des statistiques prenant des valeurs plus élevées... Bref, rien d'exceptionnel donc !
Notons que ces deux statistiques sont calculées uniquement sur les 200 milliards de décimales, donc c'est vraiment pour observer si quelque chose ne va pas du tout ! Car il pourrait y avoir des petites variations et il n'y a aucune raison qu'une décimale apparaisse plus que les autres, ou moins. Ce n'est donc pas très puissant !
Kanada, qui a calculé ces 200 milliards de décimales, a effectué les tests par tranches de décimales, les fichiers sont disponibles à l'adresse ftp://pi.super-computing.org/. Le test du Khi2 pour des divisions successives en 10 blocs parmi 6 milliards de décimales est disponible en local. Mais rien de vraiment spécial...

Bon, continuons notre investigation !

B.2 - Mains au poker

Cette statistique est un peu plus fine que le Khi-deux puisqu'elle s'intéresse non plus à chaque décimale, mais aux combinaisons entre décimales.
On découpe les décimales par blocs de 5, et dans chacun de ces blocs, on regarde quelle combinaison du poker on trouve.
Pour un bloc, on tire forcément soit des décimales différentes, ou une paire, un brelan, une double paire, un carré, une quinte (euh, dur au poker !), ou un full...
Ce genre de test peut paraitre plus amusant que sérieux ! Cependant, dans la nature on s'attend à trouver un certain nombre de paires, de brelans, etc... Ceci teste donc à un niveau supérieur au Khi-deux la régularité des fréquences des combinaisons de décimales.
Pour 200 000 mains de poker par exemple, les fréquences attendues sont les suivanets :

Combinaisons Fréquences attendues

Décimales différentes
ABCDE
60480

Paires
AABCD
100800

2 Paires
AABBC
21600

Brelans
AAABC
14400

Full House
AAABB
1800

Carré
AAAAB
900

Quinte
AAAAA
20

Total
200000

Pour obtenir ces fréquences attendues, il suffit de dénombrer les cas possibles sur les cas favorables comme on dit en proba. Prenons un exemple avec le carré :
on a 1 chance sur 10 de tirer exactement A (10 décimales), une autre chance sur 10 de tirer encore A et ainsi de suite, donc en continuant, on a 1/10⁴ chances de tirer AAAA. Mais cela pourrait être A comme C ou un autrre chiffre, donc on a 10 cas possibles, on multiplie le total par 10, ce la donne 1/10³. Ensuite, il faut tirer un autre chiffre que celui représenté par A, il y en a plus que 9, donc on a 9 chances sur 10 de bien tomber et l'on multiplie donc le total par 9/10. Enfin, il faut placer ce B parmi les A, comme il y a 5 places, on a 5 choix possibles et l'on multiplie donc le tout par 5.
On obtient au final :

5*9/(10*10³)=0.0045

Comme on a 200 000 tirages, le nombre de carrés attendus est 200 000*0.0045=900, c'est bien ce qui était attendu. En y allant méthodiquement (bref pas trop comme moi !), on doit toujours y arriver, mais il est vrai que ce n'est pas trop facile et qu'il faut un certain entrainement !
Le principe consiste ensuite à effectuer un test du Khi-deux sur les résultats pour les comparer aux fréquences attendues. L'équipe de Kanada a effectué ces divers tests sur le record à 6 milliards de décimales. On regroupe en général le carré et la quinte à cause de la faible fréquence de la quinte, mais cela n'a pas été fait dans le test suivant. Le Khi2 considéré a donc 6 degrés de liberté, et l'on a bien sûr fait 1 200 000 blocs de 5 décimales :

 DECIMALE         1          2          3          4          5          6          7          8          9         10|  TOTAL       ATTENDU
 ----------------------------------------------------------------------------------------------------------------------------------------------
 Déc diff  36294173   36290069   36290127   36286820   36290298   36289575   36294505   36289984   36281969   36282987|  362890507   362879996.98
 Paires    60475840   60476864   60485069   60484354   60477375   60474120   60476577   60473797   60485057   60486104|  604795157   604799994.96
 2 Paires  12956498   12958229   12954176   12962149   12961317   12963422   12962341   12963379   12959383   12960093|  129600987   129599998.92
 Brelan     8643856    8641687    8639415    8636938    8640244    8639352    8635473    8640375    8642190    8641230|   86400760    86399999.28
 Full House 1078694    1080546    1079458    1079213    1079216    1080368    1078612    1080174    1078744    1078985|   10794010    10799999.91
 Carré       539027     540460     539627     538583     539598     541309     540416     540236     540532     538638|    5398426     5399999.95
 Quinte       11912      12145      12128      11943      11952      11854      12076      12055      12125      11963|     120153      120000.00
 ----------------------------------------------------------------------------------------------------------------------------------------------
  KHI2         7.98       3.27       5.10       6.36       1.46       6.67       6.74       2.03       5.30       5.99|      4.33
  (FRACTILE    0.25       0.77       0.54       0.4        0.96       0.36       0.35       0.92       0.51       0.44|      0.64
  APPROCHE)

Il y a donc eu un test par décimale, puis un test total (c'est pratique le Khi2 pour cela, on peut tester n'importe quoi !). Et l'on voit bien qu'il n'y a rien à signaler, aucun fractile ne s'approchant vraiment de 0.05...
Tout au plus les écarts pour la décimale 5 sont jugés un peu trop faibles ! :-)

Aïe aïe aïe, ça se complique, toujours rien...
Mais continuons !

B.3 - Test des sommes de 5 décimales

Comme son nom l'indique, ce test découpe les décimales par 5 et calcule pour chacun de ces blocs la somme. Ce test est censé mettre en valeur des parties où par exemple de plus fréquentes apparitions de hautes décimales provoquerait des sommes plus élevées que dans la nature, etc...
Les résultats attendus sont des réalisations de lois multinômiales. Mais il me semble plus simple de retrouver les résultats par un bon raisonnement logique...
Vous savez que l'on estime une probabilité par le nombre de cas favorables sur le nombre de cas possibles. C'est ici une manière de procéder.
Commençons simple : prenons un bloc de 5 chiffres, pour que leur somme fasse 0, il faut que les 5 fassent 0, il y a donc une seule possibilité ! C'est le nombre de cas favorables. D'autre part, chacun des 5 chiffres a 10 valeurs possibles, le nombre de cas possibles est donc 10*10*10*10*10=10⁵. Donc la probabilité que la somme fasse 0 est 1/10⁵. Comme l'on a ici 1.2 milliards de blocs, cela donne

1.2*10⁹/10⁵=12000

cas attendus tout simplement.
Allez, un deuxième exemple un peu moins trivial car je sens que vous êtes chauds !
Dans le troisième cas, il faut somme des 5 chiffres valant 2. Donc on a une disjonction de cas :
Soit deux chiffres valent 1 et l'on a C(5,2)=10 (combinaisons de 2 parmi 5, C(n,p)=n!/(p!(n-p)!) ) manières de les choisir parmi les 5. En passant par une loi multinomiale M(5,0.1,0.1,...) on obtient 5!/(3!2!0!0!...)*1/(10³10²10⁰10⁰...)=10/10⁵ la proba de cet événement, pour les connaissseurs qui veulent aller vite.
Soit un chiffre vaut 2 et les quatre autres valent 0, cela représente 5 cas possibles suivant la place du 2. Avec la multinomiale, 5!/(4!1!0!0!...)*1/(10⁴10¹10⁰10⁰...)=5/10⁵ est la proba de cet événement. Au final, on a 15 cas possibles soit une probabilité de cet événement de 15/10⁵ que l'on retrouve par les deux méthodes à la main ou par la multinomiale.
Le nombre attendu de "SUM=2" sur 1.2 milliards de blocs est donc

1.2*10⁹*15/10⁵=180000

Je vous assure que c'est vite amusant de savoir si l'on a un tout petit peu de logique de dénombrement, essayez !
Toujours sur l'échantillon de 6 milliards de décimales et en découpant en blocs de 600 millions de décimales, l'équipe de Kanada a obtenu les résultats suivants :
  BLOC =          1          2          3          4          5          6          7          8          9         10|   TOTAL      ATTENDU
 ------------------------------------------------------------------------------------------------------------------------------------------------
 SUM=  0       1216       1197       1193       1250       1200       1176       1196       1214       1152       1233|      12027      12000.000
 SUM=  1       5923       6023       5957       5967       6017       6028       6077       6045       6047       5975|      60059      60000.000
 SUM=  2      17848      18002      17896      17914      18100      17835      17874      18127      17887      17937|     179420     179999.998
 SUM=  3      42128      41943      41885      42180      41659      41987      41697      42120      41935      42088|     419622     419999.997
 SUM=  4      84093      83998      83899      83694      83827      84749      83906      84146      83647      82995|     838954     839999.993
 SUM=  5     150933     151285     152040     150889     150914     151440     151465     151357     151106     150406|    1511835    1511999.987
 SUM=  6     252052     251554     252425     252377     251639     251762     251674     252596     252215     252220|    2520514    2519999.979
 SUM=  7     395189     396146     395922     396137     396044     395779     396032     396210     396185     395973|    3959617    3959999.967
 SUM=  8     593637     592684     593729     594333     593971     593748     594449     594366     595328     593856|    5940101    5939999.951
 SUM=  9     858470     858342     858321     856921     858350     859226     857611     857056     857478     858960|    8580735    8579999.929
 SUM= 10    1194437    1195429    1194514    1194536    1193553    1194870    1194976    1194134    1193540    1194598|   11944587   11951999.900
 SUM= 11    1605266    1607515    1608231    1607348    1608394    1605279    1609486    1608762    1609340    1609442|   16079063   16079999.866
 SUM= 12    2091618    2095708    2094196    2092715    2093180    2091291    2095945    2093030    2093830    2092915|   20934428   20939999.826
 SUM= 13    2648030    2646321    2645322    2643188    2647514    2646881    2644930    2645962    2643577    2643418|   26455143   26459999.780
 SUM= 14    3252283    3252822    3249652    3253274    3250272    3253381    3249525    3252776    3253078    3250408|   32517471   32519999.729
 SUM= 15    3899546    3898175    3893160    3893092    3898171    3894389    3895990    3897963    3895193    3892981|   38958660   38951999.675
 SUM= 16    4551996    4551347    4554651    4553603    4553925    4552191    4556515    4553971    4552146    4553568|   45533913   45539999.621
 SUM= 17    5201733    5201032    5201711    5203465    5201273    5206295    5205467    5202503    5205968    5204304|   52033751   52019999.566
 SUM= 18    5809804    5806104    5812753    5808793    5810430    5805164    5806757    5809698    5808856    5811122|   58089481   58079999.516
 SUM= 19    6335116    6335295    6334714    6340044    6337456    6338388    6334646    6335387    6333802    6337037|   63361885   63359999.472
 SUM= 20    6753880    6755164    6757793    6756423    6757089    6754552    6754976    6757225    6758836    6754169|   67560107   67571999.437
 SUM= 21    7048473    7047684    7054697    7049417    7047712    7050818    7055967    7052409    7047565    7049867|   70504609   70499999.413
 SUM= 22    7195837    7204989    7194831    7199905    7198519    7203840    7196208    7201386    7198388    7201909|   71995812   71999999.400
 SUM= 23    7203470    7201800    7195852    7197458    7200117    7198749    7199849    7195443    7198608    7197627|   71988973   71999999.400
 SUM= 24    7050060    7047213    7049745    7048952    7051751    7051705    7051021    7045667    7046796    7052240|   70495150   70499999.413
 SUM= 25    6761856    6760420    6761986    6763441    6754330    6755526    6758730    6761985    6763792    6756381|   67598447   67571999.437
 SUM= 26    6335540    6335738    6337255    6332486    6337542    6333532    6337991    6336563    6336177    6338455|   63361279   63359999.472
 SUM= 27    5808627    5808453    5807373    5807508    5808064    5810369    5804582    5805840    5805965    5810139|   58076920   58079999.516
 SUM= 28    5202613    5202126    5204017    5200678    5197496    5202708    5204795    5201079    5205991    5202461|   52023964   52019999.566
 SUM= 29    4555210    4553387    4553230    4555919    4557110    4552793    4553511    4554100    4554409    4553357|   45543026   45539999.621
 SUM= 30    3895961    3892915    3894162    3894606    3894262    3894426    3892307    3894606    3894956    3895352|   38943553   38951999.675
 SUM= 31    3256018    3250243    3251867    3249837    3253079    3249265    3253032    3249406    3252452    3253948|   32519147   32519999.729
 SUM= 32    2644512    2648978    2647511    2648128    2643971    2644766    2643985    2645457    2645607    2644185|   26457100   26459999.780
 SUM= 33    2093395    2095113    2096225    2095226    2092831    2094830    2093681    2095801    2093199    2095237|   20945538   20939999.826
 SUM= 34    1607321    1609097    1608165    1609658    1608917    1608961    1606667    1607598    1608289    1608217|   16082890   16079999.866
 SUM= 35    1195598    1193679    1193808    1195018    1196316    1196777    1195415    1195170    1195168    1193806|   11950755   11951999.900
 SUM= 36     857619     858681     856824     858062     858473     859108     856967     857623     856698     857784|    8577839    8579999.929
 SUM= 37     594438     594375     594600     593669     594880     595027     594359     594477     594675     593578|    5944078    5939999.951
 SUM= 38     394990     395440     395415     397078     396760     396359     395443     396010     395884     395526|    3958905    3959999.967
 SUM= 39     251920     251551     251452     252773     252682     252077     251600     252275     252268     251785|    2520383    2519999.979
 SUM= 40     150416     151017     150658     150839     150496     150787     151427     151874     150468     151099|    1509081    1511999.987
 SUM= 41      83539      84096      83381      84021      83994      84005      84573      83593      84225      84090|     839517     839999.993
 SUM= 42      42301      41678      41976      42218      42204      41926      41479      41954      42097      42034|     419867     419999.997
 SUM= 43      17972      18008      17838      17777      18371      17881      18101      17928      17898      18073|     179847     179999.998
 SUM= 44       5958       6047       5932       5986       5964       6105       5937       5930       6026       6029|      59914      60000.000
 SUM= 45       1158       1186       1236       1197       1181       1249       1179       1178       1253       1216|      12033      12000.000
Hum, rien de particulier encore... désespérant...
L'équipe de Kanada a effectué un test supplémentaire, qui s'appelle le "Gap test" (test des écarts) mais que je n'ai jamais compris ! Si quelqu'un veut bien m'éclairer ? Le fichier qui en rend compte est situé à cette adresse.

Le test de la loi de l'arctan reste également un mystère pour moi et je n'ai pas trouvé de référence sur le web qui en discute. Donc comme on ne peut pas tout inventer soi-même (!), je m'incline, j'attendrai qu'une âme charitable vienne à mon secours...

Signalons encore que de nombreuses méthodes graphiques ont été utilisées pour tenter de trouver des régularités dans les décimales. Par exemple transcrire les décimales en binaire et les mettre bout à bout dans un carré pour constituer une image. Si les paysages formés semblent plus réguliers que ceux qui seraient formés par le hasard pur, les Chudnovsky n'ont pas trouvé d'explication satisfaisante à ce genre de phénomènes...

Voilà pour un rapide tour d'horizon des méthodes statistiques très classiques d'analyse des décimales

C - D'autres approches

Bien des idées farfelues ont transité dans le domaine de la recherche de singularités. Quelques idées parfois méritent le détour, comme celle qui consiste à utiliser les connaissances sur un groupe de nombres en général pour tester l'appartenance à ce groupe d'une constante en particulier. Un bon exemple concerne la constante de Khintchine.

1 - Constante de Khintchine

Aleksandr Khintchine fait paraître en 1935 un petit recueil sur les fractions continues, ("Continued Fractions", pourquoi faire compliqué ?) dans lequel il remarque que la moyenne géométrique des coefficients d'une fraction continue tend vers une certaine constante, et ceci presque sûrement, (sauf un pour un ensemble de nombres de mesure nulle, la mesure étant celle de Lebesgue)...
En français et en gros (car ce site n'est pas un cours de théorie de la mesure !), cela signifie que pour ce résultat est vrai sauf pour un ensemble de nombres isolés, sans continuité entre eux, même de taille infinie (comme N ou Q). Il existe bien sûr quelques ensembles exotiques qui ne rentreraient pas dans cette explication intuitive mais là n'est pas l'intérêt.
Plus généralement, il montre le théorème suivant :

Théorème de Khintchine

Supposons que f(r) soit une fonction positive d'un entier r et supposons qu'il existe deux constantes positives C et d telles que

En d'autres termes, f doit croître moins vite que la racine carrée.
Alors, alors pour presque tous les nombres de l'intervalle [0,1], en notant a_k les coefficients de leur fraction continue régulière , on a l'égalité suivante :

La démonstration de ce théorème, qui occupe plusieurs pages du bouquin de Khintchine, me parait un peu ambitieuse pour l'objet de ce site, mais si un jour j'ai un peu de courage, je la retranscrirai peut-être !
Il en existe d'autres versions basées par exemple sur la théorie ergodique, ce qui ne semble pas très étonnant vu la forme du résultat et son caractère presque-sûr.
On peut déjà observer que la condition sur f est suffisante pour assurer la convergence du membre de droite dont le terme de la série est équivalent à l'infini à f(r)/r².
On prend maintenant une fonction f qui satisfait l'hypothèse du théorème, à savoir le logarithme.
On obtient alors que pour presque tous les nombres dans [0,1] :

Et voici apparue la célèbre constante de Khintchine... Elle est assez passionnante d'ailleurs, mais bon si l'on commence à s'enflammer de tous les côtés, on n'en finira plus ! Voir tout de même les références de la bibliographie pour en savoir un tout petit peu plus.
Pas facile à calculer avec cette expression. Mais Bailey, Borwein et Crandall ont récemment obtenu tout de même 7350 décimales de K à l'aide de séries de fonctions Zêta qui convergent nettement plus vite.
On peut aussi obtenir une formule avec la moyenne harmonique et f(r)=r^-1 :

On pourrait obtenir aussi un K(-2) en prenant f(r)=r^-2 etc....
Cette deuxième formule pour la moyenne harmonique est également un résultat "presque sûr", donc un petit ensemble de nombres ("négligeable" au sens des probabilités) ne vérifie pas cette formule. D'accord, toutes les fractions avec des suites de coefficients très simplement définissables feront partie de cet ensemble négligeable (pensons à la constante e par exemple, ou le nombre d'or, qui trivialement ne vérifient pas les deux formules de moyenne géométrique ou harmonique)... mais quelle est la forme de l'ensemble des suites telles que la moyenne géométrique ne tend pas vers l'expression considérée ? C'est une simple question d'analyse, non ?
Et même si l'on sait que les nombres qui ne suivent pas ce résultat sont extrêmement peu nombreux, l'idée consiste à vérifier si les coefficients de la fraction continue de Pi suivent bien ce résultat.
En tous les cas, encore une façon de chercher un groupe particulier dans lequel ranger Pi. Le cerner d'une manière ou d'une autre !

David Bailey dit à ce propos que les coefficients de la fraction continue de Pi ne semblent pas présenter de motif particulier et sont supposés être aléatoires en un certain sens.

On connait aujourd'hui 17 001 303 coefficients de la fraction continue de Pi dont les premiers sont Pi = [3; 7; 15; 1; 292; 1; 1; 1; 2; 1; 3; ...]. La moyenne géométrique de ces coefficients est 2.686393 et la moyenne harmonique 1.745882. Elles s'approchent effectivement de ces constantes K et K(-1) même si le calcul ne s'est effectué que sur 17 millions de coefficients, ce qui est bien peu à l'échelle de l'infini !
Donc là encore, aucune conclusion tangible ne peut être tirée...

2 - Mais encore ?

On le voit avec la constante de Khintchine, au détour de théories passionnantes sur le comportement général des nombres, les mathématiciens sont tentés d'observer si Pi se comporte de manière particulière. Les outils de l'étude statistique des décimales étant bien limités et n'ayant en fait pas donné grand chose, c'est une nouvelle approche assez intéressante.
La quête des décimales n'apportera sans doute pas grand chose à cette étude paradoxalement car il n'y a aucune raison pour qu'à partir de 207 milliards de décimales, tout à coup on trouve un motif très particulier qui nous saute aux nez !! C'est encore le rêve de beaucoup de mathématiciens après tout, alors on ne sait jamais...
Mais le motif est déjà probablement devant nos yeux pourtant grands ouverts, mais sans doute pas encore assez, ou bien il n'existe pas et on ne le saura sans doute que si l'on démontre un résultat très fort comme la normalité des décimales de Pi. Et encore, Pi ne serait pas Pi sans SES propres décimales, et pas une de différente ! La normalité n'est donc pas tout, elle ne banalise pas complètement et définitivement le nombre.
Pareil en ce qui concerne la représentation de Pi en fraction continue. Mais cette idée de représentation est intéressante. On a vu avec l'algorithme compte-goutte qu'il existe des bases où Pi est un des nombres les plus simples, c'est-à-dire remarquable ! Plus on trouvera de manière de représenter les nombres et des classes de nombres associées à ces représentations, plus l'idée que l'on aura de Pi et de sa place parmi les nombres sera précise. C'est donc un domaine à mon avis encore très ouvert...

D - Bibliographie

4 références de référence !

[1] Laboratoire de Kanada, Archives de Pi - Super-computing.org
ftp://pi.super-computing.org/

[2] Patrick Vanouplines, Université libre de Bruxelles, Rescaled range analysis and the fractal dimension of Pi.
http://gopher.ulb.ac.be/~pvouplin/pi/pi.ps

[3] D. Bailey, J. Borwein , R. Crandall, On the Khintchine Constant
http://www.nas.nasa.gov/Research/Reports/Techreports/1997/PDF/nas-97-030.pdf

[4] "La constante de Khintchine", miroir basé à l'Inria du site de Steven Finch
http://pauillac.inria.fr/algo/bsolve/constant/khntchn/khntchn.html

retour à la page d'accueil