vendredi 19 décembre 2008

Pi = C,CVEZCVBMLYZGEC...

Il y a une propriété du nombre pi qui me fait douter de son existence, ou plus modestement, qui me fait réaliser que je n’avais pas vraiment compris ce qu’est un nombre. Et cette propriété est : « pi est un nombre normal. » Cela veut dire que la suite des chiffres qui composent pi, et qui commence par 314159 à toutes les propriétés d’une séquence aléatoire infinie, où chaque chiffre apparaît avec la même fréquence 1/10.

Une conséquence de cette propriété est que toute suite de chiffres de longueur finie, comme 0123456789, est présente quelque part dans la suite des chiffres qui composent pi. Plus la séquence est longue plus sa fréquence est faible, mais comme pi est une suite infinie, on a la certitude que n’importe quelle suite finie y est présente une infinité de fois. Par exemple, la suite la 10 chiffres 0123456789 est présente en moyenne une fois tous les 10000000000 chiffres, tout comme 0000000000, ou 3141592653.

La même observation est plus choquante quand on l’exprime différemment. Quand on écrit pi = 3.1415, ce n’est qu’une manière concise d’écrire que pi est le nombre qu’on obtient en faisant le calcul 3*1+1*1/10+4*1/(10*10)+1*1/(10*10*10)+5*1/(10*10*10*10). C‘est ce qu’on appelle la base 10. Avec la numération en base 2 des ordinateurs on écrirait pi = 11,0010010… ce qui veut dire pi = 1*2+1+0*1/2+0*1/(2*2)+1*1/(2*2*2)+…Si on voulait utiliser une base plus grande que 10, il nous faut des symboles pour écrire tous les chiffres jusqu’à la valeur base. Pour écrire les nombres en base 27, par exemple, on peut convenir d’utiliser les lettres de notre alphabet et l’espace. On conviendrait 0 = «_», 1 = « A », 2 = « B», etc. jusqu’à 26 = « Z ». En base 27, et avec cette convention, les premières décimales de pi sont données dans le titre de ce post.

La normalité d’un nombre est indépendante de la base dans laquelle il est écrit, ce qui signifie que n’importe quelle suite finie de lettres se trouve quelque part dans pi. Par exemple, on s’attend à trouver le mot « PAPA » une fois toutes les 500000 décimales. Le texte du journal de demain figure aussi quelque part dans pi, de même que toute l’oeuvre de Voltaire. Tout cela y figure même plusieurs fois, une infinité de fois ! Pire, ce n’est pas propre à pi : la plupart des nombres sont normaux. Cela veut dire que la plupart des fois que vous faites un calcul, l’œuvre de Voltaire est cachée dans la réponse.

La situation est analogue à celle du singe imaginé par Emile Borel, qui reproduirait l’œuvre de Molière en tapant au hasard à la machine à écrire. Dans ce cas là, on peut se consoler de ce que cette situation n’est pas vraiment réelle, puisqu’il faudrait au singe un temps plus long que l’age de l’univers pour ne taper qu’un début de tirade. Ce que je trouve très choquant avec la normalité des nombres, c’est que tout y serait dès le début. De manière statique, et depuis toujours. Faut-il en conclure que la plupart des nombres ne sont pas vraiment réels ?

2 commentaires:

Anonyme a dit…

Ah, enfin!

ergosum a dit…

Sources: http://www.americanscientist.org/science/content1/8557, http://bellard.org/, http://patriot.net/~bmcgin/kjvpage.html

Voici de quoi tempérer un peu les généralisations optimistes. Le nouveau record de décimales de pi a été établi par Fabrice Bellard le 20091231: il est arrivé à la 2699999990000ème décimale.

La bible de King James (rien à voir avec William James!) fait 4.8 MB, ce qui fait que la version de pi de Fabrice Bellard vaut environ 650 KKJB (K King James Bibles). Je suppose qu'on peut dire que n'importe quelle série arbitraire de chiffres est équiprobable, donc "000000000000" et "12345678912" et aussi approximativement "PAPA" en base 26.

Voici les plus longues series de répétitions des chiffres de 0 à 9, avec leur position (sans compter le 3 initial):

Digit Length Position
0 12 1755524129973
1 12 1041032609981
2 12 1479132847647
3 12 1379574176590
4 12 1379889220413
5 12 1618922020656
6 12 1221587715177
7 12 368299898266
8 13 2164164669332
9 12 897831316556

On peut aussi voir la "fraction" de la position (0= début, 1=fin).

Digit Position
0 0.650
1 0.386
2 0.548
3 0.511
4 0.511
5 0.600
6 0.452
7 0.136
8 0.802
9 0.333

On voit que "777777777777" apparait rapidement (0.136) et "8888888888888" apparait plutôt vers la fin (0.802). Ce qui est intéressant aussi c'est que la moyenne de la "position" est de 0.492 (quasiment 0.5) et que la fréquence de séries de chiffres identiques correspond à ce qu'on attend des extractions aléatoires d'un sac de 10 boules différentes à partir d'un sac de 2699999990000 boules, à savoir 1/10^12.

J'en conclus -ce que tu savais déjà - que la probabilité pour une séquence de 4.8 Megalettres est de l'ordre de 1/10^4800000.

En extrapolant, je suppose que ça veut dire qu'il faudra une infinité de chimpanzés tapant une infinité de lettres par seconde pendant 10 milliards d'années pour trouver la KJB...

Autrement dit: pas la peine de commencer. Le fables de la Fontaine ne sont PAS dans le décimales de pi.