Odkrycie Simona Newcomba
Simon Newcomb urodził się 12 marca 1835 roku w Nowej Szkocji w Kanadzie. We wczesnym wieku wyemigrował do Stanów Zjednoczonych, gdzie szybko pozyskał uznanie jako słynny astronom. W roku 1881 będąc dyrektorem American Nautical Almanac Office w Waszyngtonie, Newcomb opublikował dwustronicowy artykuł w American Journal of Mathematics. Jego nazwa brzmiała: „Note on the Frequency of Use of the Different Digits in Natural Numbers”.
Opisał w nim ciekawe zjawisko jakie zaobserwował w bibliotece przeglądając tablice logarytmiczne. Spoglądając na bok księgi dostrzegł, że brzegi pierwszych kartek były najbardziej zabrudzone i stopniowo stawały się coraz czystsze. Z tej obserwacji wywnioskował, że naukowcy częściej szukali logarytmów liczb zaczynających się na 1 niż na 2, częściej na 2 niż na 3 i tak aż do 9.
Sukces Franka Benforda
Artykuł Simona Newcomba pozostał niezauważony i przeszedł bez większego echa. Stało się tak prawdopodobnie przez to, że nie wykazał żadnych empirycznych przykładów w swojej pracy. 57 lat później amerykański fizyk, pracownik General Electric – Frank Benford (1883-1948) prawdopodobnie będąc nieświadomym publikacji Newcomba dokonał identycznej obserwacji. Sformułował to samo prawo poparte tym samym wzorem. Benford postanowił zgromadzić różnego typu dane pochodzące z tak wielu źródeł jak tylko było to możliwe. Efekt kilkuletnich prac i obserwacji opublikował w 1938 roku w Proceedings of the American Philosophical Society w artykule pod tytułem „The Law of Anomalous Numbers”. Swoje badania Benford oparł na 20229 obserwacjach pochodzących ze źródeł takich jak: obszary rzek, statystyki MLB (Amerykańskiej Ligi Baseballowej), mas atomowych pierwiastków, liczb pojawiających się w artykułach Reader’s Digest, danych demograficznych etc. Zauważył również, że niektóre ciągi matematyczne 1/n czy n^(0,5)(n e N) wykazują podobną tendencję do podążania za prawem pierwszego znaku.
W przeciwieństwie do artykułu Newcomb’a, Benford zdołał przykuć uwagę czytelników do swojej publikacji. Tekst Newcomb’a został szybko zapomniany a logarytmiczne prawo prawdopodobieństwa zostało nazwane Prawem Benforda.
Tabela 1 – Wynika badań uzyskane przez Franka Benforda opublikowane w „The Law of Anomalous Numbers”.
Grupa |
Nazwa |
Pierwsza Cyfra |
Suma |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|||
A |
Rzeki, Obszary |
31.0 |
16.4 |
10.7 |
11.3 |
7.2 |
8.6 |
5.5 |
4.2 |
5.1 |
335 |
B |
Populacja |
33.9 |
20.4 |
14.2 |
8.1 |
7.2 |
6.2 |
4.1 |
3.7 |
2.2 |
3259 |
C |
Stałe |
41.3 |
14.4 |
4.8 |
8.6 |
10.6 |
5.8 |
1.0 |
2.9 |
10.6 |
104 |
D |
Czasopisma |
30.0 |
18.0 |
12.0 |
10.0 |
8.0 |
6.0 |
6.0 |
5.0 |
5.0 |
100 |
E |
Ciepło |
24.0 |
18.4 |
16.2 |
14.6 |
10.6 |
4.1 |
3.2 |
4.8 |
4.1 |
1389 |
F |
Ciśnienie |
29.6 |
18.3 |
12.8 |
9.8 |
8.3 |
6.4 |
5.7 |
4.4 |
4.7 |
703 |
G |
Wiatr |
30.0 |
18.4 |
11.9 |
10.8 |
8.1 |
7.0 |
5.1 |
5.1 |
3.6 |
690 |
H |
Masa Cząsteczkowa |
26.7 |
25.2 |
15.4 |
10.8 |
6.7 |
5.1 |
4.1 |
2.8 |
3.2 |
1800 |
I |
Drenaż |
27.1 |
23.9 |
13.8 |
12.6 |
8.2 |
5.0 |
5.0 |
2.5 |
1.9 |
159 |
J |
Masa Atomowa |
47.2 |
18.7 |
5.5 |
4.4 |
6.6 |
4.4 |
3.3 |
4.4 |
5.5 |
91 |
K |
n^(-1), n^(0,5) |
25.7 |
20.3 |
9.7 |
6.8 |
6.6 |
6.8 |
7.2 |
8.0 |
8.9 |
5000 |
L |
Dane Projektów |
26.8 |
14.8 |
14.3 |
7.5 |
8.3 |
8.4 |
7.0 |
7.3 |
5.6 |
560 |
M |
Dane Reader’s Digest |
33.4 |
18.5 |
12.4 |
7.5 |
7.1 |
6.5 |
5.5 |
4.9 |
4.2 |
308 |
N |
Dane o Kosztach |
32.4 |
18.8 |
10.1 |
10.1 |
9.8 |
5.5 |
4.7 |
5.5 |
3.1 |
741 |
O |
Promienie X |
27.9 |
17.5 |
14.4 |
9.0 |
8.1 |
7.4 |
5.1 |
5.8 |
4.8 |
707 |
P |
Amerykańska Liga Baseballowa |
32.7 |
17.6 |
12.6 |
9.8 |
7.4 |
6.4 |
4.9 |
5.6 |
3.0 |
1458 |
Q |
Prom. ciała doskonale czarnego |
31.0 |
17.3 |
14.1 |
8.7 |
6.6 |
7.0 |
5.2 |
4.7 |
5.4 |
1165 |
R |
Adresy |
28.9 |
19.2 |
12.6 |
8.8 |
8.5 |
6.4 |
5.6 |
5.0 |
5.0 |
342 |
S |
n^1, n^2, ... n! |
25.3 |
16.0 |
12.0 |
10.0 |
8.5 |
8.8 |
6.8 |
7.1 |
5.5 |
900 |
T |
Śmiertelność |
27.0 |
18.6 |
15.7 |
9.4 |
6.7 |
6.5 |
7.2 |
4.8 |
4.1 |
418 |
|
Średnia |
30.6 |
18.5 |
12.4 |
9.4 |
8.0 |
6.4 |
5.1 |
4.9 |
4.7 |
1011 |
Prawdopodobny błąd |
+/-0,8 |
+/-0,4 |
+/-0,4 |
+/-0,3 |
+/-0,2 |
+/-0,2 |
+/-0,2 |
+/-0,2 |
+/-0,3 |
- |
Źródło: Frank Benford „The law of Anomalous Numbers”, 1938
Hill P. Theodore, „The First-Digit Phenomenon”, American Scientist, July-August 1998
Ryder, P „Multiple origins of the Newcomb -Benford law: rational numbers, exponential growth and random fragmentation.” Staats - und Universitätsbibliothek Bremen, Germany, 2009.