Das Benfordsche Gesetz

Im Jahre 1881 bemerkte der amerikanische Mathematiker Simon Newcomb, dass in den von seinen Studenten benutzten Logarithmen-Tafeln die Seiten mit Logarithmen, die mit der Ziffer „1“ beginnen, mehr „Eselsohren“ hatten, als die folgenden Seiten, auf denen die Logarithmen mit „2“, „3“, „4“ usw. an erster Stelle stehen. Seine mathematische Beschreibung dieses Phänomens im American Journal of Mathematics geriet jedoch rasch in Vergessenheit.

Erst im Jahre 1937 wurde diese Gesetzmäßigkeit durch den Physiker Frank Benford (1883–1948) wiederentdeckt, anhand von über 20.000 Daten studiert und systematisch analysiert. Das in der Folgezeit nach ihm benannte Gesetz stellt — mathematisch formuliert — fest, dass bei einer zufälligen Auswahl einer Zahl aus einer Tabelle von physikalischen Konstanten oder statistischen Daten die Wahrscheinlichkeit, dass die erste Ziffer eine „1“ ist, etwa 0,301 beträgt. Sie ist also weit größer als 0,1, dem Wert, den man erwarten dürfte, wenn alle Ziffern gleich wahrscheinlich auftreten würden. Allgemein sagt das Benfordsche Gesetz über die Wahrscheinlichkeit, dass die erste Ziffer gleich „k“ ist:

    \[P\{k\}=\log(1+1/k).\]

Abbildung 2: Benfords Publikation

Hierbei bezeichnet \log den dekadischen Logarithmus und k kann die Werte 1, 2, …, 9 annehmen. Im Einzelnen ergibt sich also:

    \[P\{1\}=\log(1+1/1)=\log(2)\approx 0,301;\]

    \[P\{2\}=\log(1+1/2)=\log(3/2)\approx 0,176;\]

    \[P\{3\}=\log(1+1/3)=\log(4/3)\approx 0,125;\]

    \[P\{4\}=\log(1+1/4)=\log(5/4)\approx 0,097;\]

    \[P\{5\}=\log(1+1/5)=\log(6/5)\approx 0,079;\]

    \[P\{6\}=\log(1+1/6)=\log(7/6)\approx 0,067;\]

    \[P\{7\}=\log(1+1/7)=\log(8/7)\approx 0,058;\]

    \[P\{8\}=\log(1+1/8)=\log(9/8)\approx 0,05;\]

    \[P\{9\}=\log(1+1/9)=\log(10/9)\approx 0,046.\]

Das Benfordsche Gesetz impliziert folglich, dass eine Zahl mit „kleiner“ erster Ziffer in einer Tabelle mit statistischen Daten mit größerer Wahrscheinlichkeit auftritt als eine Zahl mit „größerer“ erster Ziffer. Das Benfordsche Gesetz findet Anwendung bei der Aufdeckung von Betrug bei der Bilanzerstellung, der Fälschung in Abrechnungen, generell zum raschen Auffinden eklatanter Unregelmäßigkeiten im Rechnungswesen. Mit Hilfe des Benfordschen Gesetzes wurde im Jahre 2001 das bemerkenswert „kreative“ Rechnungswesen bei ENRON, dem damals größten amerikanischen Unternehmen der Energiewirtschaft (mit 22.000 Mitarbeitern), aufgedeckt, durch welches das Management die Anleger um ihre Einlagen in Höhe von ca. 30 Milliarden Dollar betrogen hatte. Heutzutage benutzen Wirtschaftsprüfer, Steuerfahnder und sogar auch Wahlbeobachter mathematisch-statistische Methoden, um bei auffälligen Abweichungen von der Benford-Verteilung Fälschungen aufzudecken.

Abbildung 1: Das Exponat zum Benfordschen Gesetz

Mittels des Exponats im ERLEBNISLAND MATHEMATIK kann das Benfordsche Gesetz experimentell mit Häufigkeiten übereinander liegender Kugeln nachvollzogen werden (siehe obige Abbildung 1). Für das Experiment stehen geeignete Tafeln zufälliger Zahlen zur Auswahl zur Verfügung.


Und nun … die Mathematik dazu:

Der Ausgangspunkt für das Benfordsche Gesetz ist das sogenannte Mantissengesetz von Newcomb:

„Die Häufigkeit von Zahlen ist so, dass die Mantissen ihrer Logarithmen gleichverteilt sind.“

Dabei versteht man unter der Mantisse einer positiven Zahl ihren sogenannten fraktalen Anteil. Für eine positive reelle Zahl x ist die Mantisse von x gleich \langle x\rangle\coloneqq x-\lfloor x\rfloor (z.B. \langle 3,1415\rangle=3,1415-\lfloor 3,1415\rfloor=3,1415-3=0,1415).

Nimmt man nun an, dass eine Menge zufällig ausgewählter Zahlen dem oben genannten Mantissengesetz genügt und betrachtet die folgenden Mengen:

    \[E_i\coloneqq\{x\lt 0|\text{ die führende Ziffer von $x$ ist $i$}\}.\]

Dann gilt: Die Menge \mathbb R_+ der positiven reellen Zahlen ist die Vereinigung der (elementefremden) Mengen E_i, d.h.

    \[\mathbb R_+=E_1\cup E_2\cup\cdots\cup E_9.\]

Damit ergibt sich für die Wahrscheinlichkeit P (probability), dass eine beliebige der betrachteten zufälligen Zahlen X zur Menge E_i gehört:

    \[P(X\in E_i)=P(\langle\log(X)\rangle\in[\log(i),\log(i+1)))=\log(i+1)-\log(i)=\log(1+1/i).\]


Literatur

[1] Benford, F.: The Law of Anomalous Numbers, Proceedings of the American Philosophical Society 78, S. 551–572, 1938.

[2] Glück, M.: Die Benford-Verteilung — Anwendung auf reale Daten der Marktforschung, Diplomarbeit TU Dresden, Betreuer: V. Nollau und H.-O. Müller, 2007.

[3] Newcomb, S.: Note on the Frequency of the Use of different Digits in Natural Numbers, American Journal of Mathematics 4, S. 39–40, 1881.