Statistische Fehler

[Uni Ulm][Fak. Naturwissenschaften][Fachschaft Physik][Exp. Physik][Suchen][Physik Lehrunterlagen][Site Map]

Statistische Fehler

Wenn eine Messung nur einmal durchgeführt wird, so kann man über die Zuverlässigkeit keine Angaben machen. Es ist deshalb unumgänglich, Messungen zu wiederholen.

Stichproben

Die erhaltenen Messresultate sind eine Stichprobe aus der Menge aller möglichen Messresultate. Jede Stichprobe hat eine gewisse, noch zu berechnende Wahrscheinlichkeit, dass sie die Grundgesamtheit repräsentiert. Stichproben werden üblicherweise als Histogramme dargestellt. Die gemessenen Daten x werden in Klassen mit

(x_i – Dx_i) < x <x_i

eingeteilt.

Abbildung 1 Histogramm von Messwerten.

Mittelwerte

Aus diesem Histogramm kann man den Mittelwert

berechnen. Hier sind die A_i die Häufigkeiten der in eine bestimmte Klasse fallenden Messwerte. In unserem Falle ist dies 2,583030303. Man kann diese Gleichung umschreiben, indem man die relativen Häufigkeiten

verwendet. Der Mittelwert ist dann

Der so gefundene Mittelwert ist im allgemeinen nicht mit dem wahren Wert der Messgrösse identisch.

Wenn wir die Klassenbreite verringern und gleichzeitig die Anzahl Messpunkte erhöhen, so erhält man die differentielle Verteilungsfunktion f(x) der zugrunde liegenden Gesamtheit. Diese Funktion f(x) ist normiert, da wir die relativen Häufigkeiten zu ihrer Ableitung verwendet hatten.

Wir müssen unterscheiden zwischen den aus den experimentellen Daten empirisch gefundenen Verteilungsfunktionen und den durch theoretische Modelle berechneten Verteilungen. Eine wichtige Aufgabe einer Datenanalyse kann sein, zu zeigen, dass eine empirische Verteilungsfunktion mit einer theoretisch gefundenen verträglich ist.

Varianzen und Standardabweichungen

Eine Verteilungsfunktion ist nicht nur durch ihren Mittelwert, sondern auch durch die Lage- und Dispersionsgrössen gegeben. Wir haben gesehen, dass der arithmetische Mittelwerte(oben) eine solche Grösse ist. Die Lagegrössen müssen die folgenden Postulate erfüllen:

	Die Schätzung soll im Falle einer unendlich grossen Stichprobe den wert der Grundgesamtheit annehmen.
	Die beste Schätzung ist die mit der kleinsten Streuung, d.h. mit der kleinsten Fehlerabweichung.

Als Lagegrössen kommen in Frage:

	Der arithmetische Mittelwerte(oben) .
	Das geometrische Mittel
	Das reziproke Mittel
	Der Median ist der Wert, bei dem gleich viele Werte links und rechts davon liegen. Hier ist M(x)=2,58

Der Median ist besonders dann zu verwenden, wenn die Stichprobe eine grosse Streuung aufweist. Wenn aus anderen Daten bekannt ist, dass nicht alle Messwerte die gleiche Güte haben, kann man die A_i auch als Gewicht benutzen. Hier hatten wir die Anzahl Messwerte pro Klasse als Güte des Messwertes genommen.

Es ist einsichtig, dass man zusätzlich versucht, die Breite einer Verteilung zu charakterisieren. Diese Grössen heissen Dispersionsgrössen. Man verwendet:

	Den durchschnittlichen Fehler:
	Die Varianz:

. Wenn man die Varianz bezüglich eines andern Wertes B bildet, so gilt mit

also.

Da dies alles positiv definite Grössen sind, ist die Varianz minimal, wenn sie bezüglich des arithmetischen Mittelwertes berechnet wird.

Wenn wir eine kontinuierliche Verteilung haben und p(x) die Gewichtsfunktion ist, gilt:

	Arithmetischer Mittelwert:
	Varianz.
	allgemein gilt: Der mit der Verteilungs- und Gewichtsfunktion bewertete Mittelwert der Funktion h(x) ist

Shepard gibt an, dass ein besserer Wert für die Varianz erhalten wird bei in Klassen eingeteilten Messgrössen, wenn man die folgende Formel verwendet.

wobei h die Klassenbreite ist. In unserem Falle wäre .

Mittlerer Fehler und Varianz

Da der Mittelwert der Grundgesamtheit, µ, im allgemeinen nicht bekannt ist, wird die berechnete Varianz nicht die Varianz der Grundgesamtheit sein. Wir versuchen nun den besten Schätzwert für die Varianz zu berechnen. Nehmen wir an, wir würden µ kennen. Dann gilt

Im folgenden setzen wir alle A_i=1 und µ=0. Dann ist A=n. Durch ausmultiplizieren erhalten wir

mit erhält man

Mit

wird

Die Grösse s ist der mittlere Fehler einer Einzelmessung. Der Übergang von n nach n-1 ist zu Verstehen als der Verlust eines Freiheitsgrades. Da wir den Mittelwert der Grundgesamtheit µ nicht kennen, muss die Stichprobe zur Bestimmung von m herhalten. Dies ergibt eine neue Beziehung zwischen den Datensätzen, reduziert also die Anzahl Freiheitsgrade.

Mittlerer Fehler des Mittelwertes

Bei verschiedenen Stichproben schwanken der Mittelwert und die Varianz. Wenn wir für die Berechnung des Mittelwertes die Schreibweise

verwenden, und für den Erwartungswert

verwenden, dann gilt bei gleicher Grundgesamtheit für alle x_i, dass sie den Erwartungswert und ist. Wenn wir den Mittelwert der Messwerte, m einsetzen, erhalten wir auch . Für die Varianz gilt auch

Wenn die Messdaten statistisch unabhängig sind, so ist der zweite Term=0 und wir erhalten

der mittlere Fehler sm des Mittelwertes ist also um den Faktor kleiner als der mittlere Fehler der Einzelmessung

Daraus lernt man, dass, um ein Resultat doppelt so genau zu erhalten, viermal mehr Messungen durchgeführt werden müssen.

Momente der Verteilung

Das k-te Moment einer Verteilung ist definiert durch den Erwartungswert

Wenn wir B=0 setzen, so erhalten wir

Bei den höheren Momenten benutzt man eine Normierung, damit diese dimensionslos werden.

Gebräuchlich ausser dem Mittelwert und der Varianz sind:

Die Schiefe (skewness):

. Wenn die Schiefe positiv ist, heisst das, dass grössere Abweichungen auf der positiven Seite liegen. Symmetrische Verteilungen haben die Schiefe 0.

Die Überhöhung (peakedness): . Die Grösse heisst Exzess, da sie die Abweichung von der Gaussverteilung angibt.

Verteilungen

Es gibt einige Modellverteilungen, die in der Physik sehr gebräuchlich sind. Dies sind die Binominalverteilung, die bei Würfelexperimenten oder würfelartigen Experimenten zugrunde liegt, die Poisson-Verteilung und, im Grenzfall sehr grosser Grundgesamtheiten, die Normalverteilung.

Binominalverteilung

Die Binominalverteilung beschreibt Experimente, bei denen in jedem einzelnen Experiment mit der Wahrscheinlichkeit p ein Ereignis eintritt und mit der Wahrscheinlichkeit q=1-p ein zweites Ereignis eintritt (oder das erste nicht eintritt). Ein Würfelspiel genügt, zum Beispiel, diesen Gesetzen. Die Wahrscheinlichkeit, dass k-mal das erste und n-k mal das zweite Ereignis eintritt ist

Wenn die Reihenfolge dieser Ereignisse irrelevant ist, dann hat man die Binominalverteilung

Die Verteilung ist normiert, da gilt

Der Mittelwert ist

Die Varianz schliesslich berechnet sich zu

und

Die weiteren Momente sind (ohne Rechnung)

und

Für die Binominalverteilung existiert eine Rekursionsformel:

Zum Abschluss noch eine kurze Bemerkung: jede, auch asymmetrische Binominalverteilung geht für festes p bei grossen n in die Normalverteilung über.

Normalverteilung

Die Normalverteilung kann als Grenzfall der Binominalverteilung angesehen werden, wenn die Anzahl Versuche gegen unendlich geht und p=q=0,5 ist. Die Wahrscheinlichkeit für das Auftreten einer Abweichung ist

wobei k negative und 2N-k positive Abweichungen auftreten. Wir können die Binominalverteilung verwenden:

Wir berechnen den Mittelwert. Mit wird

Die Varianz wird dann

Für grosse N ist es sinnvoll, die Verteilung auf die Varianz 1 zu standardisieren

Diese standardisierte Variable t_k hat den Mittelwert 0 und die Varianz 1. Verwenden nun Histogramme, und skalieren die Achse mit . Wir erhalten

Mit der Stirlingschen Formel

wird

Mit Hilfe der Rekursionsformel kann gezeigt werden, dass

Für p=q=1/2 wird

Für N® ¥ ergibt sich

Daraus folgt

Mit einer Normierung erhält man die standardisierte Gaussverteilung

oder die allgemeine Gaussverteilung

Die Gaussverteilung ist symmetrisch bezüglich des Mittelwertes µ, also sind alle ungradzahligen Momente 0. Die gradzahligen Momente haben den Wert

Damit wird zum Beispiel die Überhöhung g₄=3.

Viele Experimente ergeben eine gaussförmige Verteilung der Messwerte um einen Mittelwert.

Zur Abschätzung von Fehlergrenzen kann das Integral der Gaussverteilung, die Fehlerfunktion verwendet werden.

Für den speziellen Wert wird erf(1)=0,683. Das heisst: bei normalverteilten statistischen Abweichungen ist die Wahrscheinlichkeit = 68,3 %, dass eine Messung einen Fehler innerhalb liefert.

Poisson-Verteilung

Bei radioaktiven Atomen ist die Anzahl in einer bestimmten Zeit zerfallender Kerne proportional zur Gesamtzahl der Kerne. Es gilt also

Daraus folgt das Zerfallsgesetz

Anstelle der Zerfallskonstante wird meistens die Halbwertszeit T_½ = ln 2 / l angegeben. Unter den folgenden Annahmen kann man die dazugehörige Verteilungsfunktion ableiten.

	Die Zahl der radioaktiven Kerne sei sehr hoch (meistens sehr gut erfüllt).
	Die Anzahl der Zerfälle werde in jeweils konstanten Intervallen DT bestimmt.
	Die Zerfallswahrscheinlichkeit nlDt sei in jedem Messintervall gleich, was gleichbedeutend ist mit Dt<<T_½.

Viele Stösse ergeben nun eine Folge von Stosszeiten (k₁,k₂,k₃...). Wir berechnen nun den Erwartungswert E(k)=µ. Mit der Zerfallswahrscheinlichkeit p (proportional zu l und Dt) wird

Die Wahrscheinlichkeit für eine Zahl k von Ereignissen im Messintervall Dt kann aus der Binominalverteilung durch einen Grenzübergang nach unendlich (n® ¥ , p® 0, q® 1, np=µ=const) berechnet werden. Wir verwenden die Rekursionsformel für die Binominalverteilung

Daraus entsteht die Rekursionsformel für die Poisson-Verteilung

Mit der Normierungsbedingung bekommt man

Und daraus die Poissonverteilung

Die Poissonverteilung hat die folgenden Eigenschaften (erhalten aus dem Vergleich mit der Binominalverteilung):

	Mittelwert
	Varianz (np ist konstant, q geht gegen 1!!
	Die Poissonverteilung ist normiert.
	Die Poissonverteilung hat nur einen Parameter
	Der relative mittlere Fehler ist

Die Poisson-Verteilung findet man immer dann, wenn ein sehr unwahrscheinliches Ereignis bei einer grossen Zahl Versuchen betrachtet wird. Neben Atomkernen sind auch die Ankunftszeiten von Photonen und Elektronen bei sehr geringem Fluss poissonverteilt.

Lorentz-Verteilung

Die Lorentzverteilung tritt in optischen Spektren auf. Sie ist da die universelle Verteilungsfunktion. Sie wird in allgemeiner Form so geschrieben:

Die Lorentzverteilung besitzt die folgenden Eigenschaften:

	Sie ist zu 1 normiert.
	Der Maximalwert ist 2/pG bei x=µ
	Sie ist symmetrisch, alle ungeraden Momente sind also null.
	Die höheren geraden Momente, insbesondere die Varianz, sind nicht definiert, da die entsprechenden Integrale divergieren.
	Die charakteristische Dispersionsgrösse ist die Halbwertsbreite G.

Statistische Tests

Die in physikalischen Experimenten erhaltenen Daten stellen Stichproben aus einer Grundgesamtheit dar. Wir müssen nun die folgenden Fragen lösen:

	Stammen zwei Messreihen (Stichproben) aus der gleichen, unbekannten Grundgesamtheit?
	Passt eine Messreihe zu früheren, ausgedehnten Stichproben (Hat die Probe sich verändert?)
	Passt eine Stichprobe zu einer Modellverteilung oder Hypothese?

Ein einfacher Test kann anhand der Standardabweichungen durchgeführt werden. So soll untersucht werden, ob bei einer Gesamtwurfzahl von 315672 die Zahl von 106602 Würfen der zahlen 5 oder 6 zur Annahme eines Homogenen Würfels (p=1/3) passt. Im Versuch ist die relative Häufigkeit 0,3377=106602/315672. Weiter ist die Standardabweichung des Mittelwertes

Man erwartet für einen homogenen Würfel µ=105224 mit

Die beobachtete Abweichung ist jedoch 1378, also 5,2 mal grösser als s. Dieser einfache Test kann gut zu einer ersten Abschätzung der Güte einer Messung dienen.

Ein weiterer einfacher Test benutzt den Vergleich der höheren Momente. Für diesen Dispersionsindex gilt

t-Test

Der t-Test gibt eine Angabe über die Konsistenz zweier Mittelwerte. Er erlaubt eine Aussage, ob eine eigene Messung mit der eines andern (aber auch eine frühere eigene Messung) konsistent ist. Damit kann getestet werden, ob eine Apparatur sich mit der Zeit verändert.

Man könnte zur Annahme gelangen, dass wenn zwei Mittelwerte und sich um weniger als eine Standardabweichung unterscheiden, dass sie dann zu einer identischen Grundgesamtheit gehören. Diese Beurteilung ist willkürlich.

Besser ist es, den erwarteten Fehler der Differenz zu berechnen. Mit Hilfe des Fehlerfortpflanzungsgesetzes ergibt sich

dabei sind und die Mittelwerte zweier Messreihen, n₁ und n₂ die Anzahl Messungen mit den Fehlern s₁ und s₂. Für setzt5 man am besten ein, wobei die Varianz durch das Zusammenlegen aller Messreihen berechnet wurde.

Für die t-Verteilung und den t-Test betrachtet man normalverteilte Zufallsvariablen y. Sind solche nicht vorhanden, dann muss mit Mittelwerten von Stichproben gerechnet werden. Wir berechnen den Mittelwert m_y aus der Stichprobe y und die Standardabweichung s_y, die auf n Freiheitsgeraden beruht. Die t-Grösse ist dann

Sie gehorcht der Studentschen t-Verteilungsfunktion

Diese Verteilungsfunktion besitzt die Kenngrössen

Für nÞ ¥ geht die Verteilung in die Normalverteilung über. Die Integrale Verteilungsfunktion

ist die Wahrscheinlichkeit, dass bei Abwesenheit systematischer Fehler t-Werte auftreten, die ausserhalb des Konfidenzbereiches ± t liegen. Diese Funktion findet man in Tabellen. Für sehr umfangreiche Stichproben geht die t-Verteilung in die Normalverteilung über.

Für die (0,1) [Mittelwert 0, Varianz 1] verteilte Testgrösse bekommt man

Wenn der Test erfüllt ist, dann sind die beiden Stichproben aus der gleichen Grundgesamtheit.

Zwei Mittelwerte mit n₁=9 und n₂=7 ergeben einen t-Wert von 1,74

Man findet

(Die entsprechende Excel Funktion =TVERT(1,74;14;2) liefert 0,103784377)

Die Interpretation sagt nun, dass

	Nur in 10% aller Stichproben tritt eine Abweichung >10% auf
	Der Test wird von den beiden Messreihen erfüllt mit einer Signifikanz-Grenze von 10%, d.h. systematische Abweichungen sind wenig wahrscheinlich
	Die Mittelwerte müssen als konsistent angesehen werden.

Üblicherweise verwendet man Vertrauensgrenzen (Signifikanz-Grenzen) von 5% und 1%. Nur wenn der t-Test eine Wahrscheinlichkeit kleiner als diese Werte ergibt, nimmt man eine Abweichung an. Grössere Signifikanz-Grenzen (z.B. 40%) bedeuten, dass man sehr oft die Hypothese der Gleichheit verwerfen muss, obwohl sie stimmt. Mit sehr kleinen Signifikanz-Grenzen läuft man Gefahr, Gleichheit anzunehmen, obwohl sie nicht da ist.

F-Test

Der F-Test ist ein zum t-Test analoger Test, der die Konsistenz von Varianzen prüft.

Die Verteilungsfunktion enthält die beiden Freiheitsgrade und . In Tabellen werden für 5% und 1% Signifikanzgrenzen Werte angegeben.

Chi-Quadrat-Test

Beim c ²-Test liefert ein allgemeines Kriterium für die Übereinstimmung der Grundgesamtheit mit der Stichprobe. Der c ²-Test taugt für jede Verteilungsfunktion, ist also modellfrei. Das Vorgehen ist folgendermassen:

Man ordnet die Messwerte in Klassen, so dass in jede Klasse mindestens 5 Werte fallen. Die Anzahl Beobachtungen sei f_ex
Es sollen mindestens M³ 6 Klassen vorhanden sein.
Aus der Hypothese, der Verteilungsfunktion, die man testen möchte, berechnet man die erwartete Häufigkeit f_th für jede Klasse.
Man berechnet aus der Klassenbreite, dem Klassenmittelwert und der Dichte der Verteilungsfunktion die erwartete Häufigkeit f_th.
Normierung:
Die Grösse

ist ein integrales Mass für die statistischen Abweichungen der beobachteten Häufigkeiten.

Die Verteilungsfunktion lautet:

Die kennzeichnenden Grössen sind:

Die c ²-Verteilungsfunktion ist verwandt mit der Poisson-Verteilung: sie geht für grosse n in die Normalverteilung über. Wir rechnen nun die Wahrscheinlichkeit für den c ²-Wert aus der Probe aus. Der Test, ob die Stichprobe zur hypothetischen Grundgesamteit passt, gilt als bestanden, wenn die Wahrscheinlichkeit >5% ist.

Für die Anzahl Freiheitsgrade gilt:

Solche Beschränkungen sind die Normierung von f_th und die Mittelwertbildung.

Für den c ²-Test ergibt sich demnach

	Normalverteilung: n=M-3
	Poissonverteilung: n=M-2
	Modellverteilungen mit a priori-Annahmen über µ und s: n=M-1.

Wenn ich bei einer Stichprobe mit 8 Messwerten ausrechne, dass der Mittelwert und die Standardabweichung , so wäre eine Resultatangabe von

vollkommen unsinnig. Ist der Fehler nämlich normalverteilt, so erhält man für , also sind 4 Stellen für den Mittelwert und 2 für die Abweichung angebracht:

[Einführung] [Statistische Fehler] [Fehlerfortpflanzung] [Ausgleichsrechnung "Fitten"] [Fitten mit Excel]

(c) Experimentelle Physik, Universität Ulm Freitag, 4. Juli 2003
V.i.S.d.P.: Othmar Marti, Experimentelle Physik, Universität Ulm
Für den Inhalt externer Links übernimmt weder die Universität Ulm noch das Universitätsrechenzentrum eine Verantwortung.