![]() |
|
Statistische Fehler Wenn eine Messung nur einmal durchgeführt wird, so kann man über die Zuverlässigkeit keine Angaben machen. Es ist deshalb unumgänglich, Messungen zu wiederholen.
Stichproben Die erhaltenen Messresultate sind eine Stichprobe aus der Menge aller möglichen Messresultate. Jede Stichprobe hat eine gewisse, noch zu berechnende Wahrscheinlichkeit, dass sie die Grundgesamtheit repräsentiert. Stichproben werden üblicherweise als Histogramme dargestellt. Die gemessenen Daten x werden in Klassen mit (xi – Dxi) < x <xi eingeteilt.
Aus diesem Histogramm kann man den Mittelwert
berechnen. Hier sind die Ai die Häufigkeiten der in eine bestimmte Klasse fallenden Messwerte. In unserem Falle ist dies 2,583030303. Man kann diese Gleichung umschreiben, indem man die relativen Häufigkeiten
verwendet. Der Mittelwert ist dann
Der so gefundene Mittelwert ist im allgemeinen nicht mit dem wahren Wert der Messgrösse identisch. Wenn wir die Klassenbreite verringern und gleichzeitig die Anzahl Messpunkte erhöhen, so erhält man die differentielle Verteilungsfunktion f(x) der zugrunde liegenden Gesamtheit. Diese Funktion f(x) ist normiert, da wir die relativen Häufigkeiten zu ihrer Ableitung verwendet hatten.
Wir müssen unterscheiden zwischen den aus den experimentellen Daten empirisch gefundenen Verteilungsfunktionen und den durch theoretische Modelle berechneten Verteilungen. Eine wichtige Aufgabe einer Datenanalyse kann sein, zu zeigen, dass eine empirische Verteilungsfunktion mit einer theoretisch gefundenen verträglich ist.
Varianzen und Standardabweichungen Eine Verteilungsfunktion ist nicht nur durch ihren Mittelwert, sondern auch durch die Lage- und Dispersionsgrössen gegeben. Wir haben gesehen, dass der arithmetische Mittelwerte(oben) eine solche Grösse ist. Die Lagegrössen müssen die folgenden Postulate erfüllen:
Als Lagegrössen kommen in Frage:
Der Median ist besonders dann zu verwenden, wenn die Stichprobe eine grosse Streuung aufweist. Wenn aus anderen Daten bekannt ist, dass nicht alle Messwerte die gleiche Güte haben, kann man die Ai auch als Gewicht benutzen. Hier hatten wir die Anzahl Messwerte pro Klasse als Güte des Messwertes genommen. Es ist einsichtig, dass man zusätzlich versucht, die Breite einer Verteilung zu charakterisieren. Diese Grössen heissen Dispersionsgrössen. Man verwendet:
. Wenn man die Varianz bezüglich eines andern Wertes B bildet, so gilt mit
also
Wenn wir eine kontinuierliche Verteilung haben und p(x) die Gewichtsfunktion ist, gilt:
Shepard gibt an, dass ein besserer Wert für die Varianz erhalten wird bei in Klassen eingeteilten Messgrössen, wenn man die folgende Formel verwendet.
wobei h die Klassenbreite ist. In unserem Falle wäre
Mittlerer Fehler und Varianz
Da der Mittelwert der Grundgesamtheit, µ, im allgemeinen nicht bekannt ist, wird die berechnete Varianz nicht die Varianz der Grundgesamtheit sein. Wir versuchen nun den besten Schätzwert für die Varianz zu berechnen. Nehmen wir an, wir würden µ kennen. Dann gilt
Im folgenden setzen wir alle Ai=1 und µ=0. Dann ist A=n. Durch ausmultiplizieren erhalten wir
mit
Mit
wird
Die Grösse s ist der mittlere Fehler einer Einzelmessung. Der Übergang von n nach n-1 ist zu Verstehen als der Verlust eines Freiheitsgrades. Da wir den Mittelwert der Grundgesamtheit µ nicht kennen, muss die Stichprobe zur Bestimmung von m herhalten. Dies ergibt eine neue Beziehung zwischen den Datensätzen, reduziert also die Anzahl Freiheitsgrade. Mittlerer Fehler des Mittelwertes Bei verschiedenen Stichproben schwanken der Mittelwert und die Varianz. Wenn wir für die Berechnung des Mittelwertes die Schreibweise
verwenden, und für den Erwartungswert
verwenden, dann gilt bei gleicher Grundgesamtheit für alle xi,
dass sie den Erwartungswert
Wenn die Messdaten statistisch unabhängig sind, so ist der zweite Term=0 und wir erhalten
der mittlere Fehler sm des Mittelwertes ist also um den
Faktor
Daraus lernt man, dass, um ein Resultat doppelt so genau zu erhalten, viermal mehr Messungen durchgeführt werden müssen. Momente der Verteilung Das k-te Moment einer Verteilung ist definiert durch den Erwartungswert
Wenn wir B=0 setzen, so erhalten wir
Bei den höheren Momenten benutzt man eine Normierung, damit diese dimensionslos werden. Gebräuchlich ausser dem Mittelwert und der Varianz sind:
. Wenn die Schiefe positiv ist, heisst das, dass grössere Abweichungen auf der positiven Seite liegen. Symmetrische Verteilungen haben die Schiefe 0. Die Überhöhung (peakedness): Verteilungen Es gibt einige Modellverteilungen, die in der Physik sehr gebräuchlich sind. Dies sind die Binominalverteilung, die bei Würfelexperimenten oder würfelartigen Experimenten zugrunde liegt, die Poisson-Verteilung und, im Grenzfall sehr grosser Grundgesamtheiten, die Normalverteilung.
Binominalverteilung Die Binominalverteilung beschreibt Experimente, bei denen in jedem einzelnen Experiment mit der Wahrscheinlichkeit p ein Ereignis eintritt und mit der Wahrscheinlichkeit q=1-p ein zweites Ereignis eintritt (oder das erste nicht eintritt). Ein Würfelspiel genügt, zum Beispiel, diesen Gesetzen. Die Wahrscheinlichkeit, dass k-mal das erste und n-k mal das zweite Ereignis eintritt ist
Wenn die Reihenfolge dieser Ereignisse irrelevant ist, dann hat man die Binominalverteilung
Die Verteilung ist normiert, da gilt
Der Mittelwert ist
Die Varianz schliesslich berechnet sich zu
und
Die weiteren Momente sind (ohne Rechnung)
und
Für die Binominalverteilung existiert eine Rekursionsformel:
Zum Abschluss noch eine kurze Bemerkung: jede, auch asymmetrische Binominalverteilung geht für festes p bei grossen n in die Normalverteilung über. Normalverteilung Die Normalverteilung kann als Grenzfall der Binominalverteilung angesehen werden, wenn die Anzahl Versuche gegen unendlich geht und p=q=0,5 ist. Die Wahrscheinlichkeit für das Auftreten einer Abweichung ist
wobei k negative und 2N-k positive Abweichungen auftreten. Wir können die Binominalverteilung verwenden:
Wir berechnen den Mittelwert. Mit
Die Varianz wird dann
Für grosse N ist es sinnvoll, die Verteilung auf die Varianz 1 zu standardisieren
Diese standardisierte Variable tk hat den
Mittelwert 0 und die Varianz 1. Verwenden nun Histogramme, und skalieren die
Achse mit
Mit der Stirlingschen Formel
wird
Mit Hilfe der Rekursionsformel kann gezeigt werden, dass
Für p=q=1/2 wird
Für N® ¥ ergibt sich
Daraus folgt
Mit einer Normierung erhält man die standardisierte Gaussverteilung
oder die allgemeine Gaussverteilung
Die Gaussverteilung ist symmetrisch bezüglich des Mittelwertes µ, also sind alle ungradzahligen Momente 0. Die gradzahligen Momente haben den Wert
Damit wird zum Beispiel die Überhöhung g4=3. Viele Experimente ergeben eine gaussförmige Verteilung der Messwerte um einen Mittelwert. Zur Abschätzung von Fehlergrenzen kann das Integral der Gaussverteilung, die Fehlerfunktion verwendet werden.
Für den speziellen Wert
Poisson-Verteilung Bei radioaktiven Atomen ist die Anzahl in einer bestimmten Zeit zerfallender Kerne proportional zur Gesamtzahl der Kerne. Es gilt also
Daraus folgt das Zerfallsgesetz
Anstelle der Zerfallskonstante wird meistens die Halbwertszeit T½ = ln 2 / l angegeben. Unter den folgenden Annahmen kann man die dazugehörige Verteilungsfunktion ableiten.
Viele Stösse ergeben nun eine Folge von Stosszeiten (k1,k2,k3...). Wir berechnen nun den Erwartungswert E(k)=µ. Mit der Zerfallswahrscheinlichkeit p (proportional zu l und Dt) wird
Die Wahrscheinlichkeit für eine Zahl k von Ereignissen im Messintervall Dt kann aus der Binominalverteilung durch einen Grenzübergang nach unendlich (n® ¥ , p® 0, q® 1, np=µ=const) berechnet werden. Wir verwenden die Rekursionsformel für die Binominalverteilung
Daraus entsteht die Rekursionsformel für die Poisson-Verteilung
Mit der Normierungsbedingung
Und daraus die Poissonverteilung
Die Poissonverteilung hat die folgenden Eigenschaften (erhalten aus dem Vergleich mit der Binominalverteilung):
Die Poisson-Verteilung findet man immer dann, wenn ein sehr unwahrscheinliches Ereignis bei einer grossen Zahl Versuchen betrachtet wird. Neben Atomkernen sind auch die Ankunftszeiten von Photonen und Elektronen bei sehr geringem Fluss poissonverteilt.
Lorentz-Verteilung Die Lorentzverteilung tritt in optischen Spektren auf. Sie ist da die universelle Verteilungsfunktion. Sie wird in allgemeiner Form so geschrieben:
Die Lorentzverteilung besitzt die folgenden Eigenschaften:
Statistische Tests Die in physikalischen Experimenten erhaltenen Daten stellen Stichproben aus einer Grundgesamtheit dar. Wir müssen nun die folgenden Fragen lösen:
Ein einfacher Test kann anhand der Standardabweichungen durchgeführt werden. So soll untersucht werden, ob bei einer Gesamtwurfzahl von 315672 die Zahl von 106602 Würfen der zahlen 5 oder 6 zur Annahme eines Homogenen Würfels (p=1/3) passt. Im Versuch ist die relative Häufigkeit 0,3377=106602/315672. Weiter ist die Standardabweichung des Mittelwertes
Man erwartet für einen homogenen Würfel µ=105224 mit
Die beobachtete Abweichung ist jedoch 1378, also 5,2 mal grösser als s. Dieser einfache Test kann gut zu einer ersten Abschätzung der Güte einer Messung dienen. Ein weiterer einfacher Test benutzt den Vergleich der höheren Momente. Für diesen Dispersionsindex gilt
t-Test Der t-Test gibt eine Angabe über die Konsistenz zweier Mittelwerte. Er erlaubt eine Aussage, ob eine eigene Messung mit der eines andern (aber auch eine frühere eigene Messung) konsistent ist. Damit kann getestet werden, ob eine Apparatur sich mit der Zeit verändert. Man könnte zur Annahme gelangen, dass wenn zwei Mittelwerte Besser ist es, den erwarteten Fehler der Differenz
dabei sind Für die t-Verteilung und den t-Test betrachtet man normalverteilte Zufallsvariablen y. Sind solche nicht vorhanden, dann muss mit Mittelwerten von Stichproben gerechnet werden. Wir berechnen den Mittelwert my aus der Stichprobe y und die Standardabweichung sy, die auf n Freiheitsgeraden beruht. Die t-Grösse ist dann
Sie gehorcht der Studentschen t-Verteilungsfunktion
Diese Verteilungsfunktion besitzt die Kenngrössen
Für nÞ ¥ geht die Verteilung in die Normalverteilung über. Die Integrale Verteilungsfunktion
ist die Wahrscheinlichkeit, dass bei Abwesenheit systematischer Fehler t-Werte auftreten, die ausserhalb des Konfidenzbereiches ± t liegen. Diese Funktion findet man in Tabellen. Für sehr umfangreiche Stichproben geht die t-Verteilung in die Normalverteilung über. Für die (0,1) [Mittelwert 0, Varianz 1] verteilte Testgrösse bekommt man
Wenn der Test erfüllt ist, dann sind die beiden Stichproben aus der gleichen Grundgesamtheit.
F-Test Der F-Test ist ein zum t-Test analoger Test, der die Konsistenz von Varianzen prüft.
Die Verteilungsfunktion enthält die beiden Freiheitsgrade Chi-Quadrat-Test Beim c 2-Test liefert ein allgemeines Kriterium für die Übereinstimmung der Grundgesamtheit mit der Stichprobe. Der c 2-Test taugt für jede Verteilungsfunktion, ist also modellfrei. Das Vorgehen ist folgendermassen:
ist ein integrales Mass für die statistischen Abweichungen der beobachteten Häufigkeiten. Die Verteilungsfunktion lautet:
Die kennzeichnenden Grössen sind:
Die c 2-Verteilungsfunktion ist verwandt mit der Poisson-Verteilung: sie geht für grosse n in die Normalverteilung über. Wir rechnen nun die Wahrscheinlichkeit für den c 2-Wert aus der Probe aus. Der Test, ob die Stichprobe zur hypothetischen Grundgesamteit passt, gilt als bestanden, wenn die Wahrscheinlichkeit >5% ist. Für die Anzahl Freiheitsgrade gilt:
Solche Beschränkungen sind die Normierung von fth und die Mittelwertbildung. Für den c 2-Test ergibt sich demnach
Wenn ich bei einer Stichprobe mit 8 Messwerten ausrechne,
dass der Mittelwert
vollkommen unsinnig. Ist der Fehler nämlich normalverteilt,
so erhält man für
|
|
[Einführung] [Statistische Fehler] [Fehlerfortpflanzung] [Ausgleichsrechnung "Fitten"] [Fitten mit Excel]
(c) Experimentelle Physik, Universität Ulm Freitag,
4. Juli 2003 |