|
Statistische Fehler Wenn eine Messung nur einmal durchgeführt wird, so kann man über die Zuverlässigkeit keine Angaben machen. Es ist deshalb unumgänglich, Messungen zu wiederholen.
Stichproben Die erhaltenen Messresultate sind eine Stichprobe aus der Menge aller möglichen Messresultate. Jede Stichprobe hat eine gewisse, noch zu berechnende Wahrscheinlichkeit, dass sie die Grundgesamtheit repräsentiert. Stichproben werden üblicherweise als Histogramme dargestellt. Die gemessenen Daten x werden in Klassen mit (xi – Dxi) < x <xi eingeteilt.
Aus diesem Histogramm kann man den Mittelwert berechnen. Hier sind die Ai die Häufigkeiten der in eine bestimmte Klasse fallenden Messwerte. In unserem Falle ist dies 2,583030303. Man kann diese Gleichung umschreiben, indem man die relativen Häufigkeiten verwendet. Der Mittelwert ist dann Der so gefundene Mittelwert ist im allgemeinen nicht mit dem wahren Wert der Messgrösse identisch. Wenn wir die Klassenbreite verringern und gleichzeitig die Anzahl Messpunkte erhöhen, so erhält man die differentielle Verteilungsfunktion f(x) der zugrunde liegenden Gesamtheit. Diese Funktion f(x) ist normiert, da wir die relativen Häufigkeiten zu ihrer Ableitung verwendet hatten.
Wir müssen unterscheiden zwischen den aus den experimentellen Daten empirisch gefundenen Verteilungsfunktionen und den durch theoretische Modelle berechneten Verteilungen. Eine wichtige Aufgabe einer Datenanalyse kann sein, zu zeigen, dass eine empirische Verteilungsfunktion mit einer theoretisch gefundenen verträglich ist.
Varianzen und Standardabweichungen Eine Verteilungsfunktion ist nicht nur durch ihren Mittelwert, sondern auch durch die Lage- und Dispersionsgrössen gegeben. Wir haben gesehen, dass der arithmetische Mittelwerte(oben) eine solche Grösse ist. Die Lagegrössen müssen die folgenden Postulate erfüllen:
Als Lagegrössen kommen in Frage:
Der Median ist besonders dann zu verwenden, wenn die Stichprobe eine grosse Streuung aufweist. Wenn aus anderen Daten bekannt ist, dass nicht alle Messwerte die gleiche Güte haben, kann man die Ai auch als Gewicht benutzen. Hier hatten wir die Anzahl Messwerte pro Klasse als Güte des Messwertes genommen. Es ist einsichtig, dass man zusätzlich versucht, die Breite einer Verteilung zu charakterisieren. Diese Grössen heissen Dispersionsgrössen. Man verwendet:
. Wenn man die Varianz bezüglich eines andern Wertes B bildet, so gilt mit also.
Wenn wir eine kontinuierliche Verteilung haben und p(x) die Gewichtsfunktion ist, gilt:
Shepard gibt an, dass ein besserer Wert für die Varianz erhalten wird bei in Klassen eingeteilten Messgrössen, wenn man die folgende Formel verwendet. wobei h die Klassenbreite ist. In unserem Falle wäre .
Mittlerer Fehler und Varianz
Da der Mittelwert der Grundgesamtheit, µ, im allgemeinen nicht bekannt ist, wird die berechnete Varianz nicht die Varianz der Grundgesamtheit sein. Wir versuchen nun den besten Schätzwert für die Varianz zu berechnen. Nehmen wir an, wir würden µ kennen. Dann gilt Im folgenden setzen wir alle Ai=1 und µ=0. Dann ist A=n. Durch ausmultiplizieren erhalten wir mit erhält man Mit wird Die Grösse s ist der mittlere Fehler einer Einzelmessung. Der Übergang von n nach n-1 ist zu Verstehen als der Verlust eines Freiheitsgrades. Da wir den Mittelwert der Grundgesamtheit µ nicht kennen, muss die Stichprobe zur Bestimmung von m herhalten. Dies ergibt eine neue Beziehung zwischen den Datensätzen, reduziert also die Anzahl Freiheitsgrade. Mittlerer Fehler des Mittelwertes Bei verschiedenen Stichproben schwanken der Mittelwert und die Varianz. Wenn wir für die Berechnung des Mittelwertes die Schreibweise verwenden, und für den Erwartungswert verwenden, dann gilt bei gleicher Grundgesamtheit für alle xi, dass sie den Erwartungswert und ist. Wenn wir den Mittelwert der Messwerte, m einsetzen, erhalten wir auch . Für die Varianz gilt auch Wenn die Messdaten statistisch unabhängig sind, so ist der zweite Term=0 und wir erhalten der mittlere Fehler sm des Mittelwertes ist also um den Faktor kleiner als der mittlere Fehler der Einzelmessung Daraus lernt man, dass, um ein Resultat doppelt so genau zu erhalten, viermal mehr Messungen durchgeführt werden müssen. Momente der Verteilung Das k-te Moment einer Verteilung ist definiert durch den Erwartungswert Wenn wir B=0 setzen, so erhalten wir Bei den höheren Momenten benutzt man eine Normierung, damit diese dimensionslos werden. Gebräuchlich ausser dem Mittelwert und der Varianz sind:
. Wenn die Schiefe positiv ist, heisst das, dass grössere Abweichungen auf der positiven Seite liegen. Symmetrische Verteilungen haben die Schiefe 0. Die Überhöhung (peakedness): . Die Grösse heisst Exzess, da sie die Abweichung von der Gaussverteilung angibt. Verteilungen Es gibt einige Modellverteilungen, die in der Physik sehr gebräuchlich sind. Dies sind die Binominalverteilung, die bei Würfelexperimenten oder würfelartigen Experimenten zugrunde liegt, die Poisson-Verteilung und, im Grenzfall sehr grosser Grundgesamtheiten, die Normalverteilung.
Binominalverteilung Die Binominalverteilung beschreibt Experimente, bei denen in jedem einzelnen Experiment mit der Wahrscheinlichkeit p ein Ereignis eintritt und mit der Wahrscheinlichkeit q=1-p ein zweites Ereignis eintritt (oder das erste nicht eintritt). Ein Würfelspiel genügt, zum Beispiel, diesen Gesetzen. Die Wahrscheinlichkeit, dass k-mal das erste und n-k mal das zweite Ereignis eintritt ist Wenn die Reihenfolge dieser Ereignisse irrelevant ist, dann hat man die Binominalverteilung Die Verteilung ist normiert, da gilt Der Mittelwert ist Die Varianz schliesslich berechnet sich zu und Die weiteren Momente sind (ohne Rechnung) und Für die Binominalverteilung existiert eine Rekursionsformel: Zum Abschluss noch eine kurze Bemerkung: jede, auch asymmetrische Binominalverteilung geht für festes p bei grossen n in die Normalverteilung über. Normalverteilung Die Normalverteilung kann als Grenzfall der Binominalverteilung angesehen werden, wenn die Anzahl Versuche gegen unendlich geht und p=q=0,5 ist. Die Wahrscheinlichkeit für das Auftreten einer Abweichung ist wobei k negative und 2N-k positive Abweichungen auftreten. Wir können die Binominalverteilung verwenden: Wir berechnen den Mittelwert. Mit wird Die Varianz wird dann Für grosse N ist es sinnvoll, die Verteilung auf die Varianz 1 zu standardisieren Diese standardisierte Variable tk hat den Mittelwert 0 und die Varianz 1. Verwenden nun Histogramme, und skalieren die Achse mit . Wir erhalten Mit der Stirlingschen Formel wird Mit Hilfe der Rekursionsformel kann gezeigt werden, dass Für p=q=1/2 wird Für N® ¥ ergibt sich Daraus folgt Mit einer Normierung erhält man die standardisierte Gaussverteilung
oder die allgemeine Gaussverteilung Die Gaussverteilung ist symmetrisch bezüglich des Mittelwertes µ, also sind alle ungradzahligen Momente 0. Die gradzahligen Momente haben den Wert Damit wird zum Beispiel die Überhöhung g4=3. Viele Experimente ergeben eine gaussförmige Verteilung der Messwerte um einen Mittelwert. Zur Abschätzung von Fehlergrenzen kann das Integral der Gaussverteilung, die Fehlerfunktion verwendet werden. Für den speziellen Wert wird erf(1)=0,683. Das heisst: bei normalverteilten statistischen Abweichungen ist die Wahrscheinlichkeit = 68,3 %, dass eine Messung einen Fehler innerhalb liefert.
Poisson-Verteilung Bei radioaktiven Atomen ist die Anzahl in einer bestimmten Zeit zerfallender Kerne proportional zur Gesamtzahl der Kerne. Es gilt also Daraus folgt das Zerfallsgesetz Anstelle der Zerfallskonstante wird meistens die Halbwertszeit T½ = ln 2 / l angegeben. Unter den folgenden Annahmen kann man die dazugehörige Verteilungsfunktion ableiten.
Viele Stösse ergeben nun eine Folge von Stosszeiten (k1,k2,k3...). Wir berechnen nun den Erwartungswert E(k)=µ. Mit der Zerfallswahrscheinlichkeit p (proportional zu l und Dt) wird Die Wahrscheinlichkeit für eine Zahl k von Ereignissen im Messintervall Dt kann aus der Binominalverteilung durch einen Grenzübergang nach unendlich (n® ¥ , p® 0, q® 1, np=µ=const) berechnet werden. Wir verwenden die Rekursionsformel für die Binominalverteilung Daraus entsteht die Rekursionsformel für die Poisson-Verteilung Mit der Normierungsbedingung bekommt man Und daraus die Poissonverteilung Die Poissonverteilung hat die folgenden Eigenschaften (erhalten aus dem Vergleich mit der Binominalverteilung):
Die Poisson-Verteilung findet man immer dann, wenn ein sehr unwahrscheinliches Ereignis bei einer grossen Zahl Versuchen betrachtet wird. Neben Atomkernen sind auch die Ankunftszeiten von Photonen und Elektronen bei sehr geringem Fluss poissonverteilt.
Lorentz-Verteilung Die Lorentzverteilung tritt in optischen Spektren auf. Sie ist da die universelle Verteilungsfunktion. Sie wird in allgemeiner Form so geschrieben: Die Lorentzverteilung besitzt die folgenden Eigenschaften:
Statistische Tests Die in physikalischen Experimenten erhaltenen Daten stellen Stichproben aus einer Grundgesamtheit dar. Wir müssen nun die folgenden Fragen lösen:
Ein einfacher Test kann anhand der Standardabweichungen durchgeführt werden. So soll untersucht werden, ob bei einer Gesamtwurfzahl von 315672 die Zahl von 106602 Würfen der zahlen 5 oder 6 zur Annahme eines Homogenen Würfels (p=1/3) passt. Im Versuch ist die relative Häufigkeit 0,3377=106602/315672. Weiter ist die Standardabweichung des Mittelwertes Man erwartet für einen homogenen Würfel µ=105224 mit Die beobachtete Abweichung ist jedoch 1378, also 5,2 mal grösser als s. Dieser einfache Test kann gut zu einer ersten Abschätzung der Güte einer Messung dienen. Ein weiterer einfacher Test benutzt den Vergleich der höheren Momente. Für diesen Dispersionsindex gilt t-Test Der t-Test gibt eine Angabe über die Konsistenz zweier Mittelwerte. Er erlaubt eine Aussage, ob eine eigene Messung mit der eines andern (aber auch eine frühere eigene Messung) konsistent ist. Damit kann getestet werden, ob eine Apparatur sich mit der Zeit verändert. Man könnte zur Annahme gelangen, dass wenn zwei Mittelwerte und sich um weniger als eine Standardabweichung unterscheiden, dass sie dann zu einer identischen Grundgesamtheit gehören. Diese Beurteilung ist willkürlich. Besser ist es, den erwarteten Fehler der Differenz zu berechnen. Mit Hilfe des Fehlerfortpflanzungsgesetzes ergibt sich dabei sind und die Mittelwerte zweier Messreihen, n1 und n2 die Anzahl Messungen mit den Fehlern s1 und s2. Für setzt5 man am besten ein, wobei die Varianz durch das Zusammenlegen aller Messreihen berechnet wurde. Für die t-Verteilung und den t-Test betrachtet man normalverteilte Zufallsvariablen y. Sind solche nicht vorhanden, dann muss mit Mittelwerten von Stichproben gerechnet werden. Wir berechnen den Mittelwert my aus der Stichprobe y und die Standardabweichung sy, die auf n Freiheitsgeraden beruht. Die t-Grösse ist dann . Sie gehorcht der Studentschen t-Verteilungsfunktion Diese Verteilungsfunktion besitzt die Kenngrössen Für nÞ ¥ geht die Verteilung in die Normalverteilung über. Die Integrale Verteilungsfunktion ist die Wahrscheinlichkeit, dass bei Abwesenheit systematischer Fehler t-Werte auftreten, die ausserhalb des Konfidenzbereiches ± t liegen. Diese Funktion findet man in Tabellen. Für sehr umfangreiche Stichproben geht die t-Verteilung in die Normalverteilung über. Für die (0,1) [Mittelwert 0, Varianz 1] verteilte Testgrösse bekommt man Wenn der Test erfüllt ist, dann sind die beiden Stichproben aus der gleichen Grundgesamtheit.
F-Test Der F-Test ist ein zum t-Test analoger Test, der die Konsistenz von Varianzen prüft. Die Verteilungsfunktion enthält die beiden Freiheitsgrade und . In Tabellen werden für 5% und 1% Signifikanzgrenzen Werte angegeben. Chi-Quadrat-Test Beim c 2-Test liefert ein allgemeines Kriterium für die Übereinstimmung der Grundgesamtheit mit der Stichprobe. Der c 2-Test taugt für jede Verteilungsfunktion, ist also modellfrei. Das Vorgehen ist folgendermassen:
ist ein integrales Mass für die statistischen Abweichungen der beobachteten Häufigkeiten. Die Verteilungsfunktion lautet: Die kennzeichnenden Grössen sind: Die c 2-Verteilungsfunktion ist verwandt mit der Poisson-Verteilung: sie geht für grosse n in die Normalverteilung über. Wir rechnen nun die Wahrscheinlichkeit für den c 2-Wert aus der Probe aus. Der Test, ob die Stichprobe zur hypothetischen Grundgesamteit passt, gilt als bestanden, wenn die Wahrscheinlichkeit >5% ist. Für die Anzahl Freiheitsgrade gilt: Solche Beschränkungen sind die Normierung von fth und die Mittelwertbildung. Für den c 2-Test ergibt sich demnach
Wenn ich bei einer Stichprobe mit 8 Messwerten ausrechne, dass der Mittelwert und die Standardabweichung , so wäre eine Resultatangabe von vollkommen unsinnig. Ist der Fehler nämlich normalverteilt, so erhält man für , also sind 4 Stellen für den Mittelwert und 2 für die Abweichung angebracht:
|
[Einführung] [Statistische Fehler] [Fehlerfortpflanzung] [Ausgleichsrechnung "Fitten"] [Fitten mit Excel]
(c) Experimentelle Physik, Universität Ulm Freitag,
4. Juli 2003 |