Statistik: Vergleich zweier Lageparameter: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Philipendula
 
(kein Unterschied)

Aktuelle Version vom 2. März 2017, 10:20 Uhr

Vergleich zweier Erwartungswerte

Wir betrachten ein Beispiel: Werbewirksamkeit der Farbe eines Verkaufsregals

Eine Unternehmung, die Tee aus fairem Anbau vertreibt, überlegt, für die Verkaufsregale ein einheitliches Design zu entwerfen. Als Farbe kommen ein dunkleres Gelb oder ein helles Türkis in Frage. Es werden in 11 Supermärkten gelbe Regale und in 9 Supermärkten türkise Regale aufgestellt. Es geht darum, ob sich die mittleren Umsätze bezüglich der Farbe unterscheiden.

Wir bezeichnen mit X1 die Zahl der Pakete, die in den ersteren Märkten, und mit X2 die Zahl der Pakete, die in den letzteren Märkten verkauft wurden. Die beiden Zufallsvariablen sind normalverteilt, jeweils mit dem Erwartungswert :μ1 bzw. μ2.

Von Interesse ist, ob der durchschnittliche Absatz von Teepackungen aus gelben Regalen gleich dem von türkisen Regalen sein könnte. Wir testen also

H0μ1=μ2.

Welche Prüfgröße nimmt man hier? Die obige Hypothesenstellung ist da wenig hilfreich, denn wir haben hier eine Gleichung als unbekannten Parameter. Wir können aber H0 umformen zu

H0μ1μ2=0.

Nun brauchen wir noch eine passende Schätzfunktion für die Differenz der Erwartungswerte: Es bieten sich die entsprechenden arithmetischen Durchschnitte x1 und x2 an, die durchschnittlichen Absatzzahlen von Teepaketen je Regalfarbe. Die Differenz X1X2 ist natürlich wieder eine Zufallsvariable, die ebenfalls normalverteilt ist. Ihr Erwartungswert ist μ1μ2, wie uns von linearen Transformationen von Zufallsvariablen bekannt ist. Wären die Varianzen von X1 und X2 bekannt, ergäbe sich die Varianz von X1X2 als Summe der Varianzen von X1 und X2, also σx¯12+σx¯22. Wir hätten also nun normalverteilte Prüfgröße

z=(X1X2)(μ1μ2)σX12+σX22.

Leider ist der Statistikgott grausam und verrät uns normalerweise die Varianzen in den Grundgesamtheiten nicht. Hier beginnt die Tragödie: Da wir die Varianzen schätzen müssen, erhalten wir eine t-verteilte Prüfgröße. Nun ist die t-Verteilung nicht reproduktiv, eine Summe von t-verteilten Zufallsvariablen ist nicht per se wieder t-verteilt. Wir bekommen also bei der Bestimmung der Prüfgrößenverteilung Probleme. Wir sind mit zwei Möglichkeiten konfrontiert:

  • Die Varianzen der X sind gleich.
Hier ist die resultierende t-Verteilung reproduktiv, und die Ermittlung der Verteilung einfach.
  • Die Varianzen sind ungleich.
Im Nenner der Prüfgröße befinden sich nun die Wurzeln zweier verschiedener Quadratsummen. Hier können wir keine exakte Verteilung der Prüfgröße angeben. Wir haben eine t-Verteilung mit einer unbekannten Zahl von Freiheitsgraden, die lediglich näherungsweise bestimmt werden können.

Meistens wird wohl getestet, ob es generell zwischen den beiden Erwartungswerten einen Unterschied gibt, als Punkthypothese

H0μ1μ2=0 bzw. H0μ1=μ2,

als Bereichshypothesen

H0μ1μ20 bzw. H0μ1μ2,
H0μ1μ20 bzw. H0μ1μ2.

Bemerkung: Es kann mal vorkommen, dass wir eine Hypothese H0μ2μ10 gegeben haben, was bedeutet, μ2 ist größer als μ1. Hielten wir uns an die Prüfgröße der Formel mit dem Zähler X1X2, müssten wir die Hypothese umformen zu H0μ1μ20. Das Hantieren mit Ungleichungen bereitet Anfängern häufig Schwierigkeiten. Wir können es aber auch in der Hypothese bei H0μ2μ10 belassen und in die Prüfgröße statt des Zählers X1X2 die Differenz X2X1 schreiben, was uns die Umdrehung der Ungleichung erspart. Ansonsten hat das keine Auswirkungen, denn die Ausdrücke mit den Varianzen bleiben gleich.

Vergleich von Erwartungswerten, wenn die Varianzen gleich sind

Sind die Varianzen gleich, steht auch nur eine Varianz im Nenner der Prüfgröße. Wir berechnen aus allen Beobachtungen die gemeinsame Stichprobenvarianz s2, die auch gepoolte Varianz genannt wird. Nennen wir die Daten aus der ersten Stichprobe x1i(i=1,,n1) und die der zweiten Stichprobe x2i(i=1,,n2). Die Gesamtzahl aller Beobachtungen ist dann n=n1+n2. Die gepoolte Varianz wird ermittelt als

s2=(n11)s12+(n21)s22n1+n22,

was wir auch schreiben können als

s2=i=1n1(x1ix1)2+i=1n2(x2ix2)2n1+n22.

Woher wissen wir eigentlich, dass die Varianzen gleich sind, wenn wir sie gar nicht kenne? Das können wir mit einem Test auf Gleichheit der Varianzen zweier Zufallvariablen rauskriegen.

Wird dieser Test nicht abgelehnt, vermuten wir Gleichheit der Varianzen (mit allen Problemen des β-Fehlers, die man bei Nichtablehnung einkauft) und erhalten die Prüfgröße

T=X1X2(μ1μ2)S1n1+1n2 ,

die wegen (μ1μ2)=0 zu

T=X1X2S1n1+1n2

vereinfacht werden kann. 1n1+1n2 im Nenner entspricht dem 1n, das wir von Sn schon kennen.

T ist t-verteilt mit n2 Freiheitsgraden. Es gehen hier zwei Freiheitsgrade verloren, denn bei der Berechnung der Varianz ersetzen wir die unbekannten Erwartungswerte μ1 und μ2 durch die Schätzer X¯1 und X¯2.

Vorgehensweise:

Der Stichprobenwert der Prüfgröße ist

t=x1x2s1n1+1n2 .

Wir verwenden die Entscheidungsregeln

 H0μ1μ2=0 wird abgelehnt, falls t<t(1α2;n1+n22) oder t>t(1α2;n1+n22) ist.
 H0μ1μ20 wird abgelehnt, falls t>t(1α;n1+n22) ist.
 H0μ1μ20 wird abgelehnt, falls t<z(1α;n1+n22) ist.

Nun wollen wir unser Verkaufsregalbeispiel durchrechnen:

Wir testen H0μ1μ2=0 bei einem α=0,05.

Zuerst müssen wir den Nichtablehnungsbereich festlegen: Laut obiger Vorschrift ist er das Intervall

[t(1α2;n1+n22); t(1α2;n1+n22)]=
[t(0,975;11+92); t(0,975;11+92)]=
[2,10;2,10].

Nun werden wir die Prüfgröße berechnen:

In den n1=11 Supermärkten mit den gelben Regalen wurden

x1i 25 28 35 30 18 27 26 21 27 30 30

Päckchen verkauft, und in den n2=9 Supermärkten mit den türkisen Regalen

x2i 30 18 24 26 27 23 18 24 26

viele. Es ergeben sich die Schätzungen x1=27, x2=24, s12=21,4 und s22=15,75.

Die Nullhypothese, dass die Varianzen gleich sind, wird nicht abgelehnt (hier). Wir berechnen somit die gepoolte Varianz als

s2=1021,4+815,751818,89

beziehungsweise

s4,35.

Die Stichprobe ergibt also

t=272404,35111+19 =1,54.

Die Nullhypothese kann nicht abgelehnt werden. Die Farbe der Regale scheint die Kauflust nicht zu beeinflussen.

Vergleich von Erwartungswerten, wenn die Varianzen ungleich sind

Für die Nullhypothesen verwenden wir jetzt analog zur obigen Formel

z=(X1X2)(μ1μ2)σX12+σX22

die entsprechende Prüfgröße

T=X1X2S12n1+S22n2 ,

die bei normalverteilter Grundgesamtheit grundsätzlich t-verteilt ist.

Die Freiheitsgrade k können jetzt nur näherungsweise ermittelt werden mit der Formel

k=(s12n1+s22n2)2(s12n1)2n11+(s22n2)2n21.

Wir verwenden die Entscheidungsregeln

 H0μ1μ2=0 wird abgelehnt, falls t<t(1α2;k) oder t>t(1α2;k) ist.
 H0μ1μ20 wird abgelehnt, falls t>t(1α;k) ist.
 H0μ1μ20 wird abgelehnt, falls t<z(1α;k) ist.

Beispiel

Es wurden n1=16 Studentinnen und n2=25 Studenten befragt, wie viel Zeit sie in in der Woche für das Pauken einer vorgeschriebenen Fremdsprache aufwendeten .

Beim Signifikanzniveau α=0,1 soll geprüft werden, ob Studentinnen im Durchschnitt weniger Zeit aufwenden als Studenten, also

H0μ1μ2 bzw. H0μ1μ20.

Es ergaben sich die Kennwerte x1=50, x2=45, s12=64 und s22=225. Der Test auf Varianzgleichheit wurde abgelehnt. Die Zahl k der Freiheitsgrade ist dann

(6416+22525)2(6416)215+(22525)224=
1691615+812439 (aufgerundet).

Da wir eine Höchststhypothese haben, packen wir den Ablehnungsbereich ans obere Ende der Verteilung und entscheiden so: Wenn der Wert der Prüfgröße t>t(1α;39) ist, wird H0 abgelehnt.

In unserem Beispiel haben wir es allerdings bei k mit mehr als 30 Freiheitsgraden zu tun. Deshalb können wir die Prüfgröße als näherungsweise normalverteilt ansehen. Und wir lehnen nun ab, wenn t>z(1α)=z(0,9)=1,29 ist. Für t erhalten wir

t=50456416+22525=54+9=1,39.

Da 1,39>1,29 ist, wird die Hypothese abgelehnt. Studentinnen wenden vermutlich im Mittel mindestens genau so viel Zeit für das Erlernen von Sprachen auf wie Studenten.

Vergleich der Erwartungswerte von zwei Zufallsvariablen unbekannter Verteilung

Wir werden gelegentlich mit Daten konfrontiert sein, die wir bei bestem Willen nicht als normalverteilt andienen können. Ist der Stichprobenumfang genügend groß, kann die Verteilung der Prüfgröße als annähernd standardnormalverteilt angesehen werden.

Wir gehen so vor:

Es wird der Unterschied der Erwartungswerte EX1 und EX2 geprüft. Verteilung und Varianz von X1 und X2 sind unbekannt.

Wenn n1>30 und n2>30 oder k>30 gilt, ist die Prüfgröße Z für

z=x1x2s12n1+s22n2

näherungsweise normalverteilt.

 H0EX1EX2=0 wird abgelehnt, falls z<z(1α2) oder z>z(1α2) ist.

 H0EX1EX20 wird abgelehnt, falls z>z(1α) ist.

 H0EX1EX20 wird abgelehnt, falls z<z(1α) ist.

Vergleich der Anteilswerte zweier binomialverteilter Grundgesamtheiten

Wir betrachten zwei Urnen mit je zwei Sorten Kugeln. Zu jeder Urne (auch Grundgesamtheit genannt) gehört eine binomialverteilte Zufallsvariable X1 und X2 . Von Interesse könnte sein, ob die Parameter θ1 und θ2 verschieden sind. Wir testen also die Anteilswerte auf Gleichheit:

H0:θ1=θ2 bzw. H0:θ1θ2=0

bei der komplementären Alternativhypothese H1:θ1θ2.

Es werden zufällig n1 bzw. n2 Kugeln mit Zurücklegen entnommen.

Für den Test müssen die θs geschätzt werden: Der Anteilswert θ1 in der ersten Urne wird mit dem Stichprobenanteil p1=x1n, θ2 entsprechend mit p2 geschätzt.

Bei genügend großem Stichprobenumfang ist die Differenz der zu Grunde liegenden Zufallsvariablen P1P2 näherungsweise normalverteilt.

Wir wenden wieder das bekannte Approximationskriterium an:

Wenn n1>9p1(1p1) und n2>9p2(1p2) sind, ist die resultierende Prüfgröße näherungsweise standardnormalverteilt.

Unter H0 sind die Anteilswerte gleich, also dann auch ihre Varianz nθ(1θ). Wir berechnen diese mit Hilfe des gepoolten Anteilswerts

p=n1p1+n2p2n1+n2.

Für die Prüfgröße verwenden wir den Stichprobenwert

z=p1p2p(1p)(1n1+1n2).

Unsere Entscheidungsregeln lauten:

 H0θ1θ2=0 wird abgelehnt, falls z<z(1α2) oder z>z(1α2) ist.
 H0θ1θ20 wird abgelehnt, falls z>z(1α) ist.
 H0θ1θ20 wird abgelehnt, falls z<z(1α) ist.

Bemerkung: Grundsätzlich kann wie beim Vergleich von Erwartungswerten auch bei diesem Test auf einen bestimmten Unterschied hin geprüft werden. Es sollen hier aber lediglich die Tests auf Gleichheit betrachtet werden .

Beispiel: Zufriedenheit bei Bahnkunden

Ein privater Bahnbetreiber veranlasst zum Zweck der Qualitätssicherung eine Kundenbefragung. Unter anderem wurden die Kunden in die Kategorien Senior (mindestens 60 Jahre alt) und jüngerer Fahrgast eingeteilt. Während einer Zugfahrt wurden n1=280 jüngere Fahrgäste und n2=110 Senioren befragt. Von den jüngeren Fahrgästen wünschten 49, dass man auch ein Fahrrad mitnehmen kann, bei den Senioren waren es 22. Es soll bei α=0,05 die Hypothese getestet werden, dass der Anteil der jüngeren Fahrgäste, die das Rad mitnehmen wollen, größer ist als der entsprechende Anteil der Senioren.

Zu prüfen ist

H0θ1θ2 beziehungsweise H0θ1θ20

Der Stichprobenanteil für θ1 berechnet sich als p1=49280=0,175 und der für θ2 als p2=22110=0,2.

Zuerst müssen wir prüfen, ob die Prüfgröße näherungsweise normalverteilt ist.

Es sind

90,175(10,175)62<n1=280

und

90,2(10,2)56<n2=110.

Wir können also mit der Normalverteilung approximieren und lehnen die Hypothese ab, wenn z<z(1α), also z<1,65 ist.

Nun brauchen wir noch den gepoolten Anteilswert

p=n1p1+n2p2n1+n2=2800,175+1100,2280+110=0,1820.

Der Stichprobenwert der Prüfgröße ist dann

z=p1p2p(1p)(1n1+1n2)=0,1750,20,1820(10,1820)(1280+1110)0,58.

z liegt im Nichtablehnungsbereich. Es liegt also kein signifikanter Unterschied zwischen den Wünschen der beiden Gruppen vor.


↓  Vergleich zweier Varianzen
↑  Test auf Varianz
↑↑ Inhaltsverzeichnis Statistik