LK: Stochastik, Hypothesentests

Raguna

Legende
Mitglied seit
19.07.2006
Beiträge
787
Jojo, hier wurde ja schon viel zu lange nichts mehr geschrieben, deswegen liefer ich mal für alle Mathe-Knobel-Freunde ein neues, spannendes Rätsel, diesmal aus dem wunderbar fantastischen Bereich der Hypothesentests in der Stochastik. XD
Also, in der Aufgabe geht es allgemein darum, dass man eine gleichbleibende Warscheinlichkeit hat, mit der es sich bei einem Deutschen um eine "Leseratte" handelt. Man geht jetzt also hin und pickt aus einer mehr oder weniger großen Gruppe Menschen eine Anzahl raus und guckt dann per Binominalverteilung, wieviele der Menschen tatsächlich lesen. Soviel zur Vorgeschichte.
Jetzt gibt es folgende, letzte Teilaufgabe:

"Angenommen, der wirkliche Anteil der Lesefans beträgt 27% (p=0,27). Die relative Häufigkeit X/n der Lesefans in der Stichprobe vom Umfang n soll sich höchstens 0,02 vom wirklichen Anteil p unterscheiden."


(1) Weisen sie nach, dass die Warscheinlichkeit für dieses Ereignis gegeben ist durch P (0,25n ≼ X ≼ 0,29n).

Den Teil fand ich noch nicht so schwierig:
Der Unterschied zwischen der relativen Häufigkeit und der wirklichen darf nur 0,02 betragen, also kann man imo sagen:

I. Wenn der Unterschied -0,02 beträgt:

X/n -0,27 ≼ -0,02
X/n ≽ 0,25 (Vielfraßschnabel ändert seine Richtung da aus - + wird XD)
X ≽ 0,25n

II. Wenn der Unterschied +0,02 beträgt:

X/n -0,27 ≼0,02
X/n ≼ 0,29
X ≼0,29n

Also folgt daraus: P(0,25n ≼ X ≼ 0,29n) q.e.d. (;P)

Die nächste Teilaufgabe bereitet mir aber Probleme:

"Bestimmen sie einen möglichst kleinen Stichprobenumfang n, so dass diese Warscheinlichkeit mind. 95% beträgt. Gehen Sie bei Ihrem Lösungsansatz von einer Normalverteilung aus. Lassen Sie im Argument der Φ-Funktion die Summanden +0,5 bzw. -0,5 weg."

Der letzte Satz stört mich hierbei, normalerweise benutze ich die Φ-Funktion, um bei einem Hypothesentest die rechte bzw. Linke Grenze der gaußchen Glockenkurve weiterzuermitteln, oder? Nur hab ich hier kein Signifikanz-Niveau, noch einen Hypothesentest. ôo
Die Sache mit der Normalverteilung hat mich auf folgenden Gedanken gebracht:

P(0,25n ≼ X ≼ 0,29n) ≽ 0,95

den Ausdruck der linken Seite könnte ich theoretisch als SUMMENverteilung darstellen, mit n (unbekannt) und p = 0,27. Einziges Problem für mich wäre, dass das doch eine Heidenarbeit wäre das alles durchzurechnen, zumal ich in der Tafelsammlung nicht viel dazu finde. :heul:
Bin für jede Hilfe dankbar, vor allem der Punkt mit der Binominalverteilung wurmt mich.:pein:
 

Kirika1987

Legende
Mitglied seit
30.03.2008
Beiträge
1.167
Also, in der Aufgabe geht es allgemein darum, dass man eine gleichbleibende Warscheinlichkeit hat, mit der es sich bei einem Deutschen um eine "Leseratte" handelt. Man geht jetzt also hin und pickt aus einer mehr oder weniger großen Gruppe Menschen eine Anzahl raus und guckt dann per Binominalverteilung, wieviele der Menschen tatsächlich lesen. Soviel zur Vorgeschichte.
Jetzt gibt es folgende, letzte Teilaufgabe:

"Angenommen, der wirkliche Anteil der Lesefans beträgt 27% (p=0,27). Die relative Häufigkeit X/n der Lesefans in der Stichprobe vom Umfang n soll sich höchstens 0,02 vom wirklichen Anteil p unterscheiden."


(1) Weisen sie nach, dass die Warscheinlichkeit für dieses Ereignis gegeben ist durch P (0,25n ≼ X ≼ 0,29n).

Den Teil fand ich noch nicht so schwierig:
Der Unterschied zwischen der relativen Häufigkeit und der wirklichen darf nur 0,02 betragen, also kann man imo sagen:

I. Wenn der Unterschied -0,02 beträgt:

X/n -0,27 ≼ -0,02
X/n ≽ 0,25 (Vielfraßschnabel ändert seine Richtung da aus - + wird XD)
X ≽ 0,25n
Die Umformung stimmt so nicht. Das Relationszeichen ändert bei Addition bzw. Subtraktion niemals seine Richtung, nur bei Division oder Multiplikation und einigen anderen Umformungen. Das Ergebnis hier muss lauten X ≼ 0,25n.

Oder ist das kein "kleiner gleich" ?
Falls ich recht haben sollte, würde ich mit einem Betragszeichen arbeiten und die Dreiecksungleichung nutzen.

II. Wenn der Unterschied +0,02 beträgt:

X/n -0,27 ≼0,02
X/n ≼ 0,29
X ≼0,29n
Hier hast du es richtig gemacht, warum nicht auch oben?
Deine Schlussfolgerung ist demnach aber nicht korrekt. Wäre dem so, müssten bei dir rel. Häufigkeit und Wahrscheinlichkeit nicht nur grenzwertig, sondern grundsätzlich identisch sein, das ist aber nicht der Fall.


Also folgt daraus: P(0,25n ≼ X ≼ 0,29n) q.e.d. (;P)

Die nächste Teilaufgabe bereitet mir aber Probleme:

"Bestimmen sie einen möglichst kleinen Stichprobenumfang n, so dass diese Warscheinlichkeit mind. 95% beträgt. Gehen Sie bei Ihrem Lösungsansatz von einer Normalverteilung aus. Lassen Sie im Argument der Φ-Funktion die Summanden +0,5 bzw. -0,5 weg."

Der letzte Satz stört mich hierbei, normalerweise benutze ich die Φ-Funktion, um bei einem Hypothesentest die rechte bzw. Linke Grenze der gaußchen Glockenkurve weiterzuermitteln, oder? Nur hab ich hier kein Signifikanz-Niveau, noch einen Hypothesentest. ôo
Die Sache mit der Normalverteilung hat mich auf folgenden Gedanken gebracht:

P(0,25n ≼ X ≼ 0,29n) ≽ 0,95

den Ausdruck der linken Seite könnte ich theoretisch als SUMMENverteilung darstellen, mit n (unbekannt) und p = 0,27. Einziges Problem für mich wäre, dass das doch eine Heidenarbeit wäre das alles durchzurechnen, zumal ich in der Tafelsammlung nicht viel dazu finde. :heul:
Bin für jede Hilfe dankbar, vor allem der Punkt mit der Binominalverteilung wurmt mich.:pein:
Ich glaube, hier schlägt dein Fehler aus der ersten Teilaufgabe durch.
Leider habe ich meine Abi-Unterlagen gerade verliehen, die könnte ich morgen wohl wieder haben. Wenn du so lang warten kannst, kann ich dir vermutlich morgen abend schreiben, wie es funktioniert. Wir hatten auch solche Aufgaben.
Die +/- 0,5 sollst du weglassen, weil die grundsätzlich genauere Werte ausspucken, wenn die gesuchte Variable ganzzahlig sein soll, bzw diskret verteilt ist. Da befragte Personen immer nur in ganzen Zahlen aufgeführt werden, müsste man es hier streng genommen machen. Prinzipiell ändert das aber nichts am Rechenweg.
Ich vermisse nach wie vor ein Betragszeichen bei dir, dafür hatten wir meines Wissens damals eine Formel.


Das Ganze ist im Übrigen kein Hypothesentest, sondern Schätzen von Parametern. ;)
 
OP
OP
R

Raguna

Legende
Mitglied seit
19.07.2006
Beiträge
787
klaro, ich hab Zeit genug. ^^
thx für die Hinweise.
Ja, ich hab auch erst überlegt mit dem betragszeichen zu rechnen, dass erschein mir auch viel sinnvoller.

Die Umformung stimmt so nicht. Das Relationszeichen ändert bei Addition bzw. Subtraktion niemals seine Richtung, nur bei Division oder Multiplikation und einigen anderen Umformungen. Das Ergebnis hier muss lauten X ≼ 0,25n.
Genau das hatte ich auch erst gedacht, nur ist X jetzt kleiner/gleich als 0,25 und nicht größer/gleich, wie es in der angegeben Lösung ist.

Hier hast du es richtig gemacht, warum nicht auch oben?
nun, hier ändert sich ja das vorzeichen nicht auf der rechten seite.
Ich hatte auch so'n ungutes gefühl bei dem drehen des Relationszeichen bei der ersten gleichung, nur passte dort anders dass nciht mit der Ziellösung.

tjoah, hab's mir wohl zu einfach gemacht. :pein:
aber okay, das mit der Formel für Betragszeichen klingt neu für mich, vielleicht hilft mir das ja weiter. ^^
Wenn ich im Prinzip bei der zweiten aufgabe eine Binominalverteilung statt einer summenverteilung hätte, wäre ich echt happy ^^
 

Kirika1987

Legende
Mitglied seit
30.03.2008
Beiträge
1.167
Du musst in jedem Fall eine Binomialverteilung zugrunde legen, daran erinnere ich mich noch.
Und wenn bei dir gilt, dass |X/n - p| <= 0,02 sein soll, dann bekommst du doch auch genau dein "Zielintervall" raus. ;)
 

Kirika1987

Legende
Mitglied seit
30.03.2008
Beiträge
1.167
So, hab meine Unterlagen wieder.


Zu der zweiten Teilaufgabe, die dir ja nur noch fehlt:

Beim Schätzen von Wahrscheinlichkeiten (bei einer Binomial-, also Normalverteilung) gilt:

P(|p - h| <= c/n ) ist ungefähr 2*Φ(c / sigma(x)) - 1 = gamma (I)

Dabei ist p die exakte Wahrscheinlichkeit (also 27%), h die rel. Häufigkeit, c eine Zahl, die die Abweichung von p zu h bestimmt, n der Stichprobenumfang und sigma die Standardabweichung (hier also n*p*(1-p)) und gamma deine Sicherheitswahrscheinlichkeit (das sind die 95%).
Das ungefähr kommt daher, dass wir die Binomialverteilung hier durch eine Normalverteilung nähern, was du ja hier tun sollst (wird in der Anwendung öfter gemacht).

Wie geht man nun damit um?

Als erstes musst du das c bestimmen.

Du weißt, dass Φ(c / sigma(x)) >= (gamma + 1)/2 durch Umstellen der Formel (I).
(gamma + 1)/2 wiederum kannst du ausrechnen, und musst dann anhand der Tabelle mit den Werten der Φ-Funktion ablesen, für welches X = c/sigma(x) das gilt.

Wenn du das gefunden hast, stellst
X = c/sigma(x) nach c um, wobei X der Wert ist, den du aus der Tabelle abgelesen hast.

Nun, da du das c hast, Kannst du das Argument von P aus Formel (I) umstellen:
|p - h| <= c/n
<=> n <= c / |p - h|

Und fertig ist dein n. :)



Ist das so verständlich?
 
Oben