Montag, 06. Februar 2012
 
 

Was sagt die Statistik dazu?

Im Rahmen einer Prozessvalidierung ist laut Plan (Basis AQL = 0,015) eine Stichprobe vom Umfang 800 zu ziehen.
Es wird das Merkmal "Freiheit von Fehlstellen" untersucht und festgestellt, dass unter den letzten 100 Einheiten sieben fehlerhafte sind.

Was passiert eigentlich in der Sprache der Statistik, wenn nun die ursprüngliche Stichprobe von 800 auf 700 reduziert und darauf eine weitere Stichprobe vom Umfang 100 gezogen wird? (Von der ich weiß, dass sich keine fehlerhaften Teile enthält.)

Erst mal steht die Aussage im Raum: „Unter 800 gezogenen Einheiten befand sich kein fehlerhaftes... Das Akzeptanzkriterium wird erfüllt und der betrachtete Prozess gilt (nun) als validiert!“

Es braucht keine Statistikkenntnisse, um zu vermuten, dass es nicht nur moralisch einen Unterschied bedeutet, wenn ich unangenehme Teile einer Stichprobe „ersetze“ und nochmals ziehe.

Wie erkennen Sie aber genau, was durch unseren "Eingriff" passiert ist?

Tun wir erstmal so als handle es sich um eine Zufallsstichprobe von n = 800 Einheiten, in der sich insgesamt x = 7 „schlechte“ Elemente befinden. Dann gilt als Schwätzwert (p) für den Fehleranteil in der Grundgesamtheit:

p = x/n = 7/800 = 0.875%

Der 95%-Vertrauensbereich für diesen Fehleranteil p in der Grundgesamtheit
liegt zwischen der Untergrenze (pu) = 0.0035 (0.35%) und der Obergrenze (po) = 0.0179 (1.79%).
Mit einer statistischen Sicherheit von 95% dürfen wir also schließen, dass aufgrund der ungeteilten 800er-Stichprobe der "wahre" Anteil „schlechter“ Elemente zischen 0,35% und 1,79% liegt.

Wie vertragen sich dazu die Aussagen, die man erhält, wenn man die Stichprobe auseinanderzieht: Zunächst 700 Mal „gut“, dann 7 Mal „schlecht" in 100 Stück?

Hierfür wird die Gesamtstichprobe (n = 800) gedanklich in eine 700er-Stichprobe (n1 = 700, x1 = 0) und eine 100er-Stichprobe (n2 = 100, x2 = 7) aufgeteilt.
Wird die zweite Teilstichprobe erstmal ignoriert, lässt sich aus n1 und x1 berechnen,
dass die Obergrenze für p bei 0.0043 (0.43%) liegt (über den einseitig abgegrenzten 95%-Vertrauensbereich).
Dies ist allerdings mit dem Ergebnis der zweiten Teilstichprobe nicht in
Übereinstimmung zu bringen. Unter Annahme dieses Wertes für p ergibt sich
nämlich, dass bei einer Ziehung von n2 = 100 Stück mit einer Sicherheit von über 0.99 (99%) höchstens zwei schlechte Elemente enthalten sein sollten.

Als Fazit lässt sich folgern:

  • dass es sich bei den 800 Stück wahrscheinlich nicht um eine Zufallsstichprobe handelt, die entstanden wäre, wenn man z. B. die Gesamtmenge vor der Stichprobenentnahme in einer Urne gemischt hätte, sondern dass irgendeine Inhomigenität vorliegt.
  • Das Vorgehen, die zweite Teilstichprobe zu verwerfen, ist nicht zulässig, da hierdurch der Schlechtanteil der "ungeteilten" 800er-Stichprobe je nach Ursache der Inhomogenität unter- oder überschätzt wird.

Besser wäre es, die Ursache der Inhomogenität zu ermitteln und zu eliminieren, um danach eine "echte" Zufallsstichprobe zu ziehen.