mschnell hat sinngemäß geschrieben:
Ruewa, Du Dummkopf!
Na meinetwegen. Das ist das Positive an einem Forum: Das Urteil darüber fällen einzig und alleine die
Leser - auch und gerade die, die verständlicherweise keine Lust haben, sich selbst ins unergiebige Getümmel zu begeben. Und bei denen ist das Urteil auch ausgesprochen gut aufgehoben!
Nicht, um mich länger mit mschnell herumzustreiten, sondern um interessierten Lesern das Meßproblem vielleicht noch etwas klarer zu verdeutlichen, möchte ich im Folgenden drei unterschiedliche Experimentalanordnungen skizzieren, um zu zeigen, wie sehr der
Gegenstand des Experiments die Anforderungen an die Meßapparatur bestimmt.
Vorausgeschickt sei:
Es gibt keine ideale Meßvorrichtung.
Jede Messung in der realen Welt ist
fehlerbehaftet! Und zu jeder (nicht-trivialen) Messung gehört untrennbar die Beschäftigung mit der Frage: "
Wie genau ist denn nun eigentlich mein Meßgerät?"
1. Fall: Ein Physiker möchte eine bestimmte Größe messen - sagen wir die Lichtgeschwindigkeit in transparentem Silikon (wieweit die Erkenntnis dann weltbewegend ist, sei dahingestellt). "
Auf den Schultern von Riesen stehend" kann er aus guten Gründen davon ausgehen, daß der Wert, den er messen will, eine
Konstante ist. Jedwede
Schwankung, die er im Verlauf seiner Testreihe mißt, ist dann einzig und allein seiner Meßanordnung geschuldet, und er wird sehr viel Arbeit investieren, seine Apparatur zu analysieren und zu verbessern. Und schließlich wird er die verbleibende Fehlermarge zusammen mit seinen Ergebnissen veröffentlichen (das sind dann die Diagramme mit den I-förmigen Fehlerbalken). Einen
Offsetfehler (z.B. durch ungenügende Kalibrierung) kann er überhaupt nicht gebrauchen, denn der verfälscht jede Einzelmessung gleichermaßen. Das würde sein Ergebnis systematisch verfälschen und das Gemeine daran ist, daß dieser Fehler schwer aufzuspüren ist. Einzelne
Ausreißer kann er zwar ebensowenig gebrauchen, mit denen kann er aber besser umgehen, denn sie sind
erkennbar und er kann sie zur Not herausfiltern (auch wenn ihn das dann in erhebliche Erklärungsnot bringt).
2.Fall: Einem Luftfahrttechnischen Betrieb ist eine Charge Schrauben nach Luftfahrtnorm geliefert worden (diese popligen Dinger sind
richtig teuer!). Der Prüfer hat nun die Aufgabe, herauszufinden, ob die Charge innnerhalb der in der Norm spezifizierten Toleranzen liegt (Okay, im wirklichen Leben sind die Nachweispflichten komplizierter verteilt, aber als Beispiel mag das genügen). Er nimmt also eine hinreichend große Stichprobe und vermiß die. U.a. spannt er sie in eine Maschine ein, um deren Scherfestigkeit zu messen: Ein über dem Spannbock abgleitender Schlitten wird mit zunehmender Kraft zur Seite gezogen, bis die Schraube reißt, und das Kraftmaximum (kurz bevor die Schraube nachgibt) wird gemessen. Wovon muß der Prüfer ausgehen? Nun:
Schwankungen sind zu erwarten und normal! Solange sie innerhalb definierter Toleranzen bleiben, ist alles okay. Die wichtigste Frage ist aber, ob das Material womöglich selbst
Ausreißer aufweist, z.B. infolge von Korn-Anomalien.
Ein Ausreißer, und er wird die ganze Charge ins Sperrlager tragen müssen!
Ausreißer der Meßvorichtung sind also das allerletzte, was er gebrauchen kann, denn er kann nicht entscheiden, woran es liegt, und wird auf Nummer Sicher gehen müssen. Schwupps, sind ein paar tausend Euro versenkt...
Offsetfehler sind für ihn hingegen weniger problematisch. Natürlich müssen die in einem definierten Rahmen bleiben, und deshalb muß seine Meßvorrichtung auch über eine gültige Kalibrierung verfügen. Aber die
Möglichkeit von Schwankungen und Prüffehlern ist schon in die Normen eingearbeitet: U.a. deshalb werden solche Materialien durchgängig mit üppigen Sicherheitsfaktoren ausgestattet, um nämlich sicherstellen zu können, daß nicht womöglich unentdeckte Schweinereien und ungenaue Prüfungen zu Materialversagen im später tatsächlich benötigten Festigkeitsbereich führen können. Für diesen Fall ist entscheidend, daß sowohl sein Meßgerät, als auch der Gegenstand seiner Prüfung innerhalb jeweils klar definierter
Toleranzen bleibt.
3. Fall: Kommen wir nun zum sozialwissenschaftlichen Experiment. Womit arbeitet ein Psychologe, der (wie Eva) günstige bzw. ungünstige Einflußfaktoren auf das Reaktionsvermögen testen möchte? Banale Antwort: Er arbeitet mit
Menschen. Jeder dieser Menschen ist ein
Individuum. Schrauben gleicher Größe und Spezifikation sind idealtypisch alle gleich (bzw. sollten es wenigstens innerhalb enger Grenzen sein). Aber Menschen? Frauen, Männer, dicke, dünne, junge, alte, schlaue, dumme, konzentrierte, hippelige, Sportler, Couchpotatoes? Wir sind halt so, wie wir sind, und nicht so, wie wir zugunsten besserer Berechenbarkeit mustergültig sein sollten (falls das irgendjemand für erstebenswert hielte).
Schwankungen sind
uns selbst zueigen. Untereinander sowieso, aber z.B. auch je nach Tagesform. Und selbst
Ausreißer produzieren wir en masse: Eine Wespe umschwirrt uns, das Handy klingelt, oder wir sind gerade in Gedanken versunken - wer kennt das nicht? D.h. aber: Der
Gegenstand des Meßvorgangs ist ein gänzlich anderer als in den zuvor beschriebenen Fällen!
Schwankungen und Ausreißer sind geradezu sein eigentliches Charakteristikum! Dennoch läßt sich auch dieser Gegenstand "
Mensch" vermessen - man muß allerdings vollkommen anders vorgehen, um belastbare Aussagen zu erlangen.
Deshalb arbeiten z.B. Psychologen immer mit unterschiedlichen
Gruppen, die sie miteinander
vergleichen. Auch Mediziner tun das, wenn sie Medikamente testen. Damit das Ganze Sinn macht, muß man versuchen, alle möglichen anderen Einflußfaktoren zu neutralisieren - eben bis auf den einen, dessen Wirkung man untersuchen möchte. Man muß also danach trachten, beide Gruppen möglichst spiegelbildlich zusammenzusetzen und sie auch den gleichen Bedingungen auszusetzen. Mediziner, die ein neues Medikament testen, verabreichen der einen Gruppe den Wirkstoff, der anderen hingegen ein Placebo, von dem diese
glaubt, es enthalte den Wirkstoff - nur so läßt sich auch der wohlbekannte Einfluß psychischer Faktoren ausschließen. Da aber die Menschen untereinander unterschiedlich sind, müssen die Gruppen
groß genug sein, um die
Streuungen, die beide Gruppen produzieren, einander anzugleichen und die Gruppen gegeneinander zu nivellieren.
Was bedeutet das nun für die Anforderungen an eine Meßvorrichtung, wie Eva sie benötigt hat?
Offsetfehler (wie etwa ein als Stoppuhr programmierter Computer sie unweigerlich mit
jeder einzelnen Messung produziert) spielen überhaupt keine Rolle! Denn es geht in diesem Versuchsaufbau in keinster Weise um irgendeinen
Absolutwert, sondern vielmehr um die
Unterschiede, die auf den betrachteten Einflußfaktor zurückzuführen sind. Welchen Wert hätte denn schon die Erkenntnis, daß die durchschnittliche Reaktionszeit beider Gruppen zusammengenommen in Wirklichkeit 249 Millisekunden beträgt, und nicht wie gemessen 251? Nein, die interessierende Frage ist vielmehr:
Verändert psychische Anspannung etwa die Reaktionszeiten (z.B. im Straßenverkehr) zum Negativen hin? Oder womöglich auch zum Positiven? Was bewirkt der
Unterschied zwischen Anspannung und Entspanntheit? Es geht um das Dingfestmachen eines
Unterschieds, nicht um eine irgendwie physikartige
Gesamteigenschaft. Und was hat es mit allfälligen
Ausreißern der Meßvorrichtung auf sich? Nun, vorausgesetzt, sie bleiben in einem überschaubaren Rahmen (z.B. 1 %), addieren sie sich im schlimmsten Fall zu den menschproduzierten Ausreißern einseitig hinzu. Aber auch die konnten ungleich verteilt sein. Um genau das in den Griff zu kriegen, nimmt man ja hinreichend viele Messungen von hinreichend großen Gruppen vor. Im Best Case aber (und näherungsweise auch im Normalfall) betreffen maschineninduzierte Ausreißer ja
beide Gruppen gleichermaßen und kürzen sich so aus dem betrachteten
Gruppen-Unterschied gegenseitig (einigermaßen) wieder heraus.
Anhänger der exakten Naturwissenschaften neigen oft dazu, die Sozialwissenschaften mit einiger Herablassung zu betrachten. Was etwa eine "
Messung" zu leisten habe, beurteilen sie aus ihrer eigenen, manchmal schon ziemlich verengten Vorstellungswelt heraus. Wer seine eigene Profession für die eigentliche "
Königsdisziplin" hält, der hält sich nicht lange damit auf, die Logik dessen, was er abschätzig für "
Bonsai-Wissenschaft" hält, zu durchdringen. Aber seit wann ist Borniertheit eine Tugend? Der springende Punkt ist:
Der Gegenstand selbst könnte nicht unterschiedlicher sein, und der erfordert jeweils ganz unterschiedliche Versuchsaufbauten und auch ganz unterschiedliche Methoden der Auswertung. Was im einen Fall erfolgsentscheidend ist, kann im anderen vollkommen bedeutungslos sein - und umgekehrt. Es gibt keine allgemeingültige Definition dessen,
was wichtig und was unwichtig sei. Sondern es gibt Fälle, in denen
das eine wichtig ist und
das andere nicht, während sich das im anderen Fall wieder ganz anders darstellen mag.
Diese Überlegungen haben mich dazu geführt, zu sagen: "
Hätt'ste ruhig so machen können, Eva!". Mein Fehler, für den ich mich entschuldigen muß, war, nicht schnell genug erkannt zu haben, daß Ihr wie das Kaninchen auf die Schlange der "
signifikanten Einzelmessung" gestarrt habt. Nein! In diesem speziellen Fall (und
nur in diesem!) ist die Einzelmessung gerade
nicht signifikant. Wäre sie es, hätte man etwas falsch gemacht!
Signifikant ist vielmehr (hoffentlich) das
Ensemble der Gruppen-Messungen.
Warum mache ich mir die Mühe (und das ist es), dies so ausführlich darzulegen? Nicht um das letzte Wort zu behalten (das werden andere besorgen) und auch nicht, um die Leser zu langweilen (so hoffe ich doch!). Ginge es nur um diesen unbedeutenden Thread, würde sich das nicht lohnen. Aber es steckt mehr dahinter! Und darüber lohnt es sich nachzudenken, und zwar gerade für Programmierer, die damit ihren Lebenunterhalt bestreiten oder das eines Tages tun wollen!
Denn dieser unwichtige kleine Thread ist im Kleinen ein
Musterbeispiel dafür, wie Softwareentwickler
an den Bedürfnissen ihrer Kunden vorbei das Ziel verfehlen können. Wer die Dinge nur aus der eigenen Vorstellungswelt heraus beurteilt und sich dessen
nicht bewußt ist, daß die zwangsläufig
begrenzt ist, wird immer in Gefahr schweben, den u.U. ganz anderen Kosmos seines Auftraggebers nicht durchdringen zu können, und damit dessen Anforderungskatalog nicht wirklich zu verstehen. Schlimmer noch: Er wird das nicht einmal
bemerken und schließlich aus allen Wolken fallen, wenn sein Kunde am Ende unzufrieden ist und sein doch so formidables Produkt, aus purer Bosheit, wie er dann finden wird, schlechtredet.
Sage keiner, soetwas würde so gut wie nie passieren... Insofern könnte es sich vielleicht für den einen oder anderen Leser doch lohnen, die hier geführte Auseinandersetzung noch einmal unter diesem Aspekt zu überdenken, und am Ende vielleicht sogar ein Lehrstück darin zu sehen. Dann wäre die Mühe nicht vergebens gewesen.
Gruß Rüdiger