wp_xyz hat geschrieben: Do 3. Jun 2021, 22:00
Ich verstehe nicht, was du da machst. Warum nimmst du nicht die bekannte Formel und berechnest die Streuung (du meinst wahrscheinlich die Standardabweichung) aus den einzelnen Werten?
Was ich habe sind Klassen und Objekte die danach klassiert werden sollen. Die Klassen haben Merkmale, von denen ich die Durchschnittsausprägung kenne und die ungefähre Streuung. Ich kenne die genauen Streuungen aber nicht. Bisher habe ich mit der Normalverteilung gearbeitet, aber die Ergebnisse kommen mir nicht so gut vor. Meines Erachtens kann die Normalverteilung nur angewendet werden, wenn man die genaue Standardabweichung kennt. Zur Normalverteilung: Bei der Normalverteilung bringt es nicht soviel, wenn ein Objekt die Merkmalsausprägung einer Klasse genau trifft, im Verhältnis dazu wenn es eine leichte Abweichung gibt (Denn die Normalverteilung ist oben rund.). Hauptsächlich kommt es darauf an, nicht stark abzuweichen. Da liegt, denke ich, das Problem. Die Ausprägung der Klasse genau zu treffen sollte sich mehr lohnen und eine starke Abweichung bei einem Merkmal nicht zu sehr ins Gewicht fallen. Damit ließen sich vielleicht bessere Ergebnisse erzielen. So meine Vermutung.
Dann habe ich mir gedacht, dass ich die genaue Streuung bzw. die Standardabweichung ja gar nicht kenne und das vielleicht relevant ist (Über alle Klassen kenne ich vielleicht die ungefähre Streuung, aber es könnte von Klasse zu Klasse oder auch von Einzelobjekt zu Einzelobjekt eine andere Streuung geben). Wenn man z. B. drei Normalverteilungen mit beispielsweise den Standardabweichungen 0.5 , 1 und 2 miteinander verrechnet, entspricht die Form der Kurve ja keiner Normalverteilung mehr. Die Kurve ist in der Mitte spitzer und geht gleichzeitig außen mehr in die Breite. Also genau das was ich haben möchte. Genaue Treffer werden mehr belohnt, starke Abweichungen weniger bestraft. Allerdings sieht die verrechneten Kurve nicht so aus als gäbe es da eine einfache Formel für.
Dann habe ich etwas weiter gedacht. Ich weiß ja auch nicht wie stark die Streuung der Streuung streut. Also habe ich auch das einbezogen. Zusammengerechnet habe ich dann vom Prinzip her folgende Normalverteilungen:
- Standardabweichung: 0,015625; Gewichtung: 1
- Standardabweichung: 0,125; Gewichtung: 4
- Standardabweichung: 1; Gewichtung: 6
- Standardabweichung: 8; Gewichtung: 4
- Standardabweichung: 64; Gewichtung: 1
- Standardabweichung: 0,0625; Gewichtung: 1*4
- Standardabweichung: 0,25; Gewichtung: 4*4
- Standardabweichung: 1; Gewichtung: 6*4
- Standardabweichung: 4; Gewichtung: 4*4
- Standardabweichung: 16; Gewichtung: 1*4
- Standardabweichung: 0,25; Gewichtung: 1*6
- Standardabweichung: 0,5; Gewichtung: 4*6
- Standardabweichung: 1; Gewichtung: 6*6
- Standardabweichung: 2; Gewichtung: 4*6
- Standardabweichung: 4; Gewichtung: 1*6
- Standardabweichung: 0,5; Gewichtung: 1*4
- Standardabweichung: 0,707; Gewichtung: 4*4
- Standardabweichung: 1; Gewichtung: 6*4
- Standardabweichung: 1,41; Gewichtung: 4*4
- Standardabweichung: 2; Gewichtung: 1*4
- Standardabweichung: 0,707; Gewichtung: 1
- Standardabweichung: 0,841; Gewichtung: 4
- Standardabweichung: 1; Gewichtung: 6
- Standardabweichung: 1,189; Gewichtung: 4
- Standardabweichung: 1,41; Gewichtung: 1
(Die Gewichtungen sind dem Pascalschen Dreieck zu entnehmen, dass ja entsprechend der Normalverteilung gebildet ist.)
Heraus kommt eine Kurve mit bei logarithmischer Skalierung nahezu geraden sich in der Mitte treffenden Flügeln. Wie ein Spitzdach. Da habe ich mir gedacht: Das kann kein Zufall sein. Da habe ich wohl die Lösung gefunden.
Allerdings merkwürdig, dass ich darüber im Internet nichts finde. Also habe ich hier mal nachgefragt. Vielleicht weiß da ja einer was drüber. Dass bei einer Verteilung die genaue Streuung nicht bekannt ist, sollte doch kein neues Problem der Heuristik sein.