
http://wiki.freepascal.org/DMath
https://sourceforge.net/projects/dmath/
ich beziehe mich auf die https://sourceforge.net/p/dmath/code/HE ... catest.pas
dazu habe ich einige fragen:
1.) hier wird die correlation matrix (R) aus der variance-covariance matrix (V) berechnet, in zeile 100 und 103. ist das korrekt so? hab ich so noch in keinem anderen beispiel gesehen, da wurde immer entweder correlation oder covariance berechnet?
2.) wenn ich es richtig verstanden hab nimmt man die correlation bei inputs die bereits normalisiert sind, die covariance wenn die inputs verschiedene ranges aufweisen, ist das korrekt?
meine inputs sind bereits aufbereit und haben die range - 0.9 <> + 0.9, somit sollte die im beispiel verwendete correlation matrix für mich ok sein oder?
3.) hier wird standardisiert
Code: Alles auswählen
ScaleVar(XX, 1, N, Nvar, M, S, Z); // in zeile 115
("Scales a set of variables by subtracting means and dividing by SD's"), die matrix der skalierten daten liegt dann in (Z). aber (Z) fließt überhaupt nicht in die PCA ein???
Code: Alles auswählen
PCA(R, Nvar, Lambda, C, Rc); // in zeile 119
wie man sehen kann, wird die PCA mit der correlation matrix (R) gemacht, (Z) wandert dann in
Code: Alles auswählen
PrinFac(Z, 1, N, Nvar, C, F); // zeile 128
ist das richtig so? wendet der ersteller hier die sogenannte mittelwertkorrektur an ?
4.) "Bekanntlich bleibt die Kovarianzmatrix unveraendert, wenn die Daten nur verschoben werden, d.h. die Eigenwerte und Eigenvektoren aendern sich nicht." >>> ist das korrekt angewendet hier?
vielen lieben dank an alle die sich zeit nehmen

Code: Alles auswählen
******************************************************************
// http://www.statoek.wiso.uni-goettingen.de/veranstaltungen/Multivariate/Daten/mvsec4.pdf
******************************************************************
// 4.3 Weiteres zur Hauptkomponentenanalyse
******************************************************************
// Mittelwertkorrektur: Bisher haben wir die Hauptkomponentenanalyse auf die Ursprungsdaten angewendet.
// Das bedeutet auch, dass die zugrunde liegenden Zufallsvariablen einen von Null verschiedenen
// Erwartungswertvektor haben. Damit haben auch die Hauptkomponenten eine von Null verschiedene Erwartung.
******************************************************************
// Es ist zweckmaessig den Erwartungswertvektor (mean) abzuziehen.
// Die Daten werden also zunaechst verschoben, bevor die Transformation in die Hauptkomponenten durchgefuehrt wird.
********************************************************