Die Korrelation ist ein Mass fuer die Enge des linearen Zusammenhangs zweier Variablen. Die (einfache) Regression liefert Parameter der Gerade, um die sich die Datenpunkte mit der durch die Korrelation beschriebenen Enge verteilen. Exploriere die Bedeutung der Korrelation fuer die Form einer Punktewolke und den Zusammenhang zwischen Korrelation und Regression im Fall zweier standardisierter Variablen)
Die einfache lineare Regression erlaubt eine Beschreibung des Zusammenhanges zwischen zwei Variablen in Form einer Graden. Diese Grade wird durch einen Achsenabschnitt und eine Steigung definiert. Als Regressionsgrade wird diejenige Grade bezeichnet, von der die (quadrierten) Abweichungen in y - Richutung minimal sind. Probiere Dich als 'Geradenanpasser' und versuche die optimale Grade per Hand zu finden. Untersuche den Zusammenhang zwischen Passung der Graden und den Abweichungen (Residuen)
Wenn mehr als ein Praediktor in eine Regressions - Analyse aufgenommen wird spricht man von multipler Regression. Neben den Steigungskoeffizienten fuer jeden Praediktor, die bereits aus der einfachen linearen Regression bekannt sind, kommen in der multiplen linearen Regression zusaetzlich Interaktionen vor. Exploriere in dieser Demo die Bedeutung der Parameter fuer Form und Lage der Ebene im Raum fuer den Fall einer Regression mit zwei Praediktoren.
In Regressionsanalysen koennen sowohl metrische, als auch kategoriale Praediktoren aufgenommen werden. Die Parameter der metrischen Praediktoren bestimmen dabei die Form und Lage der Graden (bzw. Ebenen) in jeder Kategorie im Raum. Die Parameter der kategorialen Praediktoren bestimmen die Achsenabschnitte der jeweiligen Grade/ Ebene. Kategoriale Praediktoren muessen hierzu kodiert werden. Zwei moegliche Kodierungen sind die Dummy - Kodierung und die Effekt - Kodierung. Untersuche in dieser Demo die Bedeutung der Parameter eines Modells mit einem metrischen und einem kategorialen Praediktor.
Wie sind die Parameter der multiplen regression zu interpretieren? Bei der einfachen Regression haben wir die Parameter als Achsenabschnitt und Steigung kennen gelernt. Die Steigung wiederum kann als Veraenderung des Erwartungswertes des Kriteriums wenn sich der Praediktor um 1 veraendert interpretiert werden. In der multiplen Regressions haben wir es ebenfalls mit Steigungen zu tun. Wenn die Praediktoren unabhaengig voneinander sind, also ihre Korrelation untereinander Null ist, lassen sich diese Parameter ebenso Interpretieren, wie in der einfachen Regression. Wenn die Praediktoren abhaengig voneinander sind kann diese Interpretation jedoch nicht aufrecht gehalten werden. Dann sind die Steigungen zu interpretieren als Veraenderung des Erwartungswerts des Kriteriums wenn der Einfluss aller anderen Variablen herausgerechnet (herauspartialisiert) wird. Untersuche in dieser Demo den Zusammenhang von multipler Regression, simplen Regressionen und simplen Regressionen mit partialisierten Variablen.
Damit eine Regression ein sinnvolles Modell fuer die untersuchten Zusammenhaenge liefern kann, ist es wuenschenwert dass die Ergebnisse nicht vom Vorhandensein einzelner, extremer Punkte abhengen. Solche extremen Beobachtungen wuerden bei einer Replikation der Untersuchung vielleicht nicht wieder vorkommen und die Ergebnisse waeren daher nicht gut verallgemeinerbar. Daher wird in Regressionsanalysen haeufig auch der Einfluss einzelner Datenpunkte auf die Regression untersucht. Exploriere den Einfluss einzelner Punkte auf eine einfache Regression anhand ihrer Hebelwerte und der Residuen.
Wahrscheinlichkeitsverteilungen erlauben eine Zuordnung von Zufallereignissen und deren Auftretenswahrscheinlichkeit. Eruiere in dieser Demo die Bedeutung von Wahrscheinlichkeitsverteilungen, Verteilungsfunktionen und Quantilsfunktionen fuer stetige und diskrete Zufallsvariablen am Beispiel der Normal- und der Binomialverteilung.
Der zentrale Grenzwertsatz besagt (im wesentlichen), dass die Verteilung einer Summe von n (unabhaengig, identisch verteilten) Zufallsvariablen naeherungsweise normal ist, wenn n hinreichend gross ist. Betrachte dieses Phaenomen fuer eine Summe von binomialverteilten Zufallsvariablen anhand der Galton - Box.