Interaktive Demos

Korrelation und Regression

Die Korrelation ist ein Mass fuer die Enge des linearen Zusammenhangs zweier Variablen. Die (einfache) Regression liefert Parameter der Gerade, um die sich die Datenpunkte mit der durch die Korrelation beschriebenen Enge verteilen. Exploriere die Bedeutung der Korrelation fuer die Form einer Punktewolke und den Zusammenhang zwischen Korrelation und Regression im Fall zweier standardisierter Variablen)

Modell der (einfachen) linearen Regression

Die einfache lineare Regression erlaubt eine Beschreibung des Zusammenhanges zwischen zwei Variablen in Form einer Graden. Diese Grade wird durch einen Achsenabschnitt und eine Steigung definiert. Als Regressionsgrade wird diejenige Grade bezeichnet, von der die (quadrierten) Abweichungen in y - Richutung minimal sind. Probiere Dich als 'Geradenanpasser' und versuche die optimale Grade per Hand zu finden. Untersuche den Zusammenhang zwischen Passung der Graden und den Abweichungen (Residuen)

Multiple Regression: Modellvorhersagen

Wenn mehr als ein Praediktor in eine Regressions - Analyse aufgenommen wird spricht man von multipler Regression. Neben den Steigungskoeffizienten fuer jeden Praediktor, die bereits aus der einfachen linearen Regression bekannt sind, kommen in der multiplen linearen Regression zusaetzlich Interaktionen vor. Exploriere in dieser Demo die Bedeutung der Parameter fuer Form und Lage der Ebene im Raum fuer den Fall einer Regression mit zwei Praediktoren.

Multiple Regression mit kategorialen Variablen

In Regressionsanalysen koennen sowohl metrische, als auch kategoriale Praediktoren aufgenommen werden. Die Parameter der metrischen Praediktoren bestimmen dabei die Form und Lage der Graden (bzw. Ebenen) in jeder Kategorie im Raum. Die Parameter der kategorialen Praediktoren bestimmen die Achsenabschnitte der jeweiligen Grade/ Ebene. Kategoriale Praediktoren muessen hierzu kodiert werden. Zwei moegliche Kodierungen sind die Dummy - Kodierung und die Effekt - Kodierung. Untersuche in dieser Demo die Bedeutung der Parameter eines Modells mit einem metrischen und einem kategorialen Praediktor.

Multiple Regression mit abhaengigen Praediktoren

Wie sind die Parameter der multiplen regression zu interpretieren? Bei der einfachen Regression haben wir die Parameter als Achsenabschnitt und Steigung kennen gelernt. Die Steigung wiederum kann als Veraenderung des Erwartungswertes des Kriteriums wenn sich der Praediktor um 1 veraendert interpretiert werden. In der multiplen Regressions haben wir es ebenfalls mit Steigungen zu tun. Wenn die Praediktoren unabhaengig voneinander sind, also ihre Korrelation untereinander Null ist, lassen sich diese Parameter ebenso Interpretieren, wie in der einfachen Regression. Wenn die Praediktoren abhaengig voneinander sind kann diese Interpretation jedoch nicht aufrecht gehalten werden. Dann sind die Steigungen zu interpretieren als Veraenderung des Erwartungswerts des Kriteriums wenn der Einfluss aller anderen Variablen herausgerechnet (herauspartialisiert) wird. Untersuche in dieser Demo den Zusammenhang von multipler Regression, simplen Regressionen und simplen Regressionen mit partialisierten Variablen.

Einfluss einzelner Punkte auf die Grade

Damit eine Regression ein sinnvolles Modell fuer die untersuchten Zusammenhaenge liefern kann, ist es wuenschenwert dass die Ergebnisse nicht vom Vorhandensein einzelner, extremer Punkte abhengen. Solche extremen Beobachtungen wuerden bei einer Replikation der Untersuchung vielleicht nicht wieder vorkommen und die Ergebnisse waeren daher nicht gut verallgemeinerbar. Daher wird in Regressionsanalysen haeufig auch der Einfluss einzelner Datenpunkte auf die Regression untersucht. Exploriere den Einfluss einzelner Punkte auf eine einfache Regression anhand ihrer Hebelwerte und der Residuen.

Modellauswahl

Eventuell liefert die Anpassung einer Graden nicht die beste Beschreibung fuer einen Zusammenhang zwischen zwei Variablen. Vergleiche lineare und quadratische Modelle in der einfachen Regression.


Eigenschaften von Punktschaetzern

Punktschaetzer erlauben Aussagen ueber die Lage eines unbekannten Parameters. Wichtige Eigenschaften solcher Schaetzer sind Erwartungstreue, Konsistenz, und Effizienz. Untersuche in dieser Simulation die Bedeutung dieser Eigenschaften

Konfidenzintervalle

Intervallschaetzer erlauben Aussagen ueber die Praezision der Schaetzung eines unbekannten Parameters. Untersuche in dieser Simulation den Zusammenhang zwischen Konfidenzintervall, Konfidenzniveau und Ueberdeckungsrate. Bilde einen Bezug zwischen Stichprobenverteilung und Konfidenzintervall


Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen erlauben eine Zuordnung von Zufallereignissen und deren Auftretenswahrscheinlichkeit. Eruiere in dieser Demo die Bedeutung von Wahrscheinlichkeitsverteilungen, Verteilungsfunktionen und Quantilsfunktionen fuer stetige und diskrete Zufallsvariablen am Beispiel der Normal- und der Binomialverteilung.

Zentraler Grenzwertsatz

Der zentrale Grenzwertsatz besagt (im wesentlichen), dass die Verteilung einer Summe von n (unabhaengig, identisch verteilten) Zufallsvariablen naeherungsweise normal ist, wenn n hinreichend gross ist. Betrachte dieses Phaenomen fuer eine Summe von binomialverteilten Zufallsvariablen anhand der Galton - Box.

Spezielle Verteilungen

In der Statistik liefern verschiedene Wahrscheinlichkeitsverteilungen Modelle fuer unterschiedliche Situationen. Untersuche in dieser Demo die Abhaengigkeit der Form verschiedener Verteilungen von ihren Parametern.