In der Statistik ist die (durch die Regression) erklärte Quadratsumme, bzw. erklärte Abweichungsquadratsumme, kurz SQE für Summe der Quadrate der Erklärten Abweichungen (englischsum of squared explained deviations, kurz SSE oder explained sum of squares, kurz ESS), Summe der Abweichungsquadrate der -Werte, kurz , bzw. SAQErklärt, oft auch Modellquadratsumme oder Regressionsquadratsumme, die Quadratsumme der Schätzwerte bzw. Regresswerte. Sie wird berechnet als Summe der Quadrate der zentrierten Schätzwerte und kann als „Gesamtvariation der Schätzwerte “ („erklärte Variation“) interpretiert werden. Über die genaue Bezeichnung und ihre Abkürzungen gibt es international keine Einigkeit.[1] In der deutschsprachigen Literatur wird manchmal die deutsche Bezeichnung mit englischen Abkürzungen gebraucht.[2]
Die erklärte (Abweichungs-)Quadratsumme bzw. Regressionsquadratsumme ist definiert als Quadratsumme der durch die Regressionsfunktion erklärten Abweichungen :[1]
Manchmal findet sich auch die Abkürzung bzw. . Dieser Ausdruck, kann allerdings leicht mit der „Residuenquadratsumme“ (englischsum of squared residuals) verwechselt werden, die ebenfalls mit abgekürzt wird.
Wenn das zugrundeliegende lineare Modell ein von Null verschiedenes Absolutglied enthält, stimmt der empirische Mittelwert der Schätzwerte mit dem der beobachteten Messwerte überein, also (für einen Beweis im multiplen Fall siehe Bestimmtheitsmaß#Matrixschreibweise). Die erklärte Quadratsumme misst die Streuung der Schätzwerte um ihren Mittelwert . Das Verhältnis der durch die Regression erklärten Quadratsumme zur totalen Quadratsumme wird Bestimmtheitsmaß der Regression genannt.
In der einfachen linearen Regression (Modell mit nur einer erklärenden Variable) lässt sich die erklärte Quadratsumme auch wie folgt ausdrücken:
.
Hierbei stellen die die vorhergesagten Werte dar und ist die Schätzung des Absolutglieds und die Schätzung des Steigungsparameters. Aus dieser Schreibweise lässt sich erkennen, dass sich die erklärte Quadratsumme auch darstellen lässt als Produkt aus dem Quadrat des Bravais-Pearson-Korrelationskoeffizienten und der totalen Quadratsumme:[3]
,
wobei der Kleinste-Quadrate-Schätzer für die Steigung der Quotient aus Produktsumme von und und Quadratsumme von ist. Um dies zu zeigen, muss zunächst gezeigt werden, dass wenn das zugrundeliegende lineare Modell ein von Null verschiedenes Absolutglied enthält, der empirische Mittelwert der Schätzwerte mit dem der beobachteten Messwerte übereinstimmt. Dies gilt, wegen[4]
und daher
,
wobei der letzte Schritt aus der Tatsache folgt, dass sich auch schreiben lässt als: