Haupt » algorithmischer Handel » Quadratsumme

Quadratsumme

algorithmischer Handel : Quadratsumme
Was ist die Summe der Quadrate?

Die Quadratsumme ist eine statistische Technik, die bei der Regressionsanalyse zur Bestimmung der Streuung von Datenpunkten verwendet wird. In einer Regressionsanalyse soll ermittelt werden, wie gut eine Datenreihe an eine Funktion angepasst werden kann, um zu erklären, wie die Datenreihe generiert wurde. Die Summe der Quadrate wird als mathematische Methode verwendet, um die Funktion zu finden, die am besten zu den Daten passt (am wenigsten davon abweicht).

Die Formel für die Summe der Quadrate lautet

Für eine Menge X von n Elementen: Summe der Quadrate = ∑i = 0n (Xi - X‾) 2wo: Xi = Das i - te Element in der MengeX‾ = Der Mittelwert aller Elemente in der Menge (Xi - X‾) = Die Abweichung jedes Elements vom Mittelwert \ begin {align} & \ text {für eine Menge} X \ text {von} n \ text {Elementen:} \\ & \ text {Summe der Quadrate} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {where:} \\ & X_i = \ text {Der} i ^ {th} \ text {item in der set} \\ & \ overline {X} = \ text {Der Mittelwert aller Elemente im Set} \\ & \ left (X_i- \ overline {X} \ right) = \ text {Die Abweichung jedes Elements vom Mittelwert} \\ \ ende {ausgerichtet} Für eine Menge X von n Elementen: Summe der Quadrate = i = 0∑n (Xi −X) 2Wo: Xi = Das i-te Element in der MengeX = Der Mittelwert von allen Elemente in der Menge (Xi - X) = Die Abweichung jedes Elements vom Mittelwert

Die Summe der Quadrate wird auch als Variation bezeichnet.

Was sagt Ihnen die Summe der Quadrate?

Die Summe der Quadrate ist ein Maß für die Abweichung vom Mittelwert. In der Statistik ist der Mittelwert der Durchschnitt einer Reihe von Zahlen und das am häufigsten verwendete Maß für die zentrale Tendenz. Das arithmetische Mittel wird einfach berechnet, indem die Werte im Datensatz summiert und durch die Anzahl der Werte dividiert werden.

Angenommen, die Schlusskurse von Microsoft (MSFT) in den letzten fünf Tagen betrugen 74, 01, 74, 77, 73, 94, 73, 61 und 73, 40 in US-Dollar. Die Summe der Gesamtpreise beträgt 369, 73 USD und der Mittelwert oder Durchschnittspreis des Lehrbuchs würde somit 369, 73 USD / 5 = 73, 95 USD betragen.

Es reicht jedoch nicht immer aus, den Mittelwert eines Messsatzes zu kennen. Manchmal ist es hilfreich zu wissen, wie stark die Messungen variieren. Wie weit die einzelnen Werte vom Mittelwert entfernt sind, kann Aufschluss darüber geben, wie gut die Beobachtungen oder Werte mit dem erstellten Regressionsmodell übereinstimmen.

Wenn ein Analyst beispielsweise wissen möchte, ob sich der Aktienkurs von MSFT parallel zum Kurs von Apple (AAPL) bewegt, kann er die Beobachtungen für den Prozess beider Aktien für einen bestimmten Zeitraum auflisten, z. B. 1, 2 oder 10 Jahre und erstellen Sie ein lineares Modell mit jeder der Beobachtungen oder Messungen aufgezeichnet. Wenn die Beziehung zwischen beiden Variablen (dh dem Preis von AAPL und dem Preis von MSFT) keine gerade Linie ist, gibt es Abweichungen im Datensatz, die geprüft werden müssen.

Wenn in der Statistik die Linie im erstellten linearen Modell nicht alle Wertmessungen durchläuft, ist ein Teil der Variabilität, die bei den Aktienkursen beobachtet wurde, unerklärt. Die Summe der Quadrate wird verwendet, um zu berechnen, ob eine lineare Beziehung zwischen zwei Variablen besteht, und jede unerklärte Variabilität wird als Restsumme der Quadrate bezeichnet.

Die Summe der Quadrate ist die Summe des Variationsquadrats, wobei die Variation als der Abstand zwischen jedem einzelnen Wert und dem Mittelwert definiert ist. Um die Summe der Quadrate zu bestimmen, wird der Abstand zwischen jedem Datenpunkt und der Linie der besten Anpassung quadriert und dann aufsummiert. Die Linie der besten Anpassung minimiert diesen Wert.

Wie man die Summe der Quadrate berechnet

Jetzt können Sie sehen, warum die Messung als Summe der quadratischen Abweichungen oder kurz als Summe der Quadrate bezeichnet wird. Anhand des obigen MSFT-Beispiels kann die Summe der Quadrate wie folgt berechnet werden:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

Addiert man nur die Summe der Abweichungen ohne Quadrierung, ergibt sich eine Zahl gleich oder nahe Null, da die negativen Abweichungen die positiven Abweichungen nahezu perfekt ausgleichen. Um eine realistischere Zahl zu erhalten, muss die Summe der Abweichungen quadriert werden. Die Summe der Quadrate ist immer eine positive Zahl, da das Quadrat jeder positiven oder negativen Zahl immer positiv ist.

Beispiel für die Verwendung der Quadratsumme

Basierend auf den Ergebnissen der MSFT-Berechnung weist eine hohe Quadratsumme darauf hin, dass die meisten Werte weiter vom Mittelwert entfernt sind und daher eine große Variabilität in den Daten besteht. Eine niedrige Quadratsumme bezieht sich auf eine geringe Variabilität in der Menge der Beobachtungen.

Im obigen Beispiel zeigt 1.0942, dass die Variabilität des Aktienkurses von MSFT in den letzten fünf Tagen sehr gering ist und Anleger, die in Aktien investieren möchten, die sich durch Preisstabilität und geringe Volatilität auszeichnen, sich möglicherweise für MSFT entscheiden.

Die zentralen Thesen

  • Die Summe der Quadrate misst die Abweichung der Datenpunkte vom Mittelwert.
  • Ein höheres Ergebnis der Quadratsumme zeigt einen hohen Grad an Variabilität innerhalb des Datensatzes an, während ein niedrigeres Ergebnis anzeigt, dass die Daten erheblich vom Mittelwert abweichen.

Einschränkungen bei der Verwendung der Quadratsumme

Um eine Anlageentscheidung über den Kauf einer Aktie zu treffen, sind weitaus mehr Beobachtungen erforderlich als die hier aufgeführten. Ein Analyst muss möglicherweise mit jahrelangen Daten arbeiten, um mit größerer Sicherheit zu wissen, wie hoch oder niedrig die Variabilität eines Vermögenswerts ist. Je mehr Datenpunkte zum Satz hinzugefügt werden, desto größer wird die Summe der Quadrate, je breiter die Werte sind.

Die am häufigsten verwendeten Variationsmessungen sind die Standardabweichung und die Varianz. Um jedoch eine der beiden Metriken zu berechnen, muss zuerst die Summe der Quadrate berechnet werden. Die Varianz ist der Durchschnitt der Summe der Quadrate (dh die Summe der Quadrate geteilt durch die Anzahl der Beobachtungen). Die Standardabweichung ist die Quadratwurzel der Varianz.

Es gibt zwei Methoden der Regressionsanalyse, die die Summe der Quadrate verwenden: die Methode der linearen kleinsten Quadrate und die Methode der nichtlinearen kleinsten Quadrate. Die Methode der kleinsten Quadrate bezieht sich auf die Tatsache, dass die Regressionsfunktion die Summe der Quadrate der Varianz von den tatsächlichen Datenpunkten minimiert. Auf diese Weise ist es möglich, eine Funktion zu zeichnen, die statistisch die beste Anpassung für die Daten bietet. Beachten Sie, dass eine Regressionsfunktion entweder linear (eine gerade Linie) oder nicht linear (eine gekrümmte Linie) sein kann.

Vergleich von Anlagekonten Name des Anbieters Beschreibung Angaben zum Werbetreibenden × Die in dieser Tabelle aufgeführten Angebote stammen von Partnerschaften, von denen Investopedia eine Vergütung erhält.

Verwandte Begriffe

Funktionsweise der Methode der kleinsten Quadrate Bei der Methode der kleinsten Quadrate handelt es sich um eine statistische Methode zur Bestimmung der besten Anpassungslinie für ein Modell, die durch eine Gleichung mit bestimmten Parametern für beobachtete Daten angegeben wird. mehr Funktionsweise der Methode des Kriteriums der kleinsten Quadrate Das Kriterium der kleinsten Quadrate ist eine Methode zur Messung der Genauigkeit einer Linie bei der Darstellung der Daten, mit denen sie generiert wurden. Das heißt, die Formel bestimmt die Linie der besten Anpassung. mehr Definition der Standardabweichung Die Standardabweichung ist eine Statistik, die die Streuung eines Datensatzes relativ zum Mittelwert misst und als Quadratwurzel der Varianz berechnet wird. Sie wird als Quadratwurzel der Varianz berechnet, indem die Variation zwischen jedem Datenpunkt relativ zum Mittelwert bestimmt wird. mehr Verwenden der Varianzgleichung Varianz ist ein Maß für die Streuung zwischen Zahlen in einem Datensatz. Anleger verwenden die Varianzgleichung, um die Vermögensallokation eines Portfolios zu bewerten. mehr Wie die Reststandardabweichung funktioniert Die Reststandardabweichung ist ein statistischer Begriff, der zur Beschreibung der Differenz der Standardabweichungen von beobachteten Werten gegenüber vorhergesagten Werten verwendet wird, wie durch Punkte in einer Regressionsanalyse gezeigt. mehr Wie der Bestimmungskoeffizient funktioniert Der Bestimmungskoeffizient ist ein Maß für die statistische Analyse, um zu bewerten, wie gut ein Modell zukünftige Ergebnisse erklärt und vorhersagt. mehr Partner Links
Empfohlen
Lassen Sie Ihren Kommentar