Resztkowa suma kwadratów (RSS) - KamilTaylan.blog
5 maja 2021 2:07

Resztkowa suma kwadratów (RSS)

Jaka jest pozostała suma kwadratów (RSS)?

Resztkowa suma kwadratów (RSS) to technika statystyczna używana do pomiaru wielkości wariancji w zbiorze danych, której nie wyjaśnia sam model regresji. Zamiast tego szacuje wariancję reszt lub składnika błędu.

Regresja liniowa to miara, która pomaga określić siłę związku między zmienną zależną a jednym lub kilkoma innymi czynnikami, znanymi jako zmienne niezależne lub objaśniające.

Kluczowe wnioski

  • Resztkowa suma kwadratów (RSS) mierzy poziom wariancji składnika błędu lub reszt modelu regresji.
  • Idealnie byłoby, gdyby suma kwadratów reszt powinna mieć mniejszą lub niższą wartość niż suma kwadratów z danych wejściowych modelu regresji.
  • RSS jest używany przez analityków finansowych do szacowania poprawności ich modeli ekonometrycznych.

Formuła RSS to

ESS =

n
i = 1 (
y i
f (
x i ))
2

gdzie:

  • y i = i- ta wartość zmiennej przewidywanej
  • f (x i ) = przewidywana wartość y i
  • n = górna granica sumowania
  • y i = i- ta wartość zmiennej przewidywanej
  • f (x i ) = przewidywana wartość y i
  • n = górna granica sumowania

Zrozumienie rezydualnej sumy kwadratów (RSS)

Ogólnie rzecz biorąc, suma kwadratów jest techniką statystyczną używaną w analizie regresji do określenia rozproszenia punktów danych. W  analizie regresji, celem jest, aby ustalić, jak również seria danych może być wyposażony w funkcję, która może pomóc wyjaśnić, jak serie danych została wygenerowana. Suma kwadratów służy jako matematyczny sposób znajdowania funkcji, która  najlepiej pasuje  (różni się najmniej) z danych.

RSS mierzy wielkość błędu pozostałego między funkcją regresji a zbiorem danych po uruchomieniu modelu. Mniejsza rezydualna suma kwadratów reprezentuje funkcję regresji.

RSS – znany również jako suma kwadratów reszt – zasadniczo określa, jak dobrze model regresji wyjaśnia lub reprezentuje dane w modelu.

RSS kontra RSE

Resztkowy błąd standardowy * RSE) jest kolejnym terminem statystycznym używanym do opisania różnicy w  odchyleniach standardowych  wartości obserwowanych w porównaniu z wartościami przewidywanymi, jak pokazują punkty w  dobroci dopasowania  środek, który może być użyty do analizy, jak również zbiór punktów danych pasuje do rzeczywistego modelu.

RSE oblicza się, dzieląc RSS przez liczbę obserwacji w próbce pomniejszonej o 2, a następnie biorąc pierwiastek kwadratowy: RSE = [RSS / (n-2)] 1/2

RSS, finanse i ekonometria

Rynki finansowe stają się coraz bardziej napędzane ilościowo; w związku z tym wielu inwestorów poszukuje przewagi i korzysta z zaawansowanych technik statystycznych, aby pomóc w podejmowaniu decyzji. Aplikacje związane z dużymi zbiorami danych, uczeniem maszynowym i sztuczną inteligencją dodatkowo wymagają wykorzystywania właściwości statystycznych do kierowania współczesnymi strategiami inwestycyjnymi. Resztkowa suma kwadratów – lub statystyki RSS – jest jedną z wielu właściwości statystycznych przeżywających renesans.

Modele statystyczne są używane przez inwestorów i zarządzających portfelami do śledzenia ceny inwestycji i wykorzystywania tych danych do przewidywania przyszłych ruchów. Badanie – zwane analizą regresji – może obejmować analizę związku w zmianach cen między towarem a akcjami firm zaangażowanych w jego produkcję.

Każdy model może mieć rozbieżności między przewidywanymi wartościami a rzeczywistymi wynikami. Chociaż wariancje można wyjaśnić za pomocą analizy regresji, rezydualna suma kwadratów reprezentuje wariancje lub błędy, które nie są wyjaśnione.

Ponieważ można stworzyć wystarczająco złożoną funkcję regresji, aby ściśle pasowała do praktycznie każdego zbioru danych, konieczne są dalsze badania w celu ustalenia, czy funkcja regresji jest w rzeczywistości użyteczna w wyjaśnianiu wariancji zbioru danych. Zazwyczaj jednak mniejsza lub niższa wartość rezydualnej sumy kwadratów jest idealna w każdym modelu, ponieważ oznacza to mniejszą zmienność w zestawie danych. Innymi słowy, im niższa suma kwadratów reszt, tym lepiej model regresji wyjaśnia dane.