Jak obliczyć korelację za pomocą programu Excel?
Co to jest korelacja?
Korelacja mierzy liniową zależność między dwiema zmiennymi. Mierząc i wiążąc wariancję każdej zmiennej, korelacja wskazuje siłę związku.
Innymi słowy, korelacja odpowiada na pytanie: W jakim stopniu zmienna A (zmienna niezależna) wyjaśnia zmienną B (zmienną zależną)?
Kluczowe wnioski
- Korelacja to statystyczna liniowa zgodność zmienności między dwiema zmiennymi.
- W finansach korelacja jest wykorzystywana w kilku aspektach analizy, w tym w obliczaniu odchylenia standardowego portfela.
- Obliczanie korelacji może być czasochłonne, ale oprogramowanie takie jak Excel ułatwia obliczenia.
Zrozumienie korelacji
Wzór na korelację
Korelacja łączy kilka ważnych i powiązanych pojęć statystycznych, a mianowicie wariancję i odchylenie standardowe. Wariancja to rozproszenie zmiennej wokół średniej, a odchylenie standardowe to pierwiastek kwadratowy z wariancji.
Formuła jest następująca:
Ponieważ korelacja chce ocenić liniową zależność dwóch zmiennych, tak naprawdę konieczne jest sprawdzenie, jaką ilość kowariancji mają te dwie zmienne i w jakim stopniu ta kowariancja jest odzwierciedlona przez odchylenia standardowe każdej zmiennej z osobna.
Typowe błędy w korelacji
Najczęstszym błędem jest założenie, że korelacja zbliżona do +/- 1 jest istotna statystycznie. Odczyt zbliżający się do +/- 1 zdecydowanie zwiększa szanse na faktyczną istotność statystyczną, ale bez dalszych testów nie można tego wiedzieć.
Statystyczne testowanie korelacji może być skomplikowane z wielu powodów; to wcale nie jest proste. Krytycznym założeniem korelacji jest to, że zmienne są niezależne, a związek między nimi jest liniowy. Teoretycznie można by przetestować te twierdzenia, aby określić, czy obliczenia korelacji są właściwe.
Pamiętaj, że korelacja między dwiema zmiennymi NIE oznacza, że A spowodowało B lub odwrotnie.
Drugim najczęściej popełnianym błędem jest zapomnienie o normalizacji danych do wspólnej jednostki. Jeśli obliczasz korelację dla dwóch wersji beta, jednostki są już znormalizowane: sama beta jest jednostką. Jeśli jednak chcesz skorelować akcje, ważne jest, aby znormalizować je w postaci procentowej stopy zwrotu i nie dzielić się zmianami cen. Zdarza się to zbyt często, nawet wśród profesjonalistów inwestycyjnych.
Jeśli chodzi o korelację cen akcji, zasadniczo zadajesz dwa pytania: Jaki jest zwrot w określonej liczbie okresów i jak ten zwrot koreluje ze zwrotem z innego papieru wartościowego w tym samym okresie?
Z tego też powodu korelacja cen akcji jest trudna: dwa papiery wartościowe mogą mieć wysoką korelację, jeśli zwrot to dzienne zmiany procentowe w ciągu ostatnich 52 tygodni, ale niską korelację, jeśli zwrot jest miesięczny w ciągu ostatnich 52 tygodni. Który jest lepszy”? Naprawdę nie ma idealnej odpowiedzi i zależy to od celu testu.
Znajdowanie korelacji w programie Excel
Istnieje kilka metod obliczania korelacji w programie Excel. Najprościej jest pobrać dwa zestawy danych obok siebie i użyć wbudowanej formuły korelacji:
Jest to wygodny sposób obliczenia korelacji między zaledwie dwoma zestawami danych. Ale co, jeśli chcesz utworzyć macierz korelacji dla szeregu zestawów danych? Aby to zrobić, musisz użyć wtyczki do analizy danych programu Excel. Wtyczkę można znaleźć w zakładce Dane, w części Analiza.
Wybierz tabelę zwrotów. W tym przypadku nasze kolumny mają tytuły, dlatego chcemy zaznaczyć pole „Etykiety w pierwszym wierszu”, aby program Excel wiedział, że należy je traktować jako tytuły. Następnie możesz wybrać wydruk na tym samym arkuszu lub na nowym arkuszu.
Po naciśnięciu klawisza Enter dane są tworzone automatycznie. Możesz dodać tekst i formatowanie warunkowe, aby wyczyścić wynik.