Definicja wygładzania danych
Co to jest wygładzanie danych?
Wygładzanie danych odbywa się za pomocą algorytmu do usuwania szumu ze zbioru danych. Pozwala to wyraźniej wyróżnić ważne wzory.
Wygładzanie danych może służyć do przewidywania trendów, takich jak ceny papierów wartościowych, a także w analizie ekonomicznej, która może uwzględniać skutki sezonowości lub pomijać jednorazowe wartości odstające.
Kluczowe wnioski
- Wygładzanie danych wykorzystuje algorytm do usuwania szumu ze zbioru danych, umożliwiając wyróżnienie ważnych wzorców i może być wykorzystywane do przewidywania trendów, takich jak te występujące w cenach papierów wartościowych.
- Różne modele wygładzania danych obejmują metodę losową wykorzystującą średnie kroczące.
- Chociaż wygładzanie danych może pomóc w przewidywaniu pewnych trendów, z natury prowadzi do mniejszej ilości informacji w próbie, co może prowadzić do ignorowania pewnych punktów danych.
Wyjaśnienie wygładzania danych
Gdy dane są kompilowane, można nimi manipulować, aby usunąć lub zmniejszyć zmienność lub dowolny inny rodzaj szumu. Nazywa się to wygładzaniem danych.
Ideą wygładzania danych jest to, że może identyfikować uproszczone zmiany, aby pomóc przewidzieć różne trendy i wzorce. Działa jako pomoc dla statystyków lub handlowców, którzy muszą spojrzeć na wiele danych – które często mogą być trudne do przetrawienia – w celu znalezienia wzorców, których inaczej by nie widzieli.
Aby wyjaśnić za pomocą wizualnej reprezentacji, wyobraź sobie roczny wykres akcji Spółki X. Każdy pojedynczy wysoki punkt na wykresie dla akcji może zostać obniżony, podnosząc jednocześnie wszystkie dolne punkty. To sprawiłoby, że krzywa byłaby gładsza, pomagając w ten sposób inwestorowi w przewidywaniu przyszłych wyników akcji.
Ekonomiści generalnie preferują dane wygładzone, ponieważ lepiej identyfikują zmiany trendu w porównaniu z danymi niewygładzonymi, które mogą wydawać się bardziej nieregularne i tworzyć fałszywe sygnały.
Metody wygładzania danych
Istnieją różne metody wygładzania danych. Niektóre z nich obejmują metodę randomizacji, użycie błądzenia losowego, obliczenie średniej ruchomej lub przeprowadzenie jednej z kilku technik wygładzania wykładniczego.
Prosty średniej ruchomej (SMA) w równym stopniu obu ostatnich cen i tych historycznych, natomiast wykładnicza średnia ruchoma (EMA) kładzie większy nacisk na ostatnich danych dotyczących cen.
Model błądzenia losowego jest powszechnie stosowany do opisu zachowania instrumentów finansowych, takich jak akcje. Niektórzy inwestorzy uważają, że nie ma związku między przeszłymi zmianami ceny papieru wartościowego a ich przyszłymi zmianami. Wygładzanie losowe zakłada, że przyszłe punkty danych będą równe ostatniemu dostępnemu punktowi danych plus zmienna losowa. Analitycy techniczni i fundamentalni nie zgadzają się z tym pomysłem; uważają, że przyszłe ruchy można ekstrapolować, badając przeszłe trendy.
Często używana w analizie technicznej, średnia ruchoma wygładza akcję cenową, jednocześnie odfiltrowując zmienność z przypadkowych ruchów cen. Proces ten opiera się na cenach z przeszłości, co czyni go wskaźnikiem podążającym za trendem lub opóźniającym się. Jak widać na poniższym wykresie cenowym, średnia ruchoma (EMA) ma ogólny kształt i trend podstawowych dziennych danych cenowych, przedstawionych za pomocą świec. Im więcej dni uwzględnionych w średniej ruchomej, tym bardziej wygładzona staje się linia.
Plusy i minusy wygładzania danych
Wygładzanie danych może pomóc w identyfikacji trendów w gospodarce, papierach wartościowych, takich jak akcje, nastroje konsumentów lub do innych celów biznesowych.
Na przykład ekonomista może wygładzić dane, aby dokonać sezonowych korekt niektórych wskaźników, takich jak sprzedaż detaliczna, zmniejszając wahania, które mogą występować każdego miesiąca, takie jak święta lub ceny gazu.
Istnieją jednak wady korzystania z tego narzędzia. Wygładzanie danych nie zawsze zapewnia wyjaśnienie trendów lub wzorców, które pomaga zidentyfikować. Może również prowadzić do ignorowania pewnych punktów danych poprzez podkreślanie innych.
Plusy
- Pomaga identyfikować rzeczywiste trendy, eliminując szum z danych
- Pozwala na sezonowe korekty danych ekonomicznych
- Łatwo to osiągnąć za pomocą kilku technik, w tym średnich ruchomych
Cons
- Usunięcie danych zawsze wiąże się z mniejszą ilością informacji do analizy, co zwiększa ryzyko błędów w analizie
- Wygładzanie może uwydatnić uprzedzenia analityków i zignorować wartości odstające, które mogą mieć znaczenie
Przykład wygładzania danych w rachunkowości finansowej
Często cytowanym przykładem wygładzania danych w rachunkowości biznesowej jest uwzględnienie wątpliwych kont w celu zmiany kosztu nieściągalnych długów z jednego okresu sprawozdawczego na drugi. Na przykład firma oczekuje, że nie otrzyma płatności za określone towary w ciągu dwóch okresów rozliczeniowych; 1000 USD w pierwszym okresie raportowania i 5000 USD w drugim okresie raportowania.
Jeśli oczekuje się, że pierwszy okres sprawozdawczy przyniesie wysokie dochody, firma może uwzględnić łączną kwotę 6000 USD jako rezerwę na wątpliwe rachunki w tym okresie sprawozdawczym. Zwiększyłoby to koszt złych długów w rachunku zysków i strat o 6000 USD i zmniejszyłby dochód netto o 6000 USD. W ten sposób złagodziłoby to okres o wysokich dochodach poprzez zmniejszenie dochodu. Dla firm ważne jest, aby przy korygowaniu kont stosowały osąd i prawne metody księgowe.