Modelowanie predykcyjne
Co to jest modelowanie predykcyjne?
Modelowanie predykcyjne to proces wykorzystywania znanych wyników do tworzenia, przetwarzania i walidacji modelu, który można wykorzystać do prognozowania przyszłych wyników. Jest to narzędzie wykorzystywane w analityce predykcyjnej, technice eksploracji danych, która próbuje odpowiedzieć na pytanie „co może się wydarzyć w przyszłości?”
Kluczowe wnioski
- Modelowanie predykcyjne to proces wykorzystywania znanych wyników do tworzenia, przetwarzania i walidacji modelu, który można wykorzystać do prognozowania w przyszłości.
- Dwie z najczęściej stosowanych technik modelowania predykcyjnego to regresja i sieci neuronowe.
- Firmy mogą wykorzystywać modelowanie predykcyjne do prognozowania zdarzeń, zachowań klientów, a także ryzyk finansowych, ekonomicznych i rynkowych.
Zrozumienie modelowania predykcyjnego
Analizując zdarzenia historyczne, firmy mogą korzystać z modelowania predykcyjnego w celu zwiększenia prawdopodobieństwa wystąpienia zdarzeń prognostycznych, zachowania klientów, a także ryzyka finansowego, gospodarczego i rynkowego.
Szybka migracja do produktów cyfrowych stworzyła morze danych, które są łatwo dostępne dla firm. Big data jest wykorzystywana przez firmy do poprawy dynamiki relacji klient-biznes. Ta ogromna ilość danych w czasie rzeczywistym jest pobierana ze źródeł takich jak media społecznościowe, historia przeglądania Internetu, dane z telefonów komórkowych i platformy przetwarzania w chmurze.
Jednak dane są zwykle nieustrukturyzowane i zbyt złożone, aby ludzie mogli je analizować w krótkim czasie. Ze względu na ogromną ilość danych firmy używają narzędzi do modelowania predykcyjnego – często za pośrednictwem programów komputerowych. Programy przetwarzają ogromne ilości danych historycznych w celu oceny i identyfikacji wzorców w danych. Stamtąd model może zapewnić zapis historyczny, a także ocenę tego, jakie zachowania lub zdarzenia prawdopodobnie wystąpią ponownie lub w przyszłości.
Modelowanie predykcyjne może być wykorzystywane przez drużyny sportowe do analizy prawdopodobieństwa sukcesu przy użyciu statystyk graczy i analizy sytuacyjnej.
Zastosowania modelowania predykcyjnego
Analityka predykcyjna wykorzystuje predyktory lub znane funkcje do tworzenia modeli predykcyjnych, które będą używane do uzyskiwania wyników. Model predykcyjny jest w stanie dowiedzieć się, jak różne punkty danych łączą się ze sobą. Dwie z najczęściej stosowanych technik modelowania predykcyjnego to regresja i sieci neuronowe.
W dziedzinie statystyki regresja odnosi się do liniowej zależności między zmiennymi wejściowymi i wyjściowymi. Model predykcyjny z funkcją liniową wymaga jednego predyktora lub cechy w celu przewidzenia wyniku lub wyniku. Na przykład bank, który ma nadzieję wykryć pranie pieniędzy na wczesnym etapie, może zastosować liniowy model predykcyjny.
Bank chce zidentyfikować, którzy z jego klientów mogą w pewnym momencie zaangażować się w pranie pieniędzy. Korzystając z danych klientów banku, model predykcyjny jest budowany wokół kwoty przekazów pieniężnych, które klienci wykonali w danym okresie.
Model uczy się rozpoznawać różnicę między transakcją prania pieniędzy a zwykłą transakcją. Optymalnym wynikiem modelu powinien być wzorzec sygnalizujący, który klient wyprał pieniądze, a który nie. Jeśli model dostrzeże, że u konkretnego klienta pojawia się wzorzec nadużyć, będzie to sygnał do działania, którym zajmie się jednostka ds. Zapobiegania nadużyciom w banku.
Narzędzia do modelowania predykcyjnego
Modele predykcyjne są również wykorzystywane w sieciach neuronowych, takich jak uczenie maszynowe i głębokie uczenie się, które są polami sztucznej inteligencji (AI). Sieci neuronowe są inspirowane ludzkim mózgiem i są tworzone z sieci połączonych ze sobą węzłów na poziomach hierarchicznych, co stanowi podstawę sztucznej inteligencji. Siła sieci neuronowych polega na ich zdolności do obsługi nieliniowych relacji danych. Są w stanie tworzyć relacje i wzorce między zmiennymi, które okazałyby się niemożliwe lub zbyt czasochłonne dla analityków-ludzi.
Z jednej strony bank może wprowadzić do swojego modelu znane zmienne, takie jak wartość przelewów zainicjowanych przez jego klientów, w celu określenia, kto może uczestniczyć w praniu pieniędzy. Z drugiej strony sieć neuronowa może stworzyć silniejszy wzorzec, tworząc relację między zmiennymi wejściowymi. Te zmienne wejściowe mogą obejmować czas zalogowania, lokalizację geograficzną użytkownika, adres IP urządzenia użytkownika, odbiorcę lub nadawcę środków oraz wszelkie inne zmienne lub zachowania, które mogą być związane z praniem pieniędzy.
Inne techniki modelowania predykcyjnego stosowane przez firmy finansowe obejmują drzewa decyzyjne, eksplorację danych szeregów czasowych i analizę bayesowską. Firmy, które wykorzystują duże zbiory danych za pomocą środków modelowania predykcyjnego, są w stanie lepiej zrozumieć, w jaki sposób ich klienci angażują się w ich produkty i mogą zidentyfikować potencjalne ryzyka i szanse dla firmy.