Magazyn danych
Co to jest hurtownia danych?
Hurtownie danych to elektroniczne przechowywanie dużej ilości informacji przez firmę lub organizację. Hurtownia danych jest istotnym elementem analizy biznesowej, która wykorzystuje techniki analityczne do danych biznesowych.
Pojęcie hurtowni danych zostało wprowadzone w 1988 roku przez badaczy IBM Barry’ego Devlina i Paula Murphy’ego. Potrzeba magazynowania danych ewoluowała, gdy systemy komputerowe stawały się coraz bardziej złożone i obsługiwały coraz większe ilości danych. Kluczową książką na temat hurtowni danych jest „Building the Data Warehouse” WH Inmon, która została opublikowana po raz pierwszy w 1990 roku i od tego czasu była wielokrotnie wznawiana.
Jak działa hurtownia danych
Hurtownia danych służy do zapewniania lepszego wglądu w wyniki firmy poprzez porównywanie danych skonsolidowanych z wielu heterogenicznych źródeł. Hurtownia danych służy do wykonywania zapytań i analiz na danych historycznych pochodzących ze źródeł transakcyjnych.
Po wprowadzeniu danych do hurtowni nie ulegają one zmianie i nie można ich zmienić, ponieważ hurtownia danych przeprowadza analizę zdarzeń, które już wystąpiły, koncentrując się na zmianach danych w czasie. Przechowywane dane muszą być przechowywane w sposób bezpieczny, niezawodny, łatwy do odzyskania i łatwy w zarządzaniu.
Istnieją pewne kroki, które należy wykonać, aby utworzyć hurtownię danych. Pierwszym krokiem jest ekstrakcja danych, która polega na gromadzeniu dużych ilości danych z wielu punktów źródłowych. Po skompilowaniu danych przechodzi przez czyszczenie danych, proces przeszukiwania danych pod kątem błędów i korygowania lub wykluczania znalezionych błędów.
Oczyszczone dane są następnie konwertowane z formatu bazy danych do formatu hurtowni. Po zapisaniu w magazynie dane są sortowane, konsolidowane, podsumowywane itp., Dzięki czemu są lepiej skoordynowane i łatwiejsze w użyciu. Z biegiem czasu do hurtowni dodawanych jest więcej danych w miarę aktualizowania wielu źródeł danych.
Kluczowe wnioski
- Hurtownie danych to elektroniczne przechowywanie dużej ilości informacji przez firmę lub organizację.
- Hurtownia danych jest przeznaczona do wykonywania zapytań i analiz danych historycznych pochodzących ze źródeł transakcyjnych na potrzeby analizy biznesowej i eksploracji danych.
- Hurtownie danych służą do zapewniania lepszego wglądu w wyniki firmy poprzez porównywanie danych skonsolidowanych z wielu heterogenicznych źródeł.
Uwagi specjalne: eksploracja danych
Firmy mogą gromadzić dane do wykorzystania w eksploracji i eksploracji danych, szukając wzorców informacji, które pomogą im usprawnić procesy biznesowe. Dobry system hurtowni danych może również ułatwić różnym działom firmy wzajemny dostęp do danych.
Na przykład hurtownia danych może pozwolić firmie na łatwą ocenę danych zespołu sprzedaży i pomóc w podejmowaniu decyzji dotyczących poprawy sprzedaży lub usprawnienia działu. Firma może skupić się na nawykach wydatków swoich klientów, aby lepiej pozycjonować swoje produkty i zwiększyć sprzedaż.
Dzięki hurtowni danych firma może gromadzić dane historyczne o wydatkach swoich klientów w przeszłości – powiedzmy 20 lat – i przeprowadzać analizy tych danych. Uzyskane informacje mogą zapewnić wgląd w preferencje konsumentów; pora dnia, miesiąc lub rok o większej sprzedaży; lub klient wydający najwięcej w ciągu roku.
Efektywne przechowywanie danych i zarządzanie nimi umożliwia również takie procesy, jak inicjowanie rezerwacji podróży i korzystanie z bankomatów.
Proces eksploracji danych dzieli się na pięć etapów:
- Organizacje zbierają dane i ładują je do swoich hurtowni danych.
- Następnie przechowują dane i zarządzają nimi na własnych serwerach lub w chmurze.
- Analitycy biznesowi, zespoły kierownicze i specjaliści IT mają dostęp do danych i określają, jak chcą je uporządkować.
- Oprogramowanie aplikacji sortuje następnie dane na podstawie wyników użytkownika
- Ostatecznie użytkownik końcowy prezentuje dane w łatwym do udostępnienia formacie, takim jak wykres lub tabela.
Hurtownie danych a bazy danych
Hurtownia danych niekoniecznie jest tym samym pojęciem, co standardowa baza danych. Baza danych to system transakcyjny, który jest skonfigurowany do monitorowania i aktualizowania danych w czasie rzeczywistym, aby mieć tylko najnowsze dostępne dane. Hurtownia danych jest zaprogramowana do agregowania danych strukturalnych w określonym przedziale czasu. Na przykład baza danych może zawierać tylko najbardziej aktualny adres klienta, podczas gdy hurtownia danych może zawierać wszystkie adresy, w których klient mieszkał przez ostatnie 10 lat.