Big Data
Co to jest Big Data?
Big data odnosi się do dużych, różnorodnych zbiorów informacji, które rosną w coraz szybszym tempie. Obejmuje ilość informacji, prędkość lub prędkość, z jaką są tworzone i gromadzone, a także różnorodność lub zakres objętych nimi punktów danych (znanych jako „trzy v” dużych zbiorów danych). Big data często pochodzi z eksploracji danych i występuje w wielu formatach.
Kluczowe wnioski
- Big data to ogromna ilość różnorodnych informacji, które docierają w coraz większych ilościach iz coraz większą prędkością.
- Duże zbiory danych mogą być ustrukturyzowane (często numeryczne, łatwe do sformatowania i przechowywania) lub nieustrukturyzowane (bardziej swobodne, mniej wymierne).
- Niemal każdy dział w firmie może wykorzystać wyniki analizy dużych zbiorów danych, ale radzenie sobie z bałaganem i hałasem może stwarzać problemy.
- Duże zbiory danych można zbierać z publicznie udostępnionych komentarzy w sieciach społecznościowych i witrynach internetowych, dobrowolnie zebranych z osobistej elektroniki i aplikacji, za pośrednictwem kwestionariuszy, zakupów produktów i elektronicznych odpraw.
- Big data jest najczęściej przechowywana w komputerowych bazach danych i analizowana za pomocą oprogramowania zaprojektowanego specjalnie do obsługi dużych, złożonych zbiorów danych.
Jak działa Big Data
Duże zbiory danych można sklasyfikować jako nieustrukturyzowane lub ustrukturyzowane. Dane strukturalne obejmują informacje, którymi organizacja już zarządza w bazach danych i arkuszach kalkulacyjnych; często ma charakter liczbowy. Dane nieustrukturyzowane to informacje, które są niezorganizowane i nie mieszczą się w z góry określonym modelu lub formacie. Obejmuje dane zebrane ze źródeł mediów społecznościowych, które pomagają instytucjom zebrać informacje o potrzebach klientów.
Duże zbiory danych można zbierać z publicznie udostępnionych komentarzy w sieciach społecznościowych i witrynach internetowych, dobrowolnie zebranych z osobistej elektroniki i aplikacji, za pośrednictwem kwestionariuszy, zakupów produktów i elektronicznych odpraw. Obecność czujników i innych danych wejściowych w urządzeniach inteligentnych umożliwia gromadzenie danych w szerokim spektrum sytuacji i okoliczności.
Big data jest najczęściej przechowywana w komputerowych bazach danych i analizowana za pomocą oprogramowania zaprojektowanego specjalnie do obsługi dużych, złożonych zbiorów danych. Wiele firm oferujących oprogramowanie jako usługę (SaaS) specjalizuje się w zarządzaniu tego typu złożonymi danymi.
Zastosowania Big Data
Analitycy danych analizują relacje między różnymi typami danych, takimi jak dane demograficzne i historia zakupów, aby określić, czy istnieje korelacja. Takie oceny mogą być przeprowadzane wewnętrznie lub zewnętrznie przez stronę trzecią, która koncentruje się na przetwarzaniu dużych zbiorów danych w przystępne formaty. Firmy często wykorzystują ocenę dużych zbiorów danych przez takich ekspertów, aby przekształcić ją w przydatne informacje.
Wiele firm, takich jak Alphabet i Facebook, wykorzystuje duże zbiory danych do generowania przychodów z reklam, umieszczając ukierunkowane reklamy użytkownikom w mediach społecznościowych i przeglądających strony internetowe.
Niemal każdy dział w firmie może wykorzystywać wyniki analizy danych, od zasobów ludzkich i technologii po marketing i sprzedaż. Celem Big Data jest zwiększenie szybkości, z jaką produkty trafiają na rynek, zmniejszenie ilości czasu i zasobów wymaganych do uzyskania akceptacji na rynku, dotarcia do odbiorców i zapewnienia zadowolenia klientów.
Zalety i wady Big Data
Wzrost ilości dostępnych danych stwarza zarówno szanse, jak i problemy. Ogólnie rzecz biorąc, posiadanie większej ilości danych o klientach (i potencjalnych klientach) powinno pozwolić firmom na lepsze dostosowywanie produktów i działań marketingowych w celu uzyskania najwyższego poziomu satysfakcji i powtarzalności transakcji. Firmy, które zbierają duże ilości danych, mają możliwość przeprowadzenia głębszych i bogatszych analiz z korzyścią dla wszystkich interesariuszy.
Biorąc pod uwagę ilość danych osobowych dostępnych obecnie na temat osób fizycznych, kluczowe jest, aby firmy podjęły kroki w celu ochrony tych danych; temat, który stał się gorącą debatą w dzisiejszym świecie online, szczególnie w kontekście wielu naruszeń danych, których firmy doświadczyły w ciągu ostatnich kilku lat.
Chociaż lepsza analiza jest pozytywna, duże zbiory danych mogą również powodować przeciążenie i szum, zmniejszając ich użyteczność. Firmy muszą obsługiwać większe ilości danych i określić, które dane reprezentują sygnały w porównaniu z szumem. Decydowanie o tym, co sprawia, że dane są istotne, staje się kluczowym czynnikiem.
Ponadto charakter i format danych mogą wymagać specjalnego traktowania przed podjęciem działań. Dane strukturalne, składające się z wartości liczbowych, można łatwo przechowywać i sortować. Dane nieustrukturyzowane, takie jak wiadomości e-mail, filmy i dokumenty tekstowe, mogą wymagać zastosowania bardziej wyrafinowanych technik, zanim staną się użyteczne.