Hurtownia danych

Hurtownia danych to uniwersalne źródło wszelkich informacji biznesowych, których potrzebujesz by skutecznie zarządzać swoją firmą. W każdym przedsiębiorstwie zidentyfikować można wiele źródeł ważnych danych. Jak zapanować nad olbrzymią ilością danych z heterogenicznych, często niezintegrowanych, rozproszonych systemów? Gdzie gromadzić dane ulotne, dotyczące historycznych zdarzeń biznesowych i ginące w systemach transakcyjnych? Jak połączyć dane z systemów z informacjami dodatkowymi, gromadzonymi na boku w arkuszach kalkulacyjnych lub innych plikach? Rozwiązaniem jest właśnie hurtownia danych.

Hurtownia danych (data warehouse) to technologia pozwalająca uporządkować dane gromadzone w przedsiębiorstwie. Jest to odrębne środowisko aplikacyjne posiadające dedykowaną bazę danych, która korzysta z różnorodnych źródeł danych i zaprojektowana została z myślą o dokonywaniu złożonych analiz na zgromadzonych informacjach. W przeciwieństwie do systemów transakcyjnych, dane w hurtowni są trwałe, uporządkowane tematycznie, zintegrowane, zasilane przyrostowo, często redundantne i odpowiednio zagregowane, zazwyczaj zawierają wymiar czasowy. Hurtownia danych to centralne źródło informacji dla całego przedsiębiorstwa.
Dobrze zaprojektowana hurtownia danych to solidna podstawa dla systemów analitycznych i źródło informacji do podejmowania decyzji w przedsiębiorstwie.

Hurtownia danych (data warehouse) to technologia pozwalająca uporządkować dane gromadzone w przedsiębiorstwie. Jest to odrębne środowisko aplikacyjne posiadające dedykowaną bazę danych, która korzysta z różnorodnych źródeł danych i zaprojektowana została z myślą o dokonywaniu złożonych analiz na zgromadzonych informacjach. W przeciwieństwie do systemów transakcyjnych, dane w hurtowni są trwałe, uporządkowane tematycznie, zintegrowane, zasilane przyrostowo, często redundantne i odpowiednio zagregowane, zazwyczaj zawierają wymiar czasowy. Hurtownia danych to centralne źródło informacji dla całego przedsiębiorstwa.
Dobrze zaprojektowana hurtownia danych to solidna podstawa dla systemów analitycznych i źródło informacji do podejmowania decyzji w przedsiębiorstwie.

Co daje hurtownia danych?

Koncepcja hurtowni danych pozwala na osiągnięcie niżej wymienione korzyści:

  • Otrzymywanie na czas aktualnej informacji.
  • Możliwość tworzenia przekrojowych analiz danych.
  • Szybsze dostrzeganie pojawiających się problemów i możliwości ich rozwiązania.
  • Możliwość „zagłębiania się” w dane, drążenia ich od ogólnego spojrzenia na firmę jako całość do szczegółowej analizy wybranych, interesujących składników.
  • Możliwość prowadzenia prognoz – analiz, co by było gdyby, co będzie za miesiąc, rok,
  • Użytkownicy mają okazję wykazania się w twórczej pracy nad analizą danych, a nie tylko nad ich ewidencją.
  • Dane zebrane w systemach transakcyjnych stają się dostępne do sporządzania dowolnych raportów.
  • Zwiększenie czytelności danych, gdyż o ich umiejscowieniu decyduje tematyka a nie np. pochodzenie czy przeznaczenie.
  • Integracja danych, dbanie o ich spójność i zgodność z przyjętymi standardami. Napływające z różnych źródeł dane są, w razie potrzeby przekształcane poprzez ujednolicanie formatów, jednostek miar, itp.
  • Zasilanie danymi odbywa się automatycznie, co zmniejsza ryzyko błędów w danych. Tworzenie raportów porównujących wartości bieżące ze wskaźnikami z poprzednich okresów dzięki przechowywaniu danych historycznych.
  • Otrzymywanie na czas aktualnej informacji.
  • Możliwość tworzenia przekrojowych analiz danych.
  • Szybsze dostrzeganie pojawiających się problemów i możliwości ich rozwiązania.
  • Możliwość „zagłębiania się” w dane, drążenia ich od ogólnego spojrzenia na firmę jako całość do szczegółowej analizy wybranych, interesujących składników.
  • Możliwość prowadzenia prognoz – analiz, co by było gdyby, co będzie za miesiąc, rok,
  • Użytkownicy mają okazję wykazania się w twórczej pracy nad analizą danych, a nie tylko nad ich ewidencją.
  • Dane zebrane w systemach transakcyjnych stają się dostępne do sporządzania dowolnych raportów.
  • Zwiększenie czytelności danych, gdyż o ich umiejscowieniu decyduje tematyka a nie np. pochodzenie czy przeznaczenie.
  • Integracja danych, dbanie o ich spójność i zgodność z przyjętymi standardami. Napływające z różnych źródeł dane są, w razie potrzeby przekształcane poprzez ujednolicanie formatów, jednostek miar, itp.
  • Zasilanie danymi odbywa się automatycznie, co zmniejsza ryzyko błędów w danych. Tworzenie raportów porównujących wartości bieżące ze wskaźnikami z poprzednich okresów dzięki przechowywaniu danych historycznych.
Proces ETL

Proces ETL (Extract, Transform, Load) to proces zasilania hurtowni danymi z systemów źródłowych. Wiąże się on z czyszczeniem danych, ich konsolidacją, i przekształceniem do wspólnego formatu. Proces ten to z reguły skomplikowana procedura informatyczna, wykonywana z reguły automatycznie, wówczas gdy konieczne jest uaktualnienie danych w hurtowni.
Hurtownia danych zasilana jest na ogół z wielu, rozproszonych i różnorodnych źródeł danych. Dla każdego z nich niezbędne jest odpowiednie przeformatowanie danych i ich oczyszczenie. Tylko wówczas dane zgromadzone w hurtowni będą stanowiły solidną podstawę do wykonywania miarodajnych analiz.

Wdrożenie hurtowni danych

Konsultanci Infar Sp. z o.o. posiadają wieloletnie doświadczenie w projektowaniu i realizacji hurtowni danych. Mamy za sobą projekty zrealizowane na różnych platformach systemowych i RDBMS, działające w oparciu o różnorodne narzędzia zasilania hurtowni danych. Nasze rozwiązania business intelligence często korzystają z technologii hurtowni danych.

Comments are closed.