Prognozowanie danych w Power BI. Skuteczna analiza i predykcje biznesowe

Power BI to zaawansowane narzędzie do analizy danych i wizualizacji, wyposażone w szereg funkcji służących do prognozowania danych, które pomogą Twojej organizacji w przewidywaniu przyszłych trendów oraz wyników. Dzięki wbudowanym algorytmom, a także integracji z różnymi narzędziami, Power BI pozwala na tworzenie precyzyjnych ekstrapolacji, kluczowych przy podejmowaniu inteligentnych decyzji biznesowych.

W poniższym artykule dokładnie omówimy możliwości i zyski, jakie niesie za sobą prognozowanie danych w Power BI. Czytaj dalej, jeśli chcesz dowiedzieć się, jak wykorzystać wbudowane algorytmy do predykcji danych (np. prognozowanie szeregów czasowych), zaimplementować model prognostyczny, wykorzystać wizualizację Key Influencers czy tworzyć całkowicie nowe modele dzięki możliwościom języków Python i R.

Prognozowanie danych w Power BI. Skuteczna analiza i predykcje biznesowe dla całej organizacji

Czym jest prognozowanie danych w Power BI i jakie korzyści biznesowe może przynieść?

Usługi Power BI. Generowanie interaktywnych raportów sprzedażowych

Prognozowanie danych to proces wykorzystywania zbiorów historycznych w celu przewidywania przyszłych zdarzeń, trendów oraz wyników. Technika stosowana w statystyce, analizie danych i dziedzinach związanych z uczeniem maszynowym. Celem prognozowania jest zrozumienie wzorców oraz tendencji ukrytych w dostępnych zestawach danych, a następnie używanie tych informacji do przewidywania, jakie będą przyszłe wartości. 

Optymalizacja kosztów i zasobów

Organizacje, w celu zwiększenia swojej konkurencyjności, powinny analizować trendy na wielu płaszczyznach. Dzięki prognozom danych firmy mogą efektywniej zarządzać zasobami, takimi jak surowce, personel czy kapitał.

Trafna predykcja pozwala na dobre dostosowanie poziomu aktywów do przewidywanej działalności biznesowej, co przekłada się na optymalizację kosztów. Podobny efekt można uzyskać w obszarze logistyki i zarządzania zapasami. Firmy mogą dostosowywać swoje operacje do przewidywanej aktywności.

Działania marketingowe

Analiza danych historycznych i prognozowanie przyszłych trendów konsumenckich prowadzą do skuteczniejszego planowania i wdrażania działań marketingowych. Firma może dostosowywać swoje strategie do oczekiwań rynku, personalizować ofertę i lepiej segmentować grupy docelowe.

Identyfikacja ryzyka

Co więcej, prognozowanie danych pomaga firmom identyfikować potencjalne ryzyka oraz szybko reagować na zmieniające się warunki rynkowe. W ten sposób organizacja może minimalizować negatywne skutki nieprzewidywalnych czynników zewnętrznych.

Wsparcie sprzedaży

Wreszcie prognozowanie danych sprzedażowych umożliwia strategiczne podejście do zarządzania zasobami, planowania działań reklamowych oraz optymalizacji procesów. Przewidywanie przyszłych wyników sprzedażowych pozwala firmie na lepsze zrozumienie rynku, dostosowanie się do zmieniających się trendów i skuteczniejsze podejmowanie decyzji.  

Jak widać, modelowanie przyszłych wartości jest istotne dla sukcesu Twojej organizacji.

Warto zatem wesprzeć ten proces poprzez wprowadzanie nowoczesnych technologii, takich jak choćby Microsoft Power BI (wykorzystując przy tym nie tylko możliwości analityczne narzędzia klasy business intelligence, ale również te z obszaru sztucznej inteligencji i uczenia maszynowego).

Wbudowane algorytmy do predykcji danych w Power BI

Power BI to nie tylko narzędzie do raportów generowanych w czasie rzeczywistym. To również kompleksowy system, który pozwala w pełni wykorzystać potencjał danych w biznesie, przynosząc nowe perspektywy i zwiększając efektywność decyzyjną.

Jego wszechstronność sprawia, że wyróżnia się spośród innych rozwiązań business intelligence. 

Oferuje nie tylko zaawansowane funkcje analityczne, ale również możliwości estymacji przyszłych wyników: od klasycznej predykcji szeregów czasowych, po narzędzia klasy AI będące w stanie prognozować wartości nie tylko zmiennych ilościowych, ale i jakościowych (opisowych). Poniżej, poprzez zaprezentowanie kilku przykładów z wykonanej analizy sprzedażowej, przedstawiony zostanie potencjał narzędzia Power BI w tym zakresie. 

Power BI. Prognozowanie szeregów czasowych

W Power BI przewidywanie szeregów czasowych oparte jest o metodę wygładzania wykładniczego (ang. exponential smoothing). Jest to sposób przetwarzania szeregów czasowych, który zmniejsza jego wariancję poprzez użycie ważonej średniej ruchomej z wcześniejszych wartości, gdzie wagi maleją wykładniczo wraz z odległością czasową.

Innymi słowy, wygładzanie wykładnicze opiera się na średniej ważonej poprzednich obserwacji, przy czym większą wagę przypisuje się nowszym obserwacjom — wagi maleją wykładniczo w miarę starzenia się obserwacji.

Opiera się to na koncepcji, że ostatnie obserwacje dostarczają więcej informacji na temat przyszłych zachowań niż te bardziej odległe. Wygładzanie wykładnicze sprawdza się do skutecznego usuwania szumów z modelu, dobrej rejestracji trendów i wizualizacji różnorodnych danych.

Poniższy rysunek przedstawia ogólną koncepcję wygładzania wykładniczego:

Prognozowanie szeregów czasowych w usłudze power BI

W zależności od tego, czy w zbiorze danych (na którym będziemy wykonywać proces prognozowania), zachodzą cykliczne i regularne zmiany, czy też są to dane pozbawione sezonowości, Power BI dobiera automatycznie jedną z dwóch wersji exponential smoothing. Dla danych sezonowych jest to ETS AAA (ang. exponential smoothning with additive error, additive trend and additve seasonality), a dla niesezonowych ETS AAN (ang. exponential smoothning with additive error, additive trend, and non-additve seasonality)

Algorytm sezonowy ETS AAA

Algorytm sezonowy ETS AAA modeluje szeregi czasowe poprzez równanie uwzględniające sezonowość.

Ten algorytm, powszechnie znany jako algorytm Holta-Wintersa, w Power BI został wzbogacony o zastosowanie procesu walidacji w celu optymalnego wyboru parametrów oraz dostosowanie wektora stanu po zakończeniu okna treningowego w przypadku wystąpienia zakłóceń w danych.  

Metoda Holta-Wintersa tradycyjnie dobiera optymalne parametry wygładzania, minimalizując błędy prognoz w oknie treningowym.

Skupia się jednak głównie na prognozach krótkoterminowych, co może prowadzić do niedokładności przy długoterminowych estymacjach.

W celu poprawy dokładności analiz długofalowych w Power BI wprowadzono okno walidacyjne, uwzględniające kilka ostatnich punktów okna treningowego.

W tym kontekście, zamiast dostosowywać stan na każdym kroku, oblicza się sumę kwadratów błędów prognoz dla całego okna, co pozwala złagodzić zmienność i zachować trend w dłuższym horyzoncie czasowym. 

W algorytmie ETS AAA wektor stanu obliczany jest w całym okresie treningowym, ale przy wysokich parametrach wygładzania model staje się podatny na wartości odstające, zwłaszcza w późniejszej fazie.

To może wprowadzić nietypowe wzorce prognoz, przyciągając dopasowanie treningowe w stronę odstępstw. Aby temu zapobiec, w Power BI algorytm monitoruje zmiany w stanie treningowym. W przypadku istotnych odchyleń dostosowuje trend w oknie czasowym, dopasowując go do ogólnego trendu szeregu czasowego i korygując prognozowane wartości. 

Algorytm AAN

Drugi z algorytmów, czyli ETS AAN nie uwzględnia sezonowości. Co za tym idzie, stosuje bardziej podstawowe równanie do analizy szeregów czasowych, które dodaje tylko składnik trendu oraz składnik błędu. Przyjmujemy założenie, że wartości danych rosną lub maleją w sposób, który można opisać matematycznym wzorem, jednak ten wzrost lub spadek nie przebiega cyklicznie.

Implementacja modelu prognostycznego w Power BI

 Tworzenie prognoz szeregów czasowych w Power BI jest jak składanie puzzli biznesowych. Na początek użytkownik musi wybrać odpowiedni rodzaj puzzli, gdzie za przykład posłuży nam wykres liniowy. Następnie należy dobrać poszczególne elementy — wymiar czasu i historyczne dane, np. sprzedażowe. Gdy istnieje już baza, dodajemy element kluczowy: prognozę.

W tym celu musimy zdefiniować następujące parametry:

  • Jednostki — do wyboru mamy np. rok, miesiąc, dzień, godzina, minuta czy punkt.
  • Długość prognozy — okres, na jaki chcemy prognozować. Parametr przyjmuje wartość liczbową (np. dla predykcji sześciomiesięcznej wpisujemy 6).
  • Ignoruj ostatnie — do uzupełnienia w przypadku, gdy chcemy zignorować jakiś okres. Niektóre zbiory mogą zawierać niekompletne dane z ostatnich x miesięcy. Możemy tym samym stwierdzić, że dane w określonym przedziale czasowym są niekompletne i należy je zignorować dla celów prognozowania.
  • Sezonowość — jeśli w przypadku dowolnych danych szeregów czasowych mamy jakąkolwiek przewidywalną, cykliczną zmianę, wówczas mamy do czynienia z sezonowością. W Power BI możemy wskazać wartość 12 dla sezonowości rocznej, 6 dla sezonowości półrocznej i 4 dla sezonowości kwartalnej.
  • Przedział ufności (ang. confidence interval) — jest to prawdopodobieństwo rozumiane jako przedział, w którym będą mieścić się rzeczywiste wartości. Jeśli na przykład podamy 95% przedział ufności, zdefiniujemy, że 95% to prawdopodobieństwo, iż rzeczywista wartość będzie mieściła się w tym przedziale.

Po dodaniu wszystkich powyższych elementów do układanki będziemy w stanie zobaczyć pełen obraz wraz z przewidywaniem przyszłych wartości. Reprezentuje to poniższa grafika: 

Usługa Power BI. Jak zaimplementować model prognostyczny? Instrukcja

Power BI, jako narzędzie znane z generowania atrakcyjnych raportów, pozwala nam na dostosowanie wyglądu wizualizacji do naszych preferencji i designu całego dashboardu (możemy dobrać kolory, czcionki i inne elementy graficzne).

Dodatkowo mamy możliwość uzupełnienia wizualizacji o linie trendu, średniej, mediany czy wartości ekstremalnych, a nawet funkcję szukania anomalii. 

Informacje zdobyte dzięki funkcji wizualizacji Key Influencers

Power BI ma w swojej ofercie wiele innych funkcjonalności wspomagających firmy w procesie prognozowania przyszłych wydarzeń. Wizualizacja o nazwie Key Influencers ukazuje kluczowe elementy mające wpływ na interesującą nas metrykę.

Narzędzie to opiera się na algorytmach analizy wpływu, takich jak drzewa decyzyjne czy algorytmy regresji, oceniając, które zmienne są najbardziej skorelowane z daną wartością docelową. Obiekt ten reprezentuje funkcjonalności z obszaru sztucznej inteligencji.   

Aby zbudować opisywany komponent wizualny, wystarczy, że zaimportujemy do niego nasz zbiór danych, a Power BI automatycznie zanalizuje dane i zidentyfikuje kluczowe wpływy na podstawie wzorców w dostępnych zmiennych, generując wizualne wyjaśnienia.  

Wizualizacja Key Influencers w Power BI. Jak ją zaimplementować?

Widok Top Segments

Drugi dostępny widok w tym obiekcie to Top Segments, za którym stoją algorytmy analizy asocjacyjnej takie jak a priori. Przeszukują one zbiór danych w poszukiwaniu częstych zestawów elementów, które występują razem.

Algorytmy przypisują wagi poszczególnym segmentom, uwzględniając ich wpływ na wynik. Umożliwiają analizę kluczowych segmentów danych, które mają największy wpływ na określone wyniki.  

Wizualizacja Key Influencers nie jest klasycznym przykładem prognozowania danych. Może jednak uwidocznić bardzo ważne informacje, które pozwolą przewidzieć przyszłe wyniki.

Cały obiekt pozwala na interaktywną analizę (możemy klikać na poszczególne elementy, a kalkulacje będą dodatkowo wyjaśniane), co umożliwia użytkownikom lepsze zrozumienie relacji między zmiennymi.

Co więcej, obiekt ten może być łatwo zintegrowany z innymi elementami w dashboardzie.  

Integracja z Power BI z Pythonem i R w celu wzmocnienia algorytmów prognozujących

Możliwości Power BI nie ograniczają się wyłącznie do wbudowanych funkcji. Szeroki zakres możliwości analizy prognostycznej umożliwia wykorzystanie Python i R.

Są to dwa główne języki programowania używane w dziedzinach takich jak data science i prognozowanie. Python, z szeroką gamą bibliotek takich jak NumPy, Pandas, scikit-learn, ARIMA i wiele innych, jest powszechnie stosowany do analizy danych i uczenia maszynowego.

Również R, z bogactwem pakietów matematycznych jak forecast czy timeSeries, to podstawa w budowie statystycznej analizy danych, prognozowania, modelowania czy tworzenia grafik. 

Wartość dodana z implementacji zewnętrznych modeli prognozujących do Power BI

Dzięki możliwościom języków Python i R możemy w Power BI tworzyć całkowicie nowe modele, w pełni pasujące do charakterystyki danych w domenie.

Zyskujemy tym samym dużą elastyczność w zastosowaniu różnych naukowych metod prognozowania, takich jak regresja liniowa, regresja logistyczna, drzewa decyzyjne, sieci neuronowe czy algorytmy uczenia maszynowego jak Random Forest, Gradient Boosting itp.

Ponadto dostrajanie hiperparametrów poprawia skuteczność modelu. Można używać technik takich jak przeszukiwanie siatki (ang. grid search) czy optymalizacja bayesowska. 

Kolejną zaletą jest duża elastyczność w korzystaniu ze sprawdzonych podejść do testowania naszego algorytmu. Można w tym celu używać różnych metryk, takich jak błąd średniokwadratowy (ang. Mean Squared Error) czy współczynnik determinacji (ang. R-squared).   

Dzięki integracji z Pythonem i R nie jesteśmy zatem ograniczeni jedynie do algorytmów wbudowanych w Power BI. Mamy możliwość tworzenia idealnie dopasowanych i dedykowanych dla danego celu modeli, co zwiększa prawdopodobieństwo trafności prognoz dla całej organizacji.

Efektywne wdrożenie wypracowanego modelu w usłudze Power BI

W praktyce wspomniana integracja rozpoczyna się od stworzenia własnego modelu prognozującego w formie skryptu Python. Najlepiej pracować nad nim poza Power BI, w dowolnym edytorze kodu typu Visual Studio Code czy PyCharm.

Popularnym rozwiązaniem w obszarze data science są notatniki typu Jupyter Notebook. W takich narzędziach możemy wygodniej trenować i testować nasz model predykcyjny, dostosowując parametry zgodnie z naszymi wymaganiami.   

Przed wyborem metodologii najczęściej dzielimy nasze dane na dwa zbiory: zbiór treningowy, na którym model jest uczony oraz zbiór testowy, na którym ocenia się jego skuteczność.

Model jest zatem dopasowywany i dostosowywany do danych treningowych z naszego zbioru danych. Kiedy jesteśmy zadowoleni z wyników działania algorytmu, zapisujemy nasz kod i implementujemy go do Power BI, gdzie mamy już nasz inicjalny, historyczny zbiór danych.

Ten zbiór będzie automatycznie podstawiony pod wypracowany i zaimplementowany przez nas model prognozujący dane w Pythonie, generując tym samym nowy zestaw danych z predykcjami sprzedażowymi.  

Ostatnim krokiem jest stworzenie raportu ze zbudowanego zestawu danych — wykresów i innych komponentów pozwalających przedstawić otrzymane wyniki. Pamiętajmy, że języki Python i R mogą być użyte nie tylko do obliczeń na danych. Możemy dzięki nim tworzyć własne wizualizacje! 

Prognozowanie i Power BI. Podsumowanie

Analiza danych dla firm i umiejętne korzystanie z prognozowania staje się nieodzownym elementem strategii rozwoju każdej organizacji, która pragnie osiągnąć sukces w erze big data. Umożliwia przedsiębiorstwom bardziej świadome podejmowanie decyzji, zwiększenie efektywności operacyjnej i utrzymanie elastyczności w dynamicznym otoczeniu rynkowym. Power BI z bogactwem wbudowanych funkcji, a także możliwościami integracji z zewnętrznymi narzędziami, jest rozwiązaniem pozwalającym na realizację tych celów.