Thursday 23 November 2017

Używanie średnia ruchoma do prognozowania


Przenoszenie średniej prognozy wstępnej. Jak można się domyślić, patrzymy na niektóre z najbardziej prymitywnych podejść do prognozowania. Miejmy nadzieję, że są to przynajmniej wartościowe wprowadzenie do niektórych problemów informatycznych związanych z wdrażaniem prognoz w arkuszach kalkulacyjnych. W tym duchu będziemy kontynuować od początku i zacząć pracę z prognozami średniej ruchomej. Średnie prognozy ruchome. Wszyscy znają średnie ruchome prognozy, niezależnie od tego, czy uważają, że są. Wszyscy studenci robią to cały czas. Pomyśl o swoich wynikach testowych na kursie, w którym będziesz miał cztery testy w trakcie semestru. Załóżmy, że masz 85 na pierwszym teście. Co byś przewidział dla swojego drugiego wyniku testu Jak sądzisz, co Twój nauczyciel przewidział dla twojego następnego wyniku testu Co twoim zdaniem mogą przewidzieć twoi znajomi dla twojego następnego wyniku testu Co twoim zdaniem rodzice mogą przewidzieć dla twojego następnego wyniku testu Niezależnie od wszystko, co możesz zrobić swoim przyjaciołom i rodzicom, oni i twój nauczyciel najprawdopodobniej oczekują, że dostaniesz coś w okolicy 85, którą właśnie dostałeś. Teraz załóżmy, że pomimo twojej autopromocji dla twoich przyjaciół, przeinaczasz siebie i wyobrażasz sobie, że możesz mniej uczyć się na drugi test, a więc dostajesz 73. Teraz, co się dzieje z tymi wszystkimi zainteresowanymi i beztroskimi? spodziewaj się, że dostaniesz swój trzeci test. Istnieją dwa bardzo prawdopodobne podejścia do opracowania oszacowania, niezależnie od tego, czy podzielą się nim z tobą. Mogą powiedzieć sobie: "Ten facet zawsze dmucha o swoich sprytach. Zamierza uzyskać kolejne 73, jeśli ma szczęście. Może rodzice będą starali się być bardziej pomocni i powiedzieć: "Cóż, jak dotąd dostałeś 85 i 73, więc może powinieneś pomyśleć o zdobyciu czegoś" (85 73) 2 79. Nie wiem, może gdybyś mniej imprezował i nie kręcili weasel w całym miejscu i jeśli zacząłeś robić o wiele więcej nauki, możesz uzyskać wyższy wynik. Oba te szacunki są w rzeczywistości średnią ruchomą. Pierwszym z nich jest wykorzystanie tylko ostatniego wyniku do prognozowania przyszłej skuteczności. Jest to tak zwana prognoza średniej ruchomej z użyciem jednego okresu danych. Drugi to również prognoza średniej ruchomej, ale z wykorzystaniem dwóch okresów danych. Załóżmy, że wszyscy ci ludzie, którzy wpadają w twój wielki umysł, trochę cię wkurzyli i postanawiasz zrobić dobrze w trzecim teście z własnych powodów i wystawić wyższy wynik przed swoimi cytatami. Poddajesz się testowi, a twój wynik to w rzeczywistości 89 Każdy, łącznie z tobą, jest pod wrażeniem. Teraz masz już ostatni test semestru i jak zwykle czujesz potrzebę nakłonienia wszystkich do przedstawienia swoich przewidywań na temat ostatniego testu. Mam nadzieję, że widzisz ten wzór. Miejmy nadzieję, że widać wzór. Co według ciebie jest najdokładniejszym Gwizdkiem, podczas gdy my pracujemy. Teraz wracamy do naszej nowej firmy sprzątającej rozpoczętej przez twoją siostrę o imieniu Whistle While We Work. Masz kilka poprzednich danych dotyczących sprzedaży reprezentowanych w poniższej sekcji z arkusza kalkulacyjnego. Najpierw przedstawiamy dane dla trzyzmianowej prognozy średniej ruchomej. Wpis dla komórki C6 powinien być teraz. Teraz możesz skopiować tę formułę komórki do innych komórek od C7 do C11. Zwróć uwagę, jak średnia porusza się po najnowszych danych historycznych, ale używa dokładnie trzech ostatnich okresów dostępnych dla każdej prognozy. Powinieneś również zauważyć, że tak naprawdę nie musimy tworzyć prognoz dla przeszłych okresów, aby rozwinąć naszą najnowszą prognozę. To zdecydowanie różni się od wykładniczego modelu wygładzania. Podaję prognozy cudzysłowów, ponieważ użyjemy ich na następnej stronie internetowej do pomiaru trafności prognozy. Teraz chcę przedstawić analogiczne wyniki dla dwuletniej prognozy średniej ruchomej. Wpis dla komórki C5 powinien być teraz. Teraz możesz skopiować tę formułę komórki do innych komórek od C6 do C11. Zwróć uwagę, jak teraz dla każdej prognozy są używane tylko dwa najnowsze dane historyczne. Ponownie uwzględniłem prognozy quotpast dla celów ilustracyjnych i do późniejszego wykorzystania w walidacji prognoz. Kilka innych rzeczy, o których należy pamiętać. Dla prognozy średniej ruchomej z okresu m do prognozowania wykorzystuje się tylko m najnowsze wartości danych. Nic więcej nie jest konieczne. Dla prognozy średniej ruchomej okresu m, podczas dokonywania prognozy quotpast, zauważ, że pierwsza prognoza ma miejsce w okresie m 1. Oba te problemy będą bardzo istotne, gdy opracujemy nasz kod. Opracowanie średniej ruchomej funkcji. Teraz musimy opracować kod dla średniej ruchomej prognozy, która może być wykorzystywana bardziej elastycznie. Kod następuje. Zauważ, że dane wejściowe odnoszą się do liczby okresów, których chcesz użyć w prognozie i tablicy wartości historycznych. Możesz przechowywać go w dowolnym skoroszycie, który chcesz. Funkcja MovingAverage (Historyczne, NumberOfPeriods) Jako pojedyncze zadeklarowanie i inicjalizacja zmiennych Dim Pozycja jako zmienny licznik wymiaru jako całkowita liczba wymiarów Dim Dimit as Single Dim HistoricalSize jako liczba całkowita Inicjowanie zmiennych Counter 1 Akumulacja 0 Określanie rozmiaru tablicy historycznej HistoricalSize Historical. Count dla licznika 1 na NumberOfPeriods Kumulacja odpowiedniej liczby ostatnio obserwowanych wartości Akumulacja akumulacja Historycznie (HistoricalSize - NumberOfPeriods Counter) MovingAverage Accumulation NumberOfPeriods Kod zostanie wyjaśniony w klasie. Chcesz umieścić funkcję w arkuszu kalkulacyjnym, aby wynik obliczeń pojawiał się tam, gdzie powinien być następujący. Średnie ruchomych: Jak ich używać Niektóre z podstawowych funkcji średniej ruchomej służą do identyfikowania trendów i odwracania. zmierzyć siłę impetu aktywów i określić potencjalne obszary, w których składnik aktywów znajdzie wsparcie lub opór. W tej części wskażemy, w jaki sposób różne okresy czasu mogą monitorować pęd i jak średnie ruchowe mogą być korzystne w ustalaniu stop-loss. Ponadto zajmiemy się niektórymi możliwościami i ograniczeniami średnich kroczących, które należy wziąć pod uwagę przy ich stosowaniu w ramach rutynowych transakcji. Trend Identyfikacja trendów jest jedną z kluczowych funkcji średnich kroczących, z których korzysta większość przedsiębiorców, którzy chcą, aby trend stał się ich przyjacielem. Średnie kroczące są wskaźnikami opóźniającymi. co oznacza, że ​​nie przewidują one nowych trendów, ale potwierdzają tendencje po ich ustaleniu. Jak widać na wykresie 1, uznaje się, że stan zapasów jest w trendzie wzrostowym, gdy cena jest powyżej średniej ruchomej, a średnia spada w górę. I odwrotnie, przedsiębiorca użyje ceny poniżej średniej nachylonej w dół, aby potwierdzić tendencję spadkową. Wielu inwestorów rozważa utrzymanie pozycji długiej w aktywach tylko wtedy, gdy cena jest wyższa od średniej ruchomej. Ta prosta reguła może pomóc zapewnić, że trend działa na korzyść traderów. Momentum Wielu początkujących handlowców pyta, w jaki sposób można zmierzyć dynamikę i jak można wykorzystać średnie ruchome, aby poradzić sobie z takim wyczynem. Prostą odpowiedzią jest zwrócenie uwagi na okresy czasu wykorzystywane do tworzenia średniej, ponieważ każdy okres może dostarczyć cennego wglądu w różne rodzaje pędu. Ogólnie, krótkoterminowy rozpęd można zmierzyć, patrząc na średnie ruchome, które koncentrują się na okresach 20 dni lub krótszych. Patrząc na średnie kroczące, które powstają w okresie od 20 do 100 dni, powszechnie uważa się za dobrą miarę średnioterminowego rozpędu. Ostatecznie, każda średnia ruchoma, która wykorzystuje 100 dni lub więcej w obliczeniach, może być używana jako miara długoterminowego rozpędu. Zdrowy rozsądek powinien Ci powiedzieć, że 15-dniowa średnia krocząca jest bardziej odpowiednią miarą krótkoterminowego rozpędu niż 200-dniowa średnia krocząca. Jedną z najlepszych metod określania siły i kierunku rozpędu aktywów jest umieszczenie trzech średnich ruchomych na wykresie, a następnie zwrócenie bacznej uwagi na to, jak układają się one względem siebie. Trzy średnie ruchome, które są ogólnie stosowane, mają różne ramy czasowe, próbując przedstawić krótkoterminowe, średnioterminowe i długoterminowe ruchy cen. Na wykresie 2 widać silny wzrost w górę, gdy krótkoterminowe wartości średnie znajdują się powyżej średnich długoterminowych, a dwie średnie są rozbieżne. Odwrotnie, gdy średnie krótkoterminowe znajdują się poniżej średnich długoterminowych, pęd jest skierowany w dół. Wsparcie Kolejnym typowym zastosowaniem średnich kroczących jest określenie potencjalnej ceny wsparcia. Nie ma dużego doświadczenia w radzeniu sobie ze średnią ruchomą, aby zauważyć, że spadająca cena składnika aktywów często zatrzyma się i odwróci kierunek na tym samym poziomie, co ważna średnia. Na przykład na wykresie 3 można zauważyć, że 200-dniowa średnia krocząca była w stanie podnieść cenę akcji po tym, jak spadła ona z jej wysokiego poziomu bliskim 32. Wielu inwestorów spodziewa się odbicia głównych średnich kroczących i wykorzysta inne wskaźniki techniczne jako potwierdzenie spodziewanego ruchu. Opór Gdy cena aktywów spadnie poniżej znaczącego poziomu wsparcia, takiego jak 200-dniowa średnia krocząca, nierzadko zdarza się, że średnia czynność stanowi silną barierę, która uniemożliwia inwestorom obniżanie ceny powyżej tej średniej. Jak widać z poniższego wykresu, opór ten jest często używany przez handlowców jako znak do czerpania zysków lub do zamykania wszelkich istniejących długich pozycji. Wiele krótkich sprzedawców będzie również używać tych średnich jako punktów wejścia, ponieważ cena często odbija się od oporu i kontynuuje ruch w dół. Jeśli jesteś inwestorem, który ma długą pozycję w aktywach, które są notowane poniżej głównych średnich kroczących, może być w twoim najlepszym interesie, aby uważnie obserwować te poziomy, ponieważ mogą one znacząco wpłynąć na wartość Twojej inwestycji. Stop-straty Charakterystyka nośności i oporu średnich kroczących sprawia, że ​​są doskonałym narzędziem do zarządzania ryzykiem. Zdolność do przesuwania średnich w celu identyfikacji strategicznych miejsc do ustalania zleceń stop-loss pozwala inwestorom odcinać przegrane pozycje, zanim będą mogli się powiększać. Jak widać na wykresie 5, inwestorzy, którzy utrzymują pozycję długą w magazynie i ustalają zlecenia stop-loss poniżej wpływowych średnich, mogą zaoszczędzić sporo pieniędzy. Używanie średnich ruchomych do ustawiania zleceń stop-loss jest kluczem do udanej strategii handlowej. Poruszanie się w średnich i wykładniczych modelach wygładzania Jako pierwszy krok w wychodzeniu poza modele średnie, modele spacerów losowych i modele trendów liniowych, wzorce i trendy niesezonowe można ekstrapolować za pomocą model średniej ruchomej lub wygładzający. Podstawowym założeniem modeli uśredniania i wygładzania jest to, że szeregi czasowe są lokalnie stacjonarne z wolno zmieniającą się średnią. W związku z tym bierzemy średnią ruchomą (lokalną), aby oszacować aktualną wartość średniej, a następnie wykorzystać ją jako prognozę na najbliższą przyszłość. Można to uznać za kompromis pomiędzy modelem średnim a modelem losowego chodzenia bez dryftu. Ta sama strategia może zostać wykorzystana do oszacowania i ekstrapolacji lokalnego trendu. Średnia ruchoma jest często nazywana wersją quotsmoothedquot oryginalnej serii, ponieważ krótkoterminowe uśrednianie ma wpływ na wygładzenie nierówności w oryginalnej serii. Dostosowując stopień wygładzenia (szerokość średniej ruchomej) możemy mieć nadzieję na uzyskanie optymalnej równowagi między wydajnością modeli średniej i losowej. Najprostszym rodzajem modelu uśredniającego jest. Prosta (równo ważona) Średnia ruchoma: Prognoza wartości Y w czasie t1, która jest dokonywana w czasie t, jest równa prostej średniej z ostatnich obserwacji: (Tu i gdzie indziej będę używał symbolu 8220Y-hat8221, aby stać dla prognozy szeregu czasowego Y dokonanego najwcześniej jak to możliwe wcześniej przez dany model.) Ta średnia jest wyśrodkowana w okresie t - (m1) 2, co oznacza, że ​​oszacowanie średniej lokalnej będzie opóźniać się w stosunku do rzeczywistej wartości wartość średniej lokalnej o około (m1) 2 okresy. Tak więc, mówimy, że średni wiek danych w prostej średniej kroczącej wynosi (m1) 2 w stosunku do okresu, dla którego obliczana jest prognoza: jest to ilość czasu, o którą prognozy będą opóźniać się za punktami zwrotnymi w danych . Na przykład, jeśli uśrednisz 5 ostatnich wartości, prognozy będą o około 3 opóźnienia w odpowiedzi na punkty zwrotne. Zauważ, że jeśli m1, model prostej średniej ruchomej (SMA) jest równoważny modelowi chodzenia swobodnego (bez wzrostu). Jeśli m jest bardzo duże (porównywalne z długością okresu szacowania), model SMA jest równoważny modelowi średniemu. Podobnie jak w przypadku każdego parametru modelu prognostycznego, zwyczajowo koryguje się wartość k, aby uzyskać najlepsze dopasowanie do danych, tj. Średnio najmniejsze błędy prognozy. Oto przykład serii, która wydaje się wykazywać losowe fluktuacje wokół wolno zmieniającej się średniej. Po pierwsze, spróbujmy dopasować go do modelu losowego spaceru, który jest odpowiednikiem prostej średniej kroczącej z 1 słowa: model losowego spaceru bardzo szybko reaguje na zmiany w serii, ale czyniąc to, wybiera dużą część quota w tekście. dane (fluktuacje losowe), a także quotsignalquot (średnia miejscowa). Jeśli zamiast tego spróbujemy prostej średniej kroczącej z 5 terminów, otrzymamy gładszy zestaw prognoz: Pięciokrotna prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego spaceru. Średni wiek danych w tej prognozie wynosi 3 ((51) 2), więc ma tendencję do pozostawania w tyle za punktami zwrotnymi o około trzy okresy. (Na przykład, pogorszenie koniunktury zdaje się mieć miejsce w okresie 21, ale prognozy nie zmieniają się aż do kilku okresów później.) Zwróć uwagę, że długoterminowe prognozy z modelu SMA są prostą poziomą, tak jak w przypadku losowego spaceru Model. Tak więc model SMA zakłada, że ​​nie ma trendu w danych. Jednakże, podczas gdy prognozy z modelu losowego spaceru są po prostu równe ostatniej obserwowanej wartości, prognozy z modelu SMA są równe średniej ważonej ostatnich wartości. Limity ufności obliczone przez Statgraphics dla długoterminowych prognoz prostej średniej kroczącej nie stają się szersze wraz ze wzrostem horyzontu prognozy. To oczywiście nie jest poprawne Niestety, nie istnieje żadna podstawowa teoria statystyczna, która mówi nam, w jaki sposób przedziały ufności powinny poszerzyć się dla tego modelu. Jednak nie jest zbyt trudno obliczyć empiryczne szacunki limitów zaufania dla prognoz o dłuższym horyzoncie. Można na przykład skonfigurować arkusz kalkulacyjny, w którym model SMA byłby używany do prognozowania 2 kroków do przodu, 3 kroków do przodu itp. W próbie danych historycznych. Następnie można obliczyć standardowe odchylenia standardowe błędów w każdym horyzoncie prognozy, a następnie skonstruować przedziały ufności dla prognoz długoterminowych, dodając i odejmując wielokrotności odpowiedniego odchylenia standardowego. Jeśli spróbujemy 9-dniowej prostej średniej kroczącej, otrzymamy jeszcze bardziej wygładzone prognozy i większy efekt opóźniający: Średni wiek to teraz 5 okresów ((91) 2). Jeśli weźmiemy 19-dniową średnią ruchomą, średnia wieku wzrośnie do 10: Należy zauważyć, że faktycznie prognozy są teraz opóźnione o punkty zwrotne o około 10 okresów. Jaka ilość wygładzania jest najlepsza dla tej serii Oto tabela, która porównuje ich statystyki błędów, w tym również średnią 3-dniową: Model C, 5-punktowa średnia ruchoma, daje najniższą wartość RMSE o niewielki margines w porównaniu z 3 - term i 9-term średnich, a ich inne statystyki są prawie identyczne. Tak więc, wśród modeli z bardzo podobnymi statystykami błędów, możemy wybrać, czy wolelibyśmy nieco większą reakcję, czy nieco większą płynność w prognozach. (Powrót do początku strony.) Browns Simple Exponential Smoothing (wykładniczo ważona średnia ruchoma) Opisany powyżej prosty model średniej ruchomej ma niepożądaną właściwość, że traktuje ostatnie k obserwacji równo i całkowicie ignoruje wszystkie poprzednie obserwacje. Intuicyjnie, przeszłe dane powinny być dyskontowane w bardziej stopniowy sposób - na przykład ostatnia obserwacja powinna mieć nieco większą wagę niż druga ostatnia, a druga ostatnia powinna mieć nieco większą wagę niż trzecia ostatnia; wkrótce. Wykonywany jest prosty model wygładzania wykładniczego (SES). Niech 945 oznacza stałą kwotową (liczbę od 0 do 1). Jednym ze sposobów napisania modelu jest zdefiniowanie serii L, która reprezentuje aktualny poziom (tj. Miejscową średnią wartość) serii oszacowanej na podstawie danych do chwili obecnej. Wartość L w czasie t jest obliczana rekurencyjnie z jego własnej poprzedniej wartości w następujący sposób: Zatem bieżącą wygładzoną wartością jest interpolacja między poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie 945 kontroluje bliskość interpolowanej wartości do najnowszej. obserwacja. Prognoza na następny okres jest po prostu bieżącą wygładzoną wartością: Równoważnie, możemy wyrazić następną prognozę bezpośrednio w odniesieniu do wcześniejszych prognoz i poprzednich obserwacji, w dowolnej z następujących równoważnych wersji. W pierwszej wersji prognozą jest interpolacja między poprzednią prognozą a poprzednią obserwacją: w drugiej wersji następna prognoza jest uzyskiwana przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu o wartość ułamkową 945. jest błąd popełniony przy czas t. W trzeciej wersji prognozą jest ważona ruchoma średnia ważona wykładniczo (tj. Zdyskontowana) ze współczynnikiem dyskontowym 1- 945: Wersja interpolacyjna formuły prognostycznej jest najprostsza do zastosowania, jeśli wdraża się model w arkuszu kalkulacyjnym: pasuje on do pojedyncza komórka i zawiera odwołania do komórek wskazujące poprzednią prognozę, poprzednią obserwację i komórkę, w której przechowywana jest wartość 945. Należy zauważyć, że jeśli model 945 1, model SES jest równoważny modelowi chodzenia swobodnego (bez wzrostu). Jeśli 945 0, model SES jest równoważny modelowi średniemu, przy założeniu, że pierwsza wygładzona wartość jest równa średniej. (Powrót do początku strony.) Średni wiek danych w prognozie wygładzania prostego wykładniczego wynosi 1 945 w stosunku do okresu, dla którego obliczana jest prognoza. (To nie powinno być oczywiste, ale można je łatwo wykazać, oceniając nieskończoną serię.) Dlatego prosta prognoza średniej ruchomej ma tendencję do pozostawania w tyle za punktami zwrotnymi o około 1 945 okresów. Na przykład, gdy 945 0,5 opóźnienie wynosi 2 okresy, gdy 945 ± 0,2 opóźnienie wynosi 5 okresów, gdy 945 ± 0,1 opóźnienie wynosi 10 okresów, i tak dalej. Dla danego średniego wieku (to jest ilości opóźnienia), prosta prognoza wygładzania wykładniczego (SES) jest nieco lepsza od prognozy prostej średniej ruchomej (SMA), ponieważ umieszcza względnie większą wagę w najnowszej obserwacji - ie. jest nieco bardziej obojętny na zmiany zachodzące w niedawnej przeszłości. Na przykład model SMA z 9 terminami i model SES z 945 0.2 mają średnią wieku 5 lat dla danych w swoich prognozach, ale model SES przykłada większą wagę do ostatnich 3 wartości niż model SMA i do w tym samym czasie nie ma w całości 8220forget8222 o wartościach większych niż 9 okresów, jak pokazano na tym wykresie: Kolejną ważną zaletą modelu SES w porównaniu z modelem SMA jest to, że model SES używa parametru wygładzania, który jest nieustannie zmienny, dzięki czemu można go łatwo zoptymalizować za pomocą algorytmu quotsolverquot, aby zminimalizować błąd średniokwadratowy. Optymalna wartość 945 w modelu SES dla tej serii okazuje się być 0,2961, jak pokazano tutaj: Średni wiek danych w tej prognozie wynosi 10,2961 3,4 okresów, co jest podobne do 6-okresowej prostej średniej kroczącej. Prognozy długoterminowe z modelu SES są prostą poziomą. jak w modelu SMA i modelu chodzenia bez wzrostu. Należy jednak zauważyć, że przedziały ufności obliczone przez Statgraphics teraz rozchodzą się w rozsądny sposób, i że są one znacznie węższe niż przedziały ufności dla modelu losowego spaceru. Model SES zakłada, że ​​seria jest w pewnym stopniu przewidywalna, podobnie jak model losowego spaceru. Model SES jest w rzeczywistości szczególnym przypadkiem modelu ARIMA. więc teoria statystyczna modeli ARIMA zapewnia solidną podstawę do obliczania przedziałów ufności dla modelu SES. W szczególności model SES jest modelem ARIMA z jedną niesezonową różnicą, terminem MA (1) i nie ma stałego okresu. inaczej znany jako model DAIMA (0,1,1) bez stałej wartości. Współczynnik MA (1) w modelu ARIMA odpowiada ilości 1-945 w modelu SES. Na przykład, jeśli dopasujesz model ARIMA (0,1,1) bez stałej do analizowanej tutaj serii, szacowany współczynnik MA (1) okaże się równy 0,7029, czyli prawie dokładnie jeden minus 0,2961. Możliwe jest dodanie do modelu SES założenia niezerowego stałego trendu liniowego. Aby to zrobić, po prostu określ model ARIMA z jedną niesezonową różnicą i terminem MA (1) ze stałą, tj. Model ARIMA (0,1,1) ze stałą. Prognozy długoterminowe będą miały tendencję równą średniej tendencji obserwowanej w całym okresie szacowania. Nie można tego zrobić w połączeniu z korektą sezonową, ponieważ opcje korekty sezonowej są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stały, długotrwały trend wykładniczy do prostego modelu wygładzania wykładniczego (z korektą sezonową lub bez niego) za pomocą opcji korekty inflacji w procedurze prognozowania. Odpowiednia stopa inflacji (procent wzrostu) na okres może być oszacowana jako współczynnik nachylenia w liniowym modelu trendu dopasowany do danych w połączeniu z logarytmem naturalnym, lub może być oparty na innych, niezależnych informacjach dotyczących długoterminowych perspektyw wzrostu . (Powrót do początku strony.) Browns Linear (tzn. Podwójnie) Exponential Smoothing Modele SMA i modele SES zakładają, że nie ma żadnego trendu w danych (co jest zwykle w porządku lub przynajmniej niezbyt dobre dla 1 prognozy wyprzedzające, gdy dane są stosunkowo hałaśliwe) i mogą być modyfikowane w celu włączenia stałego trendu liniowego, jak pokazano powyżej. A co z trendami krótkoterminowymi Jeśli w serii pojawiają się zmienne stopy wzrostu lub cykliczny wzór, który wyraźnie odróżnia się od hałasu, i jeśli istnieje potrzeba przewidywania z wyprzedzeniem dłuższym niż 1 okres, wówczas można również oszacować trend lokalny. problem. Prosty model wygładzania wykładniczego można uogólnić, aby uzyskać liniowy model wygładzania wykładniczego (LES), który oblicza lokalne oszacowania zarówno poziomu, jak i trendu. Najprostszym modelem trendu zmiennym w czasie jest liniowy model wygładzania wykładniczego Browns, który wykorzystuje dwie różne wygładzone serie, które są wyśrodkowane w różnych punktach czasowych. Formuła prognozowania opiera się na ekstrapolacji linii przez dwa ośrodki. (Bardziej wyrafinowana wersja tego modelu, Holt8217s, jest omówiona poniżej.) Algebraiczna postać liniowego modelu wygładzania wykładniczego Brown8217, podobnie jak model prostego wykładniczego wygładzania, może być wyrażana w wielu różnych, ale równoważnych formach. "Norma" w tym modelu jest zwykle wyrażana następująco: Niech S oznacza serie wygładzone pojedynczo, otrzymane przez zastosowanie prostego wygładzania wykładniczego dla szeregu Y. Oznacza to, że wartość S w okresie t jest określona przez: (Przypomnijmy, że w prostym wygładzanie wykładnicze, to byłaby prognoza dla Y w okresie t1.) Następnie pozwól oznaczać wygładzoną podwójnie serię uzyskaną przez zastosowanie prostego wygładzania wykładniczego (używając tego samego 945) do serii S: Wreszcie, prognozy dla Y tk. dla każdego kgt1, jest podana przez: To daje e 1 0 (to jest trochę oszukiwać, i niech pierwsza prognoza równa się faktycznej pierwszej obserwacji), i e 2 Y 2 8211 Y 1. po którym prognozy są generowane za pomocą równania powyżej. Daje to takie same dopasowane wartości, jak formuła oparta na S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1. Ta wersja modelu jest używana na następnej stronie ilustrującej połączenie wygładzania wykładniczego z korektą sezonową. Holt8217s Linear Exponential Smoothing Brown8217s Model LES oblicza lokalne oszacowania poziomu i trendu, wygładzając najnowsze dane, ale fakt, że robi to za pomocą pojedynczego parametru wygładzania, nakłada ograniczenia na wzorce danych, które może dopasować: poziom i trend nie mogą się różnić w niezależnych stawkach. Model LES Holt8217s rozwiązuje ten problem, włączając dwie stałe wygładzania, jedną dla poziomu i drugą dla trendu. W każdej chwili t, jak w modelu Brown8217s, istnieje oszacowanie Lt poziomu lokalnego i oszacowanie T t trendu lokalnego. Tutaj są one obliczane rekurencyjnie od wartości Y obserwowanej w czasie t oraz poprzednich oszacowań poziomu i trendu za pomocą dwóch równań, które oddzielnie stosują wygładzanie wykładnicze. Jeżeli szacowany poziom i tendencja w czasie t-1 to L t82091 i T t-1. odpowiednio, wówczas prognoza dla Y tshy, która zostałaby dokonana w czasie t-1, jest równa L t-1 T t-1. Gdy obserwowana jest wartość rzeczywista, zaktualizowana estymacja poziomu jest obliczana rekurencyjnie poprzez interpolację między Y tshy i jej prognozą L t-1 T t-1, przy użyciu wag o wartości 945 i 1-945. Zmiana szacowanego poziomu, mianowicie L t 8209 L t82091. można interpretować jako hałaśliwy pomiar trendu w czasie t. Zaktualizowane oszacowanie trendu jest następnie obliczane rekursywnie przez interpolację pomiędzy L t 8209 L t82091 a poprzednim oszacowaniem trendu, T t-1. używając ciężarów 946 i 1-946: Interpretacja stałej wygładzania trendu 946 jest analogiczna do stałej wygładzania poziomu 945. Modele o małych wartościach 946 przyjmują, że trend zmienia się bardzo powoli w czasie, podczas gdy modele z większe 946 zakłada, że ​​zmienia się szybciej. Model z dużym 946 uważa, że ​​odległe jutro jest bardzo niepewne, ponieważ błędy w oszacowaniu trendów stają się dość ważne przy prognozowaniu z więcej niż jednym okresem. (Powrót do początku strony.) Stałe wygładzania 945 i 946 można oszacować w zwykły sposób, minimalizując średni błąd kwadratowy prognoz 1-krokowych. Po wykonaniu tej czynności w Statgraphics, szacunkowe wartości wynoszą 945 0,3048 i 946 0,008. Bardzo mała wartość wynosząca 946 oznacza, że ​​model przyjmuje bardzo niewielką zmianę trendu z jednego okresu do drugiego, więc w zasadzie ten model próbuje oszacować długoterminowy trend. Analogicznie do pojęcia średniego wieku danych wykorzystywanych do szacowania lokalnego poziomu szeregu, średni wiek danych wykorzystywanych do oszacowania lokalnego trendu jest proporcjonalny do 1 946, chociaż nie jest dokładnie taki sam jak ten. . W tym przypadku okazuje się, że jest to 10.006 125. Nie jest to bardzo dokładna liczba, ponieważ dokładność oszacowania 946 wynosi 2182 tak naprawdę 3 miejsca po przecinku, ale jest tego samego ogólnego rzędu wielkości co wielkość próby 100, więc model ten uśrednia dość długą historię w szacowaniu trendu. Poniższy wykres prognozy pokazuje, że model LES szacuje nieco większy lokalny trend na końcu serii niż stały trend oszacowany w modelu SEStrend. Szacowana wartość 945 jest prawie identyczna z wartością uzyskaną przez dopasowanie modelu SES z trendem lub bez niego, więc jest to prawie ten sam model. Teraz, czy wyglądają one jak rozsądne prognozy dla modelu, który ma oszacować lokalny trend Jeśli wyobrazisz sobie 8220eyeball8221 ten wykres, wygląda na to, że lokalny trend spadł na końcu serii Co się stało Parametry tego modelu zostały oszacowane poprzez zminimalizowanie błędu kwadratów prognoz 1-krok naprzód, a nie prognoz długoterminowych, w którym to przypadku trend doesn8217t robi dużą różnicę. Jeśli wszystko, na co patrzysz, to błędy 1-etapowe, nie widzisz większego obrazu trendów w ciągu (powiedzmy) 10 lub 20 okresów. Aby uzyskać ten model lepiej dopasowany do ekstrapolacji danych przez gałkę oczną, możemy ręcznie dostosować stałą wygładzania trendu, aby wykorzystała krótszą linię podstawową do oszacowania trendu. Na przykład, jeśli zdecydujemy się ustawić 946 0,1, średnia wieku danych wykorzystywanych do oszacowania trendu lokalnego wynosi 10 okresów, co oznacza, że ​​uśredniamy trend w ciągu ostatnich 20 okresów. Tutaj wygląda to, jak wygląda prognoza, jeśli ustawimy 946 0,1, zachowując 945 0.3. Jest to intuicyjnie uzasadnione dla tej serii, chociaż prawdopodobnie ekstrapolowanie tego trendu prawdopodobnie nie będzie dłuższe niż 10 okresów w przyszłości. A co ze statystykami błędów? Oto porównanie modeli dla dwóch modeli pokazanych powyżej oraz trzech modeli SES. Optymalna wartość 945. Dla modelu SES wynosi około 0,3, ale podobne wyniki (z odpowiednio mniejszą lub większą reaktywnością) uzyskuje się przy 0,5 i 0,2. (A) Holts linear exp. wygładzanie z alfa 0,3048 i beta 0,008 (B) Holts linear exp. wygładzanie z alfa 0.3 i beta 0.1 (C) Proste wygładzanie wykładnicze z alfa 0.5 (D) Proste wygładzanie wykładnicze z alfa 0.3 (E) Proste wygładzanie wykładnicze z alfa 0.2 Ich statystyki są prawie identyczne, więc naprawdę nie możemy dokonać wyboru na podstawie błędów prognozy 1-krokowej w ramach próby danych. Musimy odwołać się do innych kwestii. Jeśli mocno wierzymy, że oparcie obecnego szacunku trendu na tym, co wydarzyło się w ciągu ostatnich 20 okresów, ma sens, możemy postawić argumenty za modelem LES z 945 0,3 i 946 0,1. Jeśli chcemy być agnostyczni w kwestii, czy istnieje lokalny trend, to jeden z modeli SES może być łatwiejszy do wyjaśnienia, a także dałby więcej prognoz z centrum drogi na następne 5 lub 10 okresów. (Powrót do początku strony.) Który rodzaj ekstrapolacji trendów jest najlepszy: poziomy lub liniowy Dowody empiryczne sugerują, że jeśli dane zostały już skorygowane (w razie potrzeby) o inflację, może być nieostrożnością ekstrapolować krótkoterminowe liniowe trendy bardzo daleko w przyszłość. Dzisiejsze trendy mogą się w przyszłości zanikać ze względu na różne przyczyny, takie jak starzenie się produktów, zwiększona konkurencja i cykliczne spadki lub wzrosty w branży. Z tego powodu proste wygładzanie wykładnicze często zapewnia lepszą pozapróbkę, niż można by się tego spodziewać, pomimo cytowania ekwiwalentnej tendencji poziomej. Tłumione modyfikacje trendów liniowego modelu wygładzania wykładniczego są również często stosowane w praktyce, aby wprowadzić nutę konserwatyzmu do swoich projekcji trendów. Model LES z tłumioną tendencją może być zaimplementowany jako specjalny przypadek modelu ARIMA, w szczególności modelu ARIMA (1,1,2). Możliwe jest obliczenie przedziałów ufności wokół długoterminowych prognoz generowanych przez modele wygładzania wykładniczego, poprzez uznanie ich za szczególne przypadki modeli ARIMA. (Uwaga: nie wszystkie programy poprawnie obliczają przedziały ufności dla tych modeli). Szerokość przedziałów ufności zależy od (i) błędu RMS modelu, (ii) rodzaju wygładzania (prostego lub liniowego) (iii) wartości (s) stałej (ów) wygładzania (-ych) i (iv) liczbę okresów, które prognozujesz. Ogólnie rzecz biorąc, interwały rozkładają się szybciej, gdy 945 staje się większy w modelu SES i rozkładają się znacznie szybciej, gdy stosuje się liniowe zamiast prostego wygładzania. Ten temat jest omówiony dalej w sekcji modeli ARIMA notatek. (Powrót do początku strony.) W praktyce średnia ruchoma zapewni dobre oszacowanie średniej serii czasowych, jeśli średnia jest stała lub powoli się zmienia. W przypadku stałej średniej, największa wartość m da najlepsze oszacowanie podstawowej średniej. Dłuższy okres obserwacji uśredni skutki zmienności. Celem zapewnienia mniejszego m jest umożliwienie prognozie reakcji na zmianę w leżącym u jej podstaw procesie. Aby to zilustrować, proponujemy zestaw danych, który uwzględnia zmiany w średniej bazowej szeregu czasowego. Na rysunku przedstawiono serie czasowe stosowane do ilustracji wraz ze średnim zapotrzebowaniem, z którego wygenerowano serię. Średnia rozpoczyna się jako stała przy 10. Zaczynając od czasu 21, zwiększa się o jedną jednostkę w każdym okresie, aż osiągnie wartość 20 w czasie 30. Następnie staje się stała ponownie. Dane są symulowane przez dodanie do średniej, losowego szumu z rozkładu normalnego ze średnią zerową i odchyleniem standardowym 3. Wyniki symulacji są zaokrąglane do najbliższej liczby całkowitej. Tabela pokazuje symulowane obserwacje stosowane dla przykładu. Kiedy używamy tabeli, musimy pamiętać, że w danym momencie znane są tylko przeszłe dane. Szacunki parametru modelu, dla trzech różnych wartości m są przedstawione razem ze średnią serii czasowych na poniższym rysunku. Rysunek pokazuje średnie ruchome oszacowanie średniej za każdym razem, a nie prognozę. Prognozy przesuwają krzywą średniej ruchomej w prawo o okresy. Jeden wniosek jest natychmiast widoczny na rysunku. We wszystkich trzech szacunkach średnia ruchoma pozostaje w tyle za trendem liniowym, przy czym opóźnienie wzrasta wraz z m. Opóźnienie jest odległością między modelem a oszacowaniem w wymiarze czasowym. Z powodu opóźnienia średnia ruchoma nie docenia obserwacji, gdy średnia rośnie. Przeciążeniem estymatora jest różnica w określonym czasie w wartości średniej modelu i średniej wartości przewidywanej przez średnią ruchomą. Przeciążenie, gdy średnia rośnie, jest ujemne. Dla zmniejszenia średniej odchylenie jest dodatnie. Opóźnienie w czasie i odchylenie wprowadzone w oszacowaniu są funkcjami m. Im większa wartość m. im większa jest wielkość opóźnienia i stronniczości. Dla ciągle rosnącej serii z trendem a. wartości opóźnień i stronniczości estymatora średniej podano w równaniach poniżej. Krzywe przykładowe nie pasują do tych równań, ponieważ przykładowy model nie zwiększa się w sposób ciągły, raczej zaczyna się jako stała, zmienia się w trend, a następnie staje się stały. Również krzywe przykładowe są zakłócane przez szum. Prognozę ruchomych średnich okresów w przyszłości reprezentuje przesuwanie krzywych w prawo. Opóźnienie i odchylenie zwiększają się proporcjonalnie. Poniższe równania wskazują opóźnienie i odchylenie okresów prognozy w przyszłości w porównaniu do parametrów modelu. Ponownie, formuły te są dla szeregu czasowego ze stałym trendem liniowym. Nie powinniśmy być zaskoczeni tym wynikiem. Estymator średniej ruchomej opiera się na założeniu stałej średniej, a przykład ma tendencję liniową w średniej podczas części okresu badania. Ponieważ serie czasu rzeczywistego rzadko będą dokładnie przestrzegać założeń dowolnego modelu, powinniśmy być przygotowani na takie wyniki. Z rysunku można również wyciągnąć wniosek, że zmienność hałasu ma największy wpływ na mniejsze m. Oszacowanie to jest dużo bardziej zmienne dla średniej kroczącej wynoszącej 5 niż średnia krocząca wynosząca 20. Mamy sprzeczne pragnienia zwiększenia m, aby zmniejszyć efekt zmienności z powodu hałasu, i zmniejszyć m, aby prognoza lepiej reagowała na zmiany w średniej. Błąd jest różnicą między rzeczywistymi danymi a prognozowaną wartością. Jeżeli szereg czasowy jest rzeczywiście stałą wartością, oczekiwana wartość błędu wynosi zero, a wariancja błędu składa się z terminu będącego funkcją drugiego i będącego wariancją szumu,. Pierwszy termin to wariancja średniej oszacowanej z próbką m obserwacji, przy założeniu, że dane pochodzą z populacji o stałej średniej. Termin ten jest minimalizowany przez uczynienie m tak dużym, jak to możliwe. Duży m sprawia, że ​​prognoza nie reaguje na zmiany w podstawowych szeregach czasowych. Aby prognoza była responsywna dla zmian, chcemy m tak małe, jak to możliwe (1), ale to zwiększa wariancję błędu. Praktyczne prognozowanie wymaga wartości pośredniej. Prognozowanie za pomocą Excela Dodatek Forecasting implementuje średnie ruchome formuły. Poniższy przykład pokazuje analizę dostarczoną przez dodatek dla przykładowych danych w kolumnie B. Pierwsze 10 obserwacji jest indeksowanych od -9 do 0. W porównaniu do powyższej tabeli, indeksy okresu są przesuwane o -10. Pierwsze dziesięć obserwacji dostarcza wartości początkowe dla oszacowania i są używane do obliczenia średniej ruchomej dla okresu 0. Kolumna MA (10) (C) pokazuje obliczone średnie ruchome. Parametr m średniej ruchomej znajduje się w komórce C3. Kolumna Fore (1) (D) pokazuje prognozę na jeden okres w przyszłości. Interwał prognozy znajduje się w komórce D3. Gdy przedział prognozy zostanie zmieniony na większą liczbę, liczby w kolumnie "Fore" zostaną przesunięte w dół. Kolumna Err (1) (E) pokazuje różnicę między obserwacją a prognozą. Na przykład obserwacja w czasie 1 to 6. Prognozowana wartość wykonana z średniej ruchomej w czasie 0 wynosi 11,1. Błąd wynosi więc -5.1. Odchylenie standardowe i średnie odchylenie średnie (MAD) są obliczane odpowiednio w komórkach E6 i E7.

No comments:

Post a Comment