Методи аналізу часових рядів. Тимчасовий ряд Статистичні методи аналізу часових рядів

АНАЛІЗ ТИМЧАСОВИХ РЯДІВ


ВСТУП

РОЗДІЛ 1. АНАЛІЗ ТИМЧАСОВИХ РЯДІВ

1.1 ТИМЧАСОВИЙ РЯД І ЙОГО ОСНОВНІ ЕЛЕМЕНТИ

1.2 АВТОКОРРЕЛЯЦІЯ РІВНЬОГО ТИМЧАСОВОГО РЯДУ І ВИЯВЕННЯ ЙОГО СТРУКТУРИ

1.3 МОДЕЛЮВАННЯ ТЕНДЕНЦІЇ ТИМЧАСОВОГО РЯДУ

1.4 МЕТОД НАЙМЕНШИХ КВАДРАТІВ

1.5 ПРИВЕДЕННЯ РІВНЯННЯ ТРЕНДА ДО ЛІНІЙНОГО ВИДУ

1.6 ОЦІНКА ПАРАМЕТРІВ РІВНЯННЯ РЕГРЕСІЇ

1.7 АДДИТИВНА ТА МУЛЬТИПЛІКАТИВНА МОДЕЛІ ТИМЧАСОВОГО РЯДУ

1.8 СТАЦІОНАРНІ ТИМЧАСОВІ РЯДИ

1.9 ЗАСТОСУВАННЯ ШВИДКОГО ПЕРЕТВОРЕННЯ ФУР'Є ДО СТАЦІОНАРНОГО ЧАСОВОГО РЯДУ

1.10 АВТОКОРРЕЛЯЦІЯ ЗАЛИШКІВ. КРИТЕРІЙ ДАРБІНА-УОТСОНА

Вступ

Майже в кожній області зустрічаються явища, які цікаво та важливо вивчати у їх розвитку та зміні у часі. У повсякденному житті можуть становити інтерес, наприклад, метеорологічні умови, ціни на той чи інший товар, ті чи інші характеристики стану здоров'я індивіда і т. д. Усі вони змінюються у часі. З часом змінюються ділова активність, режим перебігу тієї чи іншої виробничого процесу, глибина сну людини, сприйняття телевізійної програми. Сукупність вимірювань будь-якої однієї подібної характеристики протягом деякого періоду часу являють собою тимчасовий ряд.

Сукупність існуючих методів аналізу таких рядів спостережень називається аналізом часових рядів.

Основною рисою, що виділяє аналіз часових рядів серед інших видів статистичного аналізу, є суттєвість порядку, у якому проводяться спостереження. Якщо у багатьох завданнях спостереження статистично незалежні, то у часових рядах вони, як правило, залежні, і характер цієї залежності може визначатися становищем спостережень у послідовності. Природа ряду і структура, що породжує ряд процесу, можуть визначати порядок утворення послідовності.

Цільроботи полягає в отриманні моделі для дискретного часового ряду в часовій області, що має максимальну простоту і мінімальне число параметрів і при цьому адекватно описує спостереження.

Отримання такої моделі важливе з таких причин:

1) вона може допомогти зрозуміти природу системи, що генерує часові лави;

2) керувати процесом, що породжує ряд;

3) її можна використовуватиме оптимального прогнозування майбутніх значень часових рядів;

Тимчасові ряди найкраще описуються нестаціонарними моделями,в яких тренди та інші псевдостійкі характеристики, які, можливо, змінюються в часі, розглядаються скоріше як статистичні, а не детерміновані явища. Крім того, тимчасові ряди, пов'язані з економікою, часто мають помітні сезонними, або періодичними компонентами; ці компоненти можуть змінюватися в часі та повинні описуватись циклічними статистичними (можливо, нестаціонарними) моделями.

Нехай тимчасовим рядом, що спостерігається, є y 1 , y 2 , . . ., y n . Ми розумітимемо цей запис наступним чином. Є Т чисел, що являють собою спостереження деякою змінною в Т рівновіддалених моментів часу. Ці моменти зручності пронумеровані цілими числами 1, 2, . . .,Т. Достатньо загальною математичною (статистичною або імовірнісною) моделлю служить модель виду:

y t = f(t) + u t , t = 1, 2, . . ., T.

У цій моделі ряд, що спостерігається, розглядається як сума деякої повністю детермінованої послідовності (f(t)), яку можна назвати математичною складовою, і випадкової послідовності (u t ), що підпорядковується деякому імовірнісному закону. (І іноді для цих двох складових використовуються відповідно терміни сигнал та шум). Ці компоненти спостережуваного ряду не спостерігаються; є теоретичними величинами. Точний зміст зазначеного розкладання залежить тільки від даних, але частково і від того, що розуміється під повторенням експерименту, результатом якого є ці дані. Тут використовується так звана "частотна" інтерпретація. Вважається, що принаймні принципово можна повторювати всю ситуацію цілком, отримуючи нові сукупності спостережень. Випадкові складові, крім усього іншого, можуть включати помилки спостережень.

У цій роботі розглянуто модель часового ряду, в якій на тренд накладається випадкова складова, що утворює випадковий стаціонарний процес. У такій моделі передбачається, що протягом часу ніяк не відбивається на випадковій складовій. Точніше кажучи, передбачається, що математичне очікування (тобто середнє значення) випадкової складової тотожно дорівнює нулю, дисперсія дорівнює деякій постійній і що значення u t у різні моменти часу некорельовані. Таким чином, будь-яка залежність від часу включається до систематичної складової f(t). Послідовність f(t) може залежати від деяких невідомих коефіцієнтів та від відомих величин, що змінюються з часом. І тут її називають «функцією регресії». Методи статистичних висновків для коефіцієнтів функції регресії виявляються корисними у багатьох галузях статистики. Своєрідність методів, які стосуються саме часових рядів, у тому, що тут досліджуються ті моделі, у яких згадані вище величини, змінюються згодом, є відомими функціями t.


Глава 1. Аналіз часових рядів

1.1 Тимчасовий ряд та його основні елементи

Тимчасовий ряд - це сукупність значень будь-якого показника за кілька послідовних моментів або періодів часу. Кожен рівень часового ряду формується під впливом великої кількості факторів, які умовно можна поділити на три групи:

· Фактори, що формують тенденцію ряду;

· Фактори, що формують циклічні коливання ряду;

· Випадкові фактори.

При різних поєднаннях у досліджуваному процесі чи явищі цих чинників залежність рівнів часом може приймати різні форми. По першеБільшість тимчасових рядів економічних показників мають тенденцію, що характеризує довготривале сукупне вплив безлічі факторів на динаміку досліджуваного показника. Очевидно, що ці фактори, взяті окремо, можуть різноспрямовано впливати на досліджуваний показник. Однак у сукупності вони формують його зростаючу чи спадну тенденцію.

По-друге,досліджуваний показник може бути схильний до циклічних коливань. Ці коливання можуть мати сезонний характер, оскільки діяльність низки галузей економіки та сільського господарства залежить від пори року. За наявності великих масивів даних за тривалі проміжки часу можна виявити циклічні коливання, пов'язані із загальною динамікою часового ряду.

Деякі часові ряди не містять тенденції та циклічної компоненти, а кожен наступний їхній рівень утворюється як сума середнього рівня ряду та деякої (позитивної або негативної) випадкової компоненти.

Найчастіше фактичний рівень часового ряду можна як суму чи твір трендової, циклічної і випадкової компонент. Модель, в якій часовий ряд представлений як сума перерахованих компонентів, називається адитивною моделлютимчасового ряду. Модель, у якій часовий ряд представлений як добуток перерахованих компонентів, називається мультиплікативною моделлютимчасового ряду. Основне завдання статистичного дослідження окремого часового ряду – виявлення та надання кількісного виразу кожної з перерахованих вище компонентів з тим, щоб використовувати отриману інформацію для прогнозування майбутніх значень ряду.

1.2 Автокореляція рівнів часового ряду та виявлення його структури

За наявності у часовому ряді тенденції та циклічних коливань значення кожного наступного рівня ряду залежать від попередніх. Кореляційну залежність між послідовними рівнями часового ряду називають автокореляцією рівнів ряду.

Кількісно її можна виміряти за допомогою лінійного коефіцієнта кореляції між рівнями вихідного часового ряду та рівнями цього ряду, зрушеними на кілька кроків у часі.

Одна з робочих формул для розрахунку коефіцієнта автокореляції має вигляд:

(1.2.1)

Як змінну х ми розглянемо ряд y 2, y 3, …, y n; як змінну у – ряд y 1 , y 2 , . . . ,y n - 1 . Тоді наведена вище формула набуде вигляду:

(1.2.2)

Аналогічно можна визначити коефіцієнти автокореляції другого та вищих порядків. Так, коефіцієнт автокореляції другого порядку характеризує тісноту зв'язку між рівнями у t та y t – 1 і визначається за формулою

(1.2.3)

Число періодів, за якими розраховується коефіцієнт автокореляції, називають лагом. Зі збільшенням лага число пар значень, якими розраховується коефіцієнт автокореляції, зменшується. Деякі автори вважають за доцільне для забезпечення статистичної достовірності коефіцієнтів автокореляції використовувати правило – максимальний лаг має бути не більше (n/4).

У трьох попередніх нотатках описані регресійні моделі, що дозволяють прогнозувати відгук за значеннями змінних, що пояснюють. У цій замітці ми покажемо, як за допомогою цих моделей та інших статистичних методів аналізувати дані, зібрані протягом послідовних часових інтервалів. Відповідно до особливостей кожної компанії, згаданої у сценарії, ми розглянемо три альтернативні підходи до аналізу часових рядів.

Матеріал буде проілюстрований наскрізним прикладом: прогнозування доходів трьох компаній. Уявіть собі, що ви працюєте аналітиком у великій фінансовій компанії. Щоб оцінити інвестиційні перспективи своїх клієнтів, необхідно передбачити доходи трьох компаній. Для цього ви зібрали дані про три цікаві для вас компанії - Eastman Kodak, Cabot Corporation і Wal-Mart. Оскільки компанії розрізняються за видом ділової активності, кожен тимчасовий ряд має свої унікальні особливості. Отже, для прогнозування необхідно застосовувати різні моделі. Як вибрати найкращу модель прогнозування для кожної компанії? Як оцінити інвестиційні перспективи з урахуванням результатів прогнозування?

Обговорення розпочинається з аналізу щорічних даних. Демонструються два методи згладжування таких даних: ковзне середнє та експоненційне згладжування. Потім демонструється процедура обчислення тренду за допомогою методу найменших квадратів та складніші методи прогнозування. Насамкінець, ці моделі поширюються на тимчасові ряди, побудовані з урахуванням щомісячних чи щоквартальних даних.

Завантажити нотатку у форматі або , приклади у форматі

Прогнозування у бізнесі

Оскільки економічні умови з часом змінюються, менеджери повинні прогнозувати вплив, який ці зміни вплинуть на їхню компанію. Одним із методів, що дозволяють забезпечити точне планування, є прогнозування. Незважаючи на велику кількість розроблених методів, всі вони мають одну й ту саму мету - передбачити події, які відбудуться в майбутньому, щоб врахувати їх при розробці планів та стратегії розвитку компанії.

Сучасне суспільство постійно відчуває потребу у прогнозуванні. Наприклад, щоб виробити правильну політику, урядовці мають прогнозувати рівні безробіття, інфляції, промислового виробництва, прибуткового податку окремих осіб та корпорацій. Щоб визначити потреби в обладнанні та персоналі, директори авіакомпаній повинні правильно передбачити обсяг авіаперевезень. Для того, щоб створити достатню кількість місць у гуртожитку, адміністратори коледжів чи університетів хочуть знати, скільки студентів надійдуть до їхнього навчального закладу наступного року.

Існують два загальноприйняті підходи до прогнозування: якісний та кількісний. Методи якісного прогнозування є особливо важливими, якщо досліднику недоступні кількісні дані. Як правило, ці методи мають дуже суб'єктивний характер. Якщо статистику доступні дані історії об'єкта дослідження, слід застосовувати методи кількісного прогнозування. Ці методи дозволяють передбачити стан об'єкта у майбутньому з урахуванням даних про його минуле. Методи кількісного прогнозування поділяються на дві категорії: аналіз часових рядів та методи аналізу причинно-наслідкових залежностей.

Тимчасовий ряд- це набір числових даних, одержаних протягом послідовних періодів часу. Метод аналізу часових рядів дозволяє передбачити значення числової змінної на основі її минулих та справжніх значень. Наприклад, щоденні котирування акцій на Нью-Йоркській фондовій біржі утворюють тимчасовий ряд. Іншим прикладом часового ряду є щомісячні значення індексу споживчих цін, щоквартальні величини валового внутрішнього продукту та щорічні доходи від продажу якоїсь компанії.

Методи аналізу причинно-наслідкових залежностейдозволяють визначити, які чинники впливають значення прогнозованої змінної. До них відносяться методи множинного регресійного аналізу із змінними, що запізнюються, економетричне моделювання, аналіз лідируючих індикаторів, методи аналізу дифузійних індексів та інших економічних показників. Ми розповімо лише про методи прогнозування на основі аналізу часів ых рядів.

Компоненти класичної мультиплікативної моделі часу ых рядів

Основне припущення, що лежить в основі аналізу часових рядів, полягає в наступному: фактори, що впливають на досліджуваний об'єкт у теперішньому та минулому, впливатимуть на нього та в майбутньому. Таким чином, основні цілі аналізу часових рядів полягають у ідентифікації та виділенні факторів, що мають значення для прогнозування. Щоб досягти цієї мети, було розроблено багато математичних моделей, призначених для дослідження коливань компонентів, що входять до моделі часового ряду. Ймовірно, найпоширенішою є класична мультиплікативна модель для щорічних, щоквартальних та щомісячних даних. Для демонстрації класичної мультиплікативної моделі часових рядів розглянемо дані фактичних доходах компанії Wm.Wrigley Jr. Company за період з 1982 по 2001 роки (рис. 1).

Мал. 1. Графік фактичного валового прибутку компанії Wm.Wrigley Jr. Company (млн. дол. у поточних цінах) за період з 1982 по 2001 роки

Як бачимо, протягом 20 років фактичний валовий дохід компанії мав зростаючу тенденцію. Ця довготривала тенденція називається трендом. Тренд- не єдиний компонент часового ряду. Крім нього, дані мають циклічний та нерегулярний компоненти. Циклічний компонентвизначає коливання даних вгору і вниз, часто корелюючи з циклами ділової активності. Його довжина змінюється в інтервалі від 2 до 10 років. Інтенсивність, або амплітуда, циклічного компонента також непостійна. У деякі роки дані можуть бути вищими за значення, передбачене трендом (тобто перебувати в околиці піку циклу), а в інші роки - нижче (тобто бути на дні циклу). Будь-які дані, що спостерігаються, не лежать на кривій тренда і не підпорядковуються циклічній залежності, називаються іррегулярними або випадковими компонентами. Якщо дані записуються щодня або щокварталу, виникає додатковий компонент, що називається сезонним. Усі компоненти часових рядів, притаманних економічних додатків, наведено на рис. 2.

Мал. 2. Чинники, що впливають на тимчасові ряди

Класична мультиплікативна модель часового ряду стверджує, що будь-яке значення, що спостерігається, є твором перерахованих компонентів. Якщо дані є щорічними, спостереження Yi, відповідне i-му році, виражається рівнянням:

(1) Y i = T i* C i* I i

де T i- значення тренду, C i i-му році, I i i-му році.

Якщо дані вимірюються щомісяця чи щокварталу, спостереження Y i, Що відповідає i-му періоду, виражається рівнянням:

(2) Y i = T i *S i *C i *I i

де T i- значення тренду, S i- значення сезонного компонента в i-ом періоді, C i- значення циклічного компонента в i-ом періоді, I i- значення випадкового компонента в i-ом періоді.

У першому етапі аналізу часових рядів будується графік даних, і виявляється їх залежність від часу. Спочатку необхідно з'ясувати, чи існує довготривале зростання або спадання даних (тобто тренд), чи тимчасовий ряд коливається навколо горизонтальної лінії. Якщо тренд відсутній, то для згладжування даних можна застосувати метод ковзних середніх чи експоненційного згладжування.

Згладжування річних тимчасових рядів

У сценарії ми згадали про Cabot Corporation. Маючи штаб-квартиру в Бостоні, штат Массачусетс, вона спеціалізується на виробництві та продажу хімікатів, будівельних матеріалів, продуктів тонкої хімії, напівпровідників та зрідженого природного газу. Компанія має 39 заводів у 23 країнах. Ринкова вартість компанії становить близько 1,87 млрд. дол. Її акції котируються на Нью-Йоркській фондовій біржі під абревіатурою СВТ. Доходи компанії за вказаний період наведено на рис. 3.

Мал. 3. Доходи компанії Cabot Corporation у 1982–2001 роках (млрд. дол.)

Як бачимо, довготривала тенденція підвищення доходів затемнена великою кількістю коливань. Таким чином, візуальний аналіз графіка не дозволяє стверджувати, що дані мають тренд. У таких ситуаціях можна застосувати методи ковзного середнього чи експоненційного згладжування.

Ковзаючі середні.Метод ковзних середніх дуже суб'єктивний і залежить від довжини періоду L, вибраного для обчислення середніх значень. Щоб виключити циклічні коливання, довжина періоду має бути цілим числом, кратним середньої довжині циклу. Ковзні середні для вибраного періоду, що має довжину L, утворюють послідовність середніх значень, обчислених для послідовностей довжини L. Ковзаючі середні позначаються символами MA(L).

Припустимо, що ми хочемо обчислити п'ятирічні ковзні середні значення за даними, виміряними протягом n= 11 років. Оскільки L= 5, п'ятирічні ковзні середні утворюють послідовність середніх значень, обчислених по п'яти послідовним значенням часового ряду. Перше з п'ятирічних ковзних середніх значень обчислюється шляхом підсумовування даних про перші п'ять років з наступним розподілом на п'ять:

Друга п'ятирічна ковзна середня обчислюється шляхом підсумовування даних про роки з 2-го по 6-й з наступним розподілом на п'ять:

Цей процес триває, доки не буде обчислено ковзну середню для останніх п'яти років. Працюючи з річними даними, слід вважати число L(Довжину періоду, обраного для обчислення ковзних середніх) непарним. У цьому випадку неможливо обчислити ковзні середні для перших ( L– 1)/2 та останніх ( L- 1) / 2 років. Отже, при роботі з п'ятирічними ковзними середніми неможливо виконати обчислення для перших двох та останніх двох років. Рік, для якого обчислюється ковзне середнє, повинен знаходитися в середині періоду, що має довжину L. Якщо n= 11, a L= 5, перше ковзне середнє має відповідати третьому року, друге - четвертому, а останнє - дев'ятому. На рис. 4 показані графіки 3- та 7-річних ковзних середніх, обчислені для доходів компанії Cabot Corporation за період з 1982 по 2001 роки.

Мал. 4. Графіки 3- та 7-річних ковзних середніх, обчислені для доходів компанії Cabot Corporation

Зверніть увагу на те, що при обчисленні трирічних ковзаючих середніх проігноровані значення, що відповідають першому і останньому рокам. Аналогічно при обчисленні семирічних ковзних середніх немає результатів для перших та останніх трьох років. Крім того, семирічні середні ковзаючі набагато більше згладжують тимчасовий ряд, ніж трирічні. Це тому, що семирічним ковзним середнім відповідає більш тривалий період. На жаль, чим більша довжина періоду, тим менша кількість ковзних середніх можна обчислити та уявити на графіку. Отже, більше семи років для обчислення ковзних середніх вибирати небажано, оскільки з початку та кінця графіка випаде занадто багато точок, що спотворить форму часового ряду.

Експонентне згладжування.Для виявлення довгострокових тенденцій, що характеризують зміни даних, крім ковзних середніх, застосовується метод експоненційного згладжування. Цей метод дозволяє робити короткострокові прогнози (у межах періоду), коли наявність довгострокових тенденцій залишається під питанням. Завдяки цьому метод експоненційного згладжування має значну перевагу над методом ковзних середніх.

Метод експоненційного згладжування отримав свою назву від послідовності експоненційно зважених ковзних середніх. Кожне значення в цій послідовності залежить від усіх попередніх значень, що спостерігаються. Ще одна перевага методу експонентного згладжування над методом ковзного середнього полягає в тому, що при використанні останнього деякі значення відкидаються. При експоненційному згладжуванні ваги, присвоєні спостеріганим значенням, зменшуються згодом, тому після виконання обчислень найбільш часто зустрічаються значення отримають найбільшу вагу, а рідкісні величини - найменшу. Незважаючи на величезну кількість обчислень, Excel дозволяє реалізувати метод експонентного згладжування.

Рівняння, що дозволяє згладити тимчасовий ряд у межах довільного періоду часу iмістить три члени: поточне спостерігається значення Yi, що належить тимчасовому ряду, попереднє експоненційно згладжене значення Ei –1 і привласнена вага W.

(3) E 1 = Y 1 E i = WY i + (1 – W)E i–1 , i = 2, 3, 4, …

де Ei– значення експоненційно згладженого ряду, обчислене для i-го періоду, E i –1 – значення експоненційно згладженого ряду, обчислене для ( i- 1)-го періоду, Y i- Спостережуване значення тимчасового ряду в i-ом періоді, W– суб'єктивна вага, або коефіцієнт, що згладжує (0< W < 1).

Вибір коефіцієнта, що згладжує, або ваги, привласненого членам ряду, є принципово важливим, оскільки він безпосередньо впливає на результат. На жаль, цей вибір певною мірою суб'єктивний. Якщо дослідник хоче просто виключити з часового ряду небажані циклічні чи випадкові коливання, слід вибирати невеликі величини W(Близькі до нуля). З іншого боку, якщо тимчасовий ряд використовується для прогнозування, необхідно вибрати велику вагу W(Близький до одиниці). У першому випадку чітко виявляються довгострокові тенденції часового ряду. У другий випадок підвищується точність короткострокового прогнозування (рис. 5).

Мал. 5 Графіки експоненційно згладженого часового ряду (W=0,50 та W=0,25) для даних про доходи компанії Cabot Corporation за період з 1982 по 2001 роки; формули розрахунку див. у файлі Excel

Експонентно згладжене значення, отримане для i-го часового інтервалу, можна використовувати як оцінку передбаченого значення ( i+1)-му інтервалі:

Для передбачення доходів компанії Cabot Corporation у 2002 році на основі експоненційно згладженого часового ряду, що відповідає вазі W= 0,25 можна використовувати згладжене значення, обчислене для 2001 року. З рис. 5 видно, що ця величина дорівнює 1651,0 млн. дол. Коли стануть доступними дані про доходи компанії у 2002 році, можна застосувати рівняння (3) та передбачити рівень доходів у 2003 році, використовуючи згладжене значення доходів у 2002 році:

Пакет аналізу Excel здатний побудувати графік експонентного згладжування в один клік. Пройдіть меню ДаніАналіз данихта виберіть опцію Експонентне згладжування(Рис. 6). У вікні, що відкрилося Експонентне згладжуваннявстановіть параметри. На жаль, процедура дозволяє побудувати лише один згладжений ряд, тому якщо ви хочете «пограти» з параметром W, повторіть процедуру.

Мал. 6. Побудова графіка експонентного згладжування за допомогою Пакету аналізу

Обчислення трендів за допомогою методу найменших квадратів та прогнозування

Серед компонентів часового ряду найчастіше досліджується тренд. Саме тренд дозволяє робити короткострокові та довгострокові прогнози. Для виявлення довгострокової тенденції зміни часового ряду зазвичай будують графік, на якому дані (значення залежної змінної), що спостерігаються, відкладаються на вертикальній осі, а часові інтервали (значення незалежної змінної) - на горизонтальній. У цьому розділі ми опишемо процедуру виявлення лінійного, квадратичного та експонентного тренду за допомогою методу найменших квадратів.

Модель лінійного трендує найпростішою моделлю, яка застосовується для прогнозування: Y i = β 0 + β 1 X i + ε i . Рівняння лінійного тренду:

При заданому рівні значимості нульова гіпотеза відхиляється, якщо тестова t-Статистика більше верхнього або менше нижнього критичного рівня t-Розподілу. Інакше висловлюючись, вирішальне правило формулюється так: якщо t > tUабо t < t Lнульова гіпотеза Н 0відхиляється, інакше нульова гіпотеза не відхиляється (рис. 14).

Мал. 14. Області відхилення гіпотези для двостороннього критерію значимості параметра авторегресії Ар, що має найвищий порядок

Якщо нульова гіпотеза ( Ар= 0) не відхиляється, отже, вибрана модель містить багато параметрів. Критерій дозволяє відкинути старший член моделі та оцінити авторегресійну модель порядку р-1. Цю процедуру слід продовжувати доти, доки нульова гіпотеза Н 0не буде відхилено.

  1. Виберіть порядок роцінюваної авторегресійної моделі з урахуванням того, що t-Критерій значимості має n-2р-1степенів свободи.
  2. Сформуйте послідовність змінних р"із запізненням" так, щоб перша змінна запізнювалася на один часовий інтервал, друга - на два і так далі. Останнє значення має запізнюватися на ртимчасових інтервалів (див. рис. 15).
  3. Застосуйте Пакет аналізу Excel для обчислення регресійної моделі, що містить усі рзначень часового ряду із запізненням.
  4. Оцініть значення параметра А Р, що має найвищий порядок: а) якщо нульова гіпотеза відхиляється, до авторегресійної моделі можна включати все рпараметрів; б) якщо нульова гіпотеза не відхиляється, відкиньте р-ю змінну і повторіть п.3 та 4 для нової моделі, що включає р-1параметр. Перевірка значимості нової моделі заснована на t-Критерії, кількість ступенів свободи визначається новою кількістю параметрів.
  5. Повторюйте п.3 і 4, поки старший член авторегресійної моделі стане статистично значущим.

Щоб продемонструвати авторегресійне моделювання, повернемося до аналізу часового ряду реальних доходів компанії Wm. Wrigley Jr. На рис. 15 показані дані, необхідні для побудови авторегресійних моделей першого, другого та третього порядку. Для побудови моделі третього порядку потрібні всі стовпці цієї таблиці. При побудові авторегресійної моделі другого порядку останній стовпець ігнорується. При побудові авторегресійної моделі першого порядку ігноруються два останні стовпці. Таким чином, при побудові авторегресійних моделей першого, другого та третього порядку з 20 змінних виключаються одна, дві та три відповідно.

Вибір найбільш точної авторегресійної моделі починається з моделі третього порядку. Для коректної роботи Пакет аналізуслід як вхідний інтервал Yвказати діапазон В5:В21, а вхідного інтервалу для Х- С5: Е21. Дані аналізу наведено на рис. 16.

Перевіримо важливість параметра А 3, що має найвищий лад. Його оцінка а 3дорівнює -0,006 (комірка С20 на рис. 16), а стандартна помилка дорівнює 0,326 (комірка D20). Для перевірки гіпотез Н 0: А 3 = 0 та Н 1: А 3 ≠ 0 обчислимо t-Статистику:

t-критерія з n-2p-1 = 20-2 * 3-1 = 13 ступенями свободи рівні: t L=СТЬЮДЕНТ.ОБР(0,025;13) = -2,160; t U=СТЬЮДЕНТ.ОБР(0,975;13) = +2,160. Оскільки -2,160< t = –0,019 < +2,160 и р= 0,985 > α = 0,05, нульову гіпотезу Н 0відхиляти не можна. Таким чином, параметр третього порядку не має статистичної значущості в авторегресійній моделі і повинен бути видалений.

Повторимо аналіз для авторегресійної моделі другого порядку (рис. 17). Оцінка параметра, що має найвищий порядок, а 2= –0,205, та її стандартна помилка дорівнює 0,276. Для перевірки гіпотез Н 0: А 2 = 0 та Н 1: А 2 ≠ 0 обчислимо t-Статистику:

При рівні значимості α = 0,05, критичні величини двостороннього t-критерія з n-2p-1 = 20-2 * 2-1 = 15 ступенями свободи рівні: t L=СТЬЮДЕНТ.ОБР(0,025;15) = -2,131; t U=СТЬЮДЕНТ.ОБР(0,975;15) = +2,131. Оскільки -2,131< t = –0,744 < –2,131 и р= 0,469 > α = 0,05, нульову гіпотезу Н 0відхиляти не можна. Таким чином, параметр другого порядку не є статистично значущим, його слід видалити з моделі.

Повторимо аналіз для авторегресійної моделі першого порядку (рис. 18). Оцінка параметра, що має найвищий порядок, а 1= 1,024, та її стандартна помилка дорівнює 0,039. Для перевірки гіпотез Н 0: А 1 = 0 та Н 1: А 1 ≠ 0 обчислимо t-Статистику:

При рівні значимості α = 0,05, критичні величини двостороннього t-критерія з n-2p-1 = 20-2 * 1-1 = 17 ступенями свободи рівні: t L=СТЬЮДЕНТ.ОБР(0,025;17) = -2,110; t U=СТЬЮДЕНТ.ОБР(0,975;17) = +2,110. Оскільки -2,110< t = 26,393 < –2,110 и р = 0,000 < α = 0,05, нулевую гипотезу Н 0слід відхилити. Таким чином, параметр першого порядку є статистично значущим і його не можна видаляти з моделі. Отже, модель авторегресії першого порядку краще за інших апроксимує вихідні дані. Використовуючи оцінки а 0 = 18,261, а 1= 1,024 і значення часового ряду за останній рік - Y 20 = 1371,88, можна передбачити величину реальних доходів компанії Wm. Wrigley Jr. Company у 2002 р.:

Вибір адекватної моделі прогнозування

Вище було описано шість методів прогнозування значень тимчасового ряду: моделі лінійного, квадратичного та експоненційного трендів та авторегресійні моделі першого, другого та третього порядків. Чи є оптимальна модель? Яку із шести описаних моделей слід застосовувати для прогнозування значення часового ряду? Нижче наведено чотири принципи, якими необхідно керуватися при виборі адекватної моделі прогнозування. Ці принципи ґрунтуються на оцінках точності моделей. У цьому передбачається, що значення часового ряду можна передбачити, вивчаючи попередні значення.

Принципи вибору моделей для прогнозування:

  • Виконайте аналіз залишків.
  • Оцініть величину залишкової помилки за допомогою квадратів різниці.
  • Оцініть величину залишкової помилки за допомогою абсолютних різниць.
  • Керуйтеся принципом економії.

Аналіз залишків.Нагадаємо, що залишком називається різниця між передбаченим і спостережуваним значенням. Побудувавши модель для тимчасового ряду, слід обчислити залишки для кожного з nінтервалів. Як показано на рис. 19, панель А, якщо модель є адекватною, залишки є випадковим компонентом часового ряду і, отже, розподілені нерегулярно. З іншого боку, як показано на інших панелях, якщо модель не адекватна, залишки можуть мати систематичну залежність, яка не враховує тренд (панель Б), або циклічний (панель В), або сезонний компонент (панель Г).

Мал. 19. Аналіз залишків

Вимірювання абсолютної та середньоквадратичної залишкових похибок.Якщо аналіз залишків не дозволяє визначити єдину адекватну модель, можна скористатися іншими методами, що ґрунтуються на оцінці величини залишкової похибки. На жаль, статистики не дійшли консенсусу щодо найкращої оцінки залишкових похибок моделей, які застосовуються для прогнозування. Виходячи з принципу найменших квадратів, можна спочатку провести регресійний аналіз та обчислити стандартну помилку оцінки S XY. При аналізі конкретної моделі ця величина є сумою квадратів різниць між фактичним і передбаченим значеннями часового ряду. Якщо модель ідеально апроксимує значення часового ряду в попередні моменти часу, стандартна помилка оцінки дорівнює нулю. З іншого боку, якщо модель погано апроксимує значення часового ряду попередніх моментів часу, стандартна помилка оцінки велика. Таким чином, аналізуючи адекватність кількох моделей, можна вибрати модель, що має мінімальну стандартну помилку оцінки S XY.

Основним недоліком такого підходу є перебільшення помилок під час прогнозування окремих значень. Інакше кажучи, будь-яка велика різниця між величинами Yiі Ŷ iпри обчисленні суми квадратів помилок SSE зводиться квадрат, тобто. збільшується. З цієї причини багато статистики вважають за краще застосовувати для оцінки адекватності моделі прогнозування середнє абсолютне відхилення (mean absolute deviation - MAD):

При аналізі конкретних моделей величина MAD є середнє значення модулів різниць між фактичним і передбаченими значеннями часового ряду. Якщо модель ідеально апроксимує значення часового ряду в попередні моменти часу, середнє абсолютне відхилення дорівнює нулю. З іншого боку, якщо модель погано апроксимує такі значення часового ряду, середнє абсолютне відхилення велике. Таким чином, аналізуючи адекватність декількох моделей, можна вибрати модель, що має мінімальне абсолютне середнє відхилення.

Принцип економії.Якщо аналіз стандартних помилок оцінок та середніх абсолютних відхилень не дозволяє визначити оптимальну модель, можна скористатися четвертим методом, що базується на принципі економії. Цей принцип стверджує, що з кількох рівноправних моделей слід обирати найпростішу.

Серед шести розглянутих на чолі моделей прогнозування найпростішими є лінійна та квадратична регресійні моделі, а також авторегресійна модель першого порядку. Інші моделі набагато складніші.

Порівняння чотирьох методів прогнозування.Для ілюстрації процесу вибору оптимальної моделі повернемося до тимчасового ряду, що складається з реального доходу компанії Wm. Wrigley Jr. Company. Порівняємо чотири моделі: лінійну, квадратичну, експоненційну та авторегресійну модель першого порядку. (Авторегресійні моделі другого і третього порядку лише трохи покращують точність прогнозування значень даного тимчасового ряду, тому їх можна не розглядати.) На рис. 20 показані графіки залишків, побудовані під час аналізу чотирьох методів прогнозування за допомогою Пакет аналізу Excel. Роблячи висновки з урахуванням цих графіків, слід бути обережним, оскільки тимчасовий ряд містить лише 20 точок. Методи побудови див. відповідний аркуш Excel-файлу.

Мал. 20. Графіки залишків, побудовані під час аналізу чотирьох методів прогнозування за допомогою Пакет аналізу Excel

Жодна модель, крім авторегресійної моделі першого порядку, не враховує циклічний компонент. Саме ця модель краще за інших апроксимує спостереження та характеризується найменш систематичною структурою. Отже, аналіз залишків всіх чотирьох методів показав, що найкращою є авторегресійна модель першого порядку, а лінійна, квадратична та експоненційна моделі мають меншу точність. Щоб у цьому, порівняємо величини залишкових похибок цих методів (рис. 21). З методикою розрахунків можна ознайомитись, відкривши Excel-файл. На рис. 21 вказані фактичні значення Y i(колонка Реальний дохід), передбачені значення Ŷ i, а також залишки еiдля кожної із чотирьох моделей. Крім того, показано значення SYXі MAD. Для всіх чотирьох моделей величин SYXі MADприблизно однакові. Експоненційна модель є відносно гіршою, а лінійна та квадратична моделі перевершують її за точністю. Як і очікувалося, найменші величини SYXі MADмає авторегресійну модель першого порядку.

Мал. 21. Порівняння чотирьох методів прогнозування за допомогою показників S YX та MAD

Вибравши конкретну модель прогнозування, необхідно уважно стежити подальші зміни часового ряду. Крім того, така модель створюється, щоб правильно передбачати значення тимчасового ряду в майбутньому. На жаль, такі моделі прогнозування погано враховують зміни у структурі часового ряду. Цілком необхідно порівнювати як залишкову похибку, а й точність прогнозування майбутніх значень часового ряду, отриману з допомогою інших моделей. Вимірявши нову величину Yiв інтервалі часу, що спостерігається, її необхідно відразу ж порівняти з передбаченим значенням. Якщо різниця занадто велика, модель прогнозування слід переглянути.

Прогнозування часів ых рядів на основі сезонних даних

Досі ми вивчали тимчасові лави, що складаються з річних даних. Однак багато тимчасових рядів складаються з величин, що вимірюються щокварталу, щомісяця, щотижня, щодня і навіть щогодини. Як показано на рис. 2, якщо дані вимірюються щомісяця чи щокварталу, слід враховувати сезонний компонент. У цьому розділі ми розглянемо методи, що дають змогу прогнозувати значення таких часових рядів.

У сценарії, описаному на початку глави, згадувалася компанія Wal-Mart Stores, Inc. Ринкова капіталізація компанії 229 млрд. дол. Її акції котируються на Нью-Йоркській фондовій біржі під абревіатурою WMT. Фінансовий рік компанії закінчується 31 січня, тому до четвертого кварталу 2002 року включаються листопад та грудень 2001 року, а також січень 2002 року. Тимчасовий ряд квартальних доходів компанії наведено на рис. 22.

Мал. 22. Квартальні прибутки компанії Wal-Mart Stores, Inc. (Млн. дол.)

Для таких квартальних рядів, як цей, класична мультиплікативна модель, крім тренду, циклічного та випадкового компонента, містить сезонний компонент: Y i = T i* S i* C i* I i

Прогнозування місячних і тимчасових ых рядів за допомогою методу найменших квадратів.Регресійна модель, що включає сезонний компонент, ґрунтується на комбінованому підході. Для обчислення тренду застосовується метод найменших квадратів, описаний раніше, а для обліку сезонного компонента – категорійна змінна (докладніше див. Регресійні моделі з фіктивною змінною та ефекти взаємодії). Для апроксимації часових рядів із урахуванням сезонних компонентів використовується експоненційна модель. У моделі, що апроксимує квартальний часовий ряд, для обліку чотирьох кварталів нам знадобилися три фіктивні змінні. Q 1, Q 2і Q 3, а моделі для місячного часового ряду 12 місяців представляються з допомогою 11 фіктивних змінних. Оскільки в цих моделях як відгук використовується змінна log Y i, а не Y i, для обчислення реальних регресійних коефіцієнтів потрібно здійснити зворотне перетворення.

Щоб проілюструвати процес побудови моделі, що апроксимує квартальний тимчасовий ряд, повернемося до доходів компанії Wal-Mart. Параметри експоненційної моделі, отримані за допомогою Пакет аналізу Excel показано на рис. 23.

Мал. 23. Регресійний аналіз квартальних доходів компанії Wal-Mart Stores, Inc.

Видно, що експоненційна модель досить добре апроксимує вихідні дані. Коефіцієнт змішаної кореляції r 2 дорівнює 99,4% (комірки J5), скоригований коефіцієнт змішаної кореляції - 99,3% (комірки J6), тестова F-статистика - 1333,51 (осередки M12), а р-значення дорівнює 0,0000. При рівні значимості α = 0,05, кожен регресійний коефіцієнт класичної мультиплікативної моделі часового ряду є статистично значущим. Застосовуючи до них операцію потенціювання, отримуємо такі параметри:

Коефіцієнти інтерпретуються в такий спосіб.

Використовуючи регресійні коефіцієнти b i, можна передбачити дохід, отриманий компанією у конкретному кварталі. Наприклад, передбачимо дохід компанії для четвертого кварталу 2002 року ( Xi = 35):

log = b 0 + b 1 Хi = 4,265 + 0,016*35 = 4,825

= 10 4,825 = 66 834

Таким чином, згідно з прогнозом у четвертому кварталі 2002 року компанія мала отримати дохід, рівний 67 млрд. дол. (навряд чи слід робити прогноз з точністю до мільйона). Для того щоб поширити прогноз на період часу, що знаходиться за межами часового ряду, наприклад, на перший квартал 2003 року ( Xi = 36, Q 1= 1), необхідно виконати такі обчислення:

log Ŷ i = b 0 + b 1Хi + b 2 Q 1 = 4,265 + 0,016*36 – 0,093*1 = 4,748

10 4,748 = 55 976

Індекси

Індекси використовуються як індикатори, що реагують на зміни економічної ситуації або ділової активності. Існують численні різновиди індексів, зокрема індекси цін, кількісні індекси, ціннісні індекси та соціологічні індекси. У цьому розділі ми розглянемо лише індекс цін. Індекс- величина деякого економічного показника (або групи показників) у конкретний момент часу, виражений у відсотках від його значення у базовий момент часу.

Індекс цін.Простий індекс цін відображає відсоткову зміну ціни товару (або групи товарів) протягом заданого періоду часу порівняно з ціною цього товару (або групи товарів) у конкретний момент часу минулого. При обчисленні індексу цін перш за все слід вибрати базовий проміжок часу - інтервал часу в минулому, з яким проводитимуться порівняння. При виборі базового проміжку часу для конкретного індексу періоди економічної стабільності є кращими порівняно з періодами економічного підйому або спаду. Крім того, базовий проміжок не повинен бути надто віддаленим у часі, щоб на результати порівняння не надто сильно впливали зміни технології та звичок споживачів. Індекс цін обчислюється за такою формулою:

де I i- індекс цін у i-му році, Рi- ціна в i-му році, Р баз- ціна у базовому році.

Індекс цін - відсоткова зміна ціни товару (або групи товарів) у заданий період часу стосовно ціни товару у базовий момент часу. Як приклад, розглянемо індекс цін на неетильований бензин у США в проміжку часу з 1980 по 2002 р. (рис. 24). Наприклад:

Мал. 24. Ціна галону неетильованого бензину та простий індекс цін у США з 1980 по 2002 р. (базові роки - 1980 та 1995)

Отже, 2002 р. ціна неэтилированного бензину США була на 4,8% більше, ніж 1980 р. Аналіз рис. 24 показує, що індекс цін 1981 і 1982 гг. був більший за індекс цін у 1980 р., а потім аж до 2000 року не перевищував базового рівня. Оскільки як базовий період обраний 1980 р., ймовірно, має сенс вибрати найближчий рік, наприклад, 1995 р. Формула для перерахунку індексу по відношенню до нового базового проміжку часу:

де Iновий- Новий індекс цін, Iстарий- Старий індекс цін, Iновабаза – значення індексу цін новому базовому року під час розрахунку для старого базового року.

Припустимо, що в якості нової бази обрано 1995 рік. Використовуючи формулу (10), отримуємо новий індекс цін на 2002 рік:

Отже, 2002 р. неетильований бензин у США коштував на 13,9% більше, ніж 1995 р.

Незважені складові індекси цін.Незважаючи на те, що індекс цін на будь-який окремий товар представляє безперечний інтерес, важливішим є індекс цін на групу товарів, що дозволяє оцінити вартість і рівень життя великої кількості споживачів. Незважений складовий індекс цін, визначений формулою (11), приписує кожному окремому виду товарів однакову вагу. Складовий індекс цін відбиває відсоткове зміна ціни групи товарів (часто званої споживчою кошиком) у заданий період по відношенню до ціні цієї групи товарів у базовий час.

де t i- номер товару (1, 2, …, n), n- кількість товарів у групі, що розглядається, - сума цін на кожен з nтоварів у період часу t, - сума цін на кожен з nтоварів у нульовий період часу, - величина незваженого складового індексу у період часу t.

На рис. 25 представлені середні ціни на три види фруктів за період з 1980 по 1999 р.р. Для обчислення незваженого складового індексу цін у роки застосовується формула (11), вважаючи базовим 1980 рік.

Отже, у 1999 р. сумарна ціна фунта яблук, фунта бананів та фунта апельсинів на 59,4% перевищувала сумарну ціну на ці фрукти у 1980 р.

Мал. 25. Ціни (у дол.) на три види фруктів та незважений складовий індекс цін

Незважений складовий індекс цін виражає зміни ціни всю групу товарів із часом. Незважаючи на те, що цей індекс легко обчислювати, у нього є дві явні недоліки. По-перше, при обчисленні цього індексу всі види товарів вважаються однаково важливими, тому дорогі товари набувають надмірного впливу на індекс. По-друге, не всі товари споживаються однаково інтенсивно, тому зміни цін на товари, що мало споживаються, надто сильно впливають на незважений індекс.

Виважені складові індекси цін.Через недоліки невважених індексів цін кращими є зважені індекси цін, що враховують відмінності цін і рівнів споживання товарів, що утворюють споживчий кошик. Існують два типи зважених складових індексів цін. Індекс цін Лапейре, визначений формулою (12), використовує рівні споживання у базовому році. Зважений складовий індекс цін дозволяє врахувати рівні споживання товарів, що утворюють споживчий кошик, привласнюючи кожному товару певну вагу.

де t- період часу (0, 1, 2, …), i- номер товару (1, 2, …, n), n iв нульовий період часу - значення індексу Лапейре в період часу t.

Обчислення індексу Лапейре показано на рис. 26; як базовий використовується 1980 рік.

Мал. 26. Ціни (у дол.), кількість (споживання в фунтах на душу населення) трьох видів фруктів та індекс Лапейре

Отже, індекс Лапейре 1999 р. дорівнює 154,2. Це свідчить про те, що у 1999 році ці три види фруктів були на 54,2% дорожчими, ніж у 1980 році. Зверніть увагу на те, що цей індекс менший за незважений індекс, що дорівнює 159,4, оскільки ціни на апельсини - фрукти, що споживаються менше інших, - зросли більше, ніж ціна яблук і бананів. Інакше кажучи, оскільки ціни на фрукти, що споживаються найбільш інтенсивно, зросли менше, ніж ціни на апельсини, індекс Лапейре менший за незважений складовий індекс.

Індекс цін Паашевикористовує рівні споживання товару у поточному, а чи не базовому періоді часу. Отже, індекс Пааше більш точно відбиває повну вартість споживання товарів у заданий час. Однак цей індекс має дві істотні недоліки. По-перше, зазвичай поточні рівні споживання важко визначити. З цієї причини багато популярних індексів використовують індекс Лапейре, а не індекс Пааше. По-друге, якщо ціна деякого конкретного товару, що входить до споживчого кошика, різко зростає, покупці знижують рівень його споживання за потребою, а не внаслідок зміни смаків. Індекс Пааше обчислюється за такою формулою:

де t- період часу (0, 1, 2, …), i- номер товару (1, 2, …, n), n- кількість товарів у групі, що розглядається, - кількість одиниць товару iв нульовий період часу - значення індексу Пааше в період часу t.

Обчислення індексу Пааше показано на рис. 27; як базовий використовується 1980 рік.

Мал. 27. Ціни (у дол.), кількість (споживання в фунтах на душу населення) трьох видів фруктів та індекс Пааше

Отже, індекс Пааше 1999 р. дорівнює 147,0. Це свідчить про те, що у 1999 році ці три види фруктів були на 47,0% дорожчими, ніж у 1980 році.

Деякі популярні індекси цін.У бізнесі та економіці використовується кілька індексів цін. Найбільш популярним є індекс споживчих цін (Consumer Index Price – CPI). Офіційно цей індекс називається CPI-U, щоб наголосити, що він обчислюється для міст (urban), хоча, як правило, його називають просто CPI. Цей індекс щомісяця публікується Бюро статистики праці (US Bureau of Labor Statistics) як основний інструмент для вимірювання вартості життя в США. Індекс споживчих цін є складовим та виваженим за методом Лапейре. При його обчисленні використовуються ціни 400 продуктів, видів одягу, транспортних, медичних і комунальних послуг, що найбільш широко споживаються. На даний момент при обчисленні цього індексу як базовий використовується період 1982-1984 років. (Рис. 28). Важливою функцією індексу CPI є його використання як дефлятор. Індекс CPI використовується для перерахунку фактичних цін на реальні шляхом множення кожної ціни на коефіцієнт 100/CPI. Розрахунки показують, що за останні 30 років середньорічні темпи інфляції у США становили 2,9%.

Мал. 28. Динаміка Consumer Index Price; повні дані див. Excel-файл

Іншим важливим індексом цін, що публікується Бюро статистики праці, є індекс цін виробників (Producer Price Index – PPI). Індекс PPI є виваженим складовим індексом, який використовує метод Лапейре для оцінки зміни цін товарів, що їх продавалися виробниками. Індекс PPI є індикатором для індексу CPI. Інакше кажучи, збільшення індексу PPI призводить до збільшення індексу CPI і навпаки, зменшення індексу PPI призводить до зменшення індексу CPI. Фінансові індекси, такі як індекс Доу-Джонса для акцій промислових підприємств (Dow Jones Industrial Average – DJIA), S&P 500 та NASDAQ, використовуються для оцінки зміни вартості акцій у США. Багато індексів дозволяють оцінити прибутковість міжнародних фондових ринків. До таких індексів відносяться індекс Nikkei у Японії, Dax 30 у Німеччині та SSE Composite у Китаї.

Пастки, пов'язані з аналізом часу ых рядів

Значення методології, яка використовує інформацію про минуле і сьогодення для того, щоб прогнозувати майбутнє, понад двісті років тому красномовно описав державний діяч Патрік Генрі: «Я маю лише одну лампу, яка висвітлює шлях, - мій досвід. Тільки знання минулого дозволяє судити про майбутнє».

Аналіз часових рядів ґрунтується на припущенні, що фактори, що впливали на ділову активність у минулому та впливають на сьогодення, діятимуть і в майбутньому. Якщо це правда, аналіз часових рядів є ефективним засобом прогнозування та управління. Проте критики класичних методів, заснованих на аналізі часових рядів, стверджують, що ці методи надто наївні та примітивні. Інакше кажучи, математична модель, яка враховує фактори, що діяли в минулому, не повинна механічно екстраполювати тренди в майбутнє без урахування експертних оцінок, досвіду ділової активності, зміни технології, звичок і потреб людей. Намагаючись виправити це становище, останніми роками фахівці з економетрії розробляли складні комп'ютерні моделі економічної активності, які враховують перелічені вище чинники.

Тим не менш, методи аналізу часових рядів є чудовим інструментом прогнозування (як короткострокового, так і довгострокового), якщо вони застосовуються правильно, у поєднанні з іншими методами прогнозування, а також з урахуванням експертних оцінок і досвіду.

РезюмеУ замітці за допомогою аналізу часових рядів розроблено моделі для прогнозування доходів трьох компаній: Wm. Wrigley Jr. Company, Cabot Corporation та Wal-Mart. Описані компоненти тимчасового ряду, а також кілька підходів до прогнозування річних тимчасових рядів – метод ковзних середніх, метод експоненційного згладжування, лінійна, квадратична та експоненційна моделі, а також авторегресійна модель. Розглянуто регресійну модель, що містить фіктивні змінні, що відповідають сезонному компоненту. Показано застосування методу найменших квадратів для прогнозування місячних та квартальних часових рядів (рис. 29).

Р ступенів свободи втрачаються при порівнянні значень часового ряду.

Цілі аналізу часових рядів.При практичному вивченні часових рад на підставі економічних даних на певному проміжку часу економетрист повинен зробити висновки про властивості цього ряду та про ймовірнісний механізм, що породжує цей ряд. Найчастіше щодо тимчасових рядів ставляться такі цели:

1. Короткий (стислий) опис характерних особливостей ряду.

2. Підбір статистичної моделі, що описує часовий ряд.

3. Пророцтво майбутніх значень на основі минулих спостережень.

4. Управління процесом, що породжує тимчасовий ряд.

На практиці ці та подібні цілі досяжні далеко не завжди і далеко не повною мірою. Часто цьому перешкоджає недостатній обсяг спостережень через обмежений час спостережень. Ще частіше – статистична структура часового ряду, що змінюється з часом.

Стадії аналізу часових рядів . Зазвичай при практичному аналізі часових рядів послідовно проходять такі етапи:

1. Графічне уявлення та опис поведінки тимчасової ради.

2. Виділення та видалення закономірних складових тимчасового рада, що залежать від часу: тренду, сезонних та циклічних складових.

3. Виділення та видалення низько- або високочастотних складових процесу (фільтрація).

4. Дослідження випадкової складової часового ряду, що залишилася після видалення перерахованих вище складових.

5. Побудова (підбір) математичної моделі для опису випадкової складової та перевірка її адекватності.

6. Прогнозування майбутнього розвитку процесу, представленого тимчасовим рядом.

7. Дослідження взаємодій між різними тимчасовими радами.

Для вирішення цих завдань існує велика кількість різних методів. З них найбільш поширеними є такі:

8. Кореляційний аналіз, що дозволяє виявити суттєві періодичні залежності та їх лаги (затримки) усередині одного процесу (автокореляція) або між декількома процесами (кроскореляція).

9. Спектральний аналіз, що дозволяє знаходити періодичні та квазіперіодичні складові тимчасового ряду.

10. Згладжування та фільтрація, призначені для перетворення часових рядів з метою видалення з них високочастотних або сезонних коливань.

12. Прогнозування, що дозволяє на основі підібраної моделі поведінки тимчасового рада передбачати його значення у майбутньому.

Моделі тренду

найпростіші моделі тренду . Наведемо моделі трендів, що найчастіше використовуються при аналізі економічних часових рядів, а також у багатьох інших областях. По-перше, це проста лінійна модель

де а 0 , а 1- Коефіцієнти моделі тренду;

t – час.

Як одиниця часу, можливо, годину, день (добу), тиждень, місяць, квартал або рік. Модель 269, незважаючи на свою простоту, виявляється корисною у багатьох реальних завданнях. Якщо нелінійний характер тренду очевидний, то може підійти одна з таких моделей:

1. Поліноміальна:

(270)

де значення ступеня полінома пу практичних завданнях рідко перевищує 5;

2. Логарифмічна:

Ця модель найчастіше застосовується даних, мають тенденцію зберігати постійні темпи приросту;

3. Логістична:

(272)

4. Гомперця

(273), де

Дві останні моделі задають криві тренди S-подібної форми. Вони відповідають процесам з поступово зростаючими темпами зростання в початковій стадії і поступово загасаючими темпами зростання в кінці. Необхідність подібних моделей зумовлена ​​неможливістю багатьох економічних процесів тривалий час розвиватися з постійними темпами зростання або за поліноміальними моделями у зв'язку з їх досить швидким зростанням (або зменшенням).

При прогнозуванні тренд використовують насамперед для довгострокових прогнозів. Точність короткострокових прогнозів, заснованих тільки на підібраній кривій тренда, як правило, недостатня.

Для оцінки та видалення трендів з часових рядів найчастіше використовується метод найменших квадратів. Цей метод досить докладно розглядався у другому розділі посібника у завданнях лінійного регресійного аналізу. Значення часового ряду розглядають як відгук (залежну змінну), а час t- Як фактор, що впливає на відгук (незалежну змінну).

Для тимчасових рядів характерна взаємна залежність його членів (принаймні не далеко віддалених за часом) і це є істотною відмінністю від звичайного регресійного аналізу, для якого всі спостереження передбачаються незалежними. Тим не менш, оцінки тренду і в цих умовах зазвичай виявляються розумними, якщо обрано адекватну модель тренду і якщо серед спостережень немає викидів. Згадані вище порушення обмежень регресійного аналізу позначаються не так на значеннях оцінок, як на їх статистичних властивостях. Так, за наявності помітної залежності між членами часового ряду оцінки дисперсії, засновані на залишковій сумі квадратів, дають неправильні результати. Неправильними виявляються довірчі інтервали для коефіцієнтів моделі, тощо. У разі їх можна як дуже наближені.

Економетричні моделі почали використовуватися для економічного прогнозування у 60-ті роки ХХ ст. З цього часу структура економіки розвинених країн та методи економетричного аналізу зазнали кардинальних змін. Водночас проблема прогнозування майбутнього стану економіки залишається невирішеною, що потребує вдосконалення економетричних моделей.
Фахівці зосереджені на дослідженнях, пов'язаних з коінтеграцією (метод визначення довготривалого взаємозв'язку групи змінних динамічних рядів); на прогнозуванні та оцінці параметрів, що змінюються у часі. Зокрема, розробка американським економістом Р.Інглом проблеми коінтеграції змінює підхід практиків економістів до вивчення часових рядів.
Тимчасові ряди – послідовність спостережень за економічними змінами за однакові часові інтервали.
Аналіз часових рядів - основний інструмент економічної науки та одна з найплідніших сфер аналізу для економістів. Тимчасові ряди необхідні для аналізу еволюції в часі економічних та соціальних зв'язків між змінними (наприклад, економетрична модель поведінки сукупного безробіття, що базується на тимчасових рядах, може дати цінну інформацію про її еволюцію в часі, хоча не дає відомостей про структуру чи тривалість безробіття). Більшість даних, що використовуються, має вигляд тимчасових рядів, масив яких постійно розширюється.
Одним із найвідоміших дослідників у цій галузі є К.Гренджер.
Гренджер (Granger) Клів (також Клайв) (рід у 1934) – американський економіст, лауреат Нобелівської премії (2003). Народився в Суонс (Уельс, Великобританія). Навчався в Ноттінгемському університеті, де в 1955 р. захистив бакалаврську роботу з математики, а в 1959 р. - докторську дисертацію зі статистики. Працював професором Каліфорнійського університету (м. Сан-Дієго).
Він автор понад десять книг, понад двісті наукових статей.
К.Гренджер - член Британської національної академії наук, Американського економетричного товариства, Американської та Фінської академій мистецтв та наук; заслужений член Американської економічної асоціації, почесний доктор Ноттінгемського, Мадридського, Лафборського університетів та Стокгольмської школи економіки, заслужений професор Каліфорнійського університету.
Інгл (Engle) Роберт (нар. 1942) - американський економіст, лауреат Нобелівської премії (2003). Народився в Сірак'юсі (штат Нью-Йорк, США). Навчався у Корнельському університеті. У 1969 р. захистив докторську дисертацію з економіки. Протягом 1969-1974рр. працював асистентом професора Массачусетського технологічного інституту; 1975 р. - ад'юнкт-професор Каліфорнійського університету м. Сан-Дієго. За два роки обійняв посаду професора. Протягом 1990-1994рр. був деканом економічного факультету цього університету, пізніше - професор менеджменту фінансового факультету Нью-Йоркського університету.
Р.Інгл – відомий експерт з аналізу часових рядів протягом довгострокових періодів на фінансових ринках. Його дослідження присвячені таким інноваційним статистичним методам як ARCH-моделювання, коінтеграція, взаємопов'язані спектральні регресії. У своїх дослідженнях використовує методи фінансової економетрії для проведення операцій з акціями, валютними та процентними ставками, опціонами.
Він член Американського економетричного товариства та Американської академії мистецтв та наук.
Розробка аналізу часових рядів (і на його основі - прогнозування та контроль) заснувала новий напрям у методах прогнозування, стала теоретичною основою ARIMA-аналізу, за яким певний часовий ряд моделюють лише за допомогою його минулих значень та екзогенної випадкової величини, та методології, необхідною умовою якою є стаціонарність тимчасового ряду, що розглядається. Така методологія є порівняно новим поколінням засобів прогнозування, що ґрунтуються на аналізі імовірнісних (стохастичних) особливостей часових рядів. При цьому певний часовий ряд моделюється лише за допомогою його минулих значень (лагів) та випадкової екзогенної величини. Необхідною умовою впровадження ARIMA-методології є стаціонарність часового ряду - математичного очікування (середнє), дисперсія та автоковаріація (у різних проміжках) якого не залежить від часу. Якщо він стаціонарний, то його можна змоделювати різними способами, зокрема за допомогою двох складових - авторегресійної (AR) та ковзної середньої (MA). Відповідно сама модель є комбінацією цих двох складових.
Оскільки ARIMA-методологія використовується лише стаціонарних рядів, то першим кроком в ідентифікації процесу стає перевірка часового ряду на стаціонарність. Необхідність того, щоб тимчасові ряди були стаціонарними при ARIMA-моделюванні, обумовлена ​​тим, що ці моделі використовуються для прогнозу, а можна прогнозувати поведінку тільки тих процесів, основні характеристики яких (середня, дисперсія та коефіцієнти автоковаріації) не залежать від часу. Неможливо передбачити поведінку того процесу, в основі якого є нестаціонарний часовий ряд (математичне очікування, дисперсія та автоковаріація його змінюються залежно від часу). У такому разі складно знайти постійні середньої та дисперсії, тому слід шукати можливі перетворення низки, які можуть звести його до стаціонарного. Такими перетвореннями є операція відмінностей.
Моделювання економічних процесів за допомогою ARIMA-моделей дає можливість виявити динамічний зв'язок між потоковими та лаговими значеннями досліджуваного показника. Ці моделі є зручним інструментом коротко- та середньострокового прогнозування окремих часових рядів. Однак сучасні дослідження зосереджені на розробці апарату одночасного моделювання кількох часових рядів за допомогою системи динамічних рівнянь ARIMA-процесів, що дає можливість включати та досліджувати взаємозворотні зв'язки між показниками та їх лаговими значеннями.
Таким чином, VAR-моделі (векторна авторегресійна модель) є розширенням концепції ARIMA-моделювання окремого часового ряду. Термін "вектор" у цьому випадку вказує, що моделюються одночасно два або більше часових рядів. Термін «авторегресійна» означає включення лагових значень залежних змінних до правої частини кожного окремого рівняння системи. Стабільність VAR-моделей є необхідною умовою їхнього практичного використання. Вона передбачає, що послідовність зовнішніх шоків для VAR-системи має кінцевий ефект, що падає, тобто якщо шоки згасають з часом, то VAR-модель є стаціонарною.
У 90-ті роки ХХ ст. активно розвивається новий напрямок моделювання за допомогою моделей коригування помилки (error correction model – ECM). Ці моделі є структурною формою VAR-моделей, що включає нестаціонарні змінні. Для оцінки таких систем потрібні додаткові знання, зокрема коінтеграції часових рядів. Коінтеграція змінних дозволяє будувати коректні моделі навіть у разі їх нестаціонарності, не перетворюючи тимчасові ряди оператором відмінностей в стаціонарні. Це важливо для прикладних досліджень, оскільки, використовуючи оператор відмінностей, втрачається цінна «довгострокова» інформація динаміку поведінки часового ряду. Тому перетворювати ряди доцільно лише за необхідності.
Побудова та коректне впровадження ЄСМ передбачає певну послідовність.
1.Перевірка рядів на стаціонарність. Якщо вони не стаціонарні, необхідно визначити порядок інтеграції. За однакового порядку інтеграції можна переходити до перевірки рядів на коінтеграцію.
І тільки тоді, коли ряди коінтегрують, можна будувати ЄСМ (вона є не чим іншим, як VAR у структурній формі) та оцінювати її невідомі параметри.
Саме Р. Інгл і К. Гренджер запропонували власне розуміння коінтеграції: якщо між змінними, що розглядаються, існує довгостроковий зв'язок, то очевидно довгострокова рівновага досягається, коли:
γ1Υ1t + γ2Υ2t + ... + γkΥkt=0,
або в матричному вигляді:
γΥt=0, де γt=(γ1, γ2, ..., γk), Υt=(Υ1t, Υ2t, ..., Υkt).
Відхилення від довгострокової рівноваги називають «помилкою рівноваги», що відповідно дорівнює et=γΥt.
Якщо рівновага є, необхідно, щоб помилка рівноваги була стаціонарним процесом.
Виходячи з наведених формул, Р. Інгл і К. Гренджер стверджують: компоненти вектора Υt=(Υ1t, Υ2t, ..., Υkt) є коінтегрованими порядку d,b: ~ CI (d,b), якщо:
-Всі компоненти Υt мають однаковий порядок інтеграції d;
-існує вектор коефіцієнтів γt=(γ1, γ2, ..., γk) такий, що лінійна комбінація γ1Υ1t + γ2Υ2t + ... + γkΥkt є інтегрованою величиною порядку (d - b), b>0.
Вектор γ=(γ1, γ2, ..., γk) називають «коінтеграційним вектором». Очевидно, що якщо γt=(γ1, γ2, ..., γk) є коінтеграційним вектором, то для будь-якого додаткового значення Øγ=(Øγ1, Øγ2, ..., Øγk) є також коінтеграційним вектором. Тому на практиці одна із змінних використовується для нормалізації коінтеграційного вектора, тобто відповідний коефіцієнт повинен дорівнювати одиниці.
2.Перевірка тимчасових рядів на коінтеграцію. Існує кілька принципово різних підходів до тестування часових рядів на коінтеграцію. Р. Інгл і К. Гренджер запропонували спочатку оцінити рівняння довгострокової рівноваги, розрахувати надлишки, тобто отримати відповідний тимчасовий ряд надлишків, а потім, якщо надлишки виявляться стаціонарним рядом, можна зробити висновок про коінтеграцію.
На рубежі ХХ та ХХІ ст. у межах теорії валютного курсу основні зусилля вчених було спрямовано вивчення довгострокових взаємозв'язків відносних цін, і валютних курсів. Вони використовували сучасні методи економетричного аналізу: визначення порядку інтегрованості часових рядів та їхнє тестування на коінтеграцію.
Якщо два часових ряди коінтегровані, це означає, що й індивідуальні тренди взаємозалежні і що неспроможні значно відхилятися друг від друга. Відповідно до розробки Р.Інгла та К.Гренджера для коінтегрованих змінних існує ЄС-розподіл (error correction representation). Цей механізм вловлює короткострокове коригування змінних щодо довгострокової рівноваги. Тобто якщо номінальні валютні курси та відносні ціни коінтегровані, то паритет купівельної спроможності є умовою рівноваги валютних курсів, і вони у своїй довгостроковій динаміці наближаються до нього.
У більшості досліджень, які проводяться з використанням цієї методології, було встановлено коінтеграцію валютних курсів та відносних цін. Проте щодо різних груп країн ці результати були однозначними. Так, американські вчені К. Хабермайєр і М. Месквіта знайшли підтвердження теорії паритету купівельної спроможності для розвинених країн, але не змогли довести можливість її використання країнами, що розвиваються.
Значними є також дослідження Р. Інгла та К. Гренджера та у сфері економетричного прогнозування. Відомі різноманітні конкуруючі прогнози з різними інформаційними множинами та різними стратегіями моделювання. Ці прогнози можна порівнювати з «прогностичною здатністю», тобто зіставляти суми квадратів помилок прогнозування. За допомогою комбінування різноманітних прогнозів також отримують добрі прогнози. Таке комбінування можна здійснити, розраховуючи регресії фактичних значень ряду від різноманітних прогнозів, константи та лагових значень того ж ряду. Прогноз, який не вписується в таку регресію, можна відкинути, оскільки над ним домінують інші прогнози.
Точкове прогнозування має невелику цінність прийняття рішень без будь-яких вказівок на невизначеність. Щодо більшості традиційних економічних прогнозів 95% інтервали навколо прогнозованої точки надзвичайно великі, тому іноді рекомендуються 50% інтервали. Ще одна проблема полягає в тому, що дисперсії помилок прогнозування можуть змінюватись у часі. Як і середня умовна fn,h, умовна дисперсія може бути функцією використаної інформаційної множинності In:
h2n = E [(xn + h - fn, h) 2 | In].
Методи моделювання h2n менш розроблені, ніж методи моделювання fn,h помилки прогнозування еп,1=xn+1 - fn,1 часто є білим шумом, але квадратична помилка може виявитися не такою, що вказує на те, що умовні дисперсії можуть бути прогнозованими.
Позначивши через εt=xt - ft-1 однокрокові помилки прогнозування, Р. Інгл розглянув специфікацію:

і виявлений процес назвав «авторегресійним умовним гетероскедастичним процесом» (такий, що передбачає змінний розкид). Якщо дисперсія змінюється у часі прогнозовано, то перевага її моделювання полягає в тому, що при врахуванні гетероскедастичності вдається досягти більш точних оцінок параметрів у ft, а також отримати більш точні оцінки інтервалів навколо середнього прогнозу.
Р.Інгл розглянув різні форми для ht, зробивши висновок про їх особливості та методику оцінки, а також використавши метод множників Лагранжа для перевірки авторегресивної умовної гетероскедастичності (побудовані на основі цього підходу моделі названі «ARCH-моделями»). Він використав цей метод для аналізу даних про інфляцію у Великій Британії та виявив чіткі ознаки прогнозованості дисперсій: стандартне відхилення інфляції зросло за кілька років з 0,6 до 1,5% у міру руху економіки з передбачуваних 60-х до хаотичних 70-х років.
Наведений вище вираз для ht можна використовувати для включення керуючих змінних, що спостерігаються. Як приклад К. Гренджер досліджував зв'язок між роздрібними та оптовими цінами, причому у кожному рівнянні дисперсії були специфіковані вищеописаним порядком, але з додаванням квадратичних лагових значень модельованих та інших цін, а також квадратичних помилок прогнозування інших показників. Збагачення специфікації ARCH зумовило появу кращих (за коефіцієнтами правдоподібності) моделей, а також цікавіших інтерпретацій моделей. Було виявлено, що середні значення, і дисперсії оптових цін впливають відповідно на середні значення і дисперсії споживчих цін. А квадрати споживчих цін впливають на дисперсію оптових цін. Якби ці моделі були побудовані без урахування ARCH, то створювалася б видимість впливу споживчих цін на оптові ціни. Однак з урахуванням ARCH цей причинний зв'язок став слабким.
Оскільки на практиці дисперсії змінюються у передбачуваному часі, то використання моделей ARCH можна рекомендувати для випадків, коли довірчим інтервалам прогнозу приділяється значна увага. Інші сфери аналізу зосереджуються тих галузях економічної теорії, де дисперсію використовують як показник ризику (наприклад, фінансова теорія).
Останнім часом інструментарій аналізу часових рядів швидко розвивався. Але якщо брати для перевірки на коінтеграцію дві змінні, то краще й надалі використовувати тест Інгла-Гренджера (якщо перевіряти більше двох, то можна використовувати техніку Йохансена).
Дослідження методів аналізу економічних часових рядів в умовах мінливості тимчасової залежності (ARCH) Р.Інгл та К.Гренджер проводили на основі математичної моделі, яка дає можливість прогнозувати тенденції змін ВВП, споживчих цін, процентних ставок, біржового курсу не лише наступного дня, а навіть на рік уперед. Справа в тому, що на фінансових ринках випадкові відхилення показників від постійного значення (волатильність) є надзвичайно важливими, оскільки вартість акцій, опціонів та інших фінансових інструментів залежить від ризиків. Відхилення можуть значно змінюватись у часі: після періодів значних змін настають періоди незначних. Крім того, що реальна волатильність мінлива, економісти тривалий час запроваджували статистичні методи, що передбачають її постійність.
І лише виявлена ​​1982 р. Р.Инглом авторегрессивная гетероскедастична модель точно описує безліч часових рядів, які у економіці.
Результати дослідження волатильності широко використовують практично, зокрема:
а) з 1996 р. міжнародні угоди (звані Базельські правила) зобов'язують використовувати показники вартості, що піддається ризику, під час контролю необхідного капіталу банків. Використання методу ARCH у цих та інших ситуаціях зробило його необхідним інструментом для оцінки ризику у фінансовій сфері;
б)ними скористалися експерти для запровадження євро. Так, проект економічного та валютного союзу щодо інтересів низки держав був детально проаналізований академічними економістами США та Великобританії.
Їх цікавили питання, чи зростуть або зменшаться флуктуації (випадкові відхилення величини) параметрів системи, тобто обмінного курсу, внаслідок введення євро, зростуть або зменшаться при переході до єдиної валюти флуктуації платіжного балансу, чого можна очікувати від курсу долар США/євро.
За допомогою волатильності обмінного курсу було доведено, що флуктуацій поменшає. Між країнами-учасницями Єврозони вони зникнуть загалом. А оскільки зона євро розглядається як незмінне у часі творіння, то дорівнюватимуть нулю всі форвардні премії і зникне різниця у відсоткових ставках; залишаться тільки ножиці у податкових ставках та ризиках дефолту. Співдружність країн валютного союзу стане великою зоною валютної стабільності.
Фахівці також дійшли висновку, що коливання платіжних балансів за загальної валюти стануть меншими, ніж ті, що спостерігалися під час плаваючих курсів. Зникнуть два джерела нестабільності:
1)не коливатиметься обмінний курс, рух якого стимулюють потоки капіталу (спекулятивні потоки капіталу зникнуть або істотно ослабнуть);
2) у монетарній політиці профіцити платіжних балансів, які будуть меншими або більшими від бажаного рівня, автоматично коригуватимуться механізмом переливу резервів.
Від платіжних балансів усередині країн зони євро не відмовляться, але їх коригування програмуватиметься раніше і виявиться зовні не спостерігається за винятком екстраординарних випадків.
Щодо курсу долар США/євро зазначається, що він стане найважливішим ціновим фактором у світі. Дехто вважав, що цей курс повинен мати більші коливання, ніж курс долара США/німецька марка, оскільки економіка Євросоюзу більш замкнута, ніж об'єднані в союз національні економіки. Проте фахівці відхилили таку думку. Якщо орієнтуватися не на відносини імпорту або експорту до ВВП, а на загальний баланс платежів, і насамперед на рух капіталу, то з усуненням спекулятивних мотивів у зоні євро зникнуть і зрушення, що дестабілізують, від «слабших» валют до «сильніших».
Загалом сьогодні вже неможливо вивчати ключові моменти стабільності світової грошової системи, не використовуючи волатильності обмінного курсу. Крім того, модель Інгла є незамінною не лише для вчених, а й для фінансових та ринкових аналітиків, які використовують її при оцінці власності та ризиків портфельних інвестицій.
Фахівці вважають, що у багатьох аспектах економічні перетворення 90-х років подібні до перетворень першого десятиліття ХХ століття. Ефект від обережної фінансової політики є однаковим.
І все-таки, на думку Р.-А. Манделла, світоустрій змінилося на гірший бік: через постійну мінливість (волатильність) обмінних курсів за відсутності світової валюти. Від волатильності обмінних курсів особливо страждають країни, які прагнуть поодинці шляхом запровадження власних масштабів та індексів досягти стабільності цін. Тому волатильність є мірилом тих змін, які зазнають реальних обмінних курсів, і відображає дисфункціональні перекоси внутрішнього та міжнародного розвитку галузей, що ще більше посилює властиву фінансовим ринкам нестабільність.
Останні розробки у сфері аналізу нестаціонарних часових рядів вже впливають методи прогнозування. Р.Інгл та К.Гренджер розглядають властивості двох і більшої кількості об'єднаних змінних, кожна з яких є інтегрованою першого порядку, у той час як їх комбінація є стаціонарною (тобто інтегрованою нульовим порядком). Такі змінні називаються коінтегрованими.
Коінтеграція відіграє важливу роль в економічному моделюванні та прогнозуванні. По-перше, якщо змінні рівняння не коінтегровані, то оскільки помилки не стаціонарні, зв'язок між змінними може бути неправильно специфікований (або отримати значною мірою достовірну оцінку параметрів буде складно). По-друге, Р.Інгл та К.Гренджер довели, що якщо х і у є інтегрованими першого порядку, мають постійні середні та коінтегровані, то існує механізм, який коригує помилки генерування даних (модель коригування помилок), що виражається аналітично наступним чином:
Δyt=-α1ut-1 + лагові значення (Δy, Δx) + d(L)ε1t,
Δxt=- α2ut-1 + лагові значення (Δy, Δx) + d(L)ε2t, (6.1)
де ut=yt - βxt, (6.2)
а - оператор перших різниць. Тут d(L) є кінцевим поліномом лагового оператора L, а εi - випадковий процес, причому
│α1│+│α2│≠0.(6.3)
Інтерпретація (6.1) полегшується розглядом рівноважної ситуації, при якій різниці у формулі (6.1) нульові, і вираз (6.1) перетворюється на (6.2) при іt=0, тобто у рівновазі пропорційний х. Звідси, згідно з виразом (6.2), і - це відхилення від рівноважного значення, і оскільки є стаціонарним з нульовою середньою, то відхилення від рівноваги в період t-1 частково коригується в період t. Отже, механізм коригування помилок у економічній інтерпретації забезпечує зв'язок між структурними моделями та моделями часових рядів. Такий механізм коригування помилок є найважливішим для прогнозування, оскільки він означає, що модель, що включає лише відмінності змінних першого порядку, буде неправильно специфікована за коінтегрованими змінними. Це може статися, якщо, наприклад, модель VAR використовується для апроксимації даних, що мають вигляд відмінностей першого періоду.
Цінність новаторських ідей Р.Інгла та К.Гренджера полягає не лише в тому, що вони запропонували нові методи моделювання економічних залежностей, а й у тому, що розроблені ними моделі відкрили нові сфери досліджень. При цьому нобеліанти фундаментально обґрунтували використання таких моделей, довели коректність економетричної оцінки їхніх параметрів у разі порушення класичних прогнозів. Важливо й те, що кожен із запропонованих методів підтвердив теоретичні результати.

Вступ

У цьому розділі розглядаються завдання опису упорядкованих даних, отриманих послідовно (у часі). Власне кажучи, упорядкованість може мати місце у часі, а й у просторі, наприклад, діаметр нитки як функція її довжини (одномірний випадок), значення температури повітря як функція просторових координат (тривимірний випадок).

На відміну від регресійного аналізу, де порядок рядків у матриці спостережень може бути довільним, у часових рядах важлива впорядкованість, а отже, інтерес представляє взаємозв'язок значень, що належать до різних моментів часу.

Якщо значення ряду відомі в окремі моменти часу, такий ряд називають дискретним, на відміну від безперервногозначення якого відомі в будь-який момент часу. Інтервал між двома послідовними моментами часу назвемо тактом (кроком). Тут розглядатимуться в основному дискретні часові ряди з фіксованою протяжністю такту, що приймається за одиницю рахунку. Зауважимо, що тимчасові ряди економічних показників зазвичай дискретні.

Значення ряду можуть бути вимірюваними безпосередньо(ціна, прибутковість, температура), або агрегованими (кумулятивними), Наприклад, обсяг випуску; відстань, пройдена вантажоперевізниками за тимчасовим тактом.

Якщо значення ряду визначаються детермінованою математичною функцією, то ряд називають детермінованим. Якщо ці значення можуть бути описані лише із залученням імовірнісних моделей, то тимчасовий ряд називають випадковим .

Явище, що відбувається у часі, називають процесомтому можна говорити про детерміноване або випадкове процеси. В останньому випадку використовують часто термін "стохастичний процес". Аналізований відрізок часового ряду може розглядатися як приватна реалізація (вибірка) стохастичного процесу, що вивчається, генерованого прихованим імовірнісним механізмом.

Тимчасові ряди виникають у багатьох предметних сферах і мають різну природу. Для вивчення запропоновані різні методи, що робить теорію часових рядів дуже розгалуженою дисципліною. Так, залежно від виду часових рядів можна виділити такі розділи теорії аналізу часових рядів:

- стаціонарні випадкові процеси, що описують послідовності випадкових величин, ймовірнісні властивості яких не змінюються в часі. Подібні процеси поширені в радіотехніці, метереології, сейсмології тощо.

- Дифузійні процеси, що мають місце при взаємопроникненні рідин та газів.

– точкові процеси, що описують послідовності подій, таких як надходження заявок на обслуговування, стихійних та техногенних катастроф. Такі процеси вивчаються теорії масового обслуговування.

Ми обмежимося розглядом прикладних аспектів аналізу часових рядів, які корисні під час вирішення практичних завдань економіки, фінансах. Основний акцент буде зроблено на методи підбору математичної моделі для опису часового ряду та прогнозування його поведінки.

1. Цілі, методи та етапи аналізу часових рядів

Практичне вивчення часового ряду передбачає виявлення властивостей ряду та отримання висновків про ймовірнісний механізм, що породжує цей ряд. Основні цілі щодо тимчасового ряду такі:

- Опис характерних особливостей ряду в стиснутій формі;

- Побудова моделі тимчасового ряду;

– прогноз майбутніх значень на основі минулих спостережень;

- Керування процесом, що породжує тимчасовий ряд, шляхом вибірки сигналів, що попереджають про майбутні несприятливі події.

Досягнення поставлених цілей можливе далеко не завжди як через нестачу вихідних даних (недостатня тривалість спостереження), так і через мінливість з часом статистичної структури ряду.

Перелічені цілі диктують значною мірою послідовність етапів аналізу часових рядів:

1) графічне уявлення та опис поведінки ряду;

2) виділення та виключення закономірних, невипадкових складових ряду, що залежать від часу;

3) дослідження випадкової складової часового ряду, що залишилася після видалення закономірної складової;

4) побудова (підбір) математичної моделі для опису випадкової складової та перевірка її адекватності;

5) прогнозування майбутніх значень низки.

При аналізі часових рядів використовуються різні методи, найбільш поширеними є:

1) кореляційний аналіз, використовуваний виявлення характерних особливостей низки (періодичностей, тенденцій тощо. буд.);

2) спектральний аналіз, що дозволяє знаходити періодичні складові часового ряду;

3) методи згладжування та фільтрації, призначені для перетворення часових рядів з метою видалення високочастотних та сезонних коливань;

5) методи прогнозування.

2.Структурні компоненти часового ряду

Як зазначалося, у моделі часового ряду прийнято виділяти дві основні складові: детерміновану і випадкову (рис.). Під детермінованою складовою часового ряду розуміють числову послідовність, елементи якої обчислюються за певним правилом як функція часу t. Виключивши детерміновану складову з даних, ми отримаємо ряд, що коливається навколо нуля, який може в одному граничному випадку представляти суто випадкові стрибки, а в іншому - плавний коливальний рух. Найчастіше буде щось середнє: деяка иррегулярность і певний систематичний ефект, обумовлений залежністю послідовних членів низки.

У свою чергу детермінована складова може містити такі структурні компоненти:

1) тренд g, що являє собою плавну зміну процесу в часі та обумовлений дією довготривалих факторів. Як приклад таких чинників економіки можна назвати: а) зміна демографічних показників популяції (чисельності, вікової структури); б) технологічний та економічний розвиток; в) зростання споживання.

2) сезонний ефект s , пов'язаний з наявністю факторів, що діють циклічно із заздалегідь відомою періодичністю. Ряд у цьому випадку має ієрархічну шкалу часу (наприклад, усередині року є сезони, пов'язані з часом року, квартали, місяці) і в однойменних точках ряду мають місце подібні ефекти.


Мал. Структурні компоненти часового ряду.

Типові приклади сезонного ефекту: зміна завантаженості автотраси протягом доби, по днях тижня, порах року, пік продажу товарів для школярів наприкінці серпня – на початку вересня. Сезонна компонента з часом може змінюватися або носити плаваючий характер. Так на графіку обсягу перевезень авіалайнерами (див. рис.) видно, що локальні піки, що припадають на свято Великодня, «плавають» через мінливість його термінів.

Циклічна компонента c, що описує тривалі періоди відносного підйому та спаду і складається з циклів змінної тривалості та амплітуди. Подібна компонента характерна для рядів макроекономічних показників. Циклічні зміни обумовлені тут взаємодією попиту та пропозиції, а також накладенням таких факторів, як виснаження ресурсів, погодні умови, зміни у податковій політиці тощо. Зазначимо, що циклічну компоненту вкрай важко ідентифікувати формальними методами, виходячи лише з даних ряду, що вивчається.

«Вибухова» компонента i, інакше інтервенція, під якою розуміють істотне короткочасне вплив на тимчасовий ряд. Прикладом інтервенції можуть бути події «чорного вівторка» 1994 р., коли курс долара протягом дня зріс кілька десятків відсотків.

Випадкова складова ряду відображає вплив численних факторів випадкового характеру і може мати різноманітну структуру, починаючи від найпростішої у вигляді «білого шуму» до дуже складних, що описуються моделями авторегресії-ковзного середнього (докладніше).

Після виділення структурних компонентів необхідно специфікувати форму їх входження в часовий ряд. На верхньому рівні подання з виділенням лише детермінованої та випадкової складових зазвичай використовують адитивну чи мультиплікативну моделі.

Адитивна модель має вигляд

мультиплікативна -

де - значення ряду на момент t ;

значення детермінованої складової;

Значення випадкової складової.

У свою чергу, детермінована складова може бути представлена ​​як адитивна комбінація детермінованих компонентів:

як мультиплікативна комбінація:


,

або як змішана комбінація, наприклад,

3.Моделі компонентів детермінованої складової часового ряду

3.1.Моделі тренду

Тренд відбиває дію постійних довготривалих чинників і має плавний характер, отже, для опису тренду широко використовують поліноміальні моделі, лінійні за параметрами

де значення ступеня kполінома рідко перевищує 5.

Поряд із поліноміальними моделями економічні дані, що описують процеси зростання, часто апроксимуються такими моделями:

– експоненційною

Ця модель описує процес із постійним темпом приросту, тобто

- Логістичної

У процесу, що описується логістичною кривою, темп приросту характеристики, що вивчається, лінійно падає зі збільшенням y, тобто

- Гомперця

.

Ця модель описує процес, у якому темп приросту досліджуваної характеристики пропорційний її логарифму.

.

Дві останні моделі задають криві тренди S-Образної форми, представляючи процеси з наростаючим темпом зростання в початковій стадії з поступовим уповільненням в кінці.

При підборі відповідної функціональної залежності, інакше специфікації тренду, дуже корисним є графічне уявлення часового ряду.

Зазначимо також, що тренд, відбиваючи дію довгострокових чинників, є визначальним під час побудови довгострокових прогнозів.

3.2 Моделі сезонної компоненти

Сезонний ефект у часовому ряді проявляється на «фоні» тренда і його виділення виявляється можливим після попередньої оцінки тренда. (Тут не розглядаються методи спектрального аналізу, що дозволяє виділити внесок сезонної компоненти у спектр без обчислення інших компонентів ряду). Справді, ряд помісячних даних, що лінійно зростає, матиме схожі ефекти в однойменних точках - найменше значення в січні і найбільше в грудні; проте навряд чи тут доречно говорити про сезонний ефект: виключивши лінійний тренд, ми отримаємо ряд, у якому сезонність повністю відсутня. У той же час ряд, що описує помісячні обсяги продажів новорічних листівок, хоч і матиме таку ж особливість (мінімум продажів у січні і максимум у грудні) матиме швидше за все коливальний характер щодо тренду, що дозволяє специфікувати ці коливання як сезонний ефект.

У найпростішому випадку сезонний ефект може виявлятися у вигляді строго періодичної залежності.

Для будь-кого t, де t- Період сезонності.

У загальному випадку значення, що віддаляються на tможуть бути пов'язані функціональною залежністю, тобто

Наприклад, сезонний ефект сам може містити трендову складову, що відображає зміну амплітуди коливань.

Якщо сезонний ефект входить до ряду адитивно, то модель сезонного ефекту можна записати як


де - булеви, інакше індикаторні, змінні, по одній на кожен такт усередині періоду tсезонності. Так, для ряду місячних даних = 0 для всіх t , крім січня кожного року, котрій =1 тощо. Коефіцієнт показує відхилення січневих значень від тренду, - відхилення лютневих значень і так далі до . Щоб зняти неоднозначність у значеннях коефіцієнтів сезонності, вводять додаткове обмеження, так звана умова репараметризації, зазвичай

У тому випадку, коли сезонний ефект має мультиплікативний характер, тобто

модель ряду з використанням індикаторних змінних можна записати у вигляді

Коефіцієнти, у цій моделі прийнято називати сезонними індексами.

Для повністю мультиплікативного ряду


зазвичай проводять процедуру лінеаризації операцією логарифмування.

Умовимося називати представлені моделі сезонного ефекту «індикаторними». Якщо сезонний ефект досить «гладкий» – близький до гармоніки, використовують «гармонічну» виставу.

,

де d- амплітуда, w- Умови частоти (у радіанах в одиницю часу), a- Фаза хвилі. Оскільки фаза зазвичай наперед невідома. Останній вираз записують як

Параметри Аі Уможна оцінити за допомогою регресії. Кутова частота wвважається відомою. Якщо якість припасування виявиться незадовільною, поряд з гармонікою wосновний хвилі в модель включають додатково першу гармоніку (з подвоєною основною частотою 2 w), при необхідності і другу і так далі гармоніки. В принципі, з двох уявлень: індикаторного та гармонійного – слід вибирати те, що вимагатиме меншої кількості параметрів.

3.3 Модель інтервенції

Інтервенція, що є впливом, істотно перевищує флуктуації низки, може мати характер «імпульсу» чи «сходинки».

Імпульсний вплив короткочасно: розпочавшись, воно майже відразу закінчується. Ступінчаста дія тривалий час, носить стійкий характер. Узагальнена модель інтервенції має вигляд

де - значення детермінованої компоненти ряду, що описується як інтервенція;

Коефіцієнти типу ковзного середнього;

Екзогенна змінна одного із двох типів;

(«Схід»), або («імпульс»)

де - фіксований момент часу, званий моментом інтервенції.

4.Методи виділення тренду

Наведені у п.3.1 специфікації ряду є параметричними функціями часу. Оцінювання параметрів може бути проведено методом найменших квадратів як і, як у регресійному аналізі. Хоча статистичні передумови регресійного аналізу (див. п.) у часових рядах часто не виконуються (особливо п.5 – некорелюваність обурень), проте оцінки тренду виявляються прийнятними, якщо модель специфікована правильно і серед спостережень немає великих викидів. Порушення передумов регресійного аналізу позначається не так на оцінках коефіцієнтів, як на їх статистичних властивостях, зокрема, спотворюються оцінки дисперсії випадкової складової та довірчі інтервали для коефіцієнтів моделі.

У літературі описуються методи оцінювання за умов корелювання обурень, проте їх застосування вимагає додаткової інформації про кореляцію спостережень.

Головна проблема при виділенні тренду полягає в тому, що підібрати єдину специфікацію для всього тимчасового часто неможливо, оскільки змінюються умови протікання процесу. Облік цієї мінливості особливо важливий, якщо тренд обчислюється з метою прогнозування. Тут дається взнаки особливість саме часових рядів: дані, що стосуються «далекого минулого», будуть неактуальними, марними або навіть «шкідливими» для оцінювання параметрів моделі поточного періоду. Ось чому при аналізі часових рядів широко використовуються процедури зважування даних.

Для врахування мінливості умов модель ряду часто наділяють властивістю адаптивності принаймні на рівні оцінок параметрів. Адаптивність розуміється в тому сенсі, що оцінки параметрів легко перераховуються принаймні надходження нових спостережень. Звичайно, і звичайному методу найменших квадратів можна надати рис адаптивності, перераховуючи оцінки щоразу, залучаючи в процес обчислень старі дані плюс свіжі спостереження. Однак при цьому кожен новий перерахунок веде до зміни попередніх оцінок, тоді як адаптивні алгоритми вільні від цього недоліку.

4.1 Ковзаючі середні

Метод ковзних середніх – один із найстаріших і широко відомих способів виділення детермінованої складової часового ряду. Суть методу полягає у усередненні вихідного ряду на інтервалі часу, довжина якого обрано заздалегідь. При цьому сам вибраний інтервал ковзає вздовж ряду, зрушуючи щоразу на один такт вправо (звідси назва методу). За рахунок усереднення вдається суттєво зменшити дисперсію випадкової складової.

Ряд нових значень стає гладкішим, ось чому подібну процедуру називають згладжуванням часового ряду.

Процедуру згладжування розглянемо спочатку для ряду, що містить лише трендову складову, яку адитивно накладений випадкових компонент.

Як відомо, гладка функція може бути локально представлена ​​у вигляді полінома з досить високим ступенем точності. Відкладемо від початку часового ряду інтервал часу завдовжки (2 m+1) точок і побудуємо поліном ступеня mдля відібраних значень і використовуємо цей поліном для визначення значення тренду ( m +1 )-й, середній, точці групи.

Побудуємо для визначеності поліном 3-го порядку для інтервалу із семи спостережень. Для зручності подальших перетворень занумеруємо моменти часу всередині обраного інтервалу те щоб його середина мала нульове значення, тобто. t= -3, -2, -1, 0, 1, 2, 3. Запишемо шуканий поліном:


Константи знаходимо методом найменших квадратів:

Диференціюємо за коефіцієнтами:

;

Суми непарних порядків t від -3 до +3 дорівнюють 0, і рівняння зводяться до вигляду:


Використовуючи перше і третє рівнянь, отримуємо при t=0:

Отже, значення тренду в точці t= 0 дорівнює середньозваженому значенню семи точок з даною точкою як центральна і вагами

, які в силу симетрії можна записати коротше:

.

Для того, щоб обчислити значення тренда в наступній, (m+2)-й точці вихідного ряду (у нашому випадку п'ятої), слід скористатися формулою (1), де значення спостережень беруться з інтервалу, зрушеного на такт праворуч, і т.д. до точки N - m .

кількість точок формула

9 .

Властивості ковзних середніх:

1) сума терезів дорівнює одиниці (т.к. згладжування ряду, всі члени якого рівні одній і тій же константі, повинно призводити до тієї ж константи);

2) ваги симетричні щодо серединного значення;

3) формули не дозволяють обчислити значення тренду для перших та останніх m значень ряду;

4) можна вивести формули для побудови трендів на парному числі точок, проте при цьому було б отримано значення трендів у серединах тимчасових тактів. Значення тренда у точках спостережень можна визначити у цьому випадку як напівсума двох сусідніх значень тренду.

Слід зазначити, що при парному числі 2 mтактов в інтервалі усереднення (двадцять чотири години на добу, чотири тижні на місяці, дванадцять місяців на рік), широко практикується просте усереднення з вагами. Нехай є, наприклад, спостереження на останній день кожного місяця з січня до грудня. Просте усереднення 12 пікселів з вагами дає значення тренду в середині липня. Щоб отримати значення тренда на кінець липня, треба взяти середнє значення тренду в середині липня і середині серпня. Виявляється, це еквівалентно усередненню 13-місячних даних, але значення на краях інтервалу беруть із вагами. Отже, якщо інтервал згладжування містить парне число 2 mточок, у усередненні задіяні не 2 m, а 2 m+1 значень ряду:

Ковзаючі середні, згладжуючи вихідний ряд, залишають у ньому трендову та циклічну складові. Вибір величини інтервалу згладжування повинен робитися з змістовних міркувань. Якщо ряд містить сезонний компонент, то величина інтервалу згладжування вибирається рівною чи кратною періоду сезонності. У відсутності сезонності інтервал згладжування береться зазвичай у діапазоні три-сім

Ефект Слуцького-Юла

Розглянемо, як впливає процес згладжування на випадкову складову ряду, щодо якої вважатимемо, що вона центрована та сусідні члени ряду некорельовані.

Ковзне середнє випадкового ряду xє:

.

З огляду на центрованість xта відсутності кореляцій між членами вихідного ряду маємо:

І .

З отриманих співвідношень видно, що усереднення призводить до зменшення дисперсії коливань. Крім того, члени ряду, отримані в результаті усереднення, не є тепер незалежними. Похідний, згладжений ряд має ненульові автокореляції (кореляції між членами ряду, розділених k-1 спостереженнями) аж до порядку 2m. Таким чином, похідний ряд буде більш гладким, ніж вихідний випадковий ряд, і в ньому можуть виявлятися систематичні коливання. Цей ефект називається ефектом Слуцького-Юла.

4.2 Визначення порядку полінома шляхом послідовних різниць

Якщо є ряд, що містить поліном (або локально представляється поліномом) з накладеним на нього випадковим елементом, було б природно дослідити, чи не можна виключити поліноміальну частину обчисленням послідовних різниць ряду. Справді, різниці полінома порядку k є поліном порядку k-1. Далі, якщо ряд містить поліном порядку p , то перехід до різниць, повторений (p+1) разів, виключає його та залишає елементи, пов'язані з випадковою компонентою вихідного ряду.

Розглянемо, наприклад, перехід до різниць у ряді, що містить поліном третього порядку.

0 1 8 27 64 125

6 12 18 24

6 6 6

0 0

Взяття різниць перетворює випадкову складову низки.

У загальному випадку отримуємо:

;

.

З останнього співвідношення отримуємо

Отже, метод послідовних різниць змінної полягає у обчисленні перших, других, третіх тощо. різниць, визначення сум квадратів, розподілі на і т.д. та виявлення моменту, коли це ставлення стає постійним. Таким чином, ми отримуємо оцінки порядку полінома, що міститься у вихідному ряді, та дисперсії випадкового компонента.

4.3.Методи експоненційного згладжування

Методи побудови функцій для опису спостережень досі ґрунтувався на критерії найменших квадратів, відповідно до яких усі спостереження мають рівну вагу. Однак, можна припустити, що недавнім точкам слід надавати в певному сенсі більшої ваги, а спостереження, що стосуються далекого минулого, повинні мати порівняно з ними меншу цінність. До певної міри ми враховували це у ковзаючих середніх з кінцевою довжиною відрізка усереднення, де значення ваг, що приписуються групі з 2m+1 значень, не залежать від попередніх значень. Тепер звернемося до іншого методу виділення «свіжіших» спостережень.

Розглянемо ряд терезів, пропорційних множнику b, саме і т.д. Оскільки сума терезів має дорівнювати одиниці, тобто. , терезами фактично будуть і т.д. (передбачається, що 0

4.3.1 Просте експонентне згладжування

Розглянемо найпростіший ряд, рівний сумі постійної (рівень) та випадкової компоненти:

.

У наведеному вираженні розбіжності між спостереженими значеннями ряду та оцінкою рівня беруться з експоненційно спадаючими вагами залежно від віку даних.

; ; .

Отриману оцінку на момент tпозначимо ( t). Згладжене значення у момент tможна виразити через згладжене значення у минулий момент t-1 та нове спостереження:

Отримане співвідношення

Перепишемо трохи інакше, ввівши так зване постійне згладжування (0 £ a£1).

З отриманого співвідношення видно, що нове згладжене значення виходить із попереднього корекцією останнього частку помилки, неузгодженості між новим і прогнозним значеннями ряду. Відбувається свого роду адаптація рівня до нових даних.

4.3.2 Експонентне згладжування високих порядків

Узагальним метод експоненційного згладжування у разі, коли модель процесу визначається лінійної функцією . Як і раніше, при заданому b мінімізуємо:

.

(Тут для зручності представлення знаки ~ та Ù опущені).

,

З врахуванням того, що

, ,

отримуємо

Запишемо: .

Цю операцію можна як згладжування 1-го порядку. За аналогією побудуємо згладжування 2-го порядку:

; .

Розглянуту вище процедуру можна узагальнити на випадок поліноміальних трендів вищого порядку n, при цьому вирази алгебри будуть складніше. Наприклад, якщо модель описується параболою, використовується метод потрійного експоненційного згладжування.

5. Оцінювання та виключення сезонної компоненти

Сезонні компоненти можуть представляти самостійний інтерес чи у ролі заважає чинника. У першому випадку необхідно вміти виділяти їх із ряду та оцінювати параметри відповідної моделі. Що ж до видалення сезонної компоненти з ряду, то тут можливі кілька способів.

Розглянемо спочатку процедуру оцінювання сезонних ефектів. Нехай вихідний ряд є повністю адитивним, тобто

.

Необхідно оцінити за спостереженими. Іншими словами, необхідно отримати оцінку коефіцієнтів індикаторної моделі.

Як зазначалося, сезонний ефект проявляється на тлі тренду, тому спочатку необхідно оцінити трендову складову одним з розглянутих методів. Потім для кожного сезону обчислюють всі різниці, що відносяться до нього.

де, як завжди, - спостерігане значення ряду, - оцінене значення тренду.

Кожна з цих різниць дає спільну оцінку сезонного ефекту та випадкового компонента, відмінного, щоправда, від вихідного через взяття різниць.

Виробляючи усереднення отриманих різниць, одержують оцінки ефектів. Вважаючи, що вихідний ряд містить ціле число kперіодів сезонності та обмежуючись простим середнім, маємо

З урахуванням умови репараметризації, що вимагає, щоб сума сезонних ефектів дорівнювала нулю, отримуємо скориговані оцінки

.

У разі мультиплікативного сезонного ефекту, коли модель ряду має вигляд

,

обчислюють вже не різниці, а відносини

.

Як оцінка сезонного індексу виступає середнє

.

Насправді вважається, що з оцінки сезонних ефектів тимчасовий ряд має містити щонайменше п'яти-шості періодів сезонності.

Перейдемо тепер до способів видалення сезонного ефекту із ряду. Таких методів два. Перший з них назвемо «післятрендовий». Він є логічним наслідком розглянутої вище процедури оцінювання. Для адитивної моделі видалення сезонної компоненти зводиться до віднімання оціненої сезонної компоненти вихідного ряду. Для мультиплікативної моделі значення ряду поділяють на сезонні індекси.

Другий спосіб не вимагає попередньої оцінки ні трендової, ні сезонної компонент, а ґрунтується на використанні різницевих операторів.

Різносні оператори.

При дослідженні часових рядів часто можна представити детерміновані функції часу простими рекурентними рівняннями. Наприклад, лінійний тренд

можна записати як

Останнє співвідношення виходить із (1) порівнянням двох значень ряду для сусідніх моментів t-1 та t. Враховуючи, що співвідношення (2) є справедливим і для моментів t-2 та t - 1, так що , модель (1) можна записати і у вигляді


Модель (3) явно не містить параметрів, що описують тренд. Більш компактно описані перетворення можна описати, використовуючи оператори взяття різниці назад

Моделі (2) та (3) можна записати як

Виходить, різницю другого порядку повністю виключає з вихідного ряду лінійний тренд. Легко бачити, що різниця порядку dвиключає із ряду поліноміальний тренд порядку d-1. Нехай тепер ряд містить сезонний ефект із періодом t, так що

Процедура переходу від ряду ( t = 1,2,...,T) до ряду називається взяттям першої сезонної різниці, а оператор сезонним різницевим оператором з періодом t. З (4) випливає, що

Виходить, взяття сезонної різниці виключає з часового ряду будь-яку детерміновану сезонну компоненту.

Іноді корисні сезонні оператори вищих порядків. Так, сезонний оператор другого порядку з періодом tє

Якщо ряд містить і тренд, і сезонну складову, можна виключити, послідовно застосовуючи оператори і .

Легко показати, що порядок застосування цих операторів не суттєвий:

Зазначимо також, що детермінований тренд, що складається з тренду та сезонної компоненти, після застосування операторів і повністю вироджується, тобто . Проте записавши останнє рівняння у рекурентній формі, отримуємо

З останніх співвідношення видно, як ряд можна необмежено продовжувати, маючи спочатку принаймні t+1 Послідовне значення.

6. Моделі випадкової складової часового ряду

лінійний ряд тимчасової системи

Для зручності викладу умовимося позначати тут випадкові величини оскільки це прийнято у математичної статистиці – малими літерами.

Випадковим процесом X ( t ) на множині Т називають функцію, значення якої випадкові при кожному tÎT. Якщо елементи Т рахункові (дискретний час), випадковий процес часто називають випадковою послідовністю.

Повний математичний опис випадкового процесу передбачає завдання системи функцій розподілу:

- для кожного tÎT, (1)

– для кожної пари елементів

і взагалі для будь-якої кінцевої кількості елементів

Функції (1), (2), (3) називають кінцевими розподілами випадкового процесу.

Побудувати таку систему функції для випадкового процесу практично неможливо. Зазвичай випадкові процеси задають за допомогою апріорних припущень щодо його властивостей, таких як незалежність прирощень, марківський характер траєкторій тощо.

Процес, у якого всі кінцеві розподіли нормальні, називається нормальним (гауссовським). Виявляється, що для повного опису такого процесу достатньо знання одно- та двовимірних розподілів (1), (2), що важливо з практичної точки зору, оскільки дозволяє обмежитися дослідженням математичного очікування та кореляційною функцією процесу.

Теоретично часових рядів використовуються ряд моделей випадкової складової, починаючи від найпростішої – «білого шуму», до дуже складних типу авторегресії – ковзного середнього та інших, які будуються з урахуванням білого шуму.

Перш ніж визначати процес білого шуму, розглянемо послідовність незалежних випадкових величин, для якої функція розподілу є.

З останнього співвідношення випливає, що всі кінцеві розподіли послідовності визначаються за допомогою одномірних розподілів.

Якщо до того ж у такій послідовності складають її випадкові величини X (t) мають нульове математичне очікування і розподілені однаково за всіх tÎT, це – «білий шум». У разі нормальності розподілу X (t) говорять про гауссівський білий шум. Отже, гаусівський білий шум – послідовність незалежних нормально розподілених випадкових величин із нульовим математичним очікуванням та однаковою (загальною) дисперсією.

Більш складними моделями, що широко використовуються в теорії та практиці аналізу часових рядів, є лінійні моделі: процеси ковзного середнього, авторегресії та змішані.

Процес ковзного середнього порядку qє зваженою сумою випадкових обурень:

де - незалежні однаково розподілені випадкові величини (білий шум);

- Чисельні коефіцієнти.

Легко бачити з визначення, що процес ковзного середнього порядку q(скорочено CC( q)) статистично залежними є ( q+1) поспіль величин, що йдуть X (t), X (t -1),..., X (t - q). Члени ряду, віддалені один від одного більше ніж на q+1) такт, статистично незалежні, оскільки у їх формуванні беруть участь різні доданки.

де - випадкове обурення, що діє в даний момент t ;

- Чисельні коефіцієнти.

Виражаючи послідовно відповідно до співвідношення (5) X(t-1) через X(t-2), . . . , X(t-p-1), потім X(t-2) через X(t-3), . . . , X(t-p-2) і т.д. отримаємо, що X(t) є нескінченна сума минулих обурень З цього випливає, члени процесу авторегресії X(t) і X(t-k) статистично залежні за будь-якого k .

Процес АР(1) часто називають процесом Маркова, АР(2) – процесом Юла. У загальному випадку марковським називають такий процес, майбутнє якого визначається лише його станом у теперішньому та впливами на процес, які будуть опинятися у майбутньому, тоді як його стан до теперішнього моменту при цьому несуттєвий. Процес АР(1)

є марківським, оскільки його стан у будь-який момент визначається через значення процесу, якщо відома величина в момент. Формально процес авторегресії довільного порядку також можна вважати марківським, якщо його станом у момент tвважати набір

(X(t), X(t-1), . . . , X(t-p-1)).

Більш повно моделі СС, АР, і навіть їх композиція: моделі авторегрессии – ковзного середнього розглядаються далі (п.10.1.5). Зауважимо лише, що всі вони є окремими випадками загальної лінійної моделі.

де - вагові коефіцієнти, кількість яких, взагалі-то кажучи, нескінченна.

Серед моделей випадкової складової виділимо важливий клас – стаціонарні процеси, такі властивості яких не змінюються в часі. Випадковий процес Y(t) називається стаціонарним, якщо для будь-яких n, Розподіл випадкових величин і однакові. Іншими словами, функції кінцевих розподілів не змінюються при зрушенні часу:


Випадкові величини, що утворюють стаціонарну послідовність, розподілені однаково, так що певний вище процес білого шуму є стаціонарним.

7.Числові характеристики випадкової складової

При аналізі часових рядів використовуються числові характеристики, аналогічні характеристикам випадкових величин:

– математичне очікування (середнє значення процесу)

;

- Автоковаріаційна функція

– дисперсія

- стандартне відхилення

– автокореляційна функція

– приватна автокореляційна функція

Зауважимо, що в операторі функції усереднення відбувається при незмінному t, тобто є математичне очікування за безліччю реалізацій (загалом кажучи, потенційних оскільки «у річку часу не можна увійти двічі»).

Розглянемо введені числові показники для стаціонарних процесів. З визначення стаціонарності випливає, що для будь-яких s , tі

поклавши = - t, отримуємо

(1)

Виходить, у стаціонарного процесу математичне очікування та дисперсія однакові за будь-якого t, а автоковараційна та автокореляційна функції залежать не від моменту часу sабо t, а лише від їхньої різниці (лага).

Зазначимо, що виконання властивостей (1) ще не тягне за собою стаціонарності в сенсі визначення з п.6. Проте сталість перших двох моментів, і навіть залежність автокореляційної функції лише відкладу виразно відбиває деяку незмінність процесу у часі. Якщо виконані умови (1), то говорять про стаціонарність процесу в широкому значенні, тоді як виконання умов () означає стаціонарність у вузькому (строгому) значенні.

Дане вище визначення білого шуму слід трактувати у вузькому значенні. Насправді часто обмежуються білим шумом у сенсі, під яким розуміють часовий ряд (випадковий процес), у якого =0 і

Зазначимо, що гаусовський процес, стаціонарний у вузькому значенні, стаціонарний і у сенсі.

Про стаціонарність у сенсі судити набагато простіше. Для цього використовують різні статистичні критерії, що базуються на одній реалізації випадкового процесу.

8.Оцінювання числових характеристик часового ряду

Оцінювання числових характеристик випадкового часового ряду у кожний момент часу потребує набору реалізацій (траєкторій) відповідного випадкового процесу. Хоча час і не відтворюється, проте умови протікання процесу іноді можна вважати такими, що повторюються. Особливо це характерно для технічних додатків, наприклад, коливання напруги електричної мережі протягом доби. Тимчасові ряди, що спостерігаються у різну добу, можна вважати незалежними реалізаціями одного випадкового процесу.

Інша ситуація щодо процесів соціально-економічної природи. Як правило, тут доступна єдина реалізація процесу, повторити яку неможливо. Отже, отримати оцінки середнього, дисперсії, підступності не можна. Однак для стаціонарних процесів подібні оцінки таки можливі. Нехай спостерігаються значення часового ряду в моменти відповідно. Традиційна оцінка середнього може бути оцінкою математичного очікування стаціонарного (у сенсі) випадкового процесу.

Зрозуміло, що така оцінка для стаціонарного ряду буде незміщеною. Спроможність цієї оцінки встановлюється теоремою Слуцького, яка як необхідна і достатня умова вимагає

,

де – автокореляційна функція процесу.

Точність оцінювання середнього залежить від довжини Nряду. Вважається, що довжина Nзавжди має бути не менше так званого часу кореляції, під яким розуміють величину

Величина Тдає уявлення про порядок величини проміжку часу , у якому зберігається помітна кореляція між двома значеннями ряду.

Розглянемо тепер одержання оцінок значень автокореляційної функції. Як і раніше, - спостережені значення часового ряду. Утворюємо ( N-1) пар. Ці пари можна як вибірку двох випадкових величин, котрим можна визначити оцінку стандартного коефіцієнта кореляції . Потім складемо ( N-2) пар і визначимо оцінку тощо. Оскільки при підрахунку чергового обсяг вибірки змінюється, змінюється значення середнього та стандартного відхилення для відповідного набору значень. Для спрощення прийнято вимірювати всі змінні щодо середнього значення всього ряду та замінювати дисперсійні члени у знаменнику на дисперсію ряду загалом, тобто

,

де - Середнє, рівне .

При великих Nрозбіжності в оцінках незначні. На практиці kберуть не вище N /4.

Якщо ряд розглядається як генеральна сукупність нескінченної довжини, то говорять про автокореляції (теоретичні) і позначають їх. Масив коефіцієнтів чи відповідних їм вибіркових коефіцієнтів містять дуже цінну інформацію про внутрішню структуру низки. Сукупність коефіцієнтів кореляції, нанесена на графік із координатами k(лаг) по осі абсцис і або по осі ординат називають корелограмою (теоретичною або вибірковою відповідно).

Точнісні характеристики оцінки отримані для гауссівських процесів. Зокрема, для гаусовського білого шуму, у якого всі кореляції дорівнюють нулю, . Математичне очікування для гаусовского білого шуму виявляється не рівним нулю, а саме, тобто оцінка виявляється зміщеною. Величина усунення зменшується зі зростанням обсягу вибірки і менш істотна у прикладному аналізі.

Оцінка асимптотично нормальна при , що дає основу для побудови приблизного довірчого інтервалу. Широко застосовуваний 95%-інтервал є.

Кордони довірчого інтервалу, нанесені на графік, називають довірчою трубкою. Якщо корелограма деякого випадкового процесу не виходить за межі довірчої трубки, цей процес близький до білого шуму. Щоправда, цю умову можна вважати лише достатньою. Нерідко вибіркова корелограма гаусівського білого шуму містить один, а то й два викиди серед перших 20 оцінок, що ускладнює інтерпретацію подібної корелограми.

Поряд із автокореляційною функцією при аналізі структури випадкового часового ряду використовується приватна автокореляційна функція, значення якої є приватними коефіцієнтами кореляції.

9. Вільні від закону розподілу критерії перевірки низки на випадковість

Найпростішою гіпотезою, яку можна висунути щодо ряду, що коливається, не має явно вираженого тренда, є припущення, що коливання випадкові. У випадкових рядах, згідно з гіпотезою, спостереження незалежні і можуть йти в будь-якому порядку. Для перевірки на випадковість бажано використовувати критерій, що не вимагає будь-яких обмежень на вигляд розподілу сукупності, з якої, за припущенням, витягуються значення, що спостерігаються.

1. Критерій поворотних точокполягає в підрахунку піків (величин, які більше двох сусідніх) і западин (величин, які менші від двох сусідніх). Розглянемо ряд y1,...,yN.

пік западина

y t-1< y t >y t+1 y t-1 > y t< y t+1


y t-1 y t y t+1 y t-1 y t y t+1

Мал. Поворотні точки.

Для визначення поворотної точки потрібні три послідовні значення. Початкове та кінцеве значення не можуть бути поворотними точками, тому що невідомо y 0 та y N+1 . Якщо ряд випадковий, ці три значення можуть слідувати у кожному з шести можливих порядків з рівною ймовірністю. Тільки в чотирьох з них буде поворотна точка, а саме коли найбільше або найменше з трьох значень знаходиться в середині. Отже, ймовірність виявлення поворотної точки у будь-якій групі з трьох значень дорівнює 2/3.


Мал. Варіанти взаємного розташування трьох точок.

Для групи з N величин визначимо лічильну змінну Х.

ì 1, якщо y t-1< y t >y t+1 або y t-1 > y t< y t+1

î 0, інакше.

Тоді число поворотних точок р ряді є просто , які математичне очікування є М[p]=2/3(N-2). Дисперсія числа поворотних точок обчислюється за такою формулою D[p]=(16N-29)/90, а саме розподіл близько до нормального.

2. Критерій, що ґрунтується на визначенні довжини фази

Інтервал між двома поворотними точками називається фазою. Для того, щоб встановити наявність фази довжини d (наприклад, висхідної), потрібно виявити d+3 членів, що містять падіння від першого члена до другого, потім послідовний підйом до (d+2)-го члена і падіння до (d+3) -йому члену.


1 2 3 4 d+1 d+2 d+3 N

Мал. 3. Фаза довжини d.

Розглянемо групу із d+3 чисел, розташованих у порядку зростання. Якщо, не торкаючись двох крайніх членів, витягти пару чисел з d+1, що залишилися, і одне з них поставити на початок, а інше в кінець, отримаємо фазу довжини d. Існує способів такого вибору пари чисел і кожен член пари може бути поставлений у будь-який кінець, отже кількість висхідних фаз дорівнює d(d+1).

Крім того, поворотні точки будуть мати місце, якщо перший член послідовності поставити в кінець, а будь-який з тих, що залишилися, за винятком другого, помістити на початок. Число таких послідовностей складе ( d +1) . Ще стільки ж послідовностей вийде якщо останній член у вихідній, зростаючій, послідовності поставити на початок, а будь-який інший, крім останнього, на кінець. Щоб уникнути подвійного рахунку, слід виключити випадок, коли перший член ставиться на останнє місце, а останній на перше. Таким чином, у послідовності з ( d +3) чисел із фазою довжиною dкількість випадків зростання складе

d (d +1)+2(d +1)-1 =+3d +1 .

Число можливих послідовностей з ( d +3) чисел дорівнює числу перестановок ( d +3) !, Так що ймовірність або висхідної, або низхідної фази дорівнює

У ряді довжини N послідовно можна виділити N-2-d груп d+3 членів. Т.о. математичне очікування числа фаз довжини d

.

Можна показати, що математичне очікування загальної кількості фаз довжини від 1 до N-3

.

3 . Критерій, заснований на знаках різниць

Цей критерій полягає у підрахунку числа позитивних різниць першого порядку у низці, інакше кажучи, числа точок зростання ряду. Для низки N членів отримуємо N-1 різниць. Визначимо лічильну змінну як

Якщо тепер позначити через зчисло точок зростання випадкового ряду, то

.

Розподіл досить швидко прагне нормального з дисперсією

.

Здебільшого цей критерій рекомендується для перевірки наявності лінійного тренду. З іншого боку, критерій, заснований на поворотних точках, погано підходить виявлення тренда, т.к. накладання помітних випадкових коливань на помірний тренд призводить приблизно до того ж безлічі поворотних точок, що й за відсутності тренда. . Більш досконалим, але складнішим критерієм виявлення лінійного тренда є регресія y на t і перевірка значимості регресійного коефіцієнта.

4.Критерій, заснований на рангових порівняннях

Ідею порівняння сусідніх значень ряду можна розвинути до порівняння всіх значень. Для цього ряду підрахуємо кількість випадків, коли черговий член ряду перевищує всі наступні. Усього для порівняння є N(N-1) пар. Нехай nзагальна кількість випадків перевищення. Підраховують ранговий коефіцієнт кореляції Кендела

.

Якщо це коефіцієнт значимий і позитивний, ряд зростаючий, якщо негативний, то - спадний.

10. Теоретичний аналіз стаціонарної випадкової складової лінійного виду

Розглядається загальна лінійна модель стохастичного процесу

де – білий шум

- Вагові коефіцієнти.

Нагадаємо, що = 0, ,

Введемо оператор зсуву на один крок назад У :

Багаторазове (для визначеності j-кратне) застосування оператора У, позначаємо як , дає З урахуванням введених позначень загальну лінійну модель можна записати як

де – Лінійний оператор.

Знайдемо математичне очікування, дисперсію та автоковаріаційну функцію для процесу (1):

;

Щоб модель мала сенс, дисперсія має бути кінцевої, тобто передбачається, що ряд сходиться.

Крім цього припускають, що має місце так звана умова оборотності:

,

де замість Уфігурують комплексні числа. З цієї умови випливає існування зворотного оператора

де , тобто такого, що

Розкриваючи твір в останньому виразі, групуючи однорідні члени і прирівнюючи їх до нуля, отримують вирази для визначення коефіцієнтів . Так, і так далі.

Помножуючи () на ліворуч, отримаємо, що оборотний процес може бути записаний у вигляді

Запис (2) відповідає авторегрессионной схемою нескінченного порядку. Це ж співвідношення можна трактувати як лінійний предиктор для всіх попередніх значень тимчасового ряду, а доданок – як випадкову помилку цього предиктора. Якщо відомі всі попередні значення ряду, то формою (2) можна спрогнозувати майбутнє значення ряду.

10.1. Моделі авторегресії

Розглянемо більш докладно моделі випадкової складової, які є окремими випадками загальної лінійної моделі, а саме моделі авторегресії, що ковзає середнього і змішані, що широко застосовуються на практиці.

Модель АР(1) має вигляд

У модель набуде вигляду

Розглядаючи як суму нескінченно спадної геометричної прогресії зі знаменником а Уотримуємо, що

Таким чином, марківський процес є окремим випадком загальної лінійної моделі, коефіцієнти якої змінюються за законом геометричної прогресії, тобто .

Вираз (2) можна отримати і (1) безпосередньо, виражаючи через , через і т.д.

Дисперсія у відповідність до () є

Виходить, білий шум з дисперсією породжує в схемі Маркова випадковий процес зі збільшеною дисперсією, що дорівнює .

Для знаходження автоковаріаційної функції Марківського процесу можна скористатися загальним виразом (). Проте наочніший наступний шлях. Домножимо рівняння (1) марківського процесу на та візьмемо математичне очікування

Оскільки другий доданок у правій частині дорівнює нулю через некорелеваність обурення в даний момент з минулими значеннями ряду, отримуємо

(через стаціонарність )

З останнього співвідношення маємо

,

тобто азбігається з коефіцієнтом автокореляції середніх членів низки. Помножимо тепер (1) на і візьмемо математичне очікування:

Замінюючи ана і ділячи на , отримуємо

Надаючи kзначення 2,3, ... отримаємо

Отже, у марківському процесі всі автокореляції можна виразити через першу автокореляцію. Оскільки автокореляційна функція марківського процесу експоненційно зменшується при зростанні k .

Розглянемо тепер приватну автокореляційну функцію марківського процесу. Ми отримали, що кореляція між двома членами ряду, віддаленими на два такти, тобто між і виражається величиною . Але залежить від , а від . Виникає питання, чи збережеться залежність між і , якщо залежність від серединного члена усунена. Відповідний приватний коефіцієнт кореляції є

.

Оскільки , чисельник дорівнює нулю. Аналогічно можна показати, що приватні коефіцієнти кореляції для членів ряду, що віддаляються на 3,4 і так далі тактів, також дорівнюють нулю. Таким чином, автокореляція існує лише завдяки кореляції сусідніх членів, що, втім, випливає з математичної моделі марківського процесу.

Завершуючи розгляд моделі АР(1), відзначимо, що вона часто використовується в економіко-математичних дослідженнях для опису залишків лінійної регресії, що пов'язує економічні показники.

З використанням оператора зсуву Умодель запишеться як

,

Властивості моделі залежать від коренів та полінома

який можна записати також у вигляді

(1-У)(1-У)=0.

Для стаціонарності процесу (1) необхідно, щоб коріння і лежали всередині одиничного кола (випадок комплексного коріння), або були менше одиниці (випадок дійсних коренів), що забезпечується при .

Нехай і дійсні та різні. Розкладемо на прості дроби

, (3)

де .

Розглядаючи окремі доданки в (3) як суми нескінченних геометричних прогресій, отримаємо


Виходить АР(2) є окремий випадок загальної лінійної моделі () з коефіцієнтами

Розглянемо тепер автокореляційну функцію процесу Юла. Помножимо (1) по черзі на і , візьмемо математичні очікування та розділимо на . У результаті отримаємо

Цих рівнянь достатньо визначення через перші дві автокореляції і, навпаки, по відомим можна знайти .

Помножуючи тепер (1) на отримаємо рекурентне рівняння

з якого можна знайти автокореляцію високих порядків через перші автокореляції. Тим самим повністю визначається корелограма процесу Юла.

Досліджуємо вид корелограми процесу АР(2).

Вираз (4) можна розглядати як різницеве ​​рівняння другого порядку щодо rіз постійними коефіцієнтами.

Загальне рішення такого рівняння має вигляд

,

де – коріння характеристичного рівняння

(5)

Легко бачити, що рівняння (2) та (5) еквівалентні з точністю до заміни Уна zі поділ обох частин на , так що коріння цих рівнянь збігаються, тобто

Загальне рішення різницевого рівняння (4) є

(6)

де коефіцієнти Аі Узнаходять з граничних умов при j=0 і j =1.

Таким чином, у разі дійсних коренів корелограма АР(2) являє собою, як видно з (6), суміш двох загасаючих експонент.

У разі комплектності коренів і корелограма процесу АР(2) виявляється затухаючою гармонікою.

Розглянемо тепер, як поводиться приватна автокореляційна функція процесу Юла. Відмінним від нуля виявляється лише коефіцієнт, рівний. Приватні кореляції вищих порядків дорівнюють нулю (докладніше цей процес розглядається далі). Таким чином, приватна корелограма процесу відривається відразу після лага, що дорівнює одиниці.

Наприкінці зазначимо, що моделі АР(2) виявилися прийнятними в описах поведінки циклічної природи, прообразом якого служить маятник, який впливають малі випадкові імпульси. Амплітуда і фаза такого коливального процесу постійно змінюватимуться.

Рішення різницевого щодо y виразу (1) або () складається з двох частин: загального рішення, що містить рдовільних констант і приватного рішення. Загальне рішення є

де - є постійні коефіцієнти,

(j =1,2,...,р) – коріння характеристичного рівняння.

Стаціонарність ряду (2) має місце, якщо коріння рівняння (3) має модуль менше одиниці. Іншими словами, коріння має лежати всередині одиничного кола. Вважаючи, що ряд має досить довгу передісторію, загальним рішенням (2) можна знехтувати внаслідок згасання.

Часте рішення, як видно з (), є

Останнє співвідношення є формою уявлення авторегрессионного процесу як загальної лінійної моделі.

Послідовно помножимо рівняння (1) на , візьмемо математичне очікування та розділимо на . Отримаємо систему рівнянь щодо коефіцієнтів кореляції:

, k =1, 2, ..., p (4)

Враховуючи, що , та вводячи матричні позначення

,

запишемо (4) у вигляді

Pa = r (5)

Систему рівнянь (5) називають системою Юла-Уокера. З неї знаходимо, що

a = r (6)

Таким чином, знаючи перші р автокореляцій часового ряду, можна знайти (3) автокореляції вищого порядку, тобто повністю відновити автокореляційну функцію (що вже відзначалося при аналізі процесів АР(1) і АР(2)).

Поведінка автокореляційної функції залежить від коренів характеристичного полінома. Зазвичай корелограма процесу АР( р) складається з сукупності загасаючих синусоїд.

Якщо у процесу АР(2) приватна автокореляція членів ряду, розділених двома чи більшою кількістю членів, дорівнює нулю, то процес АР( р) нулю рівні автокореляції порядку р і вище. Виходить, приватна корелограма процесу АР( р) повинна дорівнювати нулю, починаючи з деякого моменту. Щоправда, слід зазначити, що це факт має місце для нескінченного ряду. Для кінцевих реалізацій вказати місце обриву корелограм часто важко.

Отже, для процесу АР( р) приватна автокореляційна функція обривається на лазі ртоді як автокореляційна функція плавно спадає.

10.1.4 Процеси ковзного середнього

Узагальнена лінійна модель для процесів ковзного середнього містить лише кінцеве число членів, тобто в (): =0 k > q .

Модель набуває вигляду

(1)

(У(1) коефіцієнти перепозначені через.)

Співвідношення (1) визначає процес ковзного середнього порядку q, або скорочено СС( q). Умова оборотності () для процесу СС( q) виконується, якщо коріння багаточлена b (У) лежать поза одиничного кола.

Знайдемо дисперсію процесу СС( q):

Усі змішані твори виду дорівнюють нулю в силу некорелюваності збурень у різні моменти часу. Для знаходження автокореляційної функції процесу СС( q) послідовно помножимо (1) на та візьмемо математичне очікування

У правій частині виразу (2) залишаться ті члени, які відповідають однаковим тимчасовим тактам (див. рис)


Отже, вираз (2) є

(3)

поділивши (3) на , отримаємо

(4)


Той факт, що автокореляційна функція процесу СС(q) має кінцеву довжину ( qтактів) – характерна риса такого процесу. Якщо відомі, то (4) можна дозволити щодо параметрів . Рівняння (4) нелінійні та у загальному випадку мають кілька рішень, однак умова оборотності завжди виділяє єдине рішення.

Як зазначалося, оборотні процеси СС можна як нескінченні АР- процеси -АР(¥). Отже, приватна автокореляційна функція процесу СС( р) має нескінченну протяжність. Отже, у процесу СС( q) автокореляційна функція обривається на лазі qтоді як приватна автокореляційна функція плавно спадає.

Хоча моделі АР( р) та СС( q) дозволяють описувати багато реальних процесів, число оцінюваних параметрів може бути значним. Для досягнення більшої гнучкості та економічності опису при підборі моделей до тимчасових рядів, що спостерігаються, дуже корисними виявилися змішані моделі, що містять в собі і авторегресію і ковзне середнє. Ці моделі були запропоновані Боксом і Дженкінсом і отримали назву моделі авторегресії - ковзного середнього (скорочено АРСС( р, q)):

З використанням оператора зсуву Умодель (1) може бути представлена ​​компактніше:


, ()

b (У)-оператор ковзного середнього порядку q .

Модель () може бути записана і так:

Розглянемо найпростіший змішаний процес АРСС(1,1)

Згідно

(2)

Зі співвідношення (2) видно, що модель АРСС(1,1) є окремим випадком загальної лінійної моделі () з коефіцієнтами (j >0)

З (2) легко отримати вираз для дисперсії:

Для отримання кореляційної функції скористаємося тим самим прийомом, що й під час аналізу моделей авторегресії. Помножимо обидві частини модельного представлення процесу АРСС(1,1)

на і візьмемо математичне очікування:

або (з урахуванням того, що другий доданок у правій частині рівності дорівнює нулю)

Поділивши коваріації на дисперсію отримуємо вирази для автокореляції

отримані співвідношення показують, що експоненційно зменшується від початкового значення , що залежить від і при цьому, якщо > , то згасання монотонне; при< – затухание колебательное.

Аналогічно може бути побудовано автокореляційну функцію для загальної моделі АРСС( р, q).

Помножимо всі члени (1) на . Візьмемо математичне очікування і в результаті отримаємо наступне різницеве ​​рівняння.

Де - взаємна ковараційна функція між yта . Оскільки обурення у момент tзначення ряду в минулі моменти (см(2)) не корелюють, 0 при k>0.

Звідси випливає, що для значень q+1 автоковариації і автокореляції задовольняють тим самим співвідношенням, що у моделі АР( р):

У результаті виявляється, що за q вся автокореляційна функція виражатиметься сукупністю загасаючих експонентів та/або загасаючих синусоїдальних хвиль, а при q > pбуде q - pзначень , що випадають із цієї схеми.

Модель АРСС допускає узагальнення у разі, коли випадковий процес є нестаціонарним. Яскравим прикладом такого процесу є «випадкові блукання»:

З використанням оператора зсуву модель (1) набуває вигляду

(2)

З (2) видно, що процес (1) розбіжний, оскільки . Характеристичне рівняння цього процесу має корінь, рівний одиниці, тобто має місце прикордонний випадок, коли корінь характеристичного рівняння опинився на межі одиничного кола. У той же час, якщо перейти до перших різниць, процес виявиться стаціонарним.

У загальному випадку вважається, що нестаціонарний авторегресійний оператор у моделі АРСС має один або кілька коренів, рівних одиниці. Іншими словами, є нестаціонарним оператором авторегресії порядку p + d ; dкоренів рівняння = 0 дорівнюють одиниці, а решта ркоріння лежить поза одиничного кола. Тоді можна записати, що

,

де a (B) – стаціонарний оператор авторегресії порядку р(З корінням поза одиничного кола).

Введемо оператор різниці, такий що = (1- B) , тоді нестаціонарний процес АРСС запишеться як

, (3)

де b (B) – оборотний оператор ковзного середнього (поза його корінням лежить поза одиничного кола).

Для різниці порядку d, тобто модель

визначає вже стаціонарний оборотний процес АРСС( р, q).

Для того, щоб від ряду різниць повернутися до вихідного ряду, потрібний оператор s, зворотний:

Цей оператор називають оператором підсумовування, оскільки

Якщо ж вихідною є різниця порядку d, то для відновлення вихідного ряду знадобиться d- кратна ітерація оператора s , інакше d- Кратне підсумовування (інтегрування). Тому процес (3) прийнято називати процесом АРІСС, додаючи до АРСС термін інтегрований. Коротко модель (3) записують як АРІСС( р, d , q), де р- Порядок авторегресії, d- Порядок різниці, q- Порядок ковзного середнього. Ясно, що за d=0 модель АРІСС перетворюється на модель АРСС.

На практиці dзазвичай не перевищує двох, тобто d .

Модель АРІСС допускає уявлення, аналогічне до загальної лінійної моделі, а також у вигляді «чистого» процесу авторегресії (нескінченного порядку). Розглянемо, наприклад, процес АРІСС (1, 1, 1):

З (4) випливає, що

У виразі (5) коефіцієнти, починаючи з третього, обчислюються за формулою .

Подання (5) цікаве тим, що ваги, починаючи з третього, спадають за експоненційним законом. Тому, хоча формально залежить від усіх минулих значень, проте реальний внесок у поточне значення внесуть кілька недавніх значень ряду. Тому рівняння (5) найбільше підходить для прогнозування.

11.Прогнозування за моделлю АРІСС

Як зазначалося, процеси АРІСС допускають подання як узагальненої лінійної моделі, тобто

Природно шукати майбутнє (прогнозне) значення ряду на момент у вигляді

Очікуване значення, яке ми будемо позначати як

=

Перша сума у ​​правій частині останнього співвідношення містять лише майбутні обурення (прогноз робиться у момент tколи відомі минулі значення і ряду і обурень) і для них математичне очікування дорівнює 0 за визначенням. Що ж до другого доданку, то обурення тут уже відбулися, тож

Таким чином

Помилка прогнозу, що становить розбіжність між прогнозним значенням та його очікуванням є

=

Дисперсія помилки звідси є

Прогнозування по співвідношенню (1) у принципі можливе, проте важко тому, що вимагає знання всіх минулих обурень. До того ж для стаціонарних рядів швидкість загасання часто виявляється недостатньою, не кажучи вже про нестаціонарні процеси, для яких ряди розходяться.

Оскільки модель АРІСС припускає інші уявлення, розглянемо можливості їх використання для прогнозування. Нехай модель задана безпосередньо різницевим рівнянням

За відомими значеннями ряду (результати спостережень) та оціненим значенням збурень , спираючись на рекурентну формулу (3) можна оцінити очікуване значення ряду в момент t +1:


При прогнозуванні на два такти слід знову скористатися рекурентним співвідношенням (3), де як спостережене значення ряду в момент t+1 слід взяти передбачену за (4) величину, тобто і так далі.

Нарешті, можливе прогнозування спираючись на подання процесу АРІСС як авторегрессии (). Як зазначалося, як і раніше порядок авторегрессии нескінченний, вагові коефіцієнти у поданні низки убувають досить швидко, для обчислення прогнозу досить помірковане число минулих значень ряду.

Дисперсія помилки прогнозу на кроки вперед є

і згідно з виразом (2) дається виразом

У припущенні, що випадкові обурення є білим гаусівським шумом, тобто можна розглядати довірчий інтервал для прогнозного значення ряду стандартним чином.

12.Технологія побудови моделей АРІСС

Описані вище теоретичні схеми будувалися у припущенні, що тимчасовий ряд має нескінченну передісторію, тоді як реально досліднику доступний обмежений обсяг спостережень. Модель доводиться підбирати експериментально, підганяючи її до даних, що є в розпорядженні. Тому з позицій теоретичного застосування теорії аналізу часових рядів визначальне значення мають питання коректної специфікації моделі АРІСС( p , d , q) (її ідентифікації) та подальшого оцінювання її параметрів.

На етапі ідентифікації спостерігані дані використовуються визначення відповідного класу моделей і робляться попередні оцінки її параметрів, тобто будується пробна модель. Потім пробна модель підганяється до даних ретельніше; при цьому первинні оцінки, отримані на етапі ідентифікації виступають як початкові значення в ітеративних алгоритмах оцінювання параметрів. І нарешті, на третьому етапі отримана модель піддається діагностичній перевірці для виявлення можливої ​​неадекватності моделі та вироблення відповідних змін у ній. Розглянемо перелічені етапи докладніше.

Ідентифікація моделі

Мета ідентифікації – отримати деяке уявлення про величини p , d , qта про параметри моделі. Ідентифікація моделі розпадається на дві стадії

1. Визначення порядку різниці dвихідного ряду.

2. Ідентифікація моделі АРСС для низки різниць.

Основний інструмент, що використовується на обох стадіях – автокореляційна та приватна автокореляційна функція.

У теоретичній частині ми бачили, що у стаціонарних моделей автокореляючі спадають зі зростанням kдуже швидко (за кореляційним законом). Якщо автокореляційна функція згасає повільно і майже лінійно, це свідчить про нестаціонарності процесу, проте, можливо, його перша різниця стаціонарно.

Побудувавши корелограму для низки різниць, знову повторюють аналіз тощо. Вважається, що порядок різниці d, Що забезпечує стаціонарність, досягнуто тоді, коли автокореляційна функція процесу падає досить швидко. На практиці і достатньо переглянути близько 15-20 перших значень автокореляції вихідного ряду, його перші та другі різниці.

Після того, як буде отримано стаціонарний ряд різниць, порядку d, вивчають загальний вигляд автокореляційної та приватної автокореляційної функцій цих різниць. Спираючись на теоретичні властивості цих функцій, можна вибрати значення pі qдля АР та СС операторів. Далі при вибраних pі qбудуються початкові оцінки параметрів авторегресії та ковзного середнього b=(). Для авторегрессионных процесів використовуються рівняння Юла-Уокера, де теоретичні автокореляції замінено їх вибіркові оцінки. Для процесів ковзного середнього порядку qтільки перші qАвтокореляції відмінні від нуля і можуть бути виражені через параметри (див.). Замінюючи їх вибірковими оцінками і вирішуючи отримані рівняння щодо, отримаємо оцінку. Ці попередні оцінки можна використовувати як початкові значення для отримання на наступних кроках ефективніших оцінок.

Для змішаних процесів АРСС процедура оцінювання ускладнюється. Так для розглянутого в п. процесу АРСС(1,1) параметри і, точніше їх оцінки, виходять з () із заміною та їх вибірковими оцінками.

У випадку обчислення початкових оцінок процесу АРСС( p , q) представляє багатостадійну процедуру і не розглядається. Зазначимо тільки, що для практики особливий інтерес мають АР та СС процеси 1-го та 2-го порядків та найпростіший змішаний процес АРСС(1,1).

Насамкінець зауважимо, що оцінки автокореляцій, на основі яких будуються процедури ідентифікації можуть мати великі дисперсії (особливо в умовах недостатнього об'єму вибірки – кілька десятків спостережень) і бути сильно корельованими. Тому говорити про сувору відповідність теоретичній та емпіричній автокореляційних функцій не доводиться. Це призводить до труднощів при виборі p , d , q , тому для подальшого дослідження можуть бути вибрані кілька моделей.

лінійний ряд система тимчасовий ряд

Розміщено на http://www.