시계열 분석 방법. 시계열 시계열 분석을 위한 통계적 방법

시계열 분석


소개

1장. 시계열 분석

1.1 시계열과 그 기본 요소

1.2 시계열 수준의 자기상관과 그 구조 식별

1.3 시계열 추세 모델링

1.4 최소제곱법

1.5 추세 방정식을 선형 형태로 축소

1.6 회귀 방정식 매개변수 추정

1.7 가법 및 다중 시계열 모델

1.8 고정시계열

1.9 고정된 시계열에 고속 푸리에 변환 적용

1.10 잔차의 자기상관. 더빈-왓슨 기준

소개

거의 모든 분야에는 시간이 지남에 따라 발전하고 변화하는 현상을 연구하는 데 흥미롭고 중요한 현상이 있습니다. 예를 들어 일상 생활에서는 기상 조건, 특정 제품의 가격, 개인의 건강 상태의 특정 특성 등이 모두 시간이 지남에 따라 변할 수 있습니다. 시간이 지남에 따라 비즈니스 활동, 특정 제작 과정의 방식, 개인의 수면 깊이, TV 프로그램에 대한 인식이 달라집니다. 특정 기간 동안 이러한 종류의 특성 중 하나를 측정한 총계는 다음을 나타냅니다. 시계열.

이러한 일련의 관찰을 분석하기 위한 기존 방법 세트를 시계열 분석.

시계열 분석을 다른 유형의 통계 분석과 구별하는 주요 특징은 관찰 순서의 중요성입니다. 많은 문제에서 관측값이 통계적으로 독립적인 경우 시계열에서는 일반적으로 종속적이며 이러한 종속성의 특성은 시퀀스에서 관측값의 위치에 따라 결정될 수 있습니다. 계열의 성격과 계열을 생성하는 과정의 구조에 따라 계열이 형성되는 순서가 미리 결정될 수 있습니다.

표적이 작업은 최대 단순성과 최소 매개변수 수를 가지며 동시에 관찰 내용을 적절하게 설명하는 시간 영역의 이산 시계열에 대한 모델을 얻는 것으로 구성됩니다.

이러한 모델을 얻는 것은 다음과 같은 이유로 중요합니다.

1) 시계열을 생성하는 시스템의 특성을 이해하는 데 도움이 될 수 있습니다.

2) 시리즈를 생성하는 프로세스를 제어합니다.

3) 시계열의 미래 값을 최적으로 예측하는 데 사용할 수 있습니다.

시계열이 가장 잘 설명되어 있습니다. 고정되지 않은 모델,시간이 지남에 따라 변할 수 있는 추세 및 기타 의사 안정 특성은 결정론적 현상이 아닌 통계적 현상으로 간주됩니다. 또한 경제와 관련된 시계열은 종종 눈에 띄는 계절의, 또는 주기적 구성 요소; 이러한 구성 요소는 시간이 지남에 따라 달라질 수 있으며 순환 통계(비정상적일 수 있음) 모델로 설명되어야 합니다.

관찰된 시계열을 y 1 , y 2 , … . ., 응 . 우리는 이 항목을 다음과 같이 이해할 것입니다. T개의 등거리 순간에 어떤 변수의 관찰을 나타내는 T개의 숫자가 있습니다. 편의상 이러한 순간은 정수 1, 2, ...로 번호가 지정됩니다. . .,티. 상당히 일반적인 수학적(통계적 또는 확률적) 모델은 다음 형식의 모델입니다.

y t = f(t) + u t , t = 1, 2, . . ., 티.

이 모델에서 관측된 계열은 수학적 구성 요소라고 할 수 있는 완전히 결정적인 수열(f(t))과 일부 확률 법칙을 따르는 무작위 수열(u t )의 합으로 간주됩니다. (때로는 신호와 잡음이라는 용어가 각각 이 두 구성 요소에 사용됩니다.) 관찰된 계열의 이러한 구성 요소는 관찰할 수 없습니다. 그것들은 이론적인 양입니다. 이러한 분해의 정확한 의미는 데이터 자체에 달려 있을 뿐만 아니라 부분적으로 이러한 데이터의 결과가 되는 실험의 반복이 의미하는 바에 따라 달라집니다. 여기서는 소위 "주파수" 해석이 사용됩니다. 적어도 원칙적으로는 전체 상황을 반복하여 새로운 관찰을 얻을 수 있다고 믿어집니다. 무작위 구성요소에는 무엇보다도 관찰 오류가 포함될 수 있습니다.

본 논문에서는 무작위 성분이 추세에 중첩되어 무작위 고정 프로세스를 형성하는 시계열 모델을 고려합니다. 이러한 모델에서는 시간의 흐름이 무작위 구성 요소에 어떤 방식으로도 영향을 미치지 않는다고 가정합니다. 보다 정확하게는 랜덤 성분의 수학적 기대값(즉, 평균값)이 0과 동일하고 분산이 일부 상수와 동일하며 서로 다른 시점의 u t 값은 상관 관계가 없다고 가정합니다. 따라서 모든 시간 의존성은 체계적 구성요소 f(t)에 포함됩니다. 시퀀스 f(t)는 알려지지 않은 일부 계수와 시간에 따라 변하는 알려진 수량에 따라 달라질 수 있습니다. 이런 경우를 '회귀함수'라고 합니다. 회귀 함수 계수에 대한 통계적 추론 방법은 통계의 여러 영역에서 유용한 것으로 입증되었습니다. 특히 시계열과 관련된 방법의 고유성은 위에서 언급한 시간에 따라 변하는 양이 알려진 t의 함수인 모델을 연구한다는 것입니다.


1장. 시계열 분석

1.1 시계열 및 주요 요소

시계열은 여러 연속 순간 또는 기간에 대한 지표 값의 모음입니다. 시계열의 각 수준은 세 그룹으로 나눌 수 있는 수많은 요인의 영향을 받아 형성됩니다.

· 시리즈의 추세를 형성하는 요소;

· 계열의 주기적 변동을 형성하는 요인;

· 무작위 요인.

연구 중인 프로세스 또는 현상에서 이러한 요소의 다양한 조합으로 인해 시간에 대한 계열 수준의 의존성은 다른 형태를 취할 수 있습니다. 첫째로, 대부분의 경제 지표 시계열에는 연구 중인 지표의 역학에 대한 여러 요인의 장기 누적 영향을 특징으로 하는 추세가 있습니다. 이러한 요인들을 개별적으로 고려하면 연구 중인 지표에 다방면으로 영향을 미칠 수 있다는 것은 명백합니다. 그러나 함께 증가하거나 감소하는 추세를 형성합니다.

둘째,연구 중인 지표는 주기적으로 변동될 수 있습니다. 다양한 경제 및 농업 부문의 활동이 연중 시기에 따라 달라지므로 이러한 변동은 계절적일 수 있습니다. 장기간에 걸쳐 대량의 데이터를 사용할 수 있는 경우 시계열의 전반적인 역학과 관련된 주기적 변동을 식별하는 것이 가능합니다.

일부 시계열에는 추세나 순환 구성요소가 포함되어 있지 않으며, 각 후속 수준은 계열의 평균 수준과 일부(양수 또는 음수) 무작위 구성요소의 합으로 형성됩니다.

대부분의 경우 시계열의 실제 수준은 추세, 순환 및 무작위 구성 요소의 합계 또는 곱으로 표시될 수 있습니다. 시계열이 나열된 구성 요소의 합으로 표시되는 모델을 호출합니다. 가산 모델시계열. 시계열이 나열된 구성 요소의 곱으로 표시되는 모델을 호출합니다. 승법 모델시계열. 개별 시계열에 대한 통계 연구의 주요 임무는 계열의 미래 값을 예측하기 위해 얻은 정보를 사용하기 위해 위에 나열된 각 구성 요소를 식별하고 정량화하는 것입니다.

1.2 시계열 수준의 자기 상관 및 구조 식별

시계열에 추세와 주기적 변동이 있는 경우 계열의 각 후속 수준 값은 이전 값에 따라 달라집니다. 시계열의 연속적인 수준 사이의 상관 의존성을 다음과 같이 부릅니다. 계열 수준의 자기 상관.

원래 시계열 수준과 시간에 따라 여러 단계 이동된 이 시계열 수준 사이의 선형 상관 계수를 사용하여 정량적으로 측정할 수 있습니다.

자기 상관 계수를 계산하는 작업 공식 중 하나는 다음과 같습니다.

(1.2.1)

변수 x로서 우리는 계열 y 2, y 3, ..., y n을 고려합니다. 변수 y – 계열 y 1, y 2, . . . ,y n - 1 . 그러면 위의 공식은 다음과 같은 형식을 취하게 됩니다.

(1.2.2)

유사하게, 2차 이상의 자기상관 계수가 결정될 수 있습니다. 따라서 2차 자기상관 계수는 레벨 y t와 y t – 1 사이의 연결이 얼마나 가까운지를 나타내며 다음 공식에 의해 결정됩니다.

(1.2.3)

자기 상관 계수가 계산되는 기간 수를 호출합니다. 라곰. 지연이 증가함에 따라 자기상관 계수가 계산되는 값 쌍의 수가 감소합니다. 일부 저자는 자기상관 계수의 통계적 신뢰성을 보장하기 위해 규칙을 사용하는 것이 바람직하다고 생각합니다. 최대 지연은 (n/4) 이하여야 합니다.

이전 세 가지 노트에서는 설명 변수 값을 기반으로 반응을 예측할 수 있는 회귀 모델에 대해 설명합니다. 이 노트에서는 이러한 모델과 기타 통계 방법을 사용하여 연속적인 시간 간격에 걸쳐 수집된 데이터를 분석하는 방법을 보여줍니다. 시나리오에 언급된 각 기업의 특성에 따라 시계열 분석에 대한 세 가지 대안적 접근 방식을 고려해 보겠습니다.

자료는 교차 절단 예를 통해 설명됩니다. 세 회사의 수익 예측. 당신이 대형 금융회사에서 분석가로 일하고 있다고 상상해 보십시오. 고객의 투자 전망을 평가하려면 세 회사의 수익을 예측해야 합니다. 이를 위해 관심 있는 세 회사(Eastman Kodak, Cabot Corporation 및 Wal-Mart)에 대한 데이터를 수집했습니다. 기업마다 비즈니스 활동 유형이 다르기 때문에 각 시계열에는 고유한 특성이 있습니다. 따라서 예측에는 다양한 모델을 사용해야 합니다. 각 회사에 가장 적합한 예측 모델을 선택하는 방법은 무엇입니까? 예측 결과를 바탕으로 투자 전망을 어떻게 평가하나요?

토론은 연간 데이터 분석으로 시작됩니다. 이러한 데이터를 평활화하는 두 가지 방법, 즉 이동 평균과 지수 평활을 보여줍니다. 그런 다음 최소 제곱과 고급 예측 방법을 사용하여 추세를 계산하는 방법을 보여줍니다. 마지막으로 이러한 모델은 월별 또는 분기별 데이터로 구성된 시계열로 확장됩니다.

형식의 메모를 다운로드하거나 형식의 예를 다운로드하십시오.

비즈니스 예측

시간이 지나면서 경제 상황이 변하기 때문에 관리자는 이러한 변화가 회사에 미칠 영향을 예측해야 합니다. 정확한 계획을 보장하는 방법 중 하나는 예측입니다. 수많은 개발 방법에도 불구하고 모두 동일한 목표를 추구합니다. 즉, 회사를 위한 계획 및 개발 전략을 개발할 때 이를 고려하기 위해 미래에 발생할 이벤트를 예측하는 것입니다.

현대사회는 예측의 필요성을 끊임없이 경험하고 있습니다. 예를 들어, 좋은 정책을 만들기 위해 정부 구성원은 실업률, 인플레이션, 산업 생산, 개인 및 기업 소득세 수준을 예측해야 합니다. 장비 및 인력 요구 사항을 결정하기 위해 항공사 경영진은 항공 교통량을 정확하게 예측해야 합니다. 충분한 기숙사 공간을 확보하기 위해 대학 행정관은 내년에 해당 기관에 등록할 학생 수를 알고 싶어합니다.

예측에는 일반적으로 인정되는 두 가지 접근 방식, 즉 정성적 접근 방식과 정량적 접근 방식이 있습니다. 정성적 예측 방법은 연구자가 정량적 데이터를 사용할 수 없는 경우 특히 중요합니다. 일반적으로 이러한 방법은 매우 주관적입니다. 통계학자가 연구 주제의 이력에 대한 데이터를 이용할 수 있는 경우 정량적 예측 방법을 사용해야 합니다. 이러한 방법을 사용하면 과거에 대한 데이터를 기반으로 미래의 객체 상태를 예측할 수 있습니다. 정량적 예측 방법은 시계열 분석과 원인 및 결과 분석 방법의 두 가지 범주로 분류됩니다.

시계열연속적인 기간에 걸쳐 얻은 수치 데이터의 모음입니다. 시계열분석법은 수치변수의 과거값과 현재값을 토대로 수치변수의 값을 예측하는 방법이다. 예를 들어, 뉴욕 증권 거래소의 일일 주가는 시계열을 형성합니다. 시계열의 다른 예로는 소비자 물가 지수의 월별 값, 국내 총생산의 분기별 값, 회사의 연간 판매 수익 등이 있습니다.

인과관계 분석 방법예측 변수의 값에 영향을 미치는 요인을 확인할 수 있습니다. 여기에는 시차 변수를 사용한 다중 회귀 분석 방법, 계량 경제학 모델링, 선행 지표 분석, 확산 지수 분석 방법 및 기타 경제 지표가 포함됩니다. 시간 분석을 기반으로 한 예측 방법에 대해서만 이야기하겠습니다. 에스 x 행.

고전적인 곱셈 시간 모델의 구성 요소 에스 x 행

시계열 분석의 기본 가정은 현재와 과거에 연구 대상에 영향을 미치는 요인이 미래에도 영향을 미칠 것이라는 것입니다. 따라서 시계열 분석의 주요 목표는 예측과 관련된 요소를 식별하고 강조하는 것입니다. 이러한 목표를 달성하기 위해 시계열 모델에 포함된 구성 요소의 변동을 연구하기 위해 많은 수학적 모델이 개발되었습니다. 아마도 가장 일반적인 것은 연간, 분기별, 월별 데이터에 대한 고전적인 곱셈 모델일 것입니다. 고전적인 곱셈 시계열 모델을 보여주기 위해 Wm. Wrigley Jr. 회사의 실제 수입에 대한 데이터를 고려하십시오. 1982년부터 2001년까지의 회사(그림 1).

쌀. 1. Wm. Wrigley Jr.의 실제 총소득 그래프. 1982년부터 2001년까지의 회사(현재 가격으로 수백만 달러)

보시다시피, 지난 20년 동안 회사의 실제 총소득은 증가하는 추세를 보였습니다. 이러한 장기적인 추세를 추세라고 합니다. 경향시계열의 유일한 구성 요소는 아닙니다. 또한 데이터에는 순환 및 불규칙 구성 요소가 있습니다. 순환 요소데이터가 위아래로 변동하는 방식을 설명하며 종종 비즈니스 주기와 상관관계가 있습니다. 그 기간은 2년에서 10년까지 다양하다. 순환 성분의 강도 또는 진폭도 일정하지 않습니다. 어떤 해에는 데이터가 추세에 의해 예측된 값보다 높을 수 있습니다(즉, 주기의 정점 근처). 다른 해에는 더 낮을 수 있습니다(즉, 주기의 맨 아래). 추세 곡선에 있지 않고 주기적 종속성을 따르지 않는 관측 데이터를 불규칙 또는 데이터라고 합니다. 무작위 구성 요소. 데이터가 매일 또는 분기별로 기록되는 경우라는 추가 구성 요소가 있습니다. 계절의. 경제적인 적용에 일반적인 시계열의 모든 구성 요소가 그림 1에 나와 있습니다. 2.

쌀. 2. 시계열에 영향을 미치는 요인

고전적인 곱셈 시계열 모델에서는 관측된 값이 나열된 구성 요소의 곱이라고 명시합니다. 데이터가 연간 데이터인 경우 관찰 와이, 해당 연도는 다음 방정식으로 표현됩니다.

(1) 응 내가 = * 씨 나는* 나는 내가

어디 - 추세 가치, 씨 나는 -년차, 나는 내가 -학년.

데이터를 월별 또는 분기별로 측정하는 경우 관찰 응 내가 i 번째 기간에 해당하는 는 다음 방정식으로 표현됩니다.

(2) Y i = T i *S i *C i *I i

어디 - 추세 가치, 나는- 계절 성분의 가치 -번째 기간, 씨 나는- 순환 구성 요소의 값 -번째 기간, 나는 내가- 랜덤 구성요소의 값 -번째 기간.

시계열 분석의 첫 번째 단계에서는 데이터 그래프가 구성되고 시간에 대한 의존성이 식별됩니다. 먼저, 데이터의 장기적인 증가 또는 감소(즉, 추세)가 있는지, 시계열이 수평선을 중심으로 진동하는지 확인해야 합니다. 추세가 없으면 이동 평균 또는 지수 평활 방법을 사용하여 데이터를 평활화할 수 있습니다.

연간 시계열 평활화

대본에서 우리는 Cabot Corporation을 언급했습니다. 매사추세츠주 보스턴에 본사를 두고 있는 이 회사는 화학제품, 건축자재, 정밀화학제품, 반도체 및 액화천연가스의 생산 및 판매를 전문으로 합니다. 이 회사는 23개국에 39개의 공장을 보유하고 있습니다. 회사의 시장 가치는 약 18억 7천만 달러이며, 주식은 SVT라는 약어로 뉴욕 증권 거래소에 상장되어 있습니다. 특정 기간 동안 회사의 수입은 그림 1에 나와 있습니다. 삼.

쌀. 3. 1982~2001년 Cabot Corporation의 수익(수십억 달러)

보시다시피, 수익 증가의 장기적인 추세는 수많은 변동으로 인해 모호해집니다. 따라서 그래프를 시각적으로 분석하면 데이터에 추세가 있다고 말할 수 없습니다. 이러한 상황에서는 이동 평균 또는 지수 평활 방법을 적용할 수 있습니다.

이동평균.이동평균법은 매우 주관적이며 기간에 따라 달라집니다. , 평균값 계산을 위해 선택되었습니다. 주기적 변동을 제거하려면 주기 길이가 평균 주기 길이의 정수배가 되어야 합니다. 선택한 기간 동안의 이동 평균 , 길이의 시퀀스에 대해 계산된 평균 시퀀스를 형성합니다. . 이동 평균은 기호로 표시됩니다. MA(엘).

측정된 데이터로부터 5년 이동 평균을 계산한다고 가정합니다. N= 11년. 왜냐하면 = 5, 5년 이동 평균은 시계열의 5개 연속 값에서 계산된 일련의 평균을 형성합니다. 5년 이동 평균 중 첫 번째는 처음 5년 동안의 데이터를 합한 다음 5로 나누어 계산합니다.

두 번째 5년 이동 평균은 2년부터 6년까지의 데이터를 합한 다음 5로 나누어 계산합니다.

이 과정은 지난 5년간의 이동평균이 계산될 때까지 계속됩니다. 연간 데이터로 작업할 때는 다음 숫자를 가정해야 합니다. (이동 평균 계산을 위해 선택한 기간의 길이) 홀수입니다. 이 경우 첫 번째( – 1)/2 및 마지막 ( – 1)/2년. 따라서 5년 이동 평균을 사용하는 경우 처음 2년과 마지막 2년에 대한 계산을 수행할 수 없습니다. 이동 평균이 계산되는 연도는 기간의 중간에 있어야 합니다. . 만약에 N= 11, 에 = 5인 경우 첫 번째 이동 평균은 3년차, 두 번째 이동평균은 4년차, 마지막 이동평균은 9년차에 해당해야 합니다. 그림에서. 그림 4는 1982년부터 2001년까지 Cabot Corporation의 수익에 대해 계산된 3년 및 7년 이동 평균을 보여줍니다.

쌀. 4. Cabot Corporation의 수익에 대해 계산된 3년 및 7년 이동평균 그래프

3년 이동평균을 계산할 때 첫 번째 연도와 마지막 연도에 해당하는 관측 값은 무시됩니다. 마찬가지로 7년 이동평균을 계산할 때 첫 3년과 마지막 3년에 대한 결과가 없습니다. 또한 7년 이동 평균은 3년 이동 평균보다 시계열을 훨씬 더 매끄럽게 만듭니다. 이는 7년 이동평균이 더 긴 기간에 해당하기 때문입니다. 안타깝게도 기간이 길수록 계산하여 차트에 표시할 수 있는 이동 평균의 수는 줄어듭니다. 따라서 이동 평균을 계산하기 위해 7년을 초과하는 연도를 선택하는 것은 그래프의 시작과 끝에서 너무 많은 점이 떨어져 시계열의 모양이 왜곡되므로 바람직하지 않습니다.

지수 평활화.데이터의 변화를 특징짓는 장기 추세를 식별하기 위해 이동 평균 외에도 지수 평활 방법이 사용됩니다. 또한 이 방법을 사용하면 장기 추세가 여전히 의심스러운 경우 단기 예측(한 기간 내)을 수행할 수 있습니다. 이로 인해 지수평활법은 이동평균법에 비해 상당한 장점을 가지고 있습니다.

지수 평활법은 일련의 지수 가중 이동 평균에서 그 이름을 얻었습니다. 이 시퀀스의 각 값은 이전에 관찰된 모든 값에 따라 달라집니다. 이동 평균 방법에 비해 지수 평활 방법의 또 다른 장점은 후자를 사용할 때 일부 값이 삭제된다는 것입니다. 지수 평활법을 사용하면 관찰된 값에 할당된 가중치가 시간이 지남에 따라 감소하므로 계산이 완료되면 가장 일반적인 값에 가장 많은 가중치가 부여되고, 희귀한 값에 가장 적은 가중치가 부여됩니다. 엄청난 양의 계산에도 불구하고 Excel을 사용하면 지수평활 방법을 구현할 수 있습니다.

임의의 기간 내에서 시계열을 평활화할 수 있는 방정식 , 세 가지 용어를 포함합니다: 현재 관찰된 값 와이, 시계열에 속하며 이전 지수 평활 값 이자형 –1 그리고 할당된 가중치 .

(3) E 1 = Y 1 E i = WY i + (1 – W)E i–1 , i = 2, 3, 4, …

어디 이자형– 다음을 위해 계산된 지수 평활 계열의 값 -번째 기간, 나는 –1 – (에 대해 계산된 지수 평활 계열의 값) – 1) 학기, 응 내가– 시계열의 관측값 -번째 기간, – 주관적 가중치 또는 평활화 계수(0< < 1).

평활화 요소의 선택, 즉 계열의 구성원에 할당된 가중치는 결과에 직접적인 영향을 미치기 때문에 근본적으로 중요합니다. 안타깝게도 이 선택은 다소 주관적입니다. 연구자가 단순히 시계열에서 원치 않는 주기적 또는 무작위 변동을 제외하려는 경우 작은 값을 선택해야 합니다. (0에 가깝습니다). 반면 시계열을 예측에 사용하는 경우에는 큰 가중치를 선택해야 합니다. (통일에 가깝습니다). 첫 번째 경우에는 시계열의 장기적인 추세가 명확하게 표시됩니다. 두 번째 경우에는 단기 예측의 정확도가 높아집니다(그림 5).

쌀. 5 1982년부터 2001년까지 Cabot Corporation 수익 데이터에 대한 지수 평활화된 시계열 도표(W=0.50 및 W=0.25); 계산식은 엑셀 파일을 참고하세요

다음에 대해 얻은 지수 평활화 값 -시간 간격은 (에서 예측 값의 추정치로 사용될 수 있습니다. +1)번째 간격:

가중치에 해당하는 기하급수적으로 평활화된 시계열을 기반으로 Cabot Corporation의 2002년 수익을 예측합니다. = 0.25이면 2001년에 대해 계산된 평활화된 값을 사용할 수 있습니다. 그림에서. 그림 5는 이 값이 2002년 회사 소득에 대한 데이터를 사용할 수 있게 되면 방정식 (3)을 적용하고 2002년 소득의 평활 값을 사용하여 2003년 소득 수준을 예측할 수 있음을 보여줍니다.

분석 패키지 Excel에서는 한 번의 클릭으로 지수 평활 그래프를 만들 수 있습니다. 메뉴를 살펴보세요 데이터데이터 분석그리고 옵션을 선택하세요 지수평활(그림 6). 열리는 창에서 지수평활매개변수를 설정합니다. 불행하게도 이 절차를 사용하면 단 하나의 평활화된 계열만 만들 수 있으므로 매개변수를 사용하여 "연주"하려는 경우 , 절차를 반복하십시오.

쌀. 6. 분석 패키지를 사용하여 지수평활 그래프 그리기

최소제곱 추세 및 예측

시계열의 구성 요소 중에서 추세가 가장 자주 연구됩니다. 단기적, 장기적 예측이 가능한 것이 추세입니다. 시계열의 장기적인 추세를 파악하기 위해서는 일반적으로 관측된 데이터(종속변수의 값)를 세로축에 표시하고, 시간간격(독립변수의 값)을 그래프로 구성하는 것이 일반적이다. 가로축에 그려져 있습니다. 이 섹션에서는 최소 제곱법을 사용하여 선형, 2차 및 지수 추세를 식별하는 절차를 설명합니다.

선형 추세 모델예측에 사용되는 가장 간단한 모델은 다음과 같습니다. 응 내가 = β 0 + β 1 X 나는 + εi. 선형 추세 방정식:

주어진 유의 수준 α에 대해 다음과 같은 경우 귀무 가설이 기각됩니다. -통계가 임계 상한보다 크거나 하한 임계 수준보다 작습니다. -배포. 즉, 결정적인 규칙은 다음과 같이 공식화됩니다. > 또는 < tL, 귀무 가설 H 0그렇지 않으면 귀무가설이 기각되지 않습니다(그림 14).

쌀. 14. 자기회귀 매개변수의 중요성에 대한 양측 기준에 대한 가설 기각 영역 아르, 가장 높은 차수를 가짐

귀무가설( 아르= 0)은 거부되지 않습니다. 이는 선택한 모델에 너무 많은 매개변수가 포함되어 있음을 의미합니다. 이 기준을 사용하면 모델의 선행항을 버리고 자기회귀 순서 모델을 추정할 수 있습니다. р–1. 이 과정은 귀무가설이 나올 때까지 계속되어야 한다. H 0거부되지 않습니다.

  1. 주문 선택 아르 자형다음 사실을 고려하여 추정된 자기회귀 모델 - 중요성 기준은 N–2р–1자유도.
  2. 변수 시퀀스 생성 아르 자형"지연 있음"으로 지정하면 첫 번째 변수는 한 시간 간격만큼 지연되고, 두 번째 변수는 2시간 간격으로 지연됩니다. 마지막 값은 다음보다 지연되어야 합니다. 아르 자형시간 간격(그림 15 참조).
  3. 적용하다 분석 패키지모든 것을 포함하는 회귀 모델을 계산하는 Excel 아르 자형시차가 있는 시계열의 값.
  4. 매개변수의 중요성 평가 A R, 가장 높은 차수를 가짐: a) 귀무가설이 기각되면, 모두 아르 자형매개변수; b) 귀무가설이 기각되지 않으면 기각한다 아르 자형번째 변수를 입력하고 다음을 포함한 새 모델에 대해 3단계와 4단계를 반복합니다. р–1매개변수. 새로운 모델의 중요성을 테스트하는 것은 다음을 기반으로 합니다. -기준, 자유도 수는 새로운 매개변수 수에 의해 결정됩니다.
  5. 자기회귀 모델의 최고차 항이 통계적으로 유의해질 때까지 3단계와 4단계를 반복합니다.

자기회귀 모델링을 입증하기 위해 Wm의 실제 수익에 대한 시계열 분석으로 돌아가 보겠습니다. 리글리 주니어 그림에서. 그림 15는 1차, 2차, 3차 자기회귀 모델을 구축하는 데 필요한 데이터를 보여줍니다. 3차 모델을 구축하려면 이 테이블의 모든 열이 필요합니다. 2차 자기회귀 모델을 구축할 때 마지막 열은 무시됩니다. 1차 자기회귀 모델을 구축할 때 마지막 두 열은 무시됩니다. 따라서 1차, 2차, 3차 자기회귀모형을 구축할 때 20개의 변수 중 각각 1개, 2개, 3개가 제외된다.

가장 정확한 자기회귀 모델을 선택하는 것은 3차 모델부터 시작됩니다. 올바른 작동을 위해 분석 패키지입력 간격으로 따릅니다. 와이 B5:B21 범위와 입력 간격을 나타냅니다. 엑스– C5:E21. 분석 데이터는 그림 1에 나와 있습니다. 16.

매개변수의 의미를 확인해 보겠습니다. A 3, 가장 높은 차수를 가지고 있습니다. 그의 평가 3는 -0.006(그림 16의 셀 C20)이고 표준 오류는 0.326(셀 D20)입니다. 가설 H 0: A 3 = 0 및 H 1: A 3 ≠ 0을 테스트하기 위해 다음을 계산합니다. -통계:

-n–2p–1 = 20–2*3–1 = 13 자유도 기준은 다음과 같습니다. tL=STUDENT.OBR(0.025,13) = –2.160; t 유=STUDENT.OBR(0.975,13) = +2.160. -2.160 이후< = –0,019 < +2,160 и 아르 자형= 0.985 > α = 0.05, 귀무가설 H 0거절할 수 없습니다. 따라서 3차 매개변수는 자기회귀 모형에서 통계적으로 유의하지 않으므로 제거해야 합니다.

2차 자기회귀 모델에 대한 분석을 반복해 보겠습니다(그림 17). 최고차 매개변수 추정 2= –0.205이고 표준오차는 0.276이다. 가설 H 0: A 2 = 0 및 H 1: A 2 ≠ 0을 테스트하기 위해 다음을 계산합니다. -통계:

유의수준 α = 0.05에서 양면의 임계값은 -n–2p–1 = 20–2*2–1 = 15 자유도 기준은 다음과 같습니다. tL=STUDENT.OBR(0.025,15) = –2.131; t 유=STUDENT.OBR(0.975,15) = +2.131. -2.131 이후< = –0,744 < –2,131 и 아르 자형= 0.469 > α = 0.05, 귀무가설 H 0거절할 수 없습니다. 따라서 2차 매개변수는 통계적으로 유의하지 않으므로 모형에서 제거해야 합니다.

1차 자기회귀 모델에 대한 분석을 반복해 보겠습니다(그림 18). 최고차 매개변수 추정 1= 1.024이고 표준오차는 0.039이다. 가설 H 0: A 1 = 0 및 H 1: A 1 ≠ 0을 테스트하기 위해 다음을 계산합니다. -통계:

유의수준 α = 0.05에서 양면의 임계값은 -n–2p–1 = 20–2*1–1 = 17 자유도 기준은 다음과 같습니다. tL=STUDENT.OBR(0.025,17) = –2.110; t 유=STUDENT.OBR(0.975,17) = +2.110. -2.110 이후< = 26,393 < –2,110 и 아르 자형 = 0,000 < α = 0,05, нулевую гипотезу H 0거부되어야합니다. 따라서 1차 매개변수는 통계적으로 유의미하므로 모델에서 제거하면 안 됩니다. 따라서 1차 자기회귀 모델은 다른 모델보다 원본 데이터에 더 잘 근접합니다. 견적 사용 0 = 18,261, 1= 1.024이고 작년 시계열 값 - Y 20 = 1,371.88이면 기업의 실질소득 Wm의 가치를 예측할 수 있습니다. 리글리 주니어 2002년 회사:

적절한 예측 모델 선택

위에서는 시계열 값을 예측하는 6가지 방법(선형, 2차 및 지수 추세 모델과 1차, 2차 및 3차 자동 회귀 모델)에 대해 설명했습니다. 최적의 모델이 있나요? 설명된 6개 모델 중 시계열 값을 예측하는 데 사용해야 하는 모델은 무엇입니까? 다음은 적절한 예측 모델을 선택할 때 안내해야 하는 네 가지 원칙입니다. 이러한 원칙은 모델 정확도의 추정치를 기반으로 합니다. 시계열의 값은 이전 값을 연구하여 예측할 수 있다고 가정합니다.

예측 모델 선택 원칙:

  • 잔차 분석을 수행합니다.
  • 차이 제곱을 사용하여 잔차 오차의 크기를 추정합니다.
  • 절대차를 사용하여 잔차 오차의 크기를 추정합니다.
  • 경제의 원칙을 따르십시오.

잔류 분석.나머지는 예측값과 관측값의 차이라는 점을 기억하세요. 시계열에 대한 모델을 구축한 후에는 각 시계열에 대한 잔차를 계산해야 합니다. N간격. 그림과 같이 19, 패널 A, 모델이 적절한 경우 잔차는 시계열의 무작위 구성 요소를 나타내므로 불규칙하게 분포됩니다. 반면, 나머지 패널에서 볼 수 있듯이 모델이 적절하지 않은 경우 잔차는 추세(패널 B) 또는 순환(패널 C) 또는 계절적 요인을 고려하지 않은 체계적인 관계를 가질 수 있습니다. 구성 요소(패널 D).

쌀. 19. 잔류물 분석

절대 및 평균 제곱근 잔류 오류 측정.잔차 분석으로 하나의 적절한 모델을 결정할 수 없는 경우 잔차 오류의 크기를 추정하는 데 기반을 둔 다른 방법을 사용할 수 있습니다. 불행하게도 통계학자들은 예측에 사용되는 모델의 잔여 오류에 대한 최선의 추정치에 대한 합의에 도달하지 못했습니다. 최소제곱의 원리를 바탕으로 먼저 회귀분석을 수행하고 추정치의 표준오차를 계산할 수 있습니다. SXY. 특정 모델을 분석할 때 이 값은 시계열의 실제 값과 예측 값 간의 차이 제곱의 합입니다. 모델이 이전 시점의 시계열 값을 완벽하게 근사하는 경우 추정치의 표준 오차는 0입니다. 반면, 모델이 이전 시점의 시계열 값을 근사화하는 작업을 제대로 수행하지 못하는 경우 추정치의 표준 오차가 커집니다. 따라서 여러 모델의 적합성을 분석하여 추정표준오차 S XY 가 최소인 모델을 선택할 수 있다.

이 접근 방식의 가장 큰 단점은 개별 값을 예측할 때 오류가 과장된다는 것입니다. 즉, 수량 간의 큰 차이 와이그리고 Ŷ 제곱 오차의 합을 계산할 때 SSE는 제곱됩니다. 즉, 증가합니다. 이러한 이유로 많은 통계학자들은 예측 모델의 적절성을 평가하기 위해 평균 절대 편차(MAD)를 사용하는 것을 선호합니다.

특정 모델을 분석할 때 MAD 값은 시계열의 실제 값과 예측 값의 차이의 절대값의 평균입니다. 모델이 이전 시점의 시계열 값을 완벽하게 근사하는 경우 평균 절대 편차는 0입니다. 반면, 모델이 이러한 시계열 값을 잘 근사하지 못하면 평균 절대 편차가 커집니다. 따라서 여러 모델의 적합성을 분석하여 평균절대편차가 가장 작은 모델을 선택할 수 있다.

경제의 원리.추정치의 표준 오차 및 평균 절대 편차 분석으로 최적 모델을 결정할 수 없는 경우 절약 원칙에 따라 네 번째 방법을 사용할 수 있습니다. 이 원칙은 여러 개의 동일한 모델 중에서 가장 간단한 모델을 선택해야 함을 나타냅니다.

이 장에서 논의된 6가지 예측 모델 중에서 가장 간단한 것은 선형 및 2차 회귀 모델과 1차 자기회귀 모델입니다. 다른 모델은 훨씬 더 복잡합니다.

네 가지 예측 방법 비교.최적의 모델을 선택하는 과정을 설명하기 위해 회사 Wm의 실질 소득 값으로 구성된 시계열로 돌아가 보겠습니다. 리글리 주니어 회사. 선형, 2차, 지수 및 1차 자기회귀 모델의 네 가지 모델을 비교해 보겠습니다. (2차 및 3차 자기회귀 모델은 주어진 시계열 값 예측의 정확도를 약간만 향상시키므로 무시할 수 있습니다.) 그림 20은 4가지 예측기법을 분석하여 생성된 잔차 그래프를 보여준다. 분석 패키지뛰어나다. 시계열에는 20개의 지점만 포함되어 있으므로 이 그래프에서 결론을 도출할 때는 주의해야 합니다. 시공 방법은 엑셀 파일의 해당 시트를 참조하세요.

쌀. 20. 다음을 사용하여 4가지 예측기법을 분석하여 구성된 잔차 그래프 분석 패키지뛰어나다

1차 자기회귀 모델 외에는 순환 성분을 고려하는 모델이 없습니다. 관찰에 가장 근접하고 가장 체계적이지 않은 구조를 특징으로 하는 것이 바로 이 모델입니다. 그래서 네 가지 방법 모두의 잔차를 분석한 결과 1차 자기회귀 모델이 가장 좋은 반면 선형, 2차, 지수 모델은 정확도가 떨어지는 것으로 나타났습니다. 이를 검증하기 위해 이들 방법의 잔여 오차를 비교해 보겠습니다(그림 21). 엑셀 파일을 열어보면 계산방법을 익힐 수 있습니다. 그림에서. 21개의 실제값이 표시됩니다. 응 내가(열 실수), 예측값 Ŷ , 잔해도 그렇고 이자형네 가지 모델 각각에 대해. 또한 값이 표시됩니다. 에스YX그리고 미친. 4가지 수량 모델 모두에 대해 에스YX그리고 미친거의 같습니다. 지수 모델은 상대적으로 나쁜 반면, 선형 및 2차 모델은 정확도가 우수합니다. 예상대로 가장 작은 값 에스YX그리고 미친 1차 자기회귀 모델이 있습니다.

쌀. 21. S YX 지표와 MAD 지표를 이용한 4가지 예측방법 비교

특정 예측 모델을 선택한 후에는 시계열의 추가 변화를 주의 깊게 모니터링해야 합니다. 무엇보다도 이러한 모델은 미래의 시계열 값을 정확하게 예측하기 위해 만들어집니다. 불행하게도 그러한 예측 모델은 시계열 구조의 변화를 잘 고려하지 않습니다. 잔차 오차뿐만 아니라 다른 모델을 이용하여 얻은 미래 시계열 값 예측의 정확도도 비교하는 것이 반드시 필요합니다. 새로운 값을 측정한 후 와이관찰된 시간 간격에서는 예측된 값과 즉시 비교되어야 합니다. 차이가 너무 크면 예측 모델을 수정해야 합니다.

시간적 예측 에스 x 시리즈는 계절별 데이터를 기반으로 합니다.

지금까지 우리는 연간 데이터로 구성된 시계열을 연구하였다. 그러나 많은 시계열은 분기별, 월별, 주별, 일별, 심지어 시간별로 측정된 수량으로 구성됩니다. 그림과 같이 2, 데이터를 월별 또는 분기별로 측정하는 경우 계절 성분을 고려해야 합니다. 이번 섹션에서는 그러한 시계열의 값을 예측할 수 있는 방법을 살펴보겠습니다.

이 장의 시작 부분에 설명된 시나리오에는 Wal-Mart Stores, Inc.가 포함되었습니다. 회사의 시가총액은 2,290억 달러이며, 주식은 WMT라는 약어로 뉴욕 증권 거래소에 상장되어 있습니다. 회사의 회계연도는 1월 31일에 끝나므로 2002년 4분기에는 2001년 11월과 12월, 2002년 1월이 포함됩니다. 그림 1은 회사의 분기별 수익 시계열을 보여줍니다. 22.

쌀. 22. Wal-Mart Stores, Inc.의 분기별 수익 (백만 달러)

이와 같은 분기별 계열의 경우 고전적인 곱셈 모델은 추세, 순환 및 무작위 구성 요소 외에도 계절 구성 요소를 포함합니다. 응 내가 = * 나는* 씨 나는* 나는 내가

월경 및 시간 예측 에스 x 계열은 최소제곱법을 사용합니다.계절적 요소를 포함하는 회귀 모델은 결합된 접근 방식을 기반으로 합니다. 추세를 계산하기 위해 앞서 설명한 최소제곱법을 사용하고, 계절성분을 고려하기 위해 범주형 변수를 사용합니다(자세한 내용은 섹션 참조). 더미 변수 회귀 모델 및 상호 작용 효과). 지수 모델은 계절 구성요소를 고려하여 시계열을 근사화하는 데 사용됩니다. 분기별 시계열에 가까운 모델에서는 4개 분기를 설명하기 위해 3개의 더미 변수가 필요했습니다. 질문 1, Q 2그리고 질문 3, 월별 시계열 모형에서는 11개의 더미변수를 사용하여 12개월을 표현하였다. 이 모델은 로그 변수를 응답으로 사용하기 때문에 응 내가, 하지만 응 내가, 실제 회귀계수를 계산하려면 역변환을 수행해야 합니다.

분기별 시계열에 가까운 모델을 구축하는 과정을 설명하기 위해 Wal-Mart의 수익으로 돌아가 보겠습니다. 다음을 사용하여 얻은 지수 모델의 매개변수 분석 패키지엑셀, 그림에 표시되어 있습니다. 23.

쌀. 23. Wal-Mart Stores, Inc.의 분기별 수익에 대한 회귀 분석.

지수 모델이 원본 데이터에 아주 잘 근접하는 것을 볼 수 있습니다. 혼합 상관 계수 아르 자형 2 99.4%(셀 J5), 조정된 혼합 상관 계수 - 99.3%(셀 J6), 테스트 에프-통계 - 1,333.51(셀 M12) 및 아르 자형-값은 0.0000입니다. α = 0.05의 유의 수준에서 기존 곱셈 시계열 모델의 각 회귀 계수는 통계적으로 유의합니다. 강화 작업을 적용하면 다음 매개변수를 얻을 수 있습니다.

승산 다음과 같이 해석됩니다.

회귀 계수 사용 비 나는를 통해 특정 분기에 회사가 창출한 수익을 예측할 수 있습니다. 예를 들어, 한 회사의 2002년 4분기 수익을 예측해 보겠습니다. 엑스 = 35):

로그 = 0 + 1 엑스 = 4,265 + 0,016*35 = 4,825

= 10 4,825 = 66 834

따라서 예측에 따르면 2002년 4분기에 회사는 670억 달러에 달하는 수익을 얻었어야 했습니다(예측이 백만 단위까지 정확할 가능성은 거의 없습니다). 예측을 시계열 외부 기간(예: 2003년 1분기)으로 확장하려면( 엑스 = 36, 질문 1= 1) 다음 계산을 수행해야 합니다.

통나무 = 비 0 + 비 1엑스 + b 2 Q 1 = 4,265 + 0,016*36 – 0,093*1 = 4,748

10 4,748 = 55 976

인덱스

지수는 경제 상황이나 기업 활동의 변화에 ​​대응하는 지표로 사용됩니다. 지수에는 가격지수, 수량지수, 가치지수, 사회지수 등 다양한 유형이 있습니다. 이번 장에서는 물가지수만 살펴보겠습니다. 색인- 특정 시점의 일부 경제 지표(또는 지표 그룹)의 가치로, 기준 시점의 가치에 대한 백분율로 표시됩니다.

물가 지수.단순 가격 지수는 과거 특정 시점의 해당 상품(또는 상품 그룹) 가격과 비교하여 특정 기간 동안 상품(또는 상품 그룹) 가격의 백분율 변화를 반영합니다. 가격 지수를 계산할 때 먼저 기본 기간(비교할 과거 시간 간격)을 선택해야 합니다. 특정 지수의 기본 기간을 선택할 때 경제 확장 또는 수축 기간보다 경제 안정 기간이 선호됩니다. 또한 비교 결과가 기술 및 소비자 습관의 변화에 ​​크게 영향을 받지 않도록 참조 기간은 시간적으로 너무 멀지 않아야 합니다. 가격 지수는 다음 공식을 사용하여 계산됩니다.

어디 나는 내가- 가격 지수 년도, 아르 자형- 가격 년도, P 베이스- 기준 연도의 가격.

가격 지수는 기준 시점의 제품 가격을 기준으로 특정 기간 동안 제품(또는 제품 그룹) 가격의 백분율 변화입니다. 예를 들어, 1980년부터 2002년까지 미국의 무연 휘발유 가격 지수를 생각해 보십시오(그림 24). 예를 들어:

쌀. 24. 1980년부터 2002년까지 미국의 무연 휘발유 갤런 가격과 단순 가격 지수(기준 연도 1980년 및 1995년)

따라서 2002년 미국의 무연 휘발유 가격은 1980년보다 4.8% 높았다. 24는 1981년과 1982년의 물가지수를 보여준다. 1980년에는 물가지수보다 높았고, 이후 2000년까지 기준수준을 넘지 못했다. 1980년이 기준 기간으로 선택되었으므로 1995년과 같이 더 가까운 연도를 선택하는 것이 합리적일 것입니다. 새 기준 기간과 관련하여 지수를 다시 계산하는 공식은 다음과 같습니다.

어디 새로운- 새로운 가격 지수, 오래된- 기존 가격 지수, 새로운기본 – 기존 기준 연도를 계산할 때 새 기준 연도의 물가 지수 값입니다.

1995년이 새로운 기준으로 선택되었다고 가정해보자. 공식 (10)을 사용하여 2002년의 새로운 물가지수를 얻습니다.

따라서 2002년 미국의 무연 휘발유 가격은 1995년보다 13.9% 더 높았습니다.

비가중 종합 가격 지수.개별 제품의 가격 지수는 의심할 여지 없이 흥미롭지만, 더 중요한 것은 상품 그룹의 가격 지수입니다. 이를 통해 많은 소비자의 비용과 생활 수준을 추정할 수 있습니다. 공식 (11)에 의해 정의된 비가중 종합 가격 지수는 각 개별 제품 유형에 동일한 가중치를 할당합니다. 종합 가격 지수는 기준 시점의 해당 상품 그룹 가격을 기준으로 특정 기간 동안 상품 그룹(종종 시장 바구니라고 함) 가격의 변화율을 반영합니다.

어디 - 제품번호(1, 2, …, N), N- 고려중인 그룹의 상품 수 - 각 상품의 가격 합계 N일정 기간의 상품 , - 각 가격의 합계 N제로 기간의 상품 - 해당 기간의 비가중 종합 지수 값 .

그림에서. 그림 25는 1980년부터 1999년까지 세 가지 과일 유형의 평균 가격을 보여줍니다. 서로 다른 연도의 비가중 종합물가지수를 계산하기 위해서는 1980년을 기준연도로 간주하여 식 (11)을 사용한다.

따라서 1999년 사과 1파운드, 바나나 1파운드, 오렌지 1파운드의 총 가격은 1980년 이들 과일의 총 가격보다 59.4% 높았습니다.

쌀. 25. 과일 3종 가격(달러)과 비가중 종합가격지수

비가중 종합 가격 지수는 시간이 지남에 따라 전체 상품 그룹의 가격 변화를 나타냅니다. 이 지수는 계산하기 쉽지만 두 가지 명백한 단점이 있습니다. 첫째, 이 지수를 계산할 때 모든 유형의 상품이 똑같이 중요하게 간주되므로 고가의 상품이 지수에 과도한 영향력을 미칩니다. 둘째, 모든 상품이 동일하게 집중적으로 소비되는 것은 아니기 때문에 소비량이 적은 상품의 가격 변동은 비가중 지수에 너무 많은 영향을 미칩니다.

가중 종합 가격 지수.비가중 가격지수는 단점이 있기 때문에 소비자 바구니를 구성하는 상품의 가격 차이와 소비 수준을 고려한 가중 가격 지수가 더 바람직하다. 가중 종합 가격 지수에는 두 가지 유형이 있습니다. 라페이르 가격 지수식 (12)에 의해 정의된 는 기준 연도의 소비 수준을 사용합니다. 가중 종합 가격 지수는 소비자 바구니를 구성하는 상품의 소비 수준을 고려하여 각 상품에 특정 가중치를 부여합니다.

어디 - 기간(0, 1, 2, ...), - 제품번호(1, 2, …, N), N 0 기간 동안 - 해당 기간의 Lapeyret 지수 값 .

Lapeyret 지수의 계산은 그림 1에 나와 있습니다. 26; 기준연도는 1980년을 사용한다.

쌀. 26. 세 가지 과일 종류의 가격(달러), 수량(1인당 소비량(파운드)) 및 라페이레 지수

따라서 1999년 Lapeyret 지수는 154.2입니다. 이는 1999년에 이 세 가지 과일 유형이 1980년보다 54.2% 더 비싸다는 것을 나타냅니다. 참고로 이 지수는 비가중 지수인 159.4보다 낮다는 점에 유의하세요. 가장 적게 소비되는 과일인 오렌지의 가격이 사과와 바나나의 가격보다 더 많이 올랐기 때문입니다. 즉, 가장 많이 소비되는 과일의 가격이 오렌지 가격보다 덜 올랐기 때문에 라페이레 지수는 비가중 종합지수보다 작습니다.

파쉐 가격 지수기준 기간이 아닌 현재 제품의 소비 수준을 사용합니다. 결과적으로 Paasche 지수는 특정 시점의 총 상품 소비 비용을 더 정확하게 반영합니다. 그러나 이 지수에는 두 가지 중요한 단점이 있습니다. 첫째, 현재 소비 수준은 일반적으로 결정하기 어렵습니다. 이러한 이유로 많은 인기 지수는 Paasche 지수 대신 Lapeyret 지수를 사용합니다. 둘째, 소비자 바구니에 있는 특정 상품의 가격이 급격히 상승하면 구매자는 취향의 변화가 아니라 필요에 따라 소비 수준을 줄입니다. Paasche 지수는 다음 공식을 사용하여 계산됩니다.

어디 - 기간(0, 1, 2, ...), - 제품번호(1, 2, …, N), N- 고려중인 그룹의 상품 수 - 상품 단위 수 0 기간 동안 - 해당 기간의 Paasche 지수 값 .

Paasche 지수의 계산은 그림 1에 나와 있습니다. 27; 기준연도는 1980년을 사용한다.

쌀. 27. 세 가지 과일 종류의 가격(달러), 수량(인당 파운드 소비) 및 파쉐 지수

따라서 1999년의 파쉐 지수는 147.0입니다. 이는 1999년에 이 세 가지 과일 유형이 1980년보다 47.0% 더 비싸다는 것을 나타냅니다.

일부 인기 있는 가격 지수.비즈니스와 경제에는 여러 가지 가격 지수가 사용됩니다. 가장 인기 있는 것은 소비자 물가 지수(CPI)입니다. 공식적으로 이 지수는 도시(도시)를 대상으로 계산된다는 점을 강조하기 위해 CPI-U라고 부르지만, 원칙적으로는 간단히 CPI라고 합니다. 이 지수는 미국 내 생활비를 측정하는 주요 도구로 미국 노동통계국에서 매월 발표합니다. 소비자 물가 지수는 Lapeyret 방법을 사용하여 종합되고 가중됩니다. 이는 가장 널리 소비되는 400개 제품의 가격, 의류 유형, 운송, 의료 및 유틸리티 서비스를 사용하여 계산됩니다. 현재 이 지수를 계산할 때 1982~1984년 기간을 기준 기간으로 사용한다. (그림 28). CPI 지수의 중요한 기능은 디플레이터로 사용된다는 것입니다. CPI 지수는 각 가격에 100/CPI를 곱하여 실제 가격을 실제 가격으로 변환하는 데 사용됩니다. 계산에 따르면 지난 30년 동안 미국의 연평균 인플레이션율은 2.9%였습니다.

쌀. 28. 소비자 지수 가격의 역학; 전체 데이터는 Excel 파일을 참조하세요.

노동통계국이 발표하는 또 다른 중요한 물가지수는 생산자물가지수(PPI)입니다. PPI는 Lapeyré 방법을 사용하여 생산자가 판매하는 상품 가격의 변화를 측정하는 가중 종합 지수입니다. PPI 지수는 CPI 지수의 선행 지표입니다. 즉, PPI 지수가 상승하면 CPI 지수도 상승하고, 반대로 PPI 지수가 하락하면 CPI 지수도 하락합니다. DJIA(Dow Jones Industrial Average), S&P 500, NASDAQ과 같은 금융 지수는 미국의 주가 변동을 측정하는 데 사용됩니다. 많은 지수가 국제 주식 시장의 수익성을 측정합니다. 이러한 지수에는 일본의 Nikkei 지수, 독일의 Dax 30 및 중국의 SSE Composite가 포함됩니다.

시간 분석과 관련된 함정 에스 x 행

미래를 예측하기 위해 과거와 현재에 대한 정보를 사용하는 방법론의 가치는 200여 년 전 정치가 패트릭 헨리(Patrick Henry)에 의해 다음과 같이 설득력 있게 설명되었습니다. 과거에 대한 지식만이 미래를 판단할 수 있게 해준다.”

시계열 분석은 과거 기업 활동에 영향을 미쳤고, 현재 기업 활동에 영향을 미치는 요인들이 미래에도 계속 작동할 것이라는 가정에 기초합니다. 이것이 사실이라면 시계열 분석은 예측 및 관리를 위한 효과적인 도구가 됩니다. 그러나 시계열 분석에 기초한 고전적 방법을 비판하는 사람들은 이러한 방법이 너무 순진하고 원시적이라고 주장합니다. 즉, 과거에 작동했던 요인을 고려하는 수학적 모델은 전문가 평가, 비즈니스 경험, 기술 변화는 물론 사람들의 습관과 요구를 고려하지 않고 미래의 추세를 기계적으로 추정해서는 안 됩니다. 이러한 상황을 바로잡기 위해 최근 몇 년 동안 계량경제학자들은 위에 나열된 요소를 고려한 경제 활동에 대한 정교한 컴퓨터 모델을 개발했습니다.

그러나 시계열 분석 기법은 다른 예측 기법과 결합하고 전문가의 판단과 경험을 바탕으로 올바르게 적용할 경우 탁월한 예측 도구(단기 및 장기 모두)가 됩니다.

요약.이 노트에서는 시계열 분석을 사용하여 세 회사의 수입을 예측하기 위한 모델을 개발했습니다. Wm. 리글리 주니어 회사, Cabot Corporation 및 Wal-Mart. 시계열의 구성 요소와 연간 시계열을 예측하는 여러 가지 접근 방식(이동 평균 방법, 지수 평활 방법, 선형, 2차 및 지수 모델, 자기회귀 모델)이 설명됩니다. 계절성분에 해당하는 더미변수를 포함하는 회귀모델을 고려한다. 월별 및 분기별 시계열 예측을 위한 최소 자승법의 적용이 표시됩니다(그림 29).

시계열 값을 비교할 때 P 자유도가 손실됩니다.

시계열 분석의 목표.특정 기간 동안의 경제 데이터를 기반으로 한 시계열에 대한 실제 연구에서 계량경제학자는 이 시계열의 속성과 이 시계열을 생성하는 확률적 메커니즘에 대한 결론을 도출해야 합니다. 시계열을 연구할 때 대부분 다음과 같은 목표가 설정됩니다.

1. 시리즈의 특징에 대한 간략한(압축) 설명입니다.

2. 시계열을 설명하는 통계 모델 선택.

3. 과거 관찰을 기반으로 미래 가치를 예측합니다.

4. 시계열을 생성하는 프로세스를 제어합니다.

실제로 이러한 목표와 유사한 목표는 항상 달성 가능한 것과는 거리가 멀고 완전히 달성할 수 있는 것도 아닙니다. 이는 제한된 관찰 시간으로 인해 관찰이 불충분하여 방해받는 경우가 많습니다. 시계열의 통계적 구조는 시간이 지남에 따라 변경되는 경우가 훨씬 더 많습니다.

시계열 분석 단계 . 일반적으로 시계열의 실제 분석에서는 다음 단계가 순차적으로 수행됩니다.

1. 임시 rad의 동작을 그래픽으로 표현하고 설명합니다.

2. 시계열의 정기적인 시간 종속 구성 요소(추세, 계절 및 순환 구성 요소) 식별 및 제거.

3. 공정의 저주파 또는 고주파 성분을 분리 및 제거합니다(여과).

4. 위에 나열된 구성요소를 제거한 후 남은 시계열의 무작위 구성요소에 대한 연구입니다.

5. 무작위 구성요소를 설명하기 위한 수학적 모델의 구축(선택) 및 그 적절성 검증.

6. 시계열로 표현되는 프로세스의 향후 개발을 예측합니다.

7. 서로 다른 상호 작용에 대한 연구 임시 협의회.

이러한 문제를 해결하는 방법에는 여러 가지가 있습니다. 그 중 가장 일반적인 것은 다음과 같습니다.

8. 하나의 프로세스(자기상관) 내에서 또는 여러 프로세스 간의(상호상관) 중요한 주기적 종속성과 지연(지연)을 식별할 수 있는 상관 분석.

9. 스펙트럼 분석을 통해 시계열의 주기적 및 준주기적 구성 요소를 찾을 수 있습니다.

10. 시계열을 변환하여 고주파수 또는 계절적 변동을 제거하도록 설계된 평활화 및 필터링.

12. 임시 rad의 동작에 대해 선택된 모델을 기반으로 미래의 값을 예측할 수 있는 예측.

트렌드 모델

가장 단순한 추세 모델 . 다음은 경제 시계열 분석 및 기타 여러 분야에서 가장 자주 사용되는 추세 모델입니다. 첫째, 간단한 선형 모델입니다.

어디 0, 1– 추세 모델 계수;

t – 시간.

시간의 단위는 시간, 일, 주, 월, 분기 또는 연이 될 수 있습니다. 269는 단순함에도 불구하고 많은 실제 응용 분야에서 유용한 것으로 입증되었습니다. 추세의 비선형 특성이 분명한 경우 다음 모델 중 하나가 적합할 수 있습니다.

1. 다항식:

(270)

다항식의 차수는 어디에 있습니까? 실제 문제에서는 5를 초과하는 경우가 거의 없습니다.

2. 로그:

이 모델은 일정한 성장률을 유지하는 경향이 있는 데이터에 가장 자주 사용됩니다.

3. 물류 센터:

(272)

4. 곰페르츠

(273), 여기서

마지막 두 모델은 S자형 추세 곡선을 생성합니다. 이는 초기 단계에서는 성장률이 점차 증가하고 마지막 단계에서는 성장률이 점차 감소하는 프로세스에 해당합니다. 이러한 모델의 필요성은 다소 빠른 성장(또는 감소)으로 인해 일정한 성장률로 또는 다항식 모델에 따라 오랫동안 개발할 수 있는 많은 경제적 프로세스가 불가능하기 때문입니다.

예측할 때 추세는 주로 장기 예측에 사용됩니다. 적합 추세 곡선에만 기초한 단기 예측의 정확성은 일반적으로 충분하지 않습니다.

최소 제곱법은 시계열에서 추세를 추정하고 제거하는 데 가장 자주 사용됩니다. 이 방법은 선형 회귀 분석 문제에 대한 매뉴얼의 두 번째 섹션에서 자세히 논의되었습니다. 시계열 값은 반응(종속변수)으로 처리되며, 시간 – 반응에 영향을 미치는 요인(독립변수).

시계열은 구성원의 상호 의존성(적어도 시간적으로 멀지 않은)을 특징으로 하며 이는 모든 관찰이 독립적인 것으로 가정되는 기존 회귀 분석과 중요한 차이입니다. 그러나 이러한 조건에서의 추세 추정은 적절한 추세 모델이 선택되고 관측치 사이에 큰 특이치가 없는 경우 일반적으로 합리적입니다. 위에서 언급한 회귀 분석 제한 위반은 추정치의 통계적 속성만큼 영향을 미치지 않습니다. 따라서 시계열 항 사이에 상당한 의존성이 있는 경우 잔차 제곱합을 기반으로 한 분산 추정은 잘못된 결과를 제공합니다. 모델계수 등에 대한 신뢰구간도 잘못된 것으로 드러났다. 기껏해야 매우 근사한 것으로 간주될 수 있습니다.

계량경제 모델은 20세기 60년대부터 경제 예측에 사용되기 시작했습니다. 이후 선진국의 경제구조와 계량경제적 분석방법은 급격한 변화를 겪었다. 동시에 경제의 미래 상태를 예측하는 문제는 여전히 해결되지 않은 상태로 남아 있으며, 이는 계량경제 모델의 개선을 필요로 합니다.
전문가들은 공적분(시계열 변수 그룹에서 장기적인 관계를 결정하는 방법)과 관련된 연구에 중점을 둡니다. 시간이 지남에 따라 변하는 매개변수 예측 및 추정에 관한 것입니다. 특히 미국 경제학자 R. 잉글(R. Ingle)의 공적분 문제의 발전은 현역 경제학자의 접근 방식을 시계열 연구로 변화시켰습니다.
시계열(Time series) - 동일한 시간 간격에 걸쳐 경제적 변화를 연속적으로 관찰한 것입니다.
시계열 분석은 경제학의 기본 도구이자 경제학자들에게 가장 유용한 분석 영역 중 하나입니다. 변수들 사이의 경제적, 사회적 관계의 시간 경과에 따른 변화를 분석하려면 시계열이 필요합니다(예를 들어, 시계열을 기반으로 하는 총실업 행태에 대한 계량경제학 모델은 시간 경과에 따른 실업의 변화에 ​​대한 귀중한 정보를 제공할 수 있습니다. 실업의 구조나 기간에 대한 정보를 제공합니다. 사용되는 데이터의 대부분은 시계열 형태로 그 배열이 지속적으로 확장되고 있습니다.
이 분야에서 가장 유명한 연구자 중 한 명은 K. Granger입니다.
Granger Cleve(Clive라고도 함)(1934년 출생)는 미국 경제학자이자 노벨상 수상자(2003)입니다. 백조(영국 웨일즈)에서 태어났습니다. 그는 노팅엄대학교에서 공부했으며, 그곳에서 1955년 수학 학사 학위 논문을, 1959년 통계학 박사 학위를 취득했습니다. 캘리포니아 대학교(샌디에이고)에서 교수로 재직했습니다.
그는 10권이 넘는 책과 200개가 넘는 과학 논문을 집필한 저자입니다.
K. Granger는 영국국립과학원, 미국계량학회, 미국 및 핀란드 예술과학아카데미의 회원입니다. 미국 경제 협회 명예 회원, 노팅엄 대학, 마드리드 대학, 러프버 대학, 스톡홀름 경제 대학 명예 박사, 캘리포니아 대학 명예 교수.
Engle Robert(1942년 출생)는 미국 경제학자이자 노벨상 수상자(2003)입니다. 시러큐스(미국 뉴욕)에서 태어났습니다. 코넬대학교에서 공부했습니다. 1969년에 그는 경제학 박사 학위 논문을 옹호했습니다. 1969년부터 1974년까지. MIT에서 조교수로 일했습니다. 1975년 - 샌디에이고 캘리포니아 대학교 부교수. 2년 뒤 그는 교수직을 맡았다. 1990-1994년 동안. 같은 대학교 경제학과 학장, 이후 뉴욕대학교 재무학과 교수를 지냈다.
R. Ingle은 금융 시장에서 장기간에 걸친 시계열 분석 분야의 유명한 전문가입니다. 그의 연구는 ARCH 모델링, 공적분, 결합 스펙트럼 회귀와 같은 혁신적인 통계 방법에 중점을 두고 있습니다. 그는 연구에서 금융 계량 경제학 방법을 사용하여 주식, 통화, 이자율 및 옵션 거래를 수행합니다.
그는 미국계량학회(American Econometric Society)와 미국 예술과학아카데미(American Academy of Arts and Sciences)의 회원입니다.
시계열 분석(및 그 기반 예측 및 제어)의 개발은 예측 방법의 새로운 방향을 제시하고 ARIMA 분석의 이론적 기반이 되었습니다. 이에 따라 특정 시계열은 과거 값과 외생 확률 변수 및 방법론은 고려중인 시계열의 정상성이라는 필수 조건입니다. 이 방법론은 시계열의 확률적(확률적) 특징 분석을 기반으로 하는 비교적 새로운 세대의 예측 도구입니다. 이 경우 특정 시계열은 과거 값(lags)과 외생 확률 변수만을 사용하여 모델링됩니다. ARIMA 방법론을 구현하는 데 필요한 조건은 시계열의 정상성입니다. 즉, 수학적 기대값(평균), 분산 및 자기공분산(다른 간격)은 시간에 의존하지 않습니다. 고정된 경우에는 특히 자기회귀(AR)와 이동평균(MA)이라는 두 가지 구성요소를 사용하여 다양한 방식으로 모델링할 수 있습니다. 따라서 모델 자체는 이 두 구성 요소의 조합입니다.
ARIMA 방법론은 정상 계열에만 사용되므로 공정을 식별하는 첫 번째 단계는 시계열의 정상성을 확인하는 것입니다. ARIMA 모델링에서 시계열이 고정되어야 하는 이유는 이러한 모델이 예측에 사용되며 주요 특성(평균, 분산 및 자기공분산 계수)이 시간에 의존하지 않는 프로세스의 동작만 예측할 수 있기 때문입니다. . 비정상 시계열(수학적 기대값, 분산 및 자기 공분산은 시간에 따라 변경됨)을 기반으로 하는 프로세스의 동작을 예측하는 것은 불가능합니다. 이 경우 평균과 분산의 상수를 찾기가 어려우므로 이를 정상으로 줄일 수 있는 계열의 가능한 변환을 찾아야 합니다. 그러한 변형은 차이의 작용이다.
ARIMA 모델을 사용하여 경제 프로세스를 모델링하면 연구 중인 지표의 흐름과 시차 값 사이의 동적 관계를 식별할 수 있습니다. 이러한 모델은 개별 시계열의 단기 및 중기 예측을 위한 편리한 도구입니다. 그러나 현대 연구는 ARIMA 프로세스의 동적 방정식 시스템을 사용하여 여러 시계열을 동시에 모델링하는 장치를 개발하는 데 중점을 두고 있습니다. 이를 통해 지표와 시차 값 간의 상호 관계를 포함하고 연구가 가능합니다.
따라서 VAR 모델(벡터 자기회귀 모델)은 개별 시계열의 ARIMA 모델링 개념을 확장한 것입니다. 이 경우 "벡터"라는 용어는 두 개 이상의 시계열이 동시에 모델링되고 있음을 나타냅니다. "자기회귀"라는 용어는 시스템의 각 개별 방정식의 오른쪽에 종속 변수의 시차 값을 포함시키는 것을 의미합니다. VAR 모델의 안정성은 실제 사용을 위한 필수 조건입니다. 이는 VAR 시스템에 대한 일련의 외부 충격이 유한한 낙하 효과를 갖는다고 규정합니다. 즉, 충격이 시간이 지남에 따라 감소하면 VAR 모델은 고정되어 있습니다.
20세기 90년대. ECM(Error Correction Model)을 활용한 새로운 모델링 방향이 활발히 개발되고 있습니다. 이러한 모델은 비정상 변수를 포함하는 VAR 모델의 구조적 형태입니다. 이러한 시스템을 평가하려면 특히 시계열 공적분과 같은 추가 지식이 필요합니다. 변수의 공적분을 사용하면 차이 연산자를 사용하여 시계열을 고정된 시계열로 변환하지 않고도 비정상인 경우에도 올바른 모델을 구축할 수 있습니다. 이는 차이 연산자를 사용할 때 시계열 동작의 역학에 대한 귀중한 "장기적" 정보가 손실되기 때문에 응용 연구에 중요합니다. 따라서 꼭 필요한 경우에만 계열을 변환하는 것이 좋습니다.
ESM을 구성하고 올바르게 구현하려면 특정 순서가 필요합니다.
1. 계열의 정상성을 확인합니다. 고정되어 있지 않은 경우 통합 순서를 결정해야 합니다. 통합 순서가 동일하면 계열의 공적분 테스트를 진행할 수 있습니다.
그리고 계열이 공적분될 때만 ESM(구조적 형태의 VAR에 지나지 않음)을 구축하고 알 수 없는 매개변수를 추정할 수 있습니다.
공적분에 대한 자신의 이해를 제안한 사람은 R. Ingle과 K. Granger였습니다. 고려 중인 변수 간에 장기적인 관계가 있는 경우 다음과 같은 경우 분명히 장기적인 균형이 달성됩니다.
γ1Υ1t + γ2Υ2t + ... + γkΥkt=0,
또는 행렬 형태로:
γΥt=0, 여기서 γt=(γ1, γ2, ..., γk), Υt=(Υ1t, Υ2t, ..., Υkt).
장기 균형으로부터의 편차를 "평형 오류"라고 하며, 따라서 et=γΥt와 같습니다.
평형이 있다면 평형 오류는 고정 과정이어야 합니다.
위 공식을 기반으로 R. Ingle과 K. Granger는 벡터 Υt=(Υ1t, Υ2t, ..., Υkt)의 구성 요소가 d,b 차수로 공적분된다고 주장합니다. ~ CI (d,b) :
- 모든 구성 요소는 동일한 통합 순서를 갖지 않습니다. d;
- 선형 조합 γ1Υ1t + γ2Υ2t + ... + γkΥkt가 차수 (d - b), b>0의 통합량인 계수 γt=(γ1, γ2, ..., γk)의 벡터가 있습니다.
벡터 γ=(γ1, γ2, ..., γk)를 "공적분 벡터"라고 합니다. 분명히 γt=(γ1, γ2, ..., γk)가 공적분 벡터이면 추가 Ø 값에 대해 Øγ=(Øγ1, Øγ2, ..., Øγk)도 공적분 벡터입니다. 따라서 실제로 변수 중 하나는 공적분 벡터를 정규화하는 데 사용됩니다. 즉, 해당 계수는 1과 같아야 합니다.
2. 공적분을 위한 시계열 확인. 공적분을 위해 시계열을 테스트하는 데는 근본적으로 다른 여러 가지 접근 방식이 있습니다. R. Ingle과 K. Granger는 먼저 장기 균형 방정식을 추정하고 잉여를 계산하여 해당 잉여 시계열을 얻은 다음 잉여가 고정 계열로 판명되면 결론을 내릴 수 있다고 제안했습니다. 공적 통합에 대해.
20세기와 21세기의 전환기. 환율 이론의 틀 내에서 과학자들의 주요 노력은 상대 가격과 환율 간의 장기적인 관계를 연구하는 것이었습니다. 그들은 현대적인 계량 경제학 분석 방법을 사용했습니다. 즉, 시계열의 적분 순서를 결정하고 공적분을 테스트하는 것입니다.
두 개의 시계열이 공적분되는 경우 이는 개별 추세가 상호의존적이며 서로 크게 벗어날 수 없음을 의미합니다. R. Ingle 및 K. Granger의 개발에 따르면 공적분 변수에 대한 EU 분포(오류 수정 표현)가 있습니다. 이 메커니즘은 장기 균형을 기준으로 변수의 단기 조정을 포착합니다. 즉, 명목 환율과 상대 가격이 공적분되면 구매력 평가는 그러한 환율 균형의 조건이며 장기적인 역학에서 접근합니다.
이 방법론을 사용하는 대부분의 연구에서는 환율과 상대 가격 간의 공적분을 발견했습니다. 그러나 이러한 결과는 여러 국가 그룹에서 일관되지 않았습니다. 따라서 미국 과학자 K. Habermeier와 M. Mesquita는 선진국의 구매력 평가 이론을 확인했지만 개발 도상국에서 사용할 가능성을 증명할 수 없었습니다.
R. Ingle과 K. Granger의 연구는 계량경제 예측 분야에서도 중요합니다. 정보의 다양성과 모델링 전략이 서로 다른 다양한 경쟁 예측이 있습니다. 이러한 예측은 "예측 능력", 즉 예측 오류 제곱의 합과 비교할 수 있습니다. 다양한 예측을 조합하면 좋은 예측도 얻을 수 있습니다. 이러한 조합은 동일한 계열의 다양한 예측값, 상수 및 시차 값에서 계열의 실제 값에 대한 회귀를 계산하여 수행할 수 있습니다. 그러한 회귀 분석에 맞지 않는 예측은 다른 예측의 지배를 받기 때문에 폐기될 수 있습니다.
점 예측은 불확실성을 전혀 나타내지 않으면 의사 결정에 거의 가치가 없습니다. 대부분의 전통적인 경제 예측에 비해 예측 지점 주변의 95 % 간격은 비정상적으로 크므로 50% 간격이 권장되는 경우도 있습니다. 또 다른 문제는 예측 오류 분산이 시간이 지남에 따라 달라질 수 있다는 것입니다. 조건부 평균 fn,h와 마찬가지로 조건부 분산은 사용된 정보 다중성의 함수일 수 있습니다.
h2n=E[(xn+h - fn,h)2|In].
h2n을 모델링하는 방법은 fn,h를 모델링하는 방법보다 덜 개발되었습니다. 예측 오류 en,1=xn+1 - fn,1은 종종 백색 잡음이지만 제곱 오류는 조건부 분산을 예측할 수 있음을 나타내는 것으로 나타나지 않을 수 있습니다.
R. Ingle은 εt=xt - ft-1로 1단계 예측 오류를 표시하여 사양을 검토했습니다.

확인된 프로세스는 "자기회귀 조건부 이분산 프로세스"(가변 분산을 포함하는 프로세스)라고 불렸습니다. 시간이 지남에 따라 분산이 예측 가능하게 변경되는 경우 모델링의 장점은 이분산성을 고려할 때 매개변수(ft)에 대한 보다 정확한 추정치를 얻을 수 있을 뿐만 아니라 예측 주변의 간격에 대한 보다 정확한 추정치를 얻을 수 있다는 것입니다. 평균의.
R. Ingle은 ht에 대한 다양한 형식을 조사하여 해당 기능과 추정 방법에 대한 결론을 도출하고 Lagrange 승수 방법을 사용하여 자기회귀 조건부 이분산성을 테스트했습니다(이 접근 방식을 기반으로 구축된 모델을 "ARCH 모델"이라고 함). 그는 이 방법을 사용하여 영국 인플레이션 데이터를 분석하고 분산 예측 가능성에 대한 명확한 증거를 찾았습니다. 경제가 예상된 60년대에서 혼란스러운 70년대로 이동함에 따라 인플레이션의 표준 편차는 수년에 걸쳐 0.6%에서 1.5 %로 증가했습니다.
ht에 대한 위의 표현식은 관찰된 제어 변수를 포함하는 데 사용될 수 있습니다. 예를 들어 K. Granger는 소매 가격과 도매 가격의 관계를 연구했으며 각 방정식에서 위에서 설명한 방식으로 차이를 지정했지만 모델링된 가격과 기타 가격의 2차 시차 값과 2차 시차 값을 추가했습니다. 다른 지표를 예측하는 데 오류가 있습니다. ARCH 사양이 강화되면서 더 나은(우도 비율 측면에서) 모델이 등장했을 뿐만 아니라 모델에 대한 더 흥미로운 해석이 가능해졌습니다. 도매가격의 평균과 변동은 각각 소비자물가의 평균과 변동에 영향을 미치는 것으로 나타났다. 그리고 소비자물가의 제곱은 도매가격의 분산에 영향을 미치지 않습니다. ARCH를 고려하지 않고 이러한 모델을 구축했다면 소비자 가격이 도매 가격에 영향을 미치는 것으로 보입니다. 그러나 ARCH에서는 이러한 인과관계가 약해졌습니다.
실제로 분산은 시간이 지남에 따라 예측 가능하게 변경되므로 신뢰 구간 예측에 상당한 주의를 기울이는 경우 ARCH 모델을 사용하는 것이 좋습니다. 다른 분석 영역은 위험의 척도로 차이를 사용하는 경제 이론(예: 금융 이론)에 중점을 둡니다.
최근에는 시계열 분석 도구가 빠르게 발전하고 있습니다. 그러나 공적분을 테스트하기 위해 두 개의 변수를 사용하는 경우 Ingle-Granger 테스트를 계속 사용하는 것이 좋습니다(두 개 이상의 변수를 테스트하는 경우 Johansen 기술을 사용할 수 있음).
R. Ingle과 K. Granger는 시간 의존성 가변성(ARCH) 조건 하에서 경제 시계열을 분석하는 방법에 대한 연구를 수행했으며 이는 GDP 변화 추세를 예측할 수 있는 수학적 모델을 기반으로 소비자, 다음날은 물론 1년 전의 물가, 금리, 증권 환율까지. 사실 금융 시장에서는 주식, 옵션 및 기타 금융 상품의 가치가 위험에 따라 달라지기 때문에 지표가 일정한 값(변동성)에서 무작위로 벗어나는 것이 매우 중요합니다. 편차는 시간이 지남에 따라 크게 달라질 수 있습니다. 중요한 변경 기간이 지나면 사소한 변경 기간이 발생합니다. 실제 변동성은 가변적이라는 사실 외에도 경제학자들은 오랫동안 변동성이 일정하다고 가정하는 통계적 방법을 사용해 왔습니다.
그리고 R. Ingle이 1982년에 식별한 자기회귀 이분산 모델만이 경제학에서 발견되는 많은 시계열을 정확하게 설명합니다.
변동성 연구 결과는 특히 다음과 같이 실제로 널리 사용됩니다.
a) 1996년부터 국제 협약(소위 바젤 규칙)은 은행의 필수 자본을 모니터링할 때 위험 가치 지표의 사용을 의무화했습니다. 이러한 상황과 기타 상황에서 ARCH 방법을 사용함으로써 ARCH는 금융 산업의 위험을 평가하는 데 필수적인 도구가 되었습니다.
b) 전문가들은 이를 사용하여 유로화를 도입했습니다. 따라서 여러 국가의 이익을 고려한 경제 및 화폐 연합 프로젝트는 미국과 영국의 경제학자들에 의해 자세히 분석되었습니다.
그들은 유로 도입으로 인해 시스템 매개변수, 즉 환율의 변동(크기의 무작위 편차)이 증가하거나 감소하는지 여부에 관심이 있었습니다. 단일 통화로의 전환은 미국 달러/유로 환율을 통해 예상할 수 있습니다.
환율 변동성을 이용하면 변동폭이 적다는 것이 입증되었습니다. 유로존 회원국 사이에서는 완전히 사라질 것입니다. 그리고 유로 지역은 시불변 개체로 간주되므로 모든 선도 프리미엄은 0이 되고 금리 차이도 사라질 것입니다. 세율과 채무 불이행 위험에는 가위만 있을 것입니다. 통화 연합 국가 연합은 통화 안정의 큰 영역이 될 것입니다.
전문가들은 또한 공통 통화를 사용하는 경우 국제수지의 변동이 변동 금리에서 관찰되는 것보다 작을 것이라는 결론에 도달했습니다. 불안정성의 두 가지 원인이 사라집니다.
1) 자본 흐름에 의해 자극되는 환율의 변동은 발생하지 않습니다(투기적 자본 흐름이 사라지거나 크게 약화됨).
2) 통화정책에서 원하는 수준보다 적거나 많은 국제수지 흑자는 지급준비금 이체 메커니즘에 의해 자동으로 조정됩니다.
유로 지역 국가 내의 국제수지는 포기되지 않을 것이지만, 그 조정은 더 일찍 프로그램될 것이며 특별한 경우를 제외하고는 외부적으로 관찰할 수 없을 것입니다.
미국 달러/유로 환율과 관련해서는 전 세계적으로 가장 중요한 가격 요인이 될 것이라는 점에 주목된다. 일부 사람들은 EU 경제가 연합으로 통합된 국가 경제보다 더 폐쇄적이기 때문에 이 환율이 미국 달러/DM 환율보다 더 큰 변동을 가져야 한다고 믿었습니다. 그러나 전문가들은 이 의견을 일축했다. GDP 대비 수출입 비율이 아니라 전반적인 국제 수지, 무엇보다도 자본 이동에 초점을 맞추면 유로 지역의 투기 동기가 제거되면서 불안정한 이동이 "약한"에서 "약한"으로 이동합니다. "강한" 통화는 사라질 것입니다.
일반적으로 오늘날 환율 변동성을 사용하지 않고 글로벌 통화 시스템 안정성의 핵심 사항을 연구하는 것은 더 이상 불가능합니다. 또한 Ingle의 모델은 과학자뿐만 아니라 포트폴리오 투자의 자산과 위험을 평가하는 데 이를 사용하는 금융 및 시장 분석가에게도 없어서는 안 될 요소입니다.
전문가들은 90년대 경제 변화가 여러 측면에서 20세기 첫 10년의 변화와 유사하다고 믿습니다. 신중한 재정정책의 효과는 동일하다.
그러나 R.-A. 만델라, 세계 질서는 더 나쁜 방향으로 변했습니다. 세계 통화가 없을 때 환율이 끊임없이 변동하기 때문입니다. 자체 척도와 지수를 도입하여 물가 안정을 달성하기 위해 개별적으로 노력하는 국가는 특히 환율 변동성의 영향을 받습니다. 따라서 변동성은 실질환율이 겪는 변화의 척도이며 국내외 산업 발전의 역기능적 왜곡을 반영하여 금융시장에 내재된 불안정성을 더욱 증가시킵니다.
비정상 시계열 분석의 최근 개발은 이미 예측 방법에 영향을 미치고 있습니다. R. Ingle과 K. Granger는 두 개 이상의 결합된 변수의 속성을 고려합니다. 각 변수는 1차 적분되지만 이들의 조합은 고정적입니다(즉, 0차 적분). 이러한 변수를 "공적분"이라고 합니다.
공적분은 경제 모델링 및 예측에서 중요한 역할을 합니다. 첫째, 방정식의 변수가 공적분되지 않으면 오류가 고정적이지 않기 때문에 변수 간의 관계가 잘못 지정될 수 있습니다(또는 상당히 신뢰할 수 있는 매개변수 추정치를 얻기 어려울 수 있음). 둘째, R. Ingle과 K. Granger는 x와 y가 1차 적분이고, 일정한 평균을 가지며, 공적분되면 데이터 생성 오류를 수정하는 메커니즘(오류 수정 모델)이 있음을 증명했으며, 분석적으로 표현하면 다음과 같습니다.
Δyt=-α1ut-1 + 시차값(Δy, Δx) + d(L)ε1t,
Δxt=- α2ut-1 + 지연값(Δy, Δx) + d(L)ε2t, (6.1)
여기서 ut=yt - βxt, (6.2)
Δ는 첫 번째 차분 연산자입니다. 여기서 d(L)은 지연 연산자 L의 유한 다항식이고, εi는 랜덤 프로세스이며,
│α1│+│α2│≠0.
(6.1)의 해석은 식 (6.1)의 차이가 0이고 식 (6.1)이 ut = 0, 즉 x에 비례하는 평형에서 (6.2)로 변환되는 평형 상황을 고려함으로써 용이해집니다. . 따라서 식 (6.2)에 따르면 는 평형 값으로부터의 편차이고 는 평균이 0으로 고정되어 있기 때문에 기간 t-1의 평형 편차는 기간 t에서 부분적으로 수정됩니다. 이는 경제적 해석의 오류 수정 메커니즘이 구조 모델과 시계열 모델 간의 연결을 제공한다는 것을 의미합니다. 이 오류 수정 메커니즘은 변수의 1차 차이만 포함하는 모델이 공적분 변수에 잘못 지정된다는 의미이므로 예측에 매우 중요합니다. 예를 들어 VAR 모델을 사용하여 첫 번째 기간 차이 형태의 데이터를 맞추는 경우 이런 일이 발생할 수 있습니다.
R. Ingle과 K. Granger의 혁신적인 아이디어의 가치는 그들이 경제적 종속성을 모델링하는 새로운 방법을 제안했다는 사실뿐만 아니라 그들이 개발한 모델이 새로운 연구 영역을 열었다는 사실에도 있습니다. 동시에 노벨상 수상자들은 그러한 모델의 사용을 근본적으로 입증했으며 여러 고전적 예측을 위반할 경우 해당 매개변수에 대한 계량경제학 평가의 정확성을 입증했습니다. 제안된 각 방법이 이론적 결과를 확증하는 것도 중요하다.

소개

이 장에서는 순차적으로(시간이 지남에 따라) 얻은 정렬된 데이터를 설명하는 문제를 검토합니다. 일반적으로 말하면, 순서는 시간뿐만 아니라 공간에서도 발생할 수 있습니다. 예를 들어 실의 길이에 따른 직경(1차원 경우), 공간 좌표에 따른 공기 온도 값(3차원의 경우) -차원적인 경우).

관찰 행렬의 행 순서가 임의적일 수 있는 회귀 분석과 달리 시계열에서는 순서가 중요하므로 서로 다른 시점의 값 간의 관계가 중요합니다.

계열의 값이 개별 시점에 알려진 경우 해당 계열을 호출합니다. 이산적인, 달리 마디 없는, 그 값은 언제든지 알려져 있습니다. 연속된 두 순간 사이의 간격을 호출해 보겠습니다. 재치 (단계). 여기서는 계산 단위로 사용되는 고정된 클록 주기 길이를 갖는 이산 시계열을 주로 고려할 것입니다. 경제 지표의 시계열은 일반적으로 이산적이라는 점에 유의하십시오.

계열 값은 다음과 같습니다. 직접 측정 가능(가격, 수익성, 온도) 또는 집계된(누적), 예를 들어 출력량; 시간 단계 동안 화물 운반선이 이동한 거리입니다.

계열의 값이 결정론적 수학 함수에 의해 결정되면 해당 계열을 호출합니다. 결정론적인. 이러한 값을 확률 모델을 통해서만 설명할 수 있는 경우 시계열을 호출합니다. 무작위의 .

시간이 지남에 따라 나타나는 현상을 프로세스, 따라서 우리는 결정적 또는 무작위 프로세스에 관해 이야기할 수 있습니다. 후자의 경우 이 용어가 자주 사용됩니다. “확률적 과정”. 시계열의 분석된 부분은 숨겨진 확률적 메커니즘에 의해 생성된 연구 중인 확률론적 프로세스의 특정 구현(샘플)으로 간주될 수 있습니다.

시계열은 다양한 주제 영역에서 발생하며 성격도 다릅니다. 그들의 연구를 위해 다양한 방법이 제안되었으며, 이는 시계열 이론을 매우 광범위한 분야로 만듭니다. 따라서 시계열 유형에 따라 시계열 분석 이론의 다음 섹션을 구분할 수 있습니다.

– 확률적 특성이 시간이 지나도 변하지 않는 무작위 변수의 시퀀스를 설명하는 고정 무작위 프로세스입니다. 유사한 프로세스가 무선 공학, 기상학, 지진학 등에 널리 퍼져 있습니다.

– 액체와 기체의 상호 침투 중에 발생하는 확산 과정.

– 서비스 요청 접수, 자연 재해, 인재 등 일련의 이벤트를 설명하는 포인트 프로세스입니다. 유사한 프로세스가 대기열 이론에서 연구됩니다.

경제와 금융 분야의 실질적인 문제를 해결하는 데 유용한 시계열 분석의 적용 측면만 고려하도록 하겠습니다. 시계열을 설명하고 그 동작을 예측하기 위해 수학적 모델을 선택하는 방법에 중점을 둡니다.

1.시계열분석의 목표, 방법 및 단계

시계열에 대한 실제 연구에는 시계열의 속성을 식별하고 이 시계열을 생성하는 확률적 메커니즘에 대한 결론을 도출하는 작업이 포함됩니다. 시계열 연구의 주요 목표는 다음과 같습니다.

– 시리즈의 특징적인 특징을 요약된 형태로 설명합니다.

– 시계열 모델의 구축;

– 과거 관찰을 바탕으로 미래 가치를 예측합니다.

– 임박한 부작용에 대한 경고 신호를 샘플링하여 시계열을 생성하는 프로세스를 제어합니다.

설정된 목표를 달성하는 것이 항상 가능한 것은 아닙니다. 초기 데이터가 부족하고(관찰 기간이 충분하지 않음) 시간이 지남에 따라 계열의 통계 구조가 다양하기 때문입니다.

나열된 목표는 대부분 시계열 분석 단계의 순서를 결정합니다.

1) 시리즈의 동작에 대한 그래픽 표현 및 설명

2) 시간에 따라 달라지는 계열의 규칙적이고 무작위가 아닌 구성 요소를 식별하고 제외합니다.

3) 정규 성분을 제거한 후 남은 시계열의 무작위 성분에 대한 연구;

4) 랜덤 구성 요소를 설명하고 그 적절성을 확인하기 위한 수학적 모델의 구성(선택)

5) 시리즈의 미래 가치를 예측합니다.

시계열을 분석할 때 다양한 방법이 사용되며 가장 일반적인 방법은 다음과 같습니다.

1) 계열의 특징(주기성, 추세 등)을 식별하는 데 사용되는 상관 분석

2) 스펙트럼 분석을 통해 시계열의 주기적인 구성 요소를 찾을 수 있습니다.

3) 고주파수 및 계절적 변동을 제거하기 위해 시계열을 변환하도록 설계된 평활화 및 필터링 방법;

5) 예측 방법.

2. 시계열의 구조적 구성요소

이미 언급한 바와 같이, 시계열 모델에서는 두 가지 주요 구성요소, 즉 결정론적 구성요소와 무작위 구성요소를 구별하는 것이 일반적입니다(그림). 시계열의 결정적 구성 요소는 숫자 시퀀스로 이해되며, 그 요소는 특정 규칙에 따라 시간 함수로 계산됩니다. . 데이터에서 결정적 구성 요소를 제외함으로써 우리는 0 주위에서 진동하는 계열을 얻습니다. 이는 극단적인 경우 순전히 무작위 점프를 나타내고 다른 경우에는 부드러운 진동 동작을 나타낼 수 있습니다. 대부분의 경우 그 사이에 뭔가가 있을 것입니다. 즉 계열의 연속적인 항의 의존성으로 인한 일부 불규칙성과 일부 체계적인 효과가 있습니다.

결과적으로 결정론적 구성요소에는 다음과 같은 구조적 구성요소가 포함될 수 있습니다.

1) 추세 g는 시간이 지남에 따라 프로세스의 원활한 변화이며 장기적인 요인의 작용으로 인해 발생합니다. 경제학에서 이러한 요인의 예로서 다음과 같은 이름을 지정할 수 있습니다. a) 인구의 인구통계학적 특성(수, 연령 구조)의 변화; b) 기술 및 경제 발전; c) 소비 증가.

2) 계절적 영향 에스 , 미리 결정된 빈도로 주기적으로 작용하는 요인의 존재와 관련됩니다. 이 경우 계열에는 계층적 시간 척도(예: 1년 내에 계절, 분기, 월과 관련된 계절이 있음)가 있으며 유사한 효과가 계열의 동일한 지점에서 발생합니다.


쌀. 시계열의 구조적 구성요소.

계절적 효과의 전형적인 예: 주간, 요일별, 연중 시간별 고속도로 정체 변화, 8월 말~9월 초 학생을 위한 상품 판매 최고치. 계절 구성 요소는 시간이 지남에 따라 변하거나 유동적 성격을 가질 수 있습니다. 따라서 여객기 운송량 그래프 (그림 참조)에서 부활절 휴가 기간 동안 발생하는 지역 피크는 시기의 가변성으로 인해 "부동"하는 것을 볼 수 있습니다.

순환 구성 요소 , 상대적인 상승과 하강의 긴 기간을 설명하고 가변 기간과 진폭의 주기로 구성됩니다. 유사한 구성 요소가 여러 거시 경제 지표에 매우 일반적입니다. 여기에서 순환적 변화는 수요와 공급의 상호 작용뿐만 아니라 자원 고갈, 기상 조건, 조세 정책 변경 등과 같은 요인의 부과로 인해 발생합니다. 순환적 구성 요소는 공식적인 방법으로 식별하기가 매우 어렵습니다. 연구중인 시리즈의 데이터만을 기반으로합니다.

"폭발성" 구성 요소 , 그렇지 않으면 개입은 시계열에 대한 중요한 단기 영향으로 이해됩니다. 1994년 달러 환율이 하루 수십%씩 오른 '검은 화요일'이 개입의 한 예다.

계열의 무작위 구성 요소는 무작위 특성을 지닌 수많은 요인의 영향을 반영하며 "백색 잡음" 형태의 가장 단순한 것부터 자기회귀 이동 평균 모델로 설명되는 매우 복잡한 것까지 다양한 구조를 가질 수 있습니다(자세한 내용은 다음과 같습니다). 아래에).

구조적 구성요소를 식별한 후에는 시계열에서 발생 형태를 지정해야 합니다. 표현의 최상위 수준에서는 결정적 및 무작위 구성요소만 강조하는 경우 일반적으로 덧셈 또는 곱셈 모델이 사용됩니다.

덧셈 모델은 다음과 같은 형식을 갖습니다.

곱셈 -

현재 시리즈의 가치는 어디에 있습니까? ;

결정론적 구성 요소의 값입니다.

랜덤 구성요소의 값입니다.

결과적으로, 결정적 구성 요소는 결정적 구성 요소의 추가 조합으로 표현될 수 있습니다.

곱셈 조합으로:


,

또는 혼합된 조합으로, 예를 들어

3. 시계열의 결정적 구성 요소의 구성 요소 모델

3.1.트렌드 모델

추세는 일정한 장기 요인의 효과를 반영하고 본질적으로 매끄러우므로 매개변수가 선형인 다항식 모델이 추세를 설명하는 데 널리 사용됩니다.

지수 값은 어디에 있나요? 케이다항식은 5를 초과하는 경우가 거의 없습니다.

다항식 모델과 함께 성장 과정을 설명하는 경제 데이터는 종종 다음 모델로 근사화됩니다.

- 지수

이 모델은 일정한 성장률을 갖는 프로세스를 설명합니다.

- 물류 센터

로지스틱 곡선으로 설명되는 프로세스의 경우 연구 중인 특성의 성장률은 증가함에 따라 선형적으로 감소합니다. 와이, 그건

– 곰페르츠

.

이 모델은 연구 중인 특성의 성장률이 로그에 비례하는 과정을 설명합니다.

.

마지막 두 모델은 추세 곡선을 설정합니다. 에스- 모양으로, 초기 단계에서는 성장률이 증가하다가 마지막 단계에서는 점진적으로 둔화되는 과정을 나타냅니다.

적절한 기능적 관계 또는 추세 사양을 선택할 때 시계열의 그래픽 표현은 매우 유용합니다.

또한 장기 예측을 구성할 때 장기 요인의 작용을 반영하는 추세가 결정적이라는 점에 유의하세요.

3.2 계절성분모델

시계열의 계절 효과는 추세의 "배경"에 대해 나타나고 추세에 대한 예비 평가 후에 식별이 가능해집니다. (계열의 다른 구성 요소를 계산하지 않고 스펙트럼에 대한 계절 구성 요소의 기여도를 분리할 수 있는 스펙트럼 분석 방법은 여기서 고려하지 않습니다.) 실제로, 선형적으로 증가하는 일련의 월별 데이터는 동일한 지점(1월에 가장 작은 값과 12월에 가장 큰 값)에서 유사한 효과를 갖습니다. 그러나 여기서 계절적 효과에 대해 이야기하는 것은 적절하지 않습니다. 선형 추세를 제거하면 계절성이 전혀 없는 계열을 얻게 됩니다. 동시에 연하장 월별 판매량을 설명하는 계열은 동일한 기능(1월 최소 판매량, 12월 최대 판매량)을 가지더라도 추세에 따라 변동하는 특성을 가질 가능성이 높습니다. 변동은 계절적 효과로 지정됩니다.

가장 단순한 경우, 계절적 효과는 엄격한 주기적인 의존성의 형태로 나타날 수 있습니다.

누구에게나 , 어디 - 계절 기간.

일반적으로 값은 다음과 같이 구분됩니다. 기능적 의존성과 관련이 있을 수 있습니다.

예를 들어, 계절 효과 자체에는 변동폭의 변화를 반영하는 추세 구성요소가 포함될 수 있습니다.

계절 효과가 계열에 추가되는 경우 계절 효과 모델은 다음과 같이 쓸 수 있습니다.


부울, 그렇지 않으면 표시기, 변수, 기간 내의 각 클록 사이클에 대해 하나씩은 어디에 있습니까? 계절성. 따라서 일련의 월별 데이터의 경우 = 모두 0입니다. , 매년 1월을 제외하고 =1 등입니다. 의 계수는 추세에서 1월 값의 편차, - 2월 값의 편차 등을 표시합니다. 계절성 계수 값의 모호성을 제거하기 위해 일반적으로 소위 재매개변수화 조건이라는 추가 제한이 도입됩니다.

계절적 효과가 본질적으로 곱셈적인 경우, 즉

표시 변수를 사용하는 계열 모델은 다음과 같이 작성할 수 있습니다.

이 모델의 계수는 일반적으로 계절 지수라고 합니다.

완전 곱셈 계열의 경우


선형화 절차는 일반적으로 로그 연산을 사용하여 수행됩니다.

제시된 계절 효과 모델을 "지표"라고 부르는 데 동의하겠습니다. 계절 효과가 매우 "부드러운" 경우(고조파에 가까움) "고조파" 표현을 사용합니다.

,

어디 - 진폭, - 주파수 조건(단위 시간당 라디안), - 파동 단계. 왜냐하면 그 단계는 일반적으로 사전에 알려지지 않기 때문입니다. 마지막 표현은 다음과 같이 쓰여진다.

옵션 그리고 안에일반적으로 회귀분석을 사용하여 추정할 수 있습니다. 각주파수 유명한 것으로 간주됩니다. 조화로운 핏과 함께 핏의 질이 만족스럽지 못한 경우 기본파의 경우 모델에는 첫 번째 고조파(기본 주파수 2의 두 배)도 포함됩니다. ), 필요한 경우 두 번째 등의 고조파. 원칙적으로 지표와 조화라는 두 가지 표현 중에서 더 적은 매개변수가 필요한 표현을 선택해야 합니다.

3.3 개입 모델

계열의 변동을 크게 초과하는 영향을 나타내는 개입은 "충동" 또는 "단계"의 성격을 가질 수 있습니다.

충동 효과는 수명이 짧습니다. 일단 시작되면 거의 즉시 끝납니다. 단계적 효과는 오래 지속되고 지속 가능합니다. 일반화된 개입 모델은 다음과 같은 형식을 갖습니다.

개입으로 설명되는 계열의 결정적 구성 요소의 값은 어디에 있습니까?

이동 평균 유형 계수;

두 가지 유형 중 하나의 외생 변수입니다.

(“단계”) 또는 (“충동”)

개입의 순간이라고 불리는 고정된 시점은 어디입니까?

4.트렌드 식별 방법

단락 3.1에 제공된 계열 사양은 시간의 매개변수 함수입니다. 매개변수 추정은 회귀분석과 마찬가지로 최소자승법을 이용하여 수행할 수 있다. 시계열의 회귀 분석(포인트 참조)에 대한 통계적 전제 조건이 충족되지 않는 경우가 많지만(특히 포인트 5 - 상관 관계가 없는 교란) 그럼에도 불구하고 모델이 올바르게 지정되고 모델 사이에 큰 이상값이 없으면 추세 추정이 수용 가능한 것으로 나타납니다. 관찰. 회귀 분석의 가정 위반은 통계적 특성만큼 계수 추정에 영향을 주지 않습니다. 특히, 모델 계수에 대한 무작위 구성요소의 분산 추정과 신뢰 구간이 왜곡됩니다.

문헌에서는 상관 교란 조건 하의 추정 방법을 설명하지만 이를 적용하려면 관찰 상관 관계에 대한 추가 정보가 필요합니다.

추세를 식별할 때 가장 큰 문제는 프로세스 조건이 변경되기 때문에 일시적으로 모든 것에 대해 단일 사양을 선택하는 것이 불가능한 경우가 많다는 것입니다. 예측 목적으로 추세를 계산하는 경우 이러한 변동성을 고려하는 것이 특히 중요합니다. 여기서 시계열의 특성이 작용합니다. "먼 과거"와 관련된 데이터는 현재 기간 모델의 매개변수를 추정하는 데 부적합하거나 쓸모가 없거나 심지어 "유해"할 수도 있습니다. 이것이 바로 시계열 분석에서 데이터 가중치 절차가 널리 사용되는 이유입니다.

조건의 가변성을 고려하기 위해 계열 모델에는 적어도 매개변수 추정 수준에서 적응성 속성이 부여되는 경우가 많습니다. 적응성은 새로운 관찰이 가능해짐에 따라 모수 추정치가 쉽게 다시 계산된다는 의미로 이해됩니다. 물론, 계산 과정에서 오래된 데이터와 새로운 관찰을 포함하여 매번 추정치를 다시 계산함으로써 일반 최소 제곱법에 적응형 기능을 부여할 수도 있습니다. 그러나 각각의 새로운 재계산으로 인해 과거 추정값이 변경되지만 적응형 알고리즘에는 이러한 단점이 없습니다.

4.1 이동 평균

이동 평균 방법은 시계열의 결정적 구성 요소를 식별하는 가장 오래되고 가장 널리 알려진 방법 중 하나입니다. 이 방법의 핵심은 길이가 미리 선택된 시간 간격에 걸쳐 원래 계열의 평균을 계산하는 것입니다. 이 경우 선택한 간격 자체가 행을 따라 미끄러지며 매번 하나의 측정값을 오른쪽으로 이동합니다(따라서 메서드 이름임). 평균화를 통해 랜덤 성분의 분산을 크게 줄일 수 있습니다.

일련의 새로운 값이 더 매끄러워지기 때문에 이 절차를 시계열 평활화라고 합니다.

먼저 무작위 성분이 추가로 중첩되는 추세 성분만 포함하는 계열에 대한 평활화 절차를 고려해 보겠습니다.

알려진 바와 같이, 매끄러운 함수는 상당히 높은 정확도를 지닌 다항식으로 국소적으로 표현될 수 있습니다. 시계열의 시작 부분부터 길이(2)의 시간 간격을 연기해 보겠습니다. +1) 점을 찍고 다항식을 구성합니다. 선택한 값에 대해 이 다항식을 사용하여 ( +1 )-번째, 중간, 그룹의 지점.

명확성을 위해 7개 관측 간격에 대한 3차 다항식을 구성해 보겠습니다. 추가 변환의 편의를 위해 선택한 간격 내의 시간 순간에 번호를 매겨 중간 값이 0이 되도록 합니다. = -3, -2, -1, 0, 1, 2, 3. 필요한 다항식을 적어 보겠습니다.


최소제곱법을 사용하여 상수를 찾습니다.

계수로 차별화합니다.

;

-3에서 +3까지의 홀수 차수 t의 합은 0과 같으며 방정식은 다음 형식으로 축소됩니다.


방정식의 첫 번째와 세 번째를 사용하여 t=0에서 다음을 얻습니다.

따라서 해당 시점의 추세 값은 = 0은 이 점을 중심으로 하고 가중치를 두는 7점의 가중 평균과 같습니다.

, 대칭으로 인해 더 짧게 작성할 수 있습니다.

.

원래 계열의 다음 (m+2)번째 지점(여기서는 5번째 지점)의 추세 값을 계산하려면 식(1)을 사용해야 합니다. 여기서 관측값은 이동된 간격에서 가져옵니다. 오른쪽으로 한 틱 등. 요점까지 N - .

포인트 수 공식

9 .

이동 평균의 속성:

1) 가중치의 합은 1과 같습니다(모든 항이 동일한 상수와 동일한 계열을 평활화하면 동일한 상수가 발생해야 하므로).

2) 가중치는 중간 값을 기준으로 대칭입니다.

3) 수식에서는 계열의 첫 번째 및 마지막 m 값에 대한 추세 값을 계산할 수 없습니다.

4) 짝수 개의 포인트에 대한 추세를 구성하는 공식을 도출하는 것이 가능하지만 이로 인해 시간 단계 중간에 추세 값이 발생하게 됩니다. 이 경우 관찰 지점의 추세 값은 인접한 두 추세 값의 절반 합계로 결정될 수 있습니다.

주의할 점은 숫자 2가 짝수인 경우입니다. 평균 간격(하루 24시간, 한 달에 4주, 1년에 12개월)의 주기를 사용하는 경우 가중치를 사용한 단순 평균이 널리 사용됩니다. 예를 들어 1월부터 12월까지 매월 마지막 날에 관측값이 있다고 가정해 보겠습니다. 12개의 가중치 포인트를 간단히 평균하면 7월 중순의 추세 값을 얻을 수 있습니다. 7월말 추세값을 구하려면 7월 중순과 8월 중순의 평균 추세값을 구해야 합니다. 이는 13개월 간의 데이터를 평균화한 것과 동일한 것으로 나타났는데, 구간 가장자리의 값에 가중치를 부여한 것입니다. 따라서 평활화 구간에 짝수 2가 포함된 경우 2개가 아닌 포인트가 평균화에 포함됩니다. , 그리고 2 +1 행 값:

이동 평균은 원래 계열을 평활화하고 추세 및 순환 구성요소를 그대로 둡니다. 평활 간격 값은 의미 있는 고려 사항을 바탕으로 선택해야 합니다. 계열에 계절 성분이 포함된 경우 평활 구간의 값은 계절성 기간과 같거나 배수로 선택됩니다. 계절성이 없는 경우 평활 간격은 일반적으로 3~7 범위에서 사용됩니다.

Slutsky-Yul 효과

평활화 과정이 계열의 무작위 구성 요소에 어떻게 영향을 미치는지 고려해 보겠습니다. 이에 따라 계열의 무작위 구성 요소는 중심에 있고 계열의 이웃 항은 상관 관계가 없다고 가정합니다.

무작위 계열의 이동 평균 엑스다음이 있습니다:

.

중심성으로 인해 엑스원래 계열의 구성원 간에 상관관계가 없으면 다음과 같은 결과가 나옵니다.

그리고 .

획득된 관계로부터 평균화는 진동 분산의 감소로 이어진다는 것이 분명합니다. 또한 평균화의 결과로 얻은 계열의 항은 더 이상 독립적이지 않습니다. 파생되고 평활화된 계열은 최대 2m 차수의 0이 아닌 자기 상관(k-1 관측값으로 분리된 계열 구성원 간의 상관)을 갖습니다. 따라서 파생된 계열은 원래 무작위 계열보다 매끄러워지며 체계적인 변동을 나타낼 수 있습니다. 이 효과를 Slutsky-Yul 효과라고 합니다.

4.2 연속차분법을 이용한 다항식의 차수 결정

임의의 요소가 겹쳐진 다항식(또는 다항식으로 지역적으로 표현됨)을 포함하는 계열이 있는 경우 계열의 연속차를 계산하여 다항식 부분을 제거할 수 없는지 여부를 조사하는 것이 당연합니다. 실제로, k 차 다항식의 차이는 k-1 차 다항식을 나타냅니다. 또한 계열에 p차 다항식이 포함되어 있으면 차이로의 전환이 반복(p+1)회 수행되어 이를 제거하고 원래 계열의 임의 구성 요소와 관련된 요소를 남깁니다.

예를 들어, 3차 다항식이 포함된 계열의 차이로의 전환을 생각해 보세요.

0 1 8 27 64 125

6 12 18 24

6 6 6

0 0

차이를 취하면 계열의 무작위 구성 요소가 변환됩니다.

일반적인 경우에 우리는 다음을 얻습니다:

;

.

우리가 얻은 마지막 관계에서

따라서 변수의 연속 차분 방법은 첫 번째, 두 번째, 세 번째 등을 계산하는 것으로 구성됩니다. 차이, 제곱합 결정, 나누기 등 그리고 이 관계가 일정해지는 순간을 감지합니다. 이러한 방식으로 우리는 원래 계열에 포함된 다항식의 차수와 랜덤 구성요소의 분산에 대한 추정치를 얻습니다.

4.3.지수평활 방법

관측치를 설명하기 위해 함수를 구성하는 방법은 지금까지 모든 관측치가 동일한 가중치를 갖는 최소 제곱 기준을 기반으로 했습니다. 그러나 어떤 의미에서는 최근 지점에 더 많은 가중치를 부여해야 하고, 먼 과거까지 거슬러 올라가는 관측값은 비교 시 더 적은 가치를 가져야 한다고 가정할 수 있습니다. 어느 정도 우리는 2m+1 값 그룹에 할당된 가중치 값이 이전 값에 의존하지 않는 유한 길이의 평균 세그먼트를 사용하는 이동 평균에서 이를 고려했습니다. 이제 보다 "최근" 관찰을 식별하는 또 다른 방법을 살펴보겠습니다.

요소 b에 비례하는 일련의 가중치, 즉 등을 고려해 보겠습니다. 가중치의 합은 1과 같아야 하므로, 즉 , 실제로는 비늘 등이 될 것입니다. (0으로 가정

4.3.1 단순 지수평활

상수(레벨)와 랜덤 구성요소의 합과 동일한 가장 간단한 계열을 고려해 보겠습니다.

.

주어진 표현식에서 계열의 관측 값과 수준 추정치 간의 불일치는 데이터의 연령에 따라 가중치가 기하급수적으로 감소하여 취해집니다.

; ; .

당시 받은 평가 ( ). 시간에 따른 평활화된 값 이전 순간의 평활화된 값을 통해 표현 가능 -1 및 새로운 관찰:

결과 비율

소위 평활화 상수(0 £)를 도입하여 조금 다르게 다시 작성해 보겠습니다. £1).

결과 관계에서 계열의 새 값과 예측 값 사이의 오류 비율, 불일치에 대해 후자를 수정하여 이전 값에서 새 평활화된 값을 얻는다는 것이 분명합니다. 새로운 데이터에 대한 시리즈 수준의 적응이 있습니다.

4.3.2 고차지수평활

지수평활법을 공정모델이 선형함수로 결정되는 경우로 일반화해 보자. 이전과 마찬가지로 주어진 b에 대해 다음을 최소화합니다.

.

(여기서는 표현의 편의를 위해 ~, Ù 기호는 생략합니다.)

,

고려해 보면

, ,

우리는 얻는다

적어보자: .

이 작업은 1차 평활화로 간주될 수 있습니다. 비유적으로 2차 평활화를 구성하겠습니다.

; .

위에서 논의된 절차는 n차가 더 높은 다항식 추세의 경우로 일반화될 수 있으며, 이 경우 대수 표현식은 더 복잡해집니다. 예를 들어 모델이 포물선으로 설명되는 경우 삼중 지수 평활 방법이 사용됩니다.

5. 계절성분의 추정 및 제거

계절 성분은 독립적인 관심 대상이 될 수도 있고 간섭 요인으로 작용할 수도 있습니다. 첫 번째 경우에는 이를 계열에서 분리하고 해당 모델의 매개변수를 추정할 수 있어야 합니다. 계열에서 계절 성분을 제거하는 방법에는 여러 가지 방법이 가능합니다.

먼저 계절효과를 추정하는 절차를 고려해 보겠습니다. 원래 계열을 완전히 덧셈적으로 만들어 보겠습니다. 즉

.

관찰을 토대로 평가하는 것이 필요하다. 즉, 지표모델의 계수 추정치를 구하는 것이 필요하다.

이미 언급한 바와 같이 계절적 효과는 추세 배경에 따라 나타나므로 먼저 고려된 방법 중 하나를 사용하여 추세 구성 요소를 평가해야 합니다. 그런 다음 각 계절에 대해 관련된 모든 차이가 계산됩니다.

여기서 평소와 같이 는 계열의 관측값이고 는 추정된 추세 값입니다.

이러한 각각의 차이는 계절 효과와 무작위 성분에 대한 공동 추정치를 제공하지만, 이는 차이를 취하기 때문에 원래 추정치와 다릅니다.

결과 차이를 평균함으로써 효과 추정치가 얻어집니다. 원래 계열에 정수가 포함되어 있다고 가정 케이계절성 기간을 단순 평균으로 제한하여

계절 효과의 합이 0이 되어야 하는 재모수화 조건을 고려하여 조정된 추정치를 얻습니다.

.

곱셈 계절효과의 경우, 계열모형이 다음과 같은 형태를 가질 때

,

그들은 더 이상 차이를 계산하지 않고 비율을 계산합니다.

.

계절지수는 평균으로 평가됩니다.

.

실제로 계절 효과를 평가하려면 시계열에 최소한 5~6개의 계절성 기간이 포함되어야 한다고 믿어집니다.

이제 계열에서 계절 효과를 제거하는 방법을 살펴보겠습니다. 그러한 방법에는 두 가지가 있습니다. 첫 번째 것을 "포스트 트렌드"라고 부르겠습니다. 이는 위에서 논의한 평가 절차의 논리적 결과입니다. 가법 모델의 경우 계절 성분을 제거하는 것은 원래 계열에서 추정된 계절 성분을 빼는 것으로 축소됩니다. 승법 모델의 경우 계열 값은 해당 계절 지수로 나뉩니다.

두 번째 방법은 추세나 계절 구성 요소에 대한 사전 평가가 필요하지 않지만 차이 연산자를 사용하는 것을 기반으로 합니다.

차이 연산자.

시계열을 연구할 때 간단한 반복 방정식으로 시간의 결정론적 함수를 표현하는 것이 가능한 경우가 많습니다. 예를 들어, 선형 추세

다음과 같이 쓸 수 있다

마지막 관계는 인접 모멘트에 대한 계열의 두 값을 비교하여 (1)에서 얻습니다. -1 및 . 관계식 (2)가 순간에도 유효하다는 점을 고려하면 -2 및 - 1, 그래서 , 모델 (1)은 다음 형식으로 작성할 수도 있습니다.


모델 (3)에는 추세를 설명하는 매개변수가 명시적으로 포함되어 있지 않습니다. 설명된 변환은 차분 연산자를 사용하여 더 간결하게 설명할 수 있습니다.

모델 (2)와 (3)은 다음과 같이 쓸 수 있습니다.

2차 차이는 원래 계열의 선형 추세를 완전히 배제하는 것으로 나타났습니다. 순서의 차이를 쉽게 알 수 있습니다. 계열에서 다항식 순서 추세를 제외합니다. -1. 이제 계열에 마침표가 있는 계절 효과가 포함되도록 하세요. , 그래서

시리즈에서 이동하는 절차( = 1,2,...,)를 계열에 적용하는 것을 첫 번째 계절차를 취한다고 하며 연산자는 마침표가 있는 계절차 연산자입니다. . (4)로부터 다음과 같다.

계절적 차이를 취하면 시계열에서 결정적인 계절 구성 요소가 제거되는 것으로 나타났습니다.

때로는 고차 계절 연산자가 유용할 때도 있습니다. 따라서, 주기를 갖는 2차 계절 연산자 있다

계열에 추세와 계절 성분이 모두 포함되어 있는 경우 및 연산자를 순차적으로 적용하여 제거할 수 있습니다.

이러한 연산자가 적용되는 순서는 중요하지 않다는 것을 쉽게 알 수 있습니다.

또한 추세와 계절적 요소로 구성된 결정론적 추세는 연산자를 적용한 후 완전히 퇴화된다는 점에 주목합니다. 그러나 마지막 방정식을 반복 형식으로 작성하면 다음을 얻습니다.

마지막 관계에서 계열이 어떻게 무한정 계속될 수 있는지 분명합니다. +1 연속 값.

6. 시계열의 무작위 구성요소 모델

선형 계열 시간 시스템

표현의 편의를 위해 여기서는 수학적 통계의 관례에 따라 확률 변수를 소문자로 표시하는 데 동의합니다.

무작위 과정을 통해 엑스 ( ) 집합 T에서 각각에 대해 값이 무작위인 함수입니다. 그것. T의 요소가 셀 수 있는 경우(이산 시간) 무작위 과정을 종종 무작위 시퀀스라고 합니다.

무작위 과정에 대한 완전한 수학적 설명에는 분포 함수 시스템을 지정하는 것이 포함됩니다.

- 각각 오티, (1)

– 각 요소 쌍에 대해

그리고 일반적으로 유한한 수의 요소에 대해

함수 (1), (2), (3)은 랜덤 프로세스의 유한 차원 분포라고 합니다.

임의의 무작위 프로세스에 대해 이러한 기능 시스템을 구성하는 것은 거의 불가능합니다. 일반적으로 무작위 프로세스는 증분의 독립성, 궤적의 마코비안 특성 등과 같은 속성에 대한 선험적 가정을 사용하여 지정됩니다.

모든 유한차원 분포가 정규인 과정을 정규(가우스)라고 합니다. 이러한 과정을 완전히 설명하려면 1차원 및 2차원 분포 (1), (2)에 대한 지식이면 충분합니다. 이는 실제적인 관점에서 중요합니다. 수학적 기대와 프로세스의 상관 함수에 대한 연구입니다.

시계열 이론에서는 가장 단순한 "백색 잡음"부터 매우 복잡한 유형의 자동 회귀(이동 평균 및 백색 잡음을 기반으로 구축된 기타)에 이르기까지 다양한 무작위 구성 요소 모델이 사용됩니다.

백색 잡음 과정을 정의하기 전에 분포 함수가 다음과 같은 일련의 독립 확률 변수를 고려하십시오.

마지막 관계에서 시퀀스의 모든 유한차원 분포는 1차원 분포를 사용하여 결정됩니다.

게다가, 그러한 시퀀스에서 구성 확률 변수가 엑스 () 수학적 기대치가 0이고 모든 항목에 대해 동일하게 배포됩니다. ÎT, 그렇다면 이것은 '백색소음'입니다. 정규분포의 경우 엑스 () 가우스 백색 잡음에 대해 이야기합니다. 따라서 가우스 백색 잡음은 수학적 기대치가 0이고 (전체) 분산이 동일한 독립적인 정규 분포 확률 변수의 시퀀스입니다.

시계열 분석의 이론과 실제에 널리 사용되는 보다 복잡한 모델은 이동 평균 프로세스, 자기 회귀 및 혼합 모델과 같은 선형 모델입니다.

이동 평균 프로세스 무작위 교란의 가중 합계를 나타냅니다.

어디 – 독립적이고 동일하게 분포된 확률 변수(백색 잡음)

– 수치 계수.

이동 평균 프로세스에 순서가 있다는 정의를 보면 쉽게 알 수 있습니다. (약칭 CC( )) 통계적으로 종속적인 것은 ( +1) 연속 수량 엑스 (), 엑스 ( -1),..., 엑스 ( - ). 시리즈의 구성원은 ( +1) 시계는 다른 용어가 형성에 참여하기 때문에 통계적으로 독립적입니다.

현재 순간에 무작위 교란이 일어나는 곳은 어디입니까? ;

– 수치 계수.

관계식 (5)에 따라 일관되게 표현함 엑스(t-1)을 통해 엑스(t-2), . . . , 엑스(t-p-1), 그런 다음 엑스(t-2)를 통해 엑스(t-3), . . . , 엑스(t-p-2) 등 우리는 그것을 얻습니다 엑스(t)는 과거 교란의 무한 합입니다. 따라서 자기회귀 과정 X(t)와 엑스(t-k)는 어떤 경우에도 통계적으로 종속됩니다. 케이 .

AP(1) 프로세스는 Markov 프로세스라고도 하며, AP(2)는 Yule 프로세스라고도 합니다. 일반적으로 마르코프 과정은 현재 상태와 미래에 작용할 과정에 미치는 영향에 의해서만 미래가 결정되고 현재까지의 상태는 중요하지 않은 과정이라고 합니다. AP 프로세스(1)

Markovian은 그 순간의 값이 알려진 경우 프로세스의 값을 통해 어떤 순간의 상태가 결정되기 때문입니다. 공식적으로, 임의 순서의 자기회귀 프로세스는 현재 상태인 경우 Markovian으로 간주될 수도 있습니다. 세트를 센다

(엑스(티), 엑스(t-1), . . . , 엑스(t-p-1)) .

SS, AR 모델 및 그 구성: 자기회귀 - 이동 평균 모델에 대해 자세히 설명합니다(섹션 10.1.5). 우리는 그것들이 모두 일반 선형 모델의 특별한 경우인 것처럼 보인다는 점만 주목합니다.

일반적으로 말하면 그 수는 무한한 가중 계수는 어디에 있습니까?

무작위 구성 요소의 모델 중에서 중요한 클래스, 즉 시간이 지나도 속성이 변하지 않는 고정 프로세스를 강조하겠습니다. 랜덤 프로세스 Y(t)는 다음과 같은 경우 정상이라고 합니다. N, 랜덤 변수의 분포는 동일합니다. 즉, 유한차원 분포의 함수는 시간 이동에 따라 변하지 않습니다.


정상 시퀀스를 구성하는 확률 변수는 균등하게 분포되므로 위에서 정의된 백색 잡음 과정은 정상입니다.

7.랜덤성분의 수치적 특성

시계열을 분석할 때 확률변수와 유사한 수치적 특성이 사용됩니다.

– 수학적 기대치(프로세스의 평균 값)

;

– 자기공분산 함수

– 분산

- 표준 편차

– 자기상관 함수

– 부분 자기 상관 함수

함수 연산자에서 평균화는 상수에서 발생합니다. 즉, 일련의 실현(일반적으로 "시간의 강에 두 번 들어갈 수 없기 때문에 잠재적인 실현)"에 대한 수학적 기대가 있습니다.

고정 프로세스에 도입된 수치적 특성을 고려해 보겠습니다. 정상성의 정의로부터 어떤 경우에도 다음과 같습니다. 에스 , 그리고

두는 것 = - , 우리는 얻는다

(1)

정상 프로세스의 경우 수학적 기대값과 분산은 모든 프로세스에 대해 동일하다는 것이 밝혀졌습니다. , 자기공분산 및 자기상관 함수는 시간의 순간에 의존하지 않습니다. 에스또는 , 그러나 차이점(지연)에만 해당됩니다.

속성 (1)의 충족은 아직 조항 6의 정의 의미에서 정상성을 의미하지 않는다는 점에 유의하십시오. 그럼에도 불구하고 처음 두 순간의 불변성과 지연에만 대한 자기상관 함수의 의존성은 확실히 시간이 지남에 따라 프로세스의 일부 불변성을 반영합니다. 조건 (1)이 충족되면 프로세스가 넓은 의미에서 정지 상태라고 하고, 조건 ()이 충족되면 좁은(엄격한) 의미에서 정지 상태를 의미합니다.

위에서 제시한 백색소음의 정의는 좁은 의미로 해석되어야 한다. 실제로는 넓은 의미에서 백색 잡음으로 제한되는 경우가 많습니다. 이는 =0과

좁은 의미에서 고정적인 가우스 프로세스는 넓은 의미에서도 고정적입니다.

넓은 의미에서 정상성을 판단하는 것이 훨씬 쉽습니다. 이를 위해 무작위 프로세스의 한 가지 실현을 기반으로 다양한 통계 기준이 사용됩니다.

8.시계열의 수치적 특성 평가

매 순간 무작위 시계열의 수치적 특성을 추정하려면 해당 무작위 프로세스의 일련의 실현(궤적)이 필요합니다. 시간은 재현 가능하지 않지만 프로세스 조건은 때때로 반복 가능한 것으로 간주될 수 있습니다. 이는 낮 동안 전기 네트워크의 전압 변동과 같은 기술 응용 분야에서 특히 일반적입니다. 서로 다른 날에 관찰된 시계열은 하나의 무작위 프로세스를 독립적으로 구현한 것으로 간주될 수 있습니다.

사회경제적 성격의 과정을 연구할 때는 상황이 다릅니다. 일반적으로 여기에는 반복할 수 없는 프로세스 구현이 하나만 있습니다. 결과적으로 평균, 분산, 공분산의 추정치를 얻는 것이 불가능합니다. 그러나 고정 프로세스의 경우 이러한 추정이 여전히 가능합니다. 시계열의 관측값을 각각 순간이라고 하자. 평균의 전통적인 추정치는 고정된(넓은 의미에서) 무작위 과정의 수학적 기대치의 추정치 역할을 할 수 있습니다.

고정된 계열에 대한 그러한 추정은 편향되지 않을 것이 분명합니다. 이 추정의 일관성은 Slutsky의 정리에 의해 확립됩니다. Slutsky의 정리는 필요 충분 조건으로서 다음을 요구합니다.

,

프로세스의 자기상관 함수는 어디에 있습니까?

평균을 추정하는 정확도는 길이에 따라 다릅니다. N열. 길이라고 믿어진다. N항상 소위 상관 시간(correlation time)보다 작지 않아야 하며, 이는 값으로 이해됩니다.

크기 계열의 두 값 사이에 눈에 띄는 상관 관계가 유지되는 기간의 규모에 대한 아이디어를 제공합니다.

이제 자기 상관 함수 값의 추정치를 얻는 것을 고려해 보겠습니다. 이전과 마찬가지로 시계열의 관측값입니다. 형태를 잡자( N-1) 항. 이러한 쌍은 표준 상관 계수의 추정치를 결정할 수 있는 두 개의 확률 변수의 표본으로 간주될 수 있습니다. 그런 다음 우리는 ( N-2) 페어링하여 등급 등을 결정합니다. 계산 중에 표본 크기가 변경되므로 해당 값 집합의 평균 및 표준 편차가 변경됩니다. 단순화하기 위해 전체 계열의 평균값을 기준으로 모든 변수를 측정하고 분모의 분산 항을 계열 전체의 분산으로 바꾸는 것이 일반적입니다.

,

평균은 어디에 있습니까?

전체적으로 N추정치의 차이는 미미합니다. 연습 중 케이그들은 더 이상 비용을 청구하지 않습니다 N /4.

계열이 무한 길이의 일반 모집단으로 간주되면 자기 상관(이론적)에 대해 이야기하고 이를 표시합니다. 계수 배열 또는 해당 샘플 계수에는 계열의 내부 구조에 대한 매우 중요한 정보가 포함되어 있습니다. 좌표가 있는 그래프에 표시된 상관 계수 세트 케이(지연)을 x축 및 세로축을 따라 상관도형(각각 이론상 또는 표본)이라고 합니다.

가우시안 프로세스에 대한 정확도 추정 특성을 얻었습니다. 특히 모든 상관관계가 0인 가우스 백색 잡음의 경우 . 가우스 백색 잡음에 대한 수학적 기대값은 0이 아닌 것으로 나타납니다. 즉, 추정값이 편향된 것으로 나타납니다. 편향의 크기는 표본 크기가 증가함에 따라 감소하며 응용 분석에서는 그다지 중요하지 않습니다.

추정치는 에서 점근적으로 정규적이며, 이는 대략적인 신뢰 구간을 구성하기 위한 기초를 제공합니다. 널리 사용되는 95% 구간은 입니다.

그래프에 표시된 신뢰구간의 경계를 신뢰관이라고 합니다. 일부 무작위 프로세스의 상관도가 신뢰관을 벗어나지 않으면 이 프로세스는 백색 잡음에 가깝습니다. 사실, 이 조건은 충분하다고 간주될 수 있습니다. 종종 가우스 백색 잡음의 샘플 상관도표에는 처음 20개의 추정치 중 하나 또는 심지어 두 개의 이상값이 포함되어 있어 당연히 그러한 상관도표의 해석이 복잡해집니다.

자기상관함수와 함께 무작위 시계열의 구조를 분석할 때 부분자기상관함수를 사용하는데, 그 값이 부분상관계수이다.

9. 분포법칙에 구애받지 않고 계열의 무작위성을 확인하는 기준

명확하게 정의된 추세가 없는 변동 계열에 대해 제시할 수 있는 가장 간단한 가설은 변동이 무작위라는 가정입니다. 가설에 따르면 무작위 계열에서는 관측값이 독립적이며 임의의 순서로 나타날 수 있습니다. 무작위성을 테스트하려면 관측값이 도출되는 것으로 가정되는 모집단의 분포 유형에 대해 어떠한 제한도 요구하지 않는 기준을 사용하는 것이 바람직합니다.

1. 전환점 기준최고점(인접한 두 값보다 큰 값)과 최저점(인접한 두 값보다 작은 값)을 계산하는 것으로 구성됩니다. 계열 y 1 ,...,y N 을 생각해 보세요.

최고점

t-1< y t >y t+1 y t-1 > y t< y t+1


y t-1 y t y t+1 y t-1 y t y t+1

쌀. 전환점.

전환점을 결정하려면 세 개의 연속 값이 필요합니다. y0과 yN+1은 알 수 없으므로 시작값과 끝값은 전환점이 될 수 없습니다. 계열이 무작위인 경우 이 세 가지 값은 동일한 확률로 가능한 6개의 순서 중 하나로 발생할 수 있습니다. 그중 4개만이 전환점, 즉 세 값 중 가장 크거나 작은 값이 중간에 있을 때 발생합니다. 따라서 세 가지 값의 그룹에서 전환점을 찾을 확률은 2/3입니다.


쌀. 세 점의 상대적 위치에 대한 옵션입니다.

N개의 수량 그룹에 대해 셀 수 있는 변수 X를 정의합니다.

М 1, y t-1인 경우< y t >y t+1 또는 y t-1 > y t< y t+1

î 0, 그렇지 않으면.

그러면 계열의 전환점 p의 수는 간단히 이고 수학적 기대값은 M[p]=2/3(N-2)입니다. 전환점 수의 분산은 D[p]=(16N-29)/90 공식을 사용하여 계산되며 분포 자체는 정규에 가깝습니다.

2. 위상 길이 결정에 따른 기준

두 전환점 사이의 간격을 위상이라고 합니다. 길이가 d인 위상(예: 오름차순)의 존재를 확인하려면 첫 번째 항에서 두 번째 항까지 감소한 다음 (d+2)까지 순차적으로 상승하는 d+3 항을 검색해야 합니다. (d+3) -그의 거시기로 감소합니다.


1 2 3 4 d+1 d+2 d+3 N

쌀. 3. 위상 길이 d.

오름차순으로 정렬된 d+3 숫자 그룹을 생각해 보세요. 두 개의 극단적인 항을 건드리지 않고 나머지 d+1에서 한 쌍의 숫자를 추출하여 그 중 하나를 시작 부분에 다른 하나를 끝에 놓으면 길이가 d인 위상을 얻습니다. 이러한 방식으로 숫자 쌍을 선택하는 방법이 있으며 쌍의 각 요소는 임의의 끝에 배치될 수 있으므로 오름차순 단계의 수는 d(d+1)와 같습니다.

또한 수열의 첫 번째 항이 끝에 배치되고 두 번째 항을 제외한 나머지 항이 처음에 배치되면 전환점이 발생합니다. 그러한 시퀀스의 수는 다음과 같습니다. ( +1) . 원래의 증가하는 수열의 마지막 항이 시작 부분에 배치되고 마지막 항을 제외한 다른 항이 끝에 배치되면 동일한 수의 수열이 얻어집니다. 이중계산을 방지하기 위해 첫 항이 맨 마지막에, 마지막 항이 첫 번째에 오는 경우는 제외되어야 한다. 따라서 다음부터 순차적으로 ( +3) 위상 길이가 있는 숫자 증가하는 경우의 수는

( +1)+2( +1)-1 =+3 +1 .

가능한 시퀀스 수 ( +3) 숫자는 순열의 수와 같습니다 ( +3) !, 따라서 상승 또는 하강 단계의 확률은 다음과 같습니다.

일련의 길이 N에서 d+3 구성원으로 구성된 N-2-d 그룹을 연속적으로 식별할 수 있습니다. 저것. 길이 d의 위상 수에 대한 수학적 기대

.

1에서 N-3까지 길이의 전체 위상 수에 대한 수학적 기대값은 다음과 같습니다.

.

3 .차이 징후에 따른 기준

이 기준은 계열의 양수 1차 차이 수, 즉 계열의 증가 지점 수를 계산하는 것으로 구성됩니다. 일련의 N 항에 대해 N-1 차이를 얻습니다. 계산 변수를 다음과 같이 정의하겠습니다.

이제 다음으로 표시하면 와 함께무작위 계열의 증가 점 수

.

분포는 분산이 있으면 매우 빠르게 정규화되는 경향이 있습니다.

.

기본적으로 이 기준은 선형 추세가 있는지 확인하는 데 권장됩니다. 반면에 전환점을 기반으로 한 기준은 추세 감지에 적합하지 않습니다. 적당한 추세에 눈에 띄는 무작위 변동을 중첩하면 추세가 없을 때와 거의 동일한 수의 전환점이 발생합니다. 선형 추세를 탐지하기 위한 더 발전되었지만 더 복잡한 테스트는 t에 대해 y를 회귀하고 회귀 계수의 유의성을 테스트하는 것입니다.

4.순위 비교에 따른 기준

계열의 이웃 값을 비교하는 아이디어는 모든 값을 비교하는 것으로 발전할 수 있습니다. 주어진 계열에 대해 계열의 다음 구성원이 모든 후속 구성원을 초과하는 경우의 수를 계산합니다. 전체적으로 비교를 위한 N(N-1) 쌍이 있습니다. 허락하다 N총 건수를 초과했습니다. Kendal 순위 상관 계수 계산

.

이 계수가 중요하고 양수이면 계열이 증가하고, 음수이면 감소합니다.

10. 선형 형태의 고정 랜덤 성분에 대한 이론적 분석

확률론적 과정의 일반 선형 모델이 고려됩니다.

백색소음은 어디에 있나요?

– 가중치 계수.

=0, ,

한발 뒤로 쉬프트 연산자를 소개해보자 안에 :

다수(구체적으로는 제이-다중) 연산자의 적용 안에로 표시되는 는 도입된 표기법을 고려하여 일반 선형 모델은 다음과 같이 쓸 수 있습니다.

선형 연산자는 어디에 있습니까?

과정 (1)에 대한 수학적 기대값, 분산, 자기공분산 함수를 찾아보겠습니다.

;

모델이 이해되려면 분산이 유한해야 합니다. 즉, 계열이 수렴한다고 가정합니다.

또한, 소위 가역성 조건이 성립한다고 가정합니다.

,

대신 어디에 안에복소수가 나타납니다. 이 조건은 역연산자의 존재를 의미합니다.

여기서, 즉,

마지막 표현식에서 곱을 확장하고 동질적인 용어를 그룹화하여 0과 동일시하여 계수를 결정하는 표현식을 얻습니다. 그래서, 등등.

왼쪽에 ()를 곱하면 가역적 프로세스가 다음과 같이 작성될 수 있음을 얻습니다.

항목 (2)는 무한 차수의 자기회귀 방식에 해당합니다. 이 동일한 비율은 시계열의 모든 과거 값에 대한 선형 예측변수로 해석될 수 있으며, 해당 항은 이 예측변수의 무작위 오류로 해석될 수 있습니다. 계열의 과거 값을 모두 알고 있는 경우 형식 (2)를 사용하면 계열의 미래 값을 예측할 수 있습니다.

10.1\. 자기회귀 모델

일반선형모형의 특수한 경우인 확률성분모형, 즉 실무에서 널리 사용되는 자기회귀모형, 이동평균모형, 혼합모형에 대해 좀 더 자세히 살펴보자.

AR(1) 모델의 형식은 다음과 같습니다.

모델은 다음과 같은 형태를 취하게 됩니다.

분모를 사용하여 무한히 감소하는 기하학적 수열의 합으로 간주됩니다. 안에우리는 그것을 얻습니다

따라서 마르코프 과정은 일반선형모형의 특수한 경우로서 기하급수법칙에 따라 계수가 변하는, 즉 기하급수법칙에 따라 변하는 것이다.

식 (2)는 (1)에서 직접적으로, , ~을 통해 표현하여 얻을 수도 있다.

()에 따른 분산은 다음과 같습니다.

분산이 있는 백색 잡음은 분산이 증가된 Markov 방식에서 무작위 프로세스를 생성하는 것으로 나타났습니다.

Markov 프로세스의 자기공분산 함수를 찾으려면 일반 표현식()을 사용할 수 있습니다. 그러나 다음 경로가 더 명확합니다. Markov 프로세스의 방정식 (1)을 곱하고 수학적 기대값을 취하겠습니다.

오른쪽의 두 번째 항은 계열의 과거 값과 현재 순간의 외란의 상관 관계가 없는 특성으로 인해 0과 같기 때문에 다음을 얻습니다.

(정체로 인해)

우리가 가진 마지막 관계에서

,

그건 계열의 평균 항의 자기상관 계수와 일치합니다. 이제 (1)에 수학적 기대값을 곱해 보겠습니다.

교체 으로 나누어서, 우리는 얻는다.

기부 케이값 2,3,... 우리는

따라서 마르코프 과정에서 모든 자기상관은 첫 번째 자기상관으로 표현될 수 있습니다. 이후 Markov 프로세스의 자기상관 함수는 성장에 따라 기하급수적으로 감소합니다. 케이 .

이제 Markov 프로세스의 부분 자기 상관 함수를 고려해 보겠습니다. 우리는 두 개의 클록 사이클로 분리된 계열의 두 항, 즉 와 사이의 상관 관계가 값으로 표현된다는 것을 발견했습니다. 그러나 그것은 , 에 달려 있습니다. 중위항에 대한 의존성이 제거되면 과 사이의 의존성이 유지되는지 여부에 대한 의문이 제기됩니다. 해당 부분 상관 계수는 다음과 같습니다.

.

왜냐하면 , 분자는 0입니다. 마찬가지로, 3, 4 등의 주기로 구분된 계열 구성원의 부분 상관 계수도 0과 같다는 것을 알 수 있습니다. 따라서 자기 상관은 이웃 항의 상관으로 인해 존재하지만 이는 마르코프 과정의 수학적 모델을 따릅니다.

AR(1) 모델에 대한 고려를 마무리하면서 우리는 이 모델이 경제 지표를 연결하는 선형 회귀의 잔차를 설명하기 위해 경제 및 수학적 연구에서 매우 자주 사용된다는 점에 주목했습니다.

시프트 연산자 사용 안에모델은 다음과 같이 작성됩니다.

,

모델의 속성은 근과 다항식에 따라 달라집니다.

이는 다음 형식으로도 작성할 수 있습니다.

(1-안에)(1-안에)=0.

과정 (1)이 정상이 되려면 근과 단위원 내부에 있어야 하거나(복소근의 경우) 1보다 작아야 합니다(실근의 경우). .

둘 다 유효하고 다르게 두십시오. 간단한 분수로 나누어 보겠습니다.

, (3)

어디 .

무한 기하학적 진행의 합으로 (3)의 개별 항을 고려하면 다음을 얻습니다.


AR(2)는 계수가 있는 일반 선형 모델()의 특별한 경우임이 밝혀졌습니다.

이제 Yule 프로세스의 자기상관 함수를 고려해 보겠습니다. (1)에 과 를 차례로 곱하고, 수학적 기대값을 취해 로 나눕니다. 결과적으로 우리는

이러한 방정식은 처음 두 개의 자기상관을 통해 결정하고 반대로 찾을 수 있는 알려진 것을 사용하여 결정하는 데 충분합니다.

이제 (1)을 곱하면 반복 방정식을 얻습니다.

첫 번째 자기상관을 통해 고차 자기상관을 찾을 수 있습니다. 따라서 Yule 과정의 상관도형이 완전히 결정되었습니다.

AR(2) 과정의 상관도형의 형태를 살펴보자.

식 (4)는 다음과 같은 2차 차분 방정식으로 간주될 수 있습니다. 아르 자형상수 계수를 사용합니다.

그러한 방정식에 대한 일반적인 해법은 다음과 같은 형식을 갖습니다.

,

특성 방정식의 근원은 어디에 있습니까?

(5)

방정식 (2)와 (5)는 대체까지 동일하다는 것을 쉽게 알 수 있습니다. 안에~에 그리고 이 방정식의 근이 일치하도록 양변을 로 나눕니다. 즉,

차이 방정식 (4)에 대한 일반적인 해는 다음과 같습니다.

(6)

계수는 어디에 있습니까? 그리고 안에의 경계 조건에서 발견되었습니다. 제이=0 및 제이 =1.

따라서 실수 근의 경우 상관도형 AP(2)는 (6)에서 볼 수 있듯이 두 감쇠 지수의 혼합입니다.

완전근의 경우, 과정 AR(2)의 상관도형은 감쇠된 고조파로 나타납니다.

이제 Yule 프로세스의 부분 자기상관 함수가 어떻게 작동하는지 살펴보겠습니다. 와 같은 계수만 0과 다릅니다. 더 높은 차수의 부분 상관은 0과 같습니다(이 프로세스는 나중에 자세히 설명됩니다). 따라서 프로세스의 부분 상관도는 1과 같은 지연 직후에 차단됩니다.

결론적으로 우리는 AR(2) 모델이 작은 무작위 충격에 의해 영향을 받는 진자를 원형으로 하는 순환 특성의 동작을 설명하는 데 허용 가능한 것으로 나타났습니다. 그러한 진동 과정의 진폭과 위상은 항상 변할 것입니다.

y에 대한 차분 식 (1) 또는 ()에 대한 해는 두 부분으로 구성됩니다. 아르 자형임의의 상수 및 특정 솔루션. 일반적인 해결책이 있습니다

여기서 – 상수 계수가 있습니다.

(제이 =1,2,...,아르 자형)는 특성 방정식의 근입니다.

급수(2)의 정상성은 방정식(3)의 근이 1보다 작은 모듈러스를 갖는 경우 발생합니다. 즉, 근은 단위원 안에 있어야 합니다. 계열의 이력이 충분히 길다고 가정하면 일반 해(2)는 감쇠로 인해 무시될 수 있습니다.

()에서 볼 수 있듯이 빈번한 해결책은 다음과 같습니다.

마지막 관계식은 자기회귀과정을 일반선형모형으로 표현한 형태이다.

우리는 방정식 (1)에 를 연속적으로 곱하고, 수학적 기대치를 취하고 로 나눕니다. 상관 계수에 대한 방정식 시스템을 얻습니다.

, 케이 =1, 2, ..., (4)

이를 고려하여 행렬 표기법을 도입합니다.

,

우리는 (4)를 다음과 같은 형식으로 씁니다.

아빠 = 아르 자형 (5)

방정식 (5) 시스템을 Yule-Walker 시스템이라고 합니다. 그것으로부터 우리는 다음을 발견합니다

= 아르 자형 (6)

따라서 시계열의 첫 번째 p 자기상관을 알면 (3)에서 고차 자기상관을 찾을 수 있습니다. 즉, 자기상관 함수(프로세스 AR(1) 및 AR(2)를 분석할 때 이미 언급한)를 완전히 복원할 수 있습니다. ).

자기상관 함수의 동작은 특성 다항식의 근에 따라 달라집니다. 일반적으로 AR 프로세스의 상관도식( 아르 자형)는 감쇠된 정현파 세트로 구성됩니다.

프로세스 AP(2)에 0과 동일한 2개 이상의 항으로 분리된 계열 항의 부분 자기상관이 있는 경우 프로세스 AP( 아르 자형) p차 이상의 자기상관은 0과 같습니다. AR 과정의 부분 상관도형( 아르 자형)는 특정 순간부터 시작하여 0과 같아야 합니다. 그러나 이 사실은 무한 급수에도 적용된다는 점에 유의해야 합니다. 유한 구현의 경우 상관도표의 중단점을 나타내는 것이 어려운 경우가 많습니다.

따라서 프로세스 AP( 아르 자형) 부분 자기 상관 함수는 지연에서 종료됩니다. 아르 자형, 자기 상관 함수는 부드럽게 감소합니다.

10.1.4 이동 평균 프로세스

이동평균 과정에 대한 일반화된 선형 모형에는 유한한 수의 항만 포함됩니다. 즉, () 안에는 다음과 같습니다. =0 케이 > .

모델은 형태를 취합니다.

(1)

(안에(1) 계수는 다음과 같이 재지정됩니다.)

관계식 (1)은 이동 평균 주문 프로세스를 정의합니다. , 또는 약어로 SS( ). 프로세스 SS(에 대한 가역성 조건() )는 다항식의 근이 만족되면 만족됩니다. (안에) 단위원 밖에 위치한다.

과정 SS(의 분산을 구해보자. ):

이 유형의 모든 혼합 곱은 서로 다른 시간에 상관되지 않는 방해 특성으로 인해 0과 같습니다. CC 프로세스의 자기 상관 함수를 찾으려면( ) 순차적으로 (1)을 곱하고 수학적 기대값을 취합니다.

식 (2)의 오른쪽에는 동일한 시간 간격에 해당하는 항만 남습니다(그림 참조).


따라서 식 (2)는

(3)

(3)을 로 나누면, 우리는 다음을 얻습니다.

(4)


프로세스 CC(q)의 자기상관 함수가 유한한 범위( 클록 사이클)은 이러한 프로세스의 특징입니다. 알려진 경우 (4)는 원칙적으로 매개변수와 관련하여 해결될 수 있습니다. 방정식 (4)는 비선형이며 일반적인 경우 여러 해를 가지지만 가역성 조건은 항상 단일 해를 선택합니다.

이미 언급한 바와 같이 가역적 SS 프로세스는 무한 AP 프로세스 -AP(\)로 간주될 수 있습니다. 결과적으로, 프로세스 CC( 아르 자형)은 무한한 범위를 가지고 있습니다. 따라서 프로세스 CC( ) 자기상관 함수는 지연에서 종료됩니다. , 부분 자기 상관 함수는 부드럽게 감소합니다.

비록 AR 모델( 아르 자형) 및 SS( ) 많은 실제 프로세스를 설명하는 것이 가능해지며, 추정된 매개변수의 수가 상당할 수 있습니다. 관찰된 시계열에 대한 모델을 선택할 때 설명의 유연성과 비용 효율성을 높이기 위해 자기회귀와 이동 평균을 모두 포함하는 혼합 모델이 매우 유용한 것으로 입증되었습니다. 이러한 모델은 Box와 Jenkins에 의해 제안되었으며 자동회귀 이동 평균 모델(약어로 ARMC( 아르 자형, )):

시프트 연산자 사용 안에모델 (1)은 더 간결하게 표현될 수 있습니다:


, ()

(안에)-이동 평균 순서 연산자 .

Model()은 다음과 같이 작성할 수도 있습니다.

가장 간단한 혼합 프로세스 ARSS(1,1)을 고려해 보겠습니다.

에 따르면

(2)

관계식 (2)에서 ARCC(1,1) 모델은 계수가 있는 일반 선형 모델()의 특별한 경우임이 분명합니다. (제이 >0)

(2)로부터 분산에 대한 표현식을 얻는 것은 쉽습니다.

상관 함수를 얻기 위해 자기회귀 모델을 분석할 때와 동일한 기술을 사용합니다. 프로세스 ARSS(1,1)의 모델 표현의 두 부분을 모두 곱해 보겠습니다.

계속해서 수학적 기대값을 취합니다.

또는 (등식의 오른쪽에 있는 두 번째 항이 0과 같다는 점을 고려)

공분산을 분산으로 나누면 자기 상관에 대한 표현식을 얻습니다.

결과 관계는 과에 따라 초기 값에서 기하급수적으로 감소하고, >이면 감쇠가 단조롭다는 것을 보여줍니다. ~에< – затухание колебательное.

마찬가지로, 일반 ARCC 모델에 대해 자기상관 함수를 구성할 수 있습니다( 아르 자형, ).

모든 항 (1)에 을 곱해 봅시다. 수학적 기대값을 취하고 그 결과 다음과 같은 차이 방정식을 얻습니다.

어디 - 사이의 상호 공분산 함수 와이그리고 . 현재 소란이 일어나고 있기 때문에 그리고 과거 순간의 계열 값(cm(2))은 상관 관계가 없습니다. k>0인 경우 0입니다.

값에 대해서는 다음과 같습니다. +1 자기공분산과 자기상관은 AR 모델에서와 동일한 관계를 만족합니다( 아르 자형):

결과적으로는 다음과 같습니다. 전체 자기상관 함수는 감쇠된 지수 및/또는 감쇠된 사인파 세트로 표현됩니다. > ~ 할 것이다 - 이 계획에서 벗어나는 가치.

ARSS 모델은 랜덤 프로세스가 비정상인 경우로 일반화될 수 있습니다. 이러한 프로세스의 놀라운 예는 "랜덤 워크(Random Walk)"입니다.

시프트 연산자를 사용하여 모델 (1)은 다음 형식을 취합니다.

(2)

(2)에서 과정 (1)이 다르다는 것이 분명합니다. . 이 과정의 특성방정식은 1과 같은 근을 갖는다. 즉, 특성방정식의 근이 단위원의 경계에 있을 때 경계의 경우가 있다. 동시에, 1차 차분으로 가면 그 과정은 고정되어 있는 것으로 드러납니다.

일반적인 경우 ARCC 모델의 비정상 자기회귀 연산자는 하나 이상의 근이 1과 같다고 가정합니다. 즉, 비정상 자기회귀 순서 연산자입니다. + ; 방정식 =0의 근은 1과 같고 나머지는 아르 자형뿌리는 단위원 바깥에 위치한다. 그럼 우리는 그것을 쓸 수 있습니다

,

어디 () – 고정 자기회귀 순서 연산자 아르 자형(단위원 밖에 근이 있음)

=(1- ), 비정상 프로세스 ARSS는 다음과 같이 작성됩니다.

, (3)

어디 ()는 가역 이동 평균 연산자입니다(근은 단위원 외부에 있음).

주문 차이의 경우 즉, 모델

이미 정지되어 있는 가역 프로세스 ARSS( 아르 자형, ).

일련의 차이를 원래의 계열로 되돌리려면 연산자가 필요합니다. 에스, 뒤집다:

이 연산자를 합산 연산자라고 합니다.

초기 차이가 순서인 경우 , 원래 시리즈를 복원하려면 다음이 필요합니다. - 연산자의 다중 반복 에스 , 그렇지 않으면 - 다중 합산(적분). 따라서 프로세스 (3)은 ARISS에 통합이라는 용어를 추가하여 일반적으로 ARISS 프로세스라고 합니다. 간략하게, 모델 (3)은 ARISS( 아르 자형, , ), 어디 아르 자형– 자동 회귀 순서, – 차이의 순서, – 이동 평균의 순서. 언제인지는 분명하다 =0 ARISS 모델은 ARSS 모델로 들어갑니다.

연습 중 일반적으로 2개를 초과하지 않습니다. .

ARISS 모델은 일반 선형 모델과 유사할 뿐만 아니라 "순수한" 자기회귀 프로세스(무한 차수)의 형태로 표현을 허용합니다. 예를 들어 ARISS(1, 1, 1) 프로세스를 생각해 보세요.

(4)로부터 다음과 같다.

식 (5)에서 세 번째부터 시작하는 계수는 공식을 사용하여 계산됩니다.

표현 (5)는 세 번째부터 가중치가 기하급수적으로 감소한다는 점에서 흥미롭습니다. 따라서 공식적으로는 모든 과거 값에 따라 달라지지만 계열의 여러 "최근" 값이 현재 값에 실제로 기여하게 됩니다. 따라서 방정식 (5)가 예측에 가장 적합합니다.

11.ARISS 모델을 이용한 예측

이미 언급한 바와 같이 ARISS 프로세스는 일반화된 선형 모델의 형태로 표현될 수 있습니다.

현재 시점의 시리즈의 미래(예측) 가치를 형태로 찾는 것은 자연스러운 일입니다.

기대값은 다음과 같이 표시됩니다.

=

마지막 관계의 오른쪽에 있는 첫 번째 합에는 미래의 교란만 포함됩니다(예측은 현재 이루어집니다). , 계열과 외란 모두의 과거 값이 알려진 경우) 수학적 기대값은 정의에 따라 0과 같습니다. 두 번째 학기에 관해서는 이미 여기에서 소란이 발생했으므로

따라서

예측값과 기대값의 차이를 나타내는 예측 오류는 다음과 같습니다.

=

여기서부터의 오차 분산은 다음과 같습니다.

관계식 (1)을 이용한 예측은 원칙적으로 가능하지만, 과거의 모든 외란에 대한 지식이 필요하기 때문에 어렵다. 또한, 고정 계열의 경우 계열이 분기되는 비정상 프로세스는 말할 것도 없고 감쇠율이 충분하지 않은 경우가 많습니다.

ARISS 모델은 다른 표현도 허용하므로 이를 예측에 사용할 가능성을 고려해 보겠습니다. 모델이 차분 방정식으로 직접 주어지도록 하세요.

계열의 알려진 값을 기반으로 함(관찰 결과) 및 교란 추정값 , 반복식 (3)을 기반으로 순간 계열의 기대값을 추정할 수 있습니다. +1:


두 단계에 대해 예측할 때 다시 재발 관계(3)를 사용해야 합니다. 여기서 현재 시계열의 관측 값은 다음과 같습니다. +1은 (4)에 의해 예측된 값, 즉 등등을 취해야 합니다.

마지막으로 ARISS 과정을 자기회귀(autoregression) 형태로 표현함으로써 예측이 가능하다. 이미 언급한 바와 같이, 자기회귀 순서가 무한하다는 사실에도 불구하고 계열 표현의 가중 계수는 매우 빠르게 감소하므로 계열의 과거 값 중 적당한 수만 있으면 예측을 계산하는 데 충분합니다.

앞으로의 단계에 대한 예측 오차의 분산은 다음과 같습니다.

그리고 식 (2)에 따르면 다음 식으로 주어진다.

무작위 교란이 가우스 백색 잡음이라고 가정하면, 즉 표준 방식으로 계열의 예측 값에 대한 신뢰 구간을 고려할 수 있습니다.

12.ARISS 모델 구축 기술

위에서 설명한 이론적 체계는 시계열이 무한한 선사시대를 가지고 있다는 가정을 바탕으로 구축되었지만 실제로는 연구자가 사용할 수 있는 관측량이 제한되어 있습니다. 모델은 실험적으로 선택되어 사용 가능한 데이터에 적합해야 합니다. 따라서 시계열 분석 이론의 이론적 적용 관점에서 볼 때 ARISS 모델의 올바른 사양 문제는 결정적으로 중요합니다( , , ) (식별) 및 해당 매개변수에 대한 후속 평가.

식별 단계에서는 관찰된 데이터를 사용하여 적합한 모델 클래스를 결정하고 해당 매개변수에 대한 예비 추정이 이루어집니다. 즉, 시험 모델이 구축됩니다. 그런 다음 시험 모델이 데이터에 더욱 주의 깊게 맞춰집니다. 이 경우 식별 단계에서 얻은 1차 추정치는 반복 매개변수 추정 알고리즘에서 초기 값으로 작용합니다. 마지막으로 세 번째 단계에서는 결과 모델에 대한 진단 테스트를 거쳐 모델의 부적절성을 식별하고 적절한 변경 사항을 개발합니다. 나열된 단계를 더 자세히 살펴보겠습니다.

모델 식별

식별의 목적은 수량에 대한 아이디어를 얻는 것입니다. , , 그리고 모델 매개 변수에 대해. 모델 식별은 두 단계로 나뉩니다.

1. 차이의 순서 결정 오리지널 시리즈.

2. 다양한 차이점에 대한 ARSS 모델 식별.

두 단계 모두에서 사용되는 주요 도구는 자기상관 함수와 부분 자기상관 함수입니다.

이론적 부분에서는 고정 모델의 경우 자기상관이 증가함에 따라 감소하는 것을 확인했습니다. 케이(상관계법에 따르면) 매우 빠르게. 자기상관 함수가 천천히 그리고 거의 선형적으로 감소한다면 이는 프로세스가 비정상적임을 나타냅니다. 그러나 아마도 첫 번째 차이는 정상적일 것입니다.

다양한 차이에 대한 상관도표를 구성한 후 분석이 다시 반복됩니다. 차등의 순서인 것으로 생각된다. , 정상성을 보장하는 것은 프로세스의 자기상관 함수가 매우 빠르게 감소할 때 달성됩니다. 실제로는 원래 계열의 약 15~20개 첫 번째 자기상관 값과 첫 번째 및 두 번째 차이점을 살펴보는 것으로 충분합니다.

차수 d의 고정된 일련의 차이를 얻은 후, 이러한 차이의 자기상관 및 부분 자기상관 함수의 일반적인 형태를 연구합니다. 이러한 함수의 이론적 속성을 기반으로 값을 선택할 수 있습니다. 그리고 AP 및 CC 운영자용. 다음으로 선택한 항목으로 그리고 자기회귀 매개변수의 초기 추정치가 구성됩니다. 이동 평균 =(). 자기회귀 과정의 경우 Yule-Walker 방정식이 사용되며, 여기서 이론적 자기상관은 표본 추정치로 대체됩니다. 이동 평균 주문 프로세스의 경우 첫 번째 것들만 자기상관은 0과 다르며 매개변수를 통해 표현될 수 있습니다(참조). 이를 표본 추정치로 대체하고 에 대한 결과 방정식을 풀면 추정치를 얻습니다. 이러한 예비 추정치는 다음 단계에서 보다 효율적인 추정치를 얻기 위한 시드로 사용될 수 있습니다.

혼합 APCC 프로세스의 경우 평가 절차가 더욱 복잡해집니다. 따라서 문단 1에서 고려된 프로세스 ARSS(1,1)의 경우 모수, 보다 정확하게는 해당 추정치가 ()에서 대체 및 해당 표본 추정치로 구해집니다.

일반적인 경우 ARCC 프로세스의 초기 추정값 계산( , )은 다단계 절차를 나타내며 여기서는 논의되지 않습니다. 연습을 위해 1차 및 2차 AR 및 SS 프로세스와 가장 간단한 혼합 프로세스 ARCC(1,1)가 특히 중요하다는 점만 참고하겠습니다.

결론적으로, 식별 절차의 기반이 되는 자기상관 추정치는 큰 분산(특히 표본 크기가 불충분한 조건 - 수십 개의 관찰)을 가질 수 있으며 높은 상관 관계를 가질 수 있습니다. 따라서 이론적 자기상관함수와 경험적 자기상관함수 사이의 엄격한 대응에 대해 말할 필요가 없습니다. 이로 인해 선택할 때 어려움이 발생합니다. , , , 따라서 추가 연구를 위해 여러 모델을 선택할 수 있습니다.

선형 계열 시계열 시스템

http://www.에 게시됨