Всё для Учёбы — студенческий файлообменник
1 монета
docx

Контрольная «Поиск параметров уравнения линейной регрессии» по Эконометрике (Горбатков С. А.)

Министерство образования и науки Российской Федерации

Федеральное агентство по образованию ГОУ ВПО

Всероссийский заочный финансово-экономический институт

Контрольная работа по предмету

"Эконометрика"

Вариант 2

Преподаватель Прокофьев О.В. Работа выполнена Горячева Е.В.

Факультет менеджмента и маркетинга

3 курс

№ личного дела 07МЭБ02922

группа № 1

Пенза 2010 г.

Задача По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.)

Требуется:

1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.

2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.

3. Проверить выполнение предпосылок МНК.

4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

6. Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.

7. Представить графически: фактические и модельные значения точки прогноза.

8. Составить уравнения нелинейной регрессии:

* гиперболической;

* степенной;

* показательной.

Привести графики построенных уравнений регрессии.

9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.

Таблица 1.1

72 52 73 74

76 79

54 68 73 64

121 84 119 117

129 128 102 111

112 98

1. Найдем параметры уравнения линейной регрессии, дадим экономическую интерпретацию коэффициента регрессии.

Уравнение линейной регрессии имеет вид:

Значения параметров а и b линейной модели определим, используя данные таблицы 1.1.

1,403987

112,1-(1,403987?68,5) = 15,92691

Уравнение линейной регрессии имеет вид: =15,92691+1,403987*x.

С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличиться в среднем на 1,403987 млн. руб. Это свидетельствует об эффективности работы предприятия.

2. Вычислим остатки; найдем остаточную сумму квадратов; оценим дисперсию остатков ; построим график остатков.

Остатки см табл 1.1 столбец

Остаточная сумма квадратов = 297,59

Дисперсия остатков 37,1985

График остатков

3. Проверим выполнение предпосылок МНК.

Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.

* случайный характер остатков

* нулевая средняя величина остатков, не зависящая от от xi

* гомоскедастичность - дисперсия каждого отклонения ei одинакова для всех значений x

* отсутствие автокорреляции остатков

* остатки подчиняются нормальному распределению

* случайный характер остатков

Для простейшей визуальной проверки строится график зависимости остатков ei от теоретических значений результативного признака y

Остатки расположены внутри симметричной огибаемой горизонтальной полосы.

На графике остатки расположены случайным образом, значит остатки ei представляют собой случайные величины и МНК оправдан.

Для проверки с помощью критерия поворотных точек строится график е(х) (используются отсортированные значения Х в порядке возрастания).

С помощью графика ei(x) мы построим таблицу для нахождения поворотных точек.

Данные для проверки 1 предпосылки по критерию поворотных точек

x i сортированные

e i поворотные точки

52 -4,93 54

10,26 1 64 -7,78

1 68

-0,40 0 72 3,99

1 73 0,58 0 73

-6,42 1 74 -2,82

0 76

6,37 1 79 1,16

Здесь данные отсортированы в порядке возрастания величины х.

Т.о., количество поворотных точек р = 5

Критическое число при n=10 равно 2.

5 >2, предпосылка о случайном характере остатков выполняется.

* нулевая средняя величина остатков, не зависящая от от xi

Для простейшей визуальной проверки используется ранее построенный график е(х) зависимости остатков ei от факторов, включенных в регрессию xi.

Остатки на графике расположены случайным образом внутри симметричной горизонтальной полосы, значит их математическое ожидание не зависит от xi.

Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей нулевой гипотезы H0: .

С этой целью строится t-статистика , где .

t= 0 26228139 (? = 0,05; ?=n-1=9) гипотеза принимается.

t-статистика

3,13*10-15 t крит 0,05

2,228139

t ei=yi-yi^ (ei-ei cp)^2

1 3,986047 15,88857

2 -4,93422 24,34652

3 0,58206

0,338794 4 -2,82193

7,963271 5 6,3701

40,57817 6 1,15814

1,341287

7 10,25781 105,2226

8 -0,39801 0,158409

9 -6,41794 41,18996

10

-7,78206 60,56045

Сумма 5,68*10-14

297,588 Среднее

5,68*10-15

* гомоскедастичность - дисперсия каждого отклонения ei одинакова для всех значений x

Коэфф. Спирмена где

r(x) - ранг х (порядковый номер х по возрастанию)

r(e) - порядковый номер остатка по возрастанию.

Связь ниже среднего (по коэффициенту Спирмена -0,35152).

t-статистика это меньше t Крит, следовательно гипотеза об отсутствии гетероскедастичности при пятипроцентном уровне значимости принимается.

К проверке предпосылки МНК №3 по тесту Спирмена

r(x)

r(e) r(x)-r(e) (r(x)-r(e))^2

5 5 0 0 1 6

-5 25 6 2 4

16 8

4 4 16 9 7 2

4 10 3 7 49 2

10 -8 64 4 1

3 9

6 8 -2 4 3 9

-6 36 Сумма

223 Коэфф. Спирмена

-0,35152

t-статистика

-1,06201 t крит 0,05

2,306004 Гомоскедастичность присутствует

Независимость остатков проверяется с помощью критерия Дарбина - Уотсона.

dw==1,571623

К проверке предпосылок МНК №№ 4-5: критерий Дарбина-Уотсона, 1-й коэффициент автокорреляции и R/S-критерий

y x е e^2 (ei-ei-1)^2

ei*ei-1 121 72

3,986047

15,88857 - - 84

52 -4,93422 24,34652

79,57114 -19,668

119 73

0,58206 0,338794

30,42933 -2,87201

117 74 -2,82193

7,963271

11,58713 -1,64253

129 76 6,3701 40,57817

84,49335 -17,976

128 79

1,15814 1,341287

27,16453 7,377464

102 54 10,25781

105,2226

82,80395 11,87997

111 68 -0,39801

0,158409 113,5464

-4,08268

112 73 -6,41794

41,18996 36,2396

2,554383 98 64

-7,78206

60,56045 1,860822

49,94479 сумма

5,68E-14 297,588

467,6962

25,51541 Верхние (d2=1,36) и нижние (d1=1,08) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели.

Если 0<d<d1, то уровни автокоррелированы, то есть зависимы, модель неадекватна.

Если d1<d<d2, то критерий Дарбина-Уотсона не дает ответа на вопрос о независимости уровней ряда остатков. В таком случае необходимо воспользоваться другими критериями (например, проверить независимость уровней по первому коэффициенту автокорреляции).

Если d2<d<2 , то уровни ряда остатков являются независимыми.

В нашем случае 1,36<1,57<2 уровни ряда остатков являются независимыми.

Проверка нормальности распределения остаточной компоненты по R/S-критерию с критическими уровнями (2,67; 3,685);

Рассчитаем значение RS: RS = (Emax - Emin)/ S,

где Emin - максимальное значение уровней ряда остатков E(t);

Emax - минимальное значение уровней ряда остатков E(t)

S - среднее квадратическое отклонение.

Emax=

10,257 Emin= - 12,2407

Emax-Emin= 22, 4985

S= 5,750 RS= 3,912

Так как 2,67<3,912>3,685, полученное значение RS выходит за границы заданного интервала. Значит, уровни ряда остатков не подчиняются нормальному распределению.

Таким образом, предпосылки МНК не выполняются.

4. Осуществим проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t-статистики) для соответствующих коэффициентов регрессии:

= 1,037473 < 2,306004

= =6,314711 >2,306004

Затем расчетные значения сравниваются с табличными tтабл= 2,306004. Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости ? (0,05)

Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым.

В нашем случае коэффициент a регрессии незначим, коэффициент b регрессии значим .

5. Вычислим коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

Определим линейный коэффициент парной корреляции по формуле

==0,912634

Рассчитаем коэффициент детерминации:

0,83 Вариация результата Y (объема выпуска продукции) на 83 % объясняется вариацией фактора X (объемом капиталовложений). Качество модели в целом высокое.

Определим среднюю относительную ошибку:

4,2 В среднем расчетные значения у для линейной модели отличаются от фактических значений на 4,2%

Точность модели высокая.

6. Осуществим прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80 % от его максимального значения.

Прогнозное значение показателя, если прогнозное значение фактора составит 80 % от его максимального значения =0,8 * 79 = 63,2 составит

= 15,92691 + 1,403987 * 63,2 = 104,6589

Интервальный прогноз:

= 6,099058 для 10 - 2 =8 степеней свободы и уровня значимости 0,1 равно 1,859.

Тогда

7. Представим графически: фактические и модельные значения точки прогноза.

Таблица 1.1.

n y x

1 121

72 8712 5184

8,9

79,21 3,5

12,25 117,01

3,99 15,89 -

3,29

31,15 2 84

52 4368 2704

-28,1

789,61

-16,5 272,25

88,93 -4,93

24,35 ? 5,87

463,65

3 119 73

8687 5329 6,9

47,61 4,5

20,25

118,42 0,58

0,34 0.49

31,05 4 117

74

8658 5476 4,9

24,01 5,5

30,25 119,82

-2,82

7,96 2.41

26,95 5 129

76 9804 5776

16,9

285,61 7,5

56,25 122,63

6,37 40,58 4.94

126,75

6 128 79

10112 6241 15,9

252,81 10,5

110,25

126,84 1,16

1,34 0.90

166,95 7 102

54

5508 2916

-10,1 102,01

-14,5 210,25

91,74

10,26 105,22

10.06 146,45

8 111 68

7548

4624 -1,1

1,21 -0,5 0,25

111,40 -0,40

0,16

0.36 0,55

9 112 73 8176

5329 -0,1

0,01

4,5 20,25

118,42 -6,42

41,19 5.73 -0,45

10

98 64 6272

4096 -14,1

198,81 -4,5

20,25

105,78 -7,78

60,56 7.94

63,45 итого

1121

685 77845

47675 5,68*10

1780,9 0 752,5

5,68*10

297,59 42

1056,5 ср. знач

112,1 68,5 7784,5

4767,5

4,20

диспер

? ?

37,1985

8. Составим уравнения нелинейной регрессии:

* гиперболической;

* степенной;

* показательной.

Приведем графики построенных уравнений регрессии.

9. Для указанных моделей найдем коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравним модели по этим характеристикам и сделаем вывод.

Построение степенной модели парной регрессии

Уравнение степенной модели имеет вид:.

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg = lg a + b lg x.

Факт Y(t)

lg(Y) Переменная X(t)

lg(X)

1 121 2,082785

72 1,857332

2 84 1,924279

52

1,716003 3 119

2,075547 73

1,863323 4 117

2,068186

74 1,869232

5 129 2,11059

76 1,880814

6 128

2,10721 79

1,897627 7 102

2,0086 54

1,732394

8 111 2,045323

68 1,832509

9 112 2,049218

73

1,863323 10

98 1,991226

64 1,80618 итого

1121

20,46296 685

18,31874 сред знач

112,1 2,046296

68,5

1,831874 Обозначим . Тогда уравнение примет вид: Y=А + b X - линейное уравнение регрессии.

Рассчитаем его параметры, используя данные таблицы 1.2.

0,841304 2,046296-0,841304* 1,831874

0,505134

Уравнение регрессии будет иметь вид : Y=0,505134+0,841304X.

Перейдем к исходным переменным ли у, выполнив потенцирование данного уравнения.

Получим уравнение степенной модели регрессии:

. Определим индекс корреляции:

Связь между показателем у и фактором х достаточно сильная.

Коэффициент детерминации равен 0,83

Вариация результата Y (объема выпуска продукции) на 83,% объясняется вариацией фактора X (объемом капиталовложений).

Средняя относительная ошибка 4,25 %

Точность модели высокая, тк. 4,2 > 5

В среднем расчетные значения для степенной модели отличаются от фактических значений на 4,25 .

Таблица 1.2.

y

Y x X YX X2

Ei |Ei/y|*100% Ei2

1 121 2,082785

72

1,857332 3,868425

3,449684 116,8732

4,126768 3,410552

17,03021

2 84 1,924279

52 1,716003

3,30207 2,944667

88,8821

-4,8821 5,812024

23,8349 3 119

2,075547 73

1,863323

3,867414 3,471972

118,2374 0,762628

0,640864 0,581601

4 117

2,068186 74

1,869232 3,865919

3,494027 119,5986

119,5986

2,220983 6,752464

5 129 2,11059

76 1,880814

3,969626

3,53746 122,3122

6,687797 5,184339

44,72663 6 128

2,10721

79 1,897627

3,998699 3,600989

126,3616 1,63842

1,280015

2,68442 7 102

2,0086 54

1,732394 3,479686

3,001188

91,74948 10,25052

10,04953 105,0731

8 111 2,045323

68

1,832509 3,748073

3,358089 111,3861

-0,38607 0,347811

0,14905

9 112 2,049218

73 1,863323

3,818355 3,471972

118,2374

-6,23737 5,569083

38,90481 10

98 1,991226

64

1,80618 3,596513

3,262286 105,8474

-7,84741 8,007564

61,58188

Итого 1121

20,46296 685

685 37,51478

33,59233

1,514624 42,52276

301,3191 Сред знач

112,1 2,046296

68,5

1,831874 3,751478

3,359233

4,252276

Построение показательной функции

Уравнение показательной кривой: у =abx . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:

lg = lg a + х lg b. Обозначим: Y = lg , В = lg b, A = lg a. Получим линейное уравнение регрессии:

Y = А + В х. Рассчитаем его параметры, используя данные таблицы 1.3

0,005745

2,046296-(0,005745

1,652788 Уравнение будет иметь вид: Y=1,652788+0,005745*X Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:

y =10(10?)x ?*?x

Определим индекс корреляции:

0,91733 Связь между показателем у и фактором x: сильная.

Коэффициент детерминации: R2 = 0,84

Вариация результата Y (объема выпуска продукции) на 84% объясняется вариацией фактора X(объемом капиталовложений). Качество модели в целом высокое.

Средняя относительная ошибка

4.090042 Точная модель.

В среднем расчетные значения для показательной модели отличаются от фактических значений на 4,09%.

таблица 1.3

t y

Y x Yx x2

Ei |Ei/y|*100%

1 121 2,082785

72

149,9605 5184

0,036485 0,00132678

3,5 12,25 116,5206

20.65

4,479396 3,70198

2 84 1,924279

52 100,0625

2704

-0,122027 0,0148906

-16,5 272,25

89,43544 29.544

-5,43544

6,470766 3 119

2,075547 73

151,5149 5329

-0,09278

0,008608 4,5 20,25

118,0721 0.860

0,927875 0,779727

4 117

2,068186 74

153,0458 5476

0,0221886 0,000492

5,5

30,25 119,6443

6.992 -2,64431

2,26009 5 129

2,11059

76 160,4048

5776 0,06429

0.004133 7,5 56,25

122,8517

45.539 6,148252

4,766087 6 128

2,10721 79

166,4696

6241 0,06091

0,00371 10,5 110,25

127,8249 0.0306

0,175148

0,136834 7 102

2,0086 54

108,4644 2916

-0,0377

0.00142 -14,5

210,25 91,83304

103.367 10,16696

9,967606

8 111 2,045323

68 108,4644

4624 -0,000977

0,0000009

-0,5 0,25 110,5157

0.235 0,484266

0,436275 9 112

2,049218

73 149,5929

5329 0,002918

0,000008 4,5 20,25

118,0721

36.870 -6,07213

5,42154 10 98

1,991226 64

127,4385

4096 -0,055074

0,003033 -4,5

20,25 104,8203

198.81

-6,82033 6,959515

Итого 1121

20,46296 685

1406,036

47675 -0,12177

0,032069 0 752,5

1119,59 1.988

1,409696

40,90042 Сред

знач 112,1000

2,0463 68,5000 140,6036

4767,5000

4,0900

Построение гиперболической функции

Уравнение гиперболической функции: у = а + b/х . Произведем линеаризацию модели путем замены Х= 1/х. В результате получим линейное уравнение у = а + b X. Рассчитаем его параметры

-5558

112,10+(5558*0,0149)=

194,74

Получим следующее уравнение гиперболической модели: 194,745558/x

Определим индекс корреляции:

=0,8961 Связь между показателем у и фактором х сильная.

Коэффициент детерминации равен 0,80

Вариация результата Y (объема выпуска продукции) на 80 % объясняется вариацией фактора X (объемом капиталовложений). Качество модели высокое.

4,64%

таблицы 1.4.

t y x X yX X2

Ei Еi2

|Ei/y|*100%

1 121,00 72,00

0,0139 1,68

0,000193 0,00132678

0,00132678

116,5206 3,45

11,9025 79,21

2,85 2 84,00

52,00

0,0192 1,62

0,000370 0,0148906

0,0148906 89,43544

-3,86

14,8996 789,61

4,60 3 119,00

73,00 0,0137

1,63

0,000188 0,008608

0,008608 118,0721

0,39 0,1521 47,61

0,33

4 117,00 74,00

0,0135 1,58

0,000183 0,000492

0,000492

119,6443 -2,64

6,9696 24,01 2,25

5 129,00 76,00

0,0132

1,70 0,000173

0.004133 0.004133

122,8517 7,39

54,6121

285,61 5,73

6 128,00 79,00

0,0127 1,62

0,000160

0,00371 0,00371

127,8249 3,61

13,0321 252,81

2,82

7 102,00 54,00

0,0185 1,89

0,000343 0.00142

0.00142

91,83304 10,18

103,6324 102,01

9,98 8 111,00

68,00

0,0147 1,63

0,000216 0,0000009

0,0000009 110,5157

-2,01

4,0401 1,21 1,81

9 112,00 73,00

0,0137 1,53

0,000188

0,000008 0,000008

118,0721 -6,61

43,6921 0,01

5,90

10 98,00 64,00

0,0156 1,53

0,000244 0,003033

0,003033

104,8203 -9,90

98,01 198,81 10,10

Итого 1121,0

685,0

0,1487 16,41

0,002257 0,032069

0,032069 1119,59

0 0

1780,9 46,37

Сред знач

112,10 68,50

0,0149

1,64 0,000226

4,64

Для выбора лучшей модели построим сводную таблицу результатов.

Таблица 3.9

Параметры

Модель Коэффициент

детерминации R2

Средняя относительная ошибка Eотн

Линейная

0,8329 4,20

Степенная

0,830805

4,252276 Показательная

0,841494 4,090042

Гиперболическая

0,80

4,64 Все модели имеют примерно одинаковые характеристики, но большее значение коэффициента детерминации R2 и меньшее значение относительной ошибка Eотн имеет показательная модель. Ее можно взять в качестве лучшей для построения прогноза

Приведем данные по средней эластичности для различных моделей (для значений )

=0,857922

68,5*ln1,013315 = 0,906087

=0,841304

Там, где Э больше, то показательная модель .модель наиболее чувствительна к изменению фактора в середине диапазона значений. Т.о., результирующий признак у изменяется на 0,9 %при изменении x на 1%

7

Показать полностью…
Похожие документы в приложении