Всё для Учёбы — студенческий файлообменник
1 монета
docx

Контрольная «Вычисление коэффициента детерминации» по Эконометрике (Горбатков С. А.)

Министерство образования и науки Российской Федерации

Федеральное агентство по образованию ГОУ ВПО

Всероссийский заочный финансово-экономический институт

Контрольная работа по предмету

"Эконометрика"

Вариант 9

Преподаватель Прокофьев О.В. Работа выполнена

Факультет финансово-кредитный

3 курс

№ личного дела

группа № 1

Пенза 2009 г.

Задача По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.)

Требуется:

1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.

2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.

3. Проверить выполнение предпосылок МНК.

4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

6. Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.

7. Представить графически: фактические и модельные значения точки прогноза.

8. Составить уравнения нелинейной регрессии:

* гиперболической;

* степенной;

* показательной.

Привести графики построенных уравнений регрессии.

9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.

12 4 18 27

26 29 1 13 26

5 21

10 26 33 34 37

9 21 32 14 1. Найдем параметры уравнения линейной регрессии, дадим экономическую интерпретацию коэффициента регрессии.

Уравнение линейной регрессии имеет вид:

Значения параметров а и b линейной модели определим, используя данные таблицы 1.1.

0,967688

23,7-0,967688?16,1=8,12023

Уравнение линейной регрессии имеет вид: =8,12023+0,967688*x.

С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции увеличиться в среднем на 0,9677 млн. руб. Это свидетельствует об эффективности работы предприятия.

2. Вычислим остатки; найдем остаточную сумму квадратов; оценим дисперсию остатков ; построим график остатков.

Остатки см табл 1.1 столбец

Остаточная сумма квадратов =11,34662

Дисперсия остатков 1,418327

График остатков

3. Проверим выполнение предпосылок МНК.

Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.

* случайный характер остатков

* нулевая средняя величина остатков, не зависящая от от xi

* гомоскедастичность - дисперсия каждого отклонения ei одинакова для всех значений x

* отсутствие автокорреляции остатков

* остатки подчиняются нормальному распределению

* случайный характер остатков

с этой целью строится график зависимости остатков ei от теоретических значений результативного признака

Та как на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения y.

* нулевая средняя величина остатков, не зависящая от от xi

с этой целью строится график зависимости остатков ei от факторов, включенных в регрессию xi.

Остатки на графике расположены в виде горизонтальной полосы, предполагается, что они не зависимы от xi.

Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей нулевой гипотезы H0: . С этой целью строится t-статистика , где .

t= 2,2622 (? = 0,05; ?=n-1=9) гипотеза принимается.

t-статистика

0 t крит 0,05

2,2622 t

1 1,267519

1,606605 2 -1,99098

3,964002 3 0,461394

0,212884 4 -1,24779

1,556991

5 0,719893 0,518246

6 0,81683 0,667212

7 -0,08792 0,007729

8 0,299831

0,089899 9 -1,28011

1,638674 10 1,041332

1,084373 Сумма

0 11,34662

Среднее

0 * гомоскедастичность - дисперсия каждого отклонения ei одинакова для всех значений x

Коэфф. Спирмена где

Связь слабая и незначимая между величинами остатков е и х.

t-статистика =0,249526 это меньше t Крит, следовательно гипотеза об отсутствии гетероскедастичности при пятипроцентном уровне значимости принимается

К проверке предпосылки МНК №3 по тесту Спирмена

r(x) r() r(x)-r()

(r(x)-r())^2 4 8

-4 16 2 10 -8

64 6

3 3 9 9 7 2

4 7,5 4 3,5 12,25

10 5 5 25 1 1

0 0

5 2 3 9 7,5 9

-1,5 2,25 3 6

-3 9 Сумма

150,5

Коэфф. Спирмена

0,08788 t-статистика

0,249526 t крит 0,05

2,2622

Так как (0,08788)<0,5 и t-крит.(2,2622) > t-стат.(0,2495), то связи между остатками и х нет, следовательно, предположение о гомоскедостичности не отвергается, предпосылка выполняется.

Независимость остатков проверяется с помощью критерия Дарбина - Уотсона.

dw=32,28867/11,34662=2,8456

dw'= 4-2,8456=1,1544

В нашем случаи d1<d<d2, то критерий Дарбина-Уотсона не дает ответа на вопрос о независимости уровней ряда остатков. В таком случае необходимо воспользоваться другими критериями (например, проверить независимость уровней по первому коэффициенту автокорреляции).

Так как |r(1)|(|-0,5414|)<rтабл.(0,576), остатки зависимы, предпосылка не выполняется.

Верхние (d1=0,88) и нижние (d2=1,32) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели.

Если 0<d<d1, то уровни автокоррелированы, то есть зависимы, модель неадекватна.

Если d1<d<d2, то критерий Дарбина-Уотсона не дает ответа на вопрос о независимости уровней ряда остатков. В таком случае необходимо воспользоваться другими критериями (например, проверить независимость уровней по первому коэффициенту автокорреляции).

Если d2<d<2 , то уровни ряда остатков являются независимыми.

Проверка нормальности распределения остаточной компоненты по R/S-критерию с критическими уровнями 2,67-3,57;

Рассчитаем значение RS: RS = (Emax - Emin)/ S,

где Emin - максимальное значение уровней ряда остатков E(t);

Emax - минимальное значение уровней ряда остатков E(t)

S - среднее квадратическое отклонение.

Emax=

1,2676 Emin= -1,9908

Emax-Emin= 3,2584

S= 1,190935 RS=

2,736084

Так как 2,670<2,736, 2,736<3,685, полученное значение RS попало в заданный интервал. Значит, уровни ряда остатков подчиняются нормальному распределению.

Таким образом, предпосылки МНК выполняются.

4. Осуществим проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t-статистики) для соответствующих коэффициентов регрессии:

== 11,412 > 2,306

= = 25,808 > 2,306

Затем расчетные значения сравниваются с табличными tтабл= 2,3060. Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости ? (0,05)

Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым.

В нашем случае коэффициенты a и b регрессии значимы.

5. Вычислим коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

Определим линейный коэффициент парной корреляции по формуле

== 0,994

Рассчитаем коэффициент детерминации:

0,9881 Вариация результата Y (объема выпуска продукции) на 98,81% объясняется вариацией фактора X (объемом капиталовложений).

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

666,104

F>Fтабл.=5,32 для ?=0,05; k1=m=1; k2=n-m-1=8

Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т. к. F > Fтабл.

Определим среднюю относительную ошибку:

4,967%

В среднем расчетные значения у для линейной модели отличаются от фактических значений на 4,967%.

Рассчитаем коэффициент эластичности для линейной функции по формуле: =

По расчетам можно сделать вывод о том, что качество модели высокое. Коэффициент детерминации, показывающий долю вариации результативного признака, находящийся под воздействием изучаемых факторов, чем ближе к 1, тем выше качество модели. = 0,9881, что свидетельствует о высоком качестве. Коэффициент корреляции R отражает тесноту связи и точность модели, т.к. R=0,994, то точность модели высокая. Высокое качество модели можно определить с помощью относительной ошибки аппроксимации =4,967%, т.к. 4,967 < 7 %, следовательно качество модели высокое.

6. Осуществим прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.

Прогнозное значение показателя, если прогнозное значение фактора составит 80% от его максимального значения =29*0,8=23,2 составит

=8,12023+0,9676*23,2=30,5706

Интервальный прогноз:

=1,1909 для 10 - 2 =8 степеней свободы и уровня значимости 0,1 равно 1,8595.

Тогда

7. Представим графически: фактические и модельные значения точки прогноза.

Таблица 1.1.

n y x

1

21 12 252 144

-2,7

7,29 -4,1 16,81

19,73248 1,267519

1,606605 - - 6,0358051

11,07

2 10 4 40 16

-13,7 187,69 -12,1

146,41 11,99098

-1,99098

3,964002 10,61782

-2,52361 19,909803

165,77 3 26 18

468 324

2,3 5,29 1,9 3,61

25,53861 0,461394

0,212884 6,014138

-0,91863

1,7745908 4,37 4

33 27 891 729

9,3 86,49 10,9

118,81

34,24779 -1,24779

1,556991 2,921324

-0,57572 3,7811958

101,37

5 34 26 884 676

10,3 106,09 9,9

98,01 33,28011 0,719893

0,518246

3,871794 -0,89828

2,1173322 101,97

6 37 29 1073 841

13,3

176,89 12,9 166,41

36,18317 0,81683

0,667212 0,009397

0,58803

2,2076492 171,57

7 9 1 9 1 -14,7

216,09 -15,1 228,01

9,087918

-0,08792 0,007729

0,818568 -0,07181

0,9768615 221,97

8 21

13 273 169 -2,7

7,29 -3,1 9,61

20,70017 0,299831

0,089899

0,150349 -0,02636

1,427769 8,37 9

32 26 832 676

8,3 68,89

9,9 98,01 33,28011

-1,28011 1,638674

2,496206 -0,38382

4,0003345

82,17 10 14 5

70 25 -9,7 94,09

-11,1 123,21 12,95867

1,041332

1,084373 5,38908

-1,33302 7,4380867

107,67 итого

237 161

4792 3601 0 956,1

0 1008,9 0 11,34662

32,28867 -6,14321

49,669428

976,3 ср. знач

23,7 16,1 479,2

360,1

3,587631

4,9669428 диспер

1,418327

8. Составим уравнения нелинейной регрессии:

* гиперболической;

* степенной;

* показательной.

Приведем графики построенных уравнений регрессии.

9. Для указанных моделей найдем коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравним модели по этим характеристикам и сделаем вывод.

Построение степенной модели парной регрессии

Уравнение степенной модели имеет вид:.

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg = lg a + b lg x.

Факт Y(t)

lg(Y)

Переменная X(t)

lg(X) 1 21 1,322

12 1,079 2 10

1 4

0,602 3 26 1,419

18 1,255 4 33

1,519 27 1,431

5 34

1,531 26 1,415

6 37 1,568 29

1,462 7 9 0,954

1 0

8 21 1,322 13

1,114 9 32 1,505

26 1,415 10 14

1,146

5 0,699 итого

237 13,283 161

10,473 сред знач

23,7

1,328 16,1 1,047

Обозначим . Тогда уравнение примет вид: Y=А + b X - линейное уравнение регрессии.

Рассчитаем его параметры, используя данные таблицы 1.2.

0,453058

1,3283-0,453058 0,853819

Уравнение регрессии будет иметь вид : Y=0,853819+0,453058X.

Перейдем к исходным переменным ли у, выполнив потенцирование данного уравнения.

Получим уравнение степенной модели регрессии:

. Определим индекс корреляции: 0,9751

Связь между показателем у и фактором х достаточно сильная.

Коэффициент детерминации равен 0,9508

Вариация результата Y (объема выпуска продукции) на 95,08% объясняется вариацией фактора X (объемом капиталовложений).

Рассчитаем F-критерий Фишера: 154,6016

F>F табл =5,32 Уравнение регрессии с вероятностью 0,95 в целом статистически значимое .

Средняя относительная ошибка 10,09%

В среднем расчетные значения для степенной модели отличаются от фактических значений на 10,09%.

Рассчитаем коэффициент эластичности. Для степенной функции он рассчитывается по формуле =0,453058%. С увеличением объема выпуска продукции на 1% объем капиталовложений увеличится на 0,45%.

Таблица 1.2.

y Y x X YX

X2 Ei |Ei/y|*100%

Ei2 1 21 1,322

12 1,079

1,426914 1,164632

2,632069 -1,01662

4,841 1,033512 2

10 1

4 0,602 0,60206

0,362476 1,600051

-3,38404 33,84 11,45172

3 26

1,419 18 1,255

1,776177 1,575709

3,162836 -0,45636

1,755

0,208264 4 33 1,519

27 1,431 2,173546

2,048802 3,800636

1,208606

3,6624 1,460728

5 34 1,531 26

1,415 2,167002 2,00215

3,736203

2,747571 8,0811

7,549149 6 37 1,568

29 1,462 2,293335

2,138608

3,925695 4,162516

11,25 17,32654 7

9 0,954 1 0 0

0 0,853819

1,858009 20,6445

3,452196 8 21 1,322

13 1,114 1,472877

1,24087

2,72927 -1,82968

8,713 3,347732 9

32 1,505 26 1,415

2,129747

2,00215 3,736203

0,747571 2,3362

0,558863 10 14

1,146

5 0,699 0,801109

0,488559 1,770271

-0,80788 5,771 0,652677

Итого

237 13,283 161

10,473 14,84277

13,02396 3,229692

100,8942

47,04138 Сред знач

23,7 1,328 16,1

1,047 1,484277 1,302396

10,08942

Построение показательной функции

Уравнение показательной кривой: у =abx . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:

lg = lg a + х lg b. Обозначим: Y = lg , В = lg b, A = lg a. Получим линейное уравнение регрессии:

Y = А + В х. Рассчитаем его параметры, используя данные таблицы 1.3

0,020598

1,328-0,020598 0,99668

Уравнение будет иметь вид: Y=0,99668+0,020598X Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:

y =100,99668(100,020598)x

9,92385*1,048572x

Определим индекс корреляции:

0,97304 Связь между показателем у и фактором x: сильная.

Коэффициент детерминации: R2 = 0,9468.

Вариация результата Y (объема выпуска продукции) на 94,68% объясняется вариацией фактора X(объемом капиталовложений).

Рассчитаем F-критерий Фишера:

142,376 F >F табл=5,32 . Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, .

Средняя относительная ошибка

10,60234 В среднем расчетные значения для показательной модели отличаются от фактических значений на

10,6 ?%.

Рассчитаем коэффициент эластичности. Для показательной функции он рассчитывается по формуле =0,764.

таблица 1.3

t y Y x Yx x2

Ei

|Ei/y|*100% 1 21

1,322219 12 15,86663

144 -0,006093 0,000037

-4,1

16,81 17,53314 12,01912

3,46686 16,5089

2 10 1 4 4 16

-0,328312

0,107789 -12,1 146,41

11,99702 3,988087

-1,99702 19,97 3

26 1,414973

18 25,46952 324

0,086660 0,007510

1,9 3,61 23,30502

7,262923

2,694981 10,3653

4 33 1,518514 27

40,99988 729 0,190201

0,036176

10,9 118,81 35,71364

7,363833 -2,71364

8,223 5 34 1,531479

26 39,81845

676 0,203166 0,041276

9,9 98,01 34,05931

0,003517 -0,05931

0,174

6 37 1,568202 29

45,47785 841 0,239889

0,057546 12,9 166,41

39,26727

5,140502 -2,26727

6,128 7 9 0,954243

1 0,954243 1 -0,374070

0,139928

-15,1 228,01 10,40587

1,976476 -1,40587

15,621 8 21 1,322219

13 17,18885

169 -0,006093 0,000037

-3,1 9,61 18,38476

6,839473 2,615239

12,4535

9 32 1,50515 26

39,1339 676 0,176837

0,031271 9,9 98,01

34,05931

4,240744 -2,05931

6,435 10 14 1,146128

5 5,73064 25 -0,182184

0,033191

-11,1 123,21 12,57974

2,017139 1,42026

10,1447 Итого

237 13,28313

161 234,64 3601

0 0,454764 0 1008,9

237,3051 50,85181

-0,30507

106,0234 Сред

знач 23,7 1,328313

16,1 23,464 360,1

10,60234

Построение гиперболической функции

Уравнение гиперболической функции: у = а + b/х . Произведем линеаризацию модели путем замены Х= 1/х. В результате получим линейное уравнение у = а + b X. Рассчитаем его параметры

-23,718 23,7+23,718

28,003

Получим следующее уравнение гиперболической модели: 28,003-23,718/x

Определим индекс корреляции:

=0,68385 Связь между показателем у и фактором х сильная.

Коэффициент детерминации равен 0,46765

Вариация результата Y (объема выпуска продукции) на 46,77% объясняется вариацией фактора X (объемом капиталовложений).

Рассчитаем F-критерий Фишера:

=7,0277 Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F>F табл.=5,32

Средняя относительная ошибка

37,04877% В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 37,04877%.

Рассчитаем коэффициент эластичности. Для гиперболической функции он рассчитывается по формуле

таблицы 1.4.

t y

x X yX X2

Ei |Ei/y|*100%

1 21 12 0,083333

1,75

0,006944 -2,7 7,29

26,02655 -5,02655

25,26624 23,936

2 10

4 0,25 2,5 0,0625

-13,7 187,69 22,07355

-12,0735 145,7705

120,735

3 26 18 0,055556

1,444444 0,003086

2,3 5,29 26,68539

-0,68539

0,469757 2,636 4

33 27 0,037037

1,222222 0,001372

9,3 86,49

27,12461 5,875389

34,52019 17,8042

5 34 26 0,038462

1,307692

0,001479 10,3 106,09

27,09083 6,909175

47,7367 20,3211

6 37

29 0,034483 1,275862

0,001189 13,3 176,89

27,18519 9,814806

96,33042

26,5265 7 9 1

1 9 1 -14,7 216,09

4,285014 4,714986

22,23109

52,3887 8 21 13

0,076923 1,615385

0,005917 -2,7 7,29

26,17859

-5,17859 26,81782

24,66 9 32 26

0,038462 1,230769

0,001479

8,3 68,89 27,09083

4,909175 24,1 15,3412

10 14 5 0,2 2,8

0,04

-9,7 94,09 23,25945

-9,25945 85,73739

66,139 Итого

237 161

1,814255 24,14637

1,123967 0 956,1

237 0 508,9801

370,4877

Сред знач

23,7 16,1 0,181425

2,414637 0,112397

37,04877

Для выбора лучшей модели построим сводную таблицу результатов.

Таблица 3.9

Параметры

Модель

Коэффициент

детерминации R2

F-критерий Фишера

Индекс корреляции

Средняя относительная ошибка Eотн

Эластичность

Линейная

0,9881

666,104 0,994 4,967

0,6573 Степенная

0,9508 154,6016

0,975

10,09 0,453 Показательная

0,9468 142,376 0,973

10,6 0,764 Гиперболическая

0,4676

7,0277 0,684 37,04877

0,0555 Все модели имеют примерно одинаковые характеристики, но большее значение коэффициента детерминации R2 и меньшее значение относительной ошибка Eотн имеет линейная модель. Ее можно взять в качестве лучшей для построения прогноза.

6

Показать полностью…
Похожие документы в приложении