Всё для Учёбы — студенческий файлообменник
1 монета
docx

Контрольная «Составление матрицы парных коэффициентов корреляции исходных переменных» по Эконометрике (Горбатков С. А.)

Всероссийский заочный финансово-экономический институт

ОТЧЕТ

о результатах выполнения аудиторной работы

по дисциплине "Эконометрика"

Вариант 2

Выполнила: студентка 3 курса

специальности "Финансы и кредит"

дневная форма обучения

№ личного дела

Проверил: Горбатков С.А.

Уфа-2007

В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996г.).

Таблица 1 - Исходные данные

№ п/п Х1 Х2

Х3 Х4 Х5 Х6

Х7 Х8 У 1 1

1 39

20 8,2 0 1 0

15,9 2 3 1 68,4

40,5 10,7 0 1

0 27

3 1 1 34,8 16

10,7 0 1 12 13,5

4 1 1 39 20 8,5

0 1

12 15,1 5 2 1

54,7 28 10,7 0

1 12 21,1 6 3

1 74,7

46,3 10,7 0 1

12 28,7 7 3 1

71,7 45,9 10,7

0 0

0 27,2 8 3 1

74,5 47,5 10,4

0 0 0 28,3 9

4 1

137,7 87,2 14,6

0 1 0 52,3 10

1 1 40 17,7 11

1 1

8 22 11 2 1 53

31,1 10 1 1 8

28 12 3 1 86

48,7

14 1 1 8 45 13

4 1 98 65,8 13

1 1 8 51 14 2

1 62,6

21,4 11 1 1 0

34,4 15 1 1 45,3

20,6 10,4 1 1

8 24,7

16 2 1 56,4 29,7

9,4 1 1 8 30,8

17 1 1 37 17,8

8,3 0

1 0 15,9 18 3

1 67,5 43,5 8,3

0 1 0 29 19 1

1 37

17,8 8,3 0 1 3

15,4 20 3 1 69

42,4 8,3 0 1 3

28,6

21 1 1 40 20

8,3 0 0 0 15,6

22 3 1 69,1 41,3

8,3 0

1 0 27,7 23 2

1 38,1 35,4 13

1 1 20 34,1 24

2 1

75,3 41,4 12,1

1 1 20 37,7 25

3 1 83,7 48,5

12,1

1 1 20 41,9 26

1 1 48,7 22,3

12,4 1 1 20 24,4

27 1

1 39,9 18 8,1

1 0 0 21,3 28

2 1 68,6 35,5

17 1

1 12 36,7 29 1

1 39 20 9,2 1

0 0 21,5 30 2

1 48,6

31 8 1 0 0 26,4

31 3 1 98 56

22 1 0 0 53,9

32 2

1 68,5 30,7 8,3

1 1 6 34,2 33

2 1 71,1 36,2

13,3

1 1 6 35,6 34

3 1 68 41 8 1

1 12 34 35 1

1 38

19 7,4 1 1 12

19 36 2 1 93,2

49,5 14 1 1 12

46,6

37 3 1 117 55,2

25 1 1 12 58,5

38 1 2 42 21

10,2

1 0 12 24,2 39

2 2 62 35 11

1 0 12 35,7 40

3 2

89 52,3 11,5 1

1 12 51,2 41 4

2 132 89,6 11

1 1

12 75,9 42 1 2

40,8 19,2 10,1

1 1 6 21,2 43

2 2

59,2 31,9 11,2

1 1 6 30,8 44

3 2 65,4 38,9

9,3 1

1 6 34 45 2 2

60,2 36,3 10,9

1 1 12 31,9 46

3 2

82,2 49,7 13,8

1 1 12 43,6 47

3 2 98,4 52,3

15,3

1 1 12 52,2 48

3 3 76,7 44,7

8 1 1 0 43,1

49 1

3 38,7 20 10,2

1 1 6 25 50 2

3 56,4 32,7 10,1

1 1

6 35,2 51 3 3

76,7 44,7 8 1

1 6 40,8 52 1

3 38,7

20 10,2 1 0 0

18,2 53 1 3 41,5

20 10,2 1 1 0

20,1

54 2 3 48,8 28,5

8 1 0 0 22,7

55 2 3 57,4 33,5

10,1

1 1 0 27,6 56

3 3 76,7 44,7

8 1 1 0 36 57

1 4

37 17,5 8,3 0

1 7 17,8 58 2

4 54 30,5 8,3

0 1

7 25,9 59 3 4

68 42,5 8,3 0

1 7 32,6 60 1

4 40,5

16 11 0 1 3 19,8

61 2 4 61 31

11 0 1 3 29,9

62 3

4 80 45,6 11 0

1 3 39,2 63 1

3 52 21,2 11,2

1 1

18 22,4 64 2 3

78,1 40 11,6 1

1 18 35,2 65 3

3 91,6

53,8 16 1 0 18

41,2 66 1 4 39,9

19,3 8,4 0 1 6

17,8

67 2 4 56,2 31,4

11,1 0 1 6 25

68 3 4 79,1 42,4

15,5

0 1 6 35,2 69

4 4 91,6 55,2

9,4 0 1 6 40,8

Принятые в таблице обозначения:

Y - цена квартиры, тыс.долл.;

Х1 - число комнат в квартире;

Х2 - район города (1 - Приморский, Шувалово-Озерки, 2 - Гражданка, 3 - Юго-запад, 4 - Красносельский);

Х3 - общая площадь квартиры (м2);

Х4 - жилая площадь квартиры (м2);

Х5 - площадь кухни (м2);

Х6 - тип дома (1 - кирпичный, 0 - другой);

Х7 - наличие балкона (1 - есть, 0 - нет);

Х8 - число месяцев до окончания срока строительства.

Задание:

1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район).

2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.

3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны.

4) Постройте модель у = f(х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?

5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.

Решение:

1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных.

Х1 Z Х3 Х4

Х5 Х6 Х7 Х8

У 1

1 39 20 8,2 0

1 0 15,9 3 1

68,4 40,5 10,7

0 1

0 27 1 1 34,8

16 10,7 0 1 12

13,5 1 1 39 20

8,5 0

1 12 15,1 2 1

54,7 28 10,7 0

1 12 21,1 3 1

74,7

46,3 10,7 0 1

12 28,7 3 1 71,7

45,9 10,7 0 0

0 27,2

3 1 74,5 47,5

10,4 0 0 0 28,3

4 1 137,7 87,2

14,6

0 1 0 52,3 1

1 40 17,7 11 1

1 8 22 2 1 53

31,1

10 1 1 8 28 3

1 86 48,7 14 1

1 8 45 4 1 98

65,8

13 1 1 8 51 2

1 62,6 21,4 11

1 1 0 34,4 1

1 45,3

20,6 10,4 1 1

8 24,7 2 1 56,4

29,7 9,4 1 1 8

30,8

1 1 37 17,8 8,3

0 1 0 15,9 3

1 67,5 43,5 8,3

0 1

0 29 1 1 37 17,8

8,3 0 1 3 15,4

3 1 69 42,4 8,3

0 1

3 28,6 1 1 40

20 8,3 0 0 0

15,6 3 1 69,1

41,3

8,3 0 1 0 27,7

2 1 38,1 35,4

13 1 1 20 34,1

2 1

75,3 41,4 12,1

1 1 20 37,7 3

1 83,7 48,5 12,1

1 1

20 41,9 1 1 48,7

22,3 12,4 1 1

20 24,4 1 1 39,9

18 8,1

1 0 0 21,3 2

1 68,6 35,5 17

1 1 12 36,7 1

1 39

20 9,2 1 0 0

21,5 2 1 48,6

31 8 1 0 0 26,4

3 1

98 56 22 1 0

0 53,9 2 1 68,5

30,7 8,3 1 1 6

34,2

2 1 71,1 36,2

13,3 1 1 6 35,6

3 1 68 41 8 1

1 12

34 1 1 38 19

7,4 1 1 12 19

2 1 93,2 49,5

14 1

1 12 46,6 3 1

117 55,2 25 1

1 12 58,5 1 1

42 21

10,2 1 0 12 24,2

2 1 62 35 11

1 0 12 35,7 3

1 89

52,3 11,5 1 1

12 51,2 4 1 132

89,6 11 1 1 12

75,9

1 1 40,8 19,2

10,1 1 1 6 21,2

2 1 59,2 31,9

11,2

1 1 6 30,8 3

1 65,4 38,9 9,3

1 1 6 34 2 1

60,2

36,3 10,9 1 1

12 31,9 3 1 82,2

49,7 13,8 1 1

12 43,6

3 1 98,4 52,3

15,3 1 1 12 52,2

3 0 76,7 44,7

8 1

1 0 43,1 1 0

38,7 20 10,2 1

1 6 25 2 0 56,4

32,7

10,1 1 1 6 35,2

3 0 76,7 44,7

8 1 1 6 40,8

1 0

38,7 20 10,2 1

0 0 18,2 1 0

41,5 20 10,2 1

1 0

20,1 2 0 48,8

28,5 8 1 0 0

22,7 2 0 57,4

33,5

10,1 1 1 0 27,6

3 0 76,7 44,7

8 1 1 0 36 1

0 37

17,5 8,3 0 1 7

17,8 2 0 54 30,5

8,3 0 1 7 25,9

3 0

68 42,5 8,3 0

1 7 32,6 1 0

40,5 16 11 0 1

3 19,8

2 0 61 31 11

0 1 3 29,9 3

0 80 45,6 11 0

1 3

39,2 1 0 52 21,2

11,2 1 1 18 22,4

2 0 78,1 40 11,6

1 1

18 35,2 3 0 91,6

53,8 16 1 0 18

41,2 1 0 39,9

19,3

8,4 0 1 6 17,8

2 0 56,2 31,4

11,1 0 1 6 25

3 0

79,1 42,4 15,5

0 1 6 35,2 4

0 91,6 55,2 9,4

0 1

6 40,8

2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде "СтатЭксперт".

Протокол корреляционного анализа

Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых переменных, имеющих высокий уровень корреляции между собой.

Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой.

Влияние независимой переменной Х3, Х4, включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).

Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303).

Х1, Х2, Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005).

3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме.

Линейная регрессия

Уравнение будет иметь вид:

у(х) = -0,505 - 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 - 0,011х8

Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7.

Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.

Матрица парных корреляций

Явление сильной коллинеарности наблюдается между факторами:

Х1 и Х3, т.к. rх1х3 = 0,872 > 0,7

Х1 и Х4, т.к. rх1х4 = 0,917 > 0,7

Х3 и Х4, т.к. rх3х4 = 0,966 > 0,7

4) Построим модель у = f (х3, х6, х7, х8, z) в линейной форме.

Результаты регрессионного анализа

Модель в линейной форме будет иметь вид:

у(х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 - 0,037х8

Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели.

5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2.

Характеристика остатков линейной регрессии

Характеристика

Значение

Среднее значение

0,000 Дисперсия

10,579

Приведенная дисперсия

12,220 Средний модуль остатков

2,237 Относительная ошибка

7,144

Критерий Дарбина-Уотсона

1,154 Коэффициент детерминации

0,991 F - значение ( n1 = 8, n2 = 58)

764,697

Критерий адекватности

36,993 Критерий точности

47,492 Критерий качества

44,867

Уравнение значимо с вероятностью 0.95

Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании:

если Fфакт > Fкрит, то модель статистически значима;

если Fфакт < Fкрит, то модель статистически незначима.

Fфакт > Fкрит, значит модель статистически значима, т.е. пригодна к использованию.

Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии.

Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69-8-1 = 60 составляет 2,0003.

Если tрасч > tтабл, то коэффициент статистически значим.

Характеристика модели

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

-6,10491 1,867676003

-3,268720937 Переменная Х 1

-0,16426 1,096321271

-0,149825399

Переменная Х 2

0,744173 0,335026167

2,221237839 Переменная Х 3

0,36827

0,092869614 3,965447278

Переменная Х 4

0,147869 0,132602783

1,115126788

Переменная Х 5

0,177213 0,195399452

0,906925347 Переменная Х 6

6,93635

0,869661345 7,975921084

Переменная Х 7

1,777648 1,124095736

1,581402513

Переменная Х 8

-0,04802 0,072432334

-0,662966567

tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим;

6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003, значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры.

Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb2 = 2,2212 > 2,0003,

Показать полностью…
Похожие документы в приложении