Всё для Учёбы — студенческий файлообменник
1 монета
docx

Лабораторная «Решение с помощью компьютерных программ типовых задач парной регрессии и корреляции» по Эконометрике (Горбатков С. А.)

Министерство образования и науки Российской Федерации Федеральное агентство по образованию ГОУ ВПО Всероссийский заочный финансово-экономический институт

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2

По дисциплине "Эконометрика"

Решение с помощью компьютерных программ типовых задач парной регрессии и корреляции

Преподаватель Сысолятина Ирина Владимировна

Работа выполнена Лашиной Юлией Сергеевной

Финансово-кредитный факультет

№ личного дела: 06ФФБ02085

Группа периферия III курс

Киров - 2009

Применение ППП Excel.

Задача: по 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс.руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 (%).

Требуется:

1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.

Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента анализа данных Описательная статистика Порядок вычисления следующий:

1) откройте электронную таблицу Excel;

2) введите исходные данные:

y x1 x2 1 7,0

3,9 10,0 2 7,0

3,9 14,0

3 7,0 3,7 15,0

4 7,0 4,0 16,0

5 7,0 3,8 17,0

6 7,0

4,8 19,0 7 8,0

5,4 19,0 8 8,0

4,4 20,0 9 8,0

5,3 20,0

10 10,0 6,8 20,0

11 9,0 6,0 21,0

12 11,0 6,4 22,0

13 9,0

6,8 22,0 14 11,0

7,2 25,0 15 12,0

8,0 28,0 16 12,0

8,2 29,0

17 12,0 8,1 30,0

18 12,0 8,5 31,0

19 14,0 9,6 32,0

20 14,0

9,0 36,0 3) в главном меню выберите Сервис/Анализ данных/Описательная статистика; щелкните по кнопке ОК;

4) заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал - диапазон, содержащий анализируемые данные, это может быть одна или несколько строк (столбцов). Введите $B$1:$D$21;

Группирование - по столбцам или по строкам - необходимо указать дополнительно. Поставьте флажок по столбцам;

Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет. Поставьте флажок;

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона. Введите $F$1;

Новый рабочий лист - можно задать произвольное имя нового рабочего листа.

Если необходимо получить дополнительную информацию Итоговой статистики, Уровня надежности, k-го наибольшего и наименьшего значений, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

Описательная статистика будет выводиться в следующем порядке:

y

x1 x2

Среднее

9,6 Среднее

6,19

Среднее 22,3

Стандартная ошибка

0,54964 Стандартная ошибка

0,43352

Стандартная ошибка

1,52367 Медиана

9 Медиана

6,2 Медиана

20,5 Мода 7

Мода 3,9 Мода

20 Стандартное отклонение

2,45807

Стандартное отклонение

1,93877 Стандартное отклонение

6,81407 Дисперсия выборки

6,04211

Дисперсия выборки

3,75884 Дисперсия выборки

46,4316 Эксцесс

-1,19605

Эксцесс -1,33143

Эксцесс -0,53653

Асимметричность

0,4451

Асимметричность

0,1881 Асимметричность

0,3278 Интервал

7 Интервал

5,9 Интервал

26 Минимум

7 Минимум

3,7 Минимум

10 Максимум

14 Максимум

9,6 Максимум

36 Сумма

192 Сумма 123,8

Сумма 446 Счет

20 Счет 20

Счет

20 Сравнивая значения средних квадратических отклонений и средних величин и определяя коэффициенты вариации:

приходим к выводу о повышенном уровне варьирования признаков, хотя и в допустимых пределах, не превышающих 35%. Совокупность предприятий однородна, и для ее изучения может использоваться метод наименьших квадратов.

2. Проанализировать линейные коэффициенты парной и частной корреляции.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

1) в главном меню выберите Сервис/Анализ данных/Корреляция; щелкните по кнопке ОК;

2) заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал - введите $B$1:$D$21;

Группирование - поставьте флажок по столбцам;

Метки - поставьте флажок;

Выходной интервал - введите $F$17;

Щелкните по кнопке ОК.

Результаты вычислений - матрица коэффициентов парной корреляции:

y x1 x2 y

1,000 x1 0,970

1,000

x2 0,941 0,943

1,000 Линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии.

К сожалению, в ППП Excel нет специального инструмента для расчета линейных коэффициентов частной корреляции. Используя математические функции Excel и значения парных коэффициентов корреляции, рассчитайте частные коэффициенты корреляции:

Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки продукции y как с коэффициентом обновления основных фондов - x1, так и с долей рабочих высокой квалификации - x2 (ryx1=0,970 и ryx2=0,941). Но в то же время межфакторная связь rx1x2=0,943 весьма тесная и превышает тесноту связи x2 с y. В связи с этим для улучшения данной модели можно исключить из нее фактор x2 как малоинформативный, недостаточно статистически надежный.

Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленными в модели. Наиболее тесно связаны y и x1: ryx1. x2=0,734,связь y и x2 гораздо слабее: ryx2. x1=0,325, а межфакторная зависимость x1 и x2 выше, чем парная y и x2: ryx2. x1=0,325< rx1x2. y=0,368. Все это приводит к выводу о необходимости исключить фактор x2 - доля высококвалифицированных рабочих - из правой части уравнения множественной регрессии.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи:

ryx1=0,970, ryx1. x2=0,734; ryx2=0,941, ryx2. x1=0,325.

Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которой теснота парной зависимости меньше, чем теснота межфакторной связи.

3. Написать уравнение множественной регрессии, оценить его параметров, пояснить их экономический смысл.

Вычисление параметров линейного уравнения множественной регрессии проводится с помощью инструмента анализа данных Регрессия. Порядок действий следующий:

1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа;

2) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК.

3) заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал Y - диапазон, содержащий данные результативного признака. Введите $B$1:$B$21;

Входной интервал X - диапазон, содержащий данные факторов независимого признака. Введите $C$1:$D$21;

Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет. Поставьте флажок;

Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист - можно задать произвольное имя нового рабочего листа. Поставьте флажок Новый рабочий лист.

Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

Используя, инструмент Регрессия, получите следующий результат:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9731012

R-квадрат

0,9469259

Нормированный R-квадрат

0,9406819

Стандартная ошибка

0,5986704

Наблюдения

20

Дисперсионный анализ

df

SS MS F Значимость F

Регрессия

2 108,70709

54,353547 151,65348

1,45045E-11

Остаток 17

6,0929055

0,3584062

Итого 19

114,8

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

1,8353069 0,471065

3,8960801 0,0011615

0,841445283 2,8291686

0,8414453

2,8291686 x1 0,9459477

0,2125765 4,449917

0,0003515 0,497449913

1,3944455

0,4974499 1,3944455

x2 0,0856178 0,0604833

1,4155606 0,1749637

-0,041991018

0,2132266 -0,041991

0,2132266 ВЫВОД ОСТАТКА

Наблюдение

Предсказанное y

Остатки 1

6,3806809 0,6193191

2 6,7231521 0,2768479

3 6,6195803

0,3804197 4 6,9889824

0,0110176 5 6,8854107

0,1145893 6 8,002594

-1,002594

7 8,5701626 -0,5701626

8 7,7098327 0,2901673

9 8,5611856 -0,5611856

10 9,9801072

0,0198928 11 9,3089668

-0,3089668 12 9,7729637

1,2270363 13 10,151343

-1,1513428

14 10,786575 0,2134248

15 11,800187 0,1998132

16 12,074994 -0,0749941

17 12,066017

-0,0660171 18 12,530014

-0,530014 19 13,656174

0,3438257 20 13,431077

0,5689232

По результатам вычислений составим уравнение множественной регрессии вида: y=a+b1x2+b2x2;

y=1,8353+0,9459x1+0,0856x2.

Если значения t-критерия больше 2-3, можно сделать вывод о существенности данного параметра, который формируется под воздействием неслучайных величин. Здесь статистически значимыми являются a и b1, а величина b2 сформировалась под воздействием случайных причин, поэтому фактор x2, силу влияния которого оценивает b2, можно исключить как несущественно влияющий.

На это же указывает показатель вероятности случайных значений параметров регрессии (Р-значение, ?): если он меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01; это соответствует 10%; 5% или 1% вероятности), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. Здесь Рx2=17,5%>5%, что позволяет рассматривать x2 как неинформативный фактор и удалить его для улучшения данного уравнения.

4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и R2yx1x2. Сравнить значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации.

По данным таблиц дисперсионного анализа Fфакт = 151,65. Вероятность случайно получить такое значение F- критерия составляет 0,0000 (1,45045Е-11), что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина Р- значения. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи R2 yx1x2.

Нескорректированный (нормированный) коэффициент множественной детерминации R2yx1x2=0,9469 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации R2yx1x2=0,9407 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и потому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата у в модели факторами х1 и х2.

5. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1.

Рассчитать частные F-критерии Фишера можно используя формулы:

Fчастн x1=(tb1)2 ; Fчастн x2=(tb2)2.

Fчастн х2=2, что меньше Fтабл. Следовательно, включение в модель фактора х2- доля высококвалифицированных рабочих - после того, как в уравнение включен фактор х1- коэффициент обновления основных фондов - статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор х2 включать в уравнение после фактора х1 не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения х1 после х2,то результат расчета частного F-критерия для х1 будет иным. Fчастн.х1= 19,80 что превышает Fтабл Следовательно, значение частного F- критерия для дополнительно включенного фактора х1 не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора х1 является существенным. Фактор х1 должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора х2.

Общий вывод состоит в том, что множественная модель с факторами х1 и х2 с R2 yx1x2=0,9469 содержит неинформативный фактор х2. Если исключить фактор х2, то можно ограничиться уравнением парной регрессии:

y=a0+a1x1=1,99+1,23x1, r2yx=0,9407.

более простым, хорошо детерминированным, пригодным для анализа и прогноза.

6. Рассчитать средние частные коэффициенты эластичности и дать на их основе сравнительную оценку силы влияния факторов на результат.

Средние частные коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора хi на 1% от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости где

bj=коэффициент регрессии при хjв уравнении множественной регрессии.

Здесь

По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат фактора х1,чем признака фактора х2: 0,6% против 0,2%.

Применение программы REGR1.

Программа "Регрессионный анализ однофакторной модели связи" позволяет вычислить статистические характеристики девяти основных видов уравнений регрессии и выполнить прогноз результативного признака по каждому уравнению.

(Данная программа является программным продуктом кафедры экономической кибернетики ВГСХА)

Ознакомьтесь с программой. Для этого запустите файл C:\MODEL\REGR1\regrpr.exe. Решите задачу, предложенную в пункте 1 Проанализируйте результаты вычислений.

Приложение 1.

Таблица значений F-критерия Фишера при уровне значимости б=0,05

k1 k2 1 2

3 4 5 6 k1 k2

1 2

3 4 5 6 1 161,45

199,50 215,72 224,57

230,17 233,97 19

4,38

3,52 3,13 2,90

2,74 2,63 2 18,51

19,00 19,16 19,25

19,30

19,33 20 4,35 3,49

3,10 2,87 2,71

2,60 3 10,13 9,55

9,28

9,12 9,01 8,94

21 4,32 3,47 3,07

2,84 2,68 2,57

4 7,71

6,94 6,59 6,39

6,26 6,16 22 4,30

3,44 3,05 2,82

2,66

2,55 5 6,61 5,79

5,41 5,19 5,05

4,95 23 4,28 3,42

3,03

2,80 2,64 2,53

6 5,99 5,14 4,76

4,53 4,39 4,28

24 4,26

3,40 3,01 2,78

2,62 2,51 7 5,59

4,74 4,35 4,12

3,97

3,87 25 4,24 3,38

2,99 2,76 2,60

2,49 8 5,32 4,46

4,07

3,84 3,69 3,58

26 4,22 3,37 2,98

2,74 2,59 2,47

9 5,12

4,26 3,86 3,63

3,48 3,37 27 4,21

3,35 2,96 2,73

2,57

2,46 10 4,96 4,10

3,71 3,48 3,33

3,22 28 4,20 3,34

2,95

2,71 2,56 2,44

11 4,84 3,98 3,59

3,36 3,20 3,09

29 4,18

3,33 2,93 2,70

2,54 2,43 12 4,75

3,88 3,49 3,26

3,11

3,00 30 4,17 3,32

2,92 2,69 2,53

2,42 13 4,67 3,80

3,41

3,18 3,02 2,92

35 4,12 3,26 2,87

2,64 2,48 2,37

14 4,60

3,74 3,34 3,11

2,96 2,85 40 4,08

3,23 2,84 2,61

2,45

2,34 15 4,54 3,68

3,29 3,06 2,90

2,79 45 4,06 3,21

2,81

2,58 2,42 2,31

16 4,49 3,63 3,24

3,01 2,85 2,74

50 4,03

3,18 2,79 2,56

2,40 2,29 17 4,45

3,59 3,20 2,96

2,81

2,70 60 4,00 3,15

2,76 2,52 2,37

2,25 18 4,41 3,55

3,16

2,93 2,77 2,66

70 3,98 3,13 2,74

2,50 2,35 2,23

Приложение 2.

Критические значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01

df б df б

0,10 0,05 0,01

0,10

0,05 0,01 1 6,3138

12,706 63,657 17

1,7396 2,1098 2,8982

2 2,9200

4,3027 9,9248 18

1,7341 2,1009 2,8784

3 2,3534 3,1825

5,8409

19 1,7291 2,0930

2,8609 4 2,1318

2,7764 4,6041 20

1,7247

2,0860 2,8453 5

2,0150 2,5706 4,0321

21 1,7207 2,0796

2,8314

6 1,9432 2,4469

3,7074 22 1,7171

2,0739 2,8188 7

1,8946

2,3646 3,4995 23

1,7139 2,0687 2,8073

8 1,8595 2,3060

3,3554

24 1,7109 2,0639

2,7969 9 1,8331

2,2622 3,2498 25

1,7081

2,0595 2,7874 10

1,8125 2,2281 3,1693

26 1,7056 2,0555

2,7787

11 1,7959 2,2010

3,1058 27 1,7033

2,0518 2,7707 12

1,7823

2,1788 3,0545 28

1,7011 2,0484 2,7633

13 1,7709 2,1604

3,0123

29 1,6991 2,0452

2,7564 14 1,7613

2,1448 2,9768 30

1,6973

2,0423 2,7500 15

1,7530 2,1315 2,9467

40 1,6839 2,0211

2,7045

16 1,7459 2,1199

2,9208 60 1,6707

2,0003 2,6603

7

7

Показать полностью…
Похожие документы в приложении