Всё для Учёбы — студенческий файлообменник
1 монета
docx

Лабораторная № 2 «Среднегодовая стоимость основных производственных фондов» по Теории вероятностей и математической статистике (Пуляшкин В. В.)

1. Постановка задачи

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5 4310 3360 23

4646 4464 27 5030

3840 1 5174 4944

8 5366,00

5280,00 32 5462,00

5568,00 22 5846,00

4752,00 19 5990,00

4560,00

2 6086,00 5424,00

3 6278,00 6048,00

13 6326,00 6432,00

26 6470,00

5904,00 9 6566,00

6192,00 4 6614,00

6720,00 28 6758,00

6000,00

17 6806,00 6144,00

6 6950,00 5760,00

14 6950,00 7008,00

25 6950,00

6240,00 7 7142,00

7776,00 30 7430,00

6240,00 18 7526,00

7296,00

10 7574,00 7728,00

20 7622,00 6240,00

24 7766,00 7152,00

29 7814,00

6576,00 15 7958,00

8496,00 11 8294,00

8160,00 21 8486,00

8400,00

16 9110,00 9120,00

В процессе статистического исследования необходимо решить ряд задач.

1. Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом;

б) методом сопоставления параллельных рядов.

2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.

3. Оценить тесноту связи признаков Х и Y на основе:

а) эмпирического корреляционного отношения ?;

б) линейного коэффициента корреляции r.

Сравнить значения ? и r и сделать вывод о возможности линейной связи между признаками Х и Y.

4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.

Построить теоретическую кривую регрессии.

Дать экономическую интерпретацию коэффициента регрессии.

Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.

5. Найти наиболее адекватное уравнение регрессии с помощью средств инструмента Мастер диаграмм.

II. Рабочий файл с результативными таблицами и графиками.

Таблица 2.2

Зависимость выпуска продукции от среднегодовой стоимости основных фондов

Номер группы

Группы предприятий по стоимости основеных фондов

Число предприятий

Выпуск продукции

Всего

В среднем

на одно

предприятие

1 4310-5270 4 16608

4152,00 2 5270-6230

5 25584,00

5116,80 3 6230-7190

11 70224,00 6384,00

4 7190-8150 7 49728,00

7104,00

5 8150-9110 3 25680,00

8560,00 Итого

30 187824,00

6260,8

Таблица 2.3

Показатели внутригрупповой вариации

Номер группы

Группы предприятий по стоимости основеных фондов

Число предприятий

Внутригрупповая дисперсия

1 4310-5270 4 362304,00

2 5270-6230

5 153538,56 3 6230-7190

11 312506,18 4

7190-8150 7 591140,57

5 8150-9110

3 166400,00 Итого

30 1585889,31

Таблица 2.4

Показатели дисперсии и эмпирического корреляционного отношения

Общая дисперсия

Средняя из внутригрупповых дисперсия

Межгрупповая дисперсия

Эмпирическое корреляционное отношение

1854210,56

343055,36 1511155,2

0,902765617 Таблица 2.5

Линейный коэффициент корреляции признаков

Столбец 1

Столбец 2

Столбец 1

1 Столбец 2

0,91318826

1 ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,91318826

R-квадрат

0,833912798 Нормированный R-квадрат

0,827981112 Стандартная ошибка

574,4195612

Наблюдения

30 Дисперсионный анализ

df SS

MS F

Значимость F

Регрессия

1 46387497,49 46387497,49

140,5861

1,98E-12 Остаток

28 9238819,305 329957,8323

Итого 29

55626316,8

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 68,0%

Верхние 68,0%

Y-пересечение

-1048,773264 625,339349

-1,677126613 0,104649

-2329,72

232,1763 -1681,89

-415,658 Переменная X 1

1,089355181 0,09187519

11,85690257

1,98E-12 0,901157

1,277553 0,996338

1,182373

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки 1

3646,347566

-286,3475657 2 4012,370907

451,6290935 3 4430,683296

-590,683296 4 4587,550442

356,4495579

5 4796,706637 483,2933632

6 4901,284734 666,7152658

7 5319,597124 -567,5971237

8 5476,46427

-916,4642697 9 5581,042367

-157,0423671 10

5790,198562 257,8014382

11 5842,487611

589,5123895 12 5999,354757

-95,35475657 13

6103,932854 88,06714606

14 6156,221903

563,7780974 15 6313,089049

-313,0890487 16

6365,378097 -221,3780974

17 6522,245243

-762,2452434 18

6522,245243 485,7547566

19 6522,245243 -282,2452434

20 6731,401438

1044,598562 21 7045,13573

-805,1357303 22

7149,713828 146,2861723

23 7202,002876

525,9971237 24 7254,291925

-1014,291925 25

7411,159071 -259,1590711

26 7463,44812

-887,4481198 27

7620,315266 875,6847342

28 7986,338607 173,6613934

29 8195,494801

204,5051986 30 8875,252434

244,7475657

III. Выводы по результатам выполнения лабораторной работы.

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом.

Рис. 1

Вывод: На основе анализа диаграммы рассеяния из Лабораторной работы №1 (рис. 1), полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.

б) методом сопоставления параллельных рядов.

Таблица 2.1

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

5 4310

3360 23 4646 4464

27 5030 3840 1

5174 4944 8 5366,00

5280,00

32 5462,00 5568,00

22 5846,00 4752,00

19 5990,00 4560,00

2 6086,00

5424,00 3 6278,00

6048,00 13 6326,00

6432,00 26 6470,00

5904,00

9 6566,00 6192,00

4 6614,00 6720,00

28 6758,00 6000,00

17 6806,00

6144,00 6 6950,00

5760,00 14 6950,00

7008,00 25 6950,00

6240,00

7 7142,00 7776,00

30 7430,00 6240,00

18 7526,00 7296,00

10 7574,00

7728,00 20 7622,00

6240,00 24 7766,00

7152,00 29 7814,00

6576,00

15 7958,00 8496,00

11 8294,00 8160,00

21 8486,00 8400,00

16 9110,00

9120,00

Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений, что позволяет сделать вывод о наличии прямой связи.

Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

Таблица 2.2

Зависимость выпуска продукции от среднегодовой стоимости основных фондов

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Выпуск продукции

Всего

В среднем

на одно

предприятие

1 4310-5270 4 16608

4152,00 2 5270-6230

5 25584,00

5116,80 3 6230-7190

11 70224,00 6384,00

4 7190-8150 7 49728,00

7104,00

5 8150-9110 3 25680,00

8560,00 Итого

30 187824,00 6260,8

Вывод: Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что вначале с ростом стоимости основных фондов предприятий растет выпуск продукции.

Задача 3.Оценка тесноты связи признаков Х и Y:

а) на основе эмпирического корреляционного отношения

Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель ? - эмпирическое корреляционное отношение, задаваемое формулой

Таблица 2.3

Показатели внутригрупповой вариации

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Внутригрупповая дисперсия

1 4310-5270 4 362304,00

2 5270-6230 5 153538,56

3 6230-7190 11

312506,18

4 7190-8150 7 591140,57

5 8150-9110 3 166400,00

Итого 30

1585889,31

Для вычисления ? необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.

Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.

Таблица 2.4

Показатели дисперсии и эмпирического корреляционного отношения

Общая дисперсия

Средняя из внутригрупповых дисперсия

Межгрупповая дисперсия

Эмпирическое корреляционное отношение

1854210,56

343055,36 1511155,2

0,902765617

Вывод: Величина ?=0,902765617 является близкой к единице, что свидетельствует о наличие корреляционной связи между признаками Х и Y.

б) на основе линейного коэффициента корреляции признаков

В предположении, что связь между факторным и результативным признаком имеется, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.

Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.

Таблица 2.5

Линейный коэффициент корреляции признаков

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

Среднегодовая стоимость основных производственных фондов, млн. руб.

1 Выпуск продукции, млн. руб.

0,91318826 1 Вывод: Значение коэффициента корреляции r=0,91318826 лежит в интервале, который более 0,7, что в соответствии со шкалой Чэддока, говорит о наличии тесной связи.

Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.

Посредством показателя ? измеряется теснота связи любой формы, а с помощью коэффициента корреляции r - только прямолинейная, следовательно, значения ? и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной. В нашем случае

Вывод: гипотезу о прямолинейной связи можно считать прямолинейной.

Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.

Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.

Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверка его адекватности исследуемым фактическим данным.

В результате работы инструмента Регрессия были получены результативные таблицы 2.6 - 2.9 Рабочего файла.

Таблица 2.6

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,91318826

R-квадрат

0,833912798

Нормированный R-квадрат

0,827981112

Стандартная ошибка

574,4195612

Наблюдения

30

Таблица 2.7

Дисперсионный анализ

df

SS MS

F Значимость F

Регрессия

1 46387497,49 46387497,49

140,5861

1,98E-12 Остаток

28 9238819,305 329957,8323

Итого 29

55626316,8

Таблица 2.8

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 68,0%

Верхние 68,0%

Y-пересечение

-1048,773264 625,339349

-1,6771266

0,104649 -2329,72

232,1763 -1681,89

-415,658 Переменная X 1

1,089355181

0,09187519 11,856902

1,98E-12 0,901157

1,277553 0,996338

1,182373

Таблица 2.9

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки 1

3646,347566 -286,3475657

2 4012,370907 451,6290935

3 4430,683296

-590,683296 4 4587,550442

356,4495579 5 4796,706637

483,2933632 6 4901,284734

666,7152658

7 5319,597124 -567,5971237

8 5476,46427 -916,4642697

9 5581,042367 -157,0423671

10 5790,198562

257,8014382 11 5842,487611

589,5123895 12 5999,354757

-95,35475657 13

6103,932854

88,06714606 17 6156,221903

563,7780974 18 6313,089049

-313,0890487 19

6365,378097

-221,3780974 20

6522,245243 -762,2452434

21 6522,245243 485,7547566

22 6522,245243

-282,2452434 23

6731,401438 1044,598562

24 7045,13573 -805,1357303

25 7149,713828

146,2861723 27 7202,002876

525,9971237 28 7254,291925

-1014,291925 29

7411,159071

-259,1590711 30

7463,44812 -887,4481198

Рис. 2

Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид Y=-187,79+1,08935X

Доверительные интервал коэффициентов уравнения регрессии представим в нижеследующей таблице.

Коэффициенты

Границы доверительных интервалов

С надежностью Р=0,68

С надежностью Р=0,95

Нижние

Верхние Нижние

Верхние а0

-2329,72 232,1763

-1681,89

-415,658 а1 0,901157

1,277553 0,996338

1,182373 С увеличением надежности границы доверительных интервалов увеличиваются.

Экономическая интерпретация коэффициента регрессии а1 заключается в том, что при увеличении среднегодовой стоимости основных фондов на 1 единицу происходит рост выпуска продукции на 1,08935 единиц.

Коэффициент эластичности =1,08935*6710/6260,8=1,167508705

Экономическая интерпретация коэффициента эластичности Э заключается в том, что при увеличении среднегодовой стоимости основных фондов на 1% происходит рост выпуска продукции на 1,1675%.

Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.

Возможности инструмента Мастер диаграмм позволяют быстро производить построение и анализ адекватности регрессионных моделей, базирующихся на использовании различных видов зависимости между признаками X и Y.

Построение моделей осуществляется непосредственно на диаграмме рассеяния.

На диаграмме рассеяния отображается линия и уравнение регрессии, а также коэффициент детерминации R2.

В лабораторной работе уравнения регрессии и их графики были построены для 5-ти видов зависимости между признаками и даны на диаграммах.

Рис. 3

Уравнения регрессии и соответствующие им коэффициент детерминации R2 даны в следующей таблице:

Регрессионные модели связи

Вид уравнения

Уравнение регрессии

Коэффициент

детерминации R2

Линейное

y = 1,0894x - 1048,8

0,8339 Полином 2-го порядка

y = 3E-05x2 + 0,6701x + 299,12

0,8353 Полином 3-го порядка

y = 3E-08x3 - 0,0006x2 + 5,0562x - 8998,7

0,8381 Степенное

y = 0,1901x1,1797

0,8371 Экспоненциальное

y = 1792,9e0,0002x

0,8272 Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным

Вывод: Максимальное значение коэффициента детерминации R2 =0,8381

Вид искомого уравнения регрессии - Полином 3-го порядка

Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния.

Рис. 4 Полином 3-го порядка

1

Показать полностью…
Похожие документы в приложении