Всё для Учёбы — студенческий файлообменник
1 монета
docx

Лабораторная № 2 «Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде Excel» по Теории вероятностей и математической статистике (Пуляшкин В. В.)

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2

Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel

Вариант № 4

Выполнил:

Специальность: финансы и кредит

№ зачётной книжки:

Проверил:

Волгоград 2008

1. Постановка задачи

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1 314,00 309,00

2 371,00

339,00 3 383,00

378,00 4 404,00

420,00 5 260,00

210,00

6 425,00 360,00

7 437,00 486,00

8 326,00 330,00

9 401,00

387,00 10 464,00

483,00 12 509,00

510,00 13 386,00

402,00

14 425,00 438,00

15 488,00 531,00

16 560,00 570,00

17 416,00

384,00 18 461,00

456,00 19 365,00

285,00 20 467,00

390,00

21 521,00 525,00

22 356,00 297,00

23 281,00 279,00

24 476,00

447,00 25 425,00

390,00 26 395,00

369,00 27 305,00

240,00

28 413,00 375,00

29 479,00 411,00

31 455,00 390,00

32 332,00

348,00 В процессе статистического исследования необходимо решить ряд задач.

1. Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом;

б) методом сопоставления параллельных рядов.

2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.

3. Оценить тесноту связи признаков Х и Y на основе:

а) эмпирического корреляционного отношения ?;

б) линейного коэффициента корреляции r.

Сравнить значения ? и r и сделать вывод о возможности линейной связи между признаками Х и Y.

4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.

Построить теоретическую линию регрессии.

Дать экономическую интерпретацию коэффициента регрессии.

Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.

5. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.

Таблица 2,1

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5 260,00 210,00

23 281,00 279,00

27 305,00 240,00

1 314,00

309,00 8 326,00

330,00 32 332,00

348,00 22 356,00

297,00

19 365,00 285,00

2 371,00 339,00

3 383,00 378,00

13 386,00

402,00 26 395,00

369,00 9 401,00

387,00 4 404,00

420,00

28 413,00 375,00

17 416,00 384,00

6 425,00 360,00

14 425,00

438,00 25 425,00

390,00 7 437,00

486,00 31 455,00

390,00

18 461,00 456,00

10 464,00 483,00

20 467,00 390,00

24 476,00

447,00 29 479,00

411,00 15 488,00

531,00 11 509,00

510,00

21 521,00 525,00

16 560,00 570,00

II. Рабочий файл с результативными таблицами и графиками.

Таблица 2.2

Зависимость продукции от среднегодовой стоимости основных фондов

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Выпуск продукции

Всего

В среднем на одно предприятие

1 260-320

4 1038,00 259,50

2 320-380 5 1599,00

319,80 3 380-440

11 4389,00

399,00 4 440-500

7 3108,00 444,00

5 500-560 3 1605,00

535,00

Итого 30

11739,00 1957,30

Таблица 2.3

Показатели внутригрупповой вариации

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Внутригрупповая дисперсия

1 260-320 4 445,50

2 320-380 5 320,40

3 380-440 11

281,45

4 440-500 7 113,14

5 500-560 3 474,00

Итого 30

1634,50

Таблица 2.4

Показатели дисперсии и эмпирического корреляционного отношения

Общая дисперсия

Средняя из внутригрупповых дисперсий

Межгрупповая дисперсия

Эмпирическое корреляционное отношение

7243,01 289,8

6953,21

0,979790289

Таблица 2.5

Линейный коэффициент корреляции признаков

Столбец 1

Столбец 2

Столбец 1

1 Столбец 2

0,91318826

1

Выходные таблицы

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,91318826

R-квадрат

0,833912798

Нормированный R-квадрат

0,827981112

Стандартная ошибка

35,90122258

Наблюдения

30 Дисперсионный анализ

df SS

MS F

Значимость F

Регрессия

1 181201,1621 181201,1621

140,5861384

1,97601E-12 Остаток

28 36089,13791 1288,897783

Итого 29

217290,3

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-55,33562419 38,23485148

-1,447256156 0,158929407

Переменная X 1

1,089355181 0,09187519

11,85690257 1,97601E-12

Нижние 95%

Верхние 95%

Нижние 68,3%

Верхние 68,3%

-133,656166 22,98491761

-94,29098405

-16,38026432 0,901157387

1,277552975 0,995748668

1,182961694 ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки 1

227,8967229 -17,89672286

2 250,7731817

28,22681834 3 276,917706

-36,917706 4 286,7219026

22,27809737 5 299,7941648

30,2058352

6 306,3302959 41,66970411

7 332,4748202 -35,47482023

8 342,2790169 -57,27901686

9 348,8151479

-9,815147943 10

361,8874101 16,11258989

11 365,1554757 36,84452434

12 374,9596723

-5,959672286 13

381,4958034 5,504196629

14 384,7638689 35,23613109

15 394,5680655

-19,56806554 16

397,8361311 -13,83613109

17 407,6403277 -47,64032771

18 407,6403277

30,35967229 19 407,6403277

-17,64032771 20

420,7125899 65,28741011

21 440,3209831

-50,32098314 22

446,8571142 9,142885772

23 450,1251798 32,87482023

24 453,3932453

-63,39324531 25

463,1974419 -16,19744194

26 466,4655075 -55,46550749

27 476,2697041

54,73029589 28 499,1461629

10,85383709 29 512,2184251

12,78157491 30 554,7032771

15,29672286

Рис.1 Уравнения регрессии и её графики

Рис.2 Наиболее адекватное уравнение регрессии

III. Выводы по результатам выполнения лабораторной работы.

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом.

Вывод: На основе анализа диаграммы рассеяния из Лабораторной работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет (не имеет) место стохастическая связь. Предположительный вид связи: линейная (нелинейная) прямая (обратная).

б) методом сопоставления параллельных рядов.

Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются (уменьшаются) значения результативного признака, за исключением некоторых отклонений от общей тенденции, что позволяет сделать вывод о наличии стохастической связи.

Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

Вывод: Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что существует корреляционная связь между Среднегодовой стоимостью основных производственных фондов и Выпуском продукции.

Задача 3.Оценка тесноты связи признаков Х и Y:

а) на основе эмпирического корреляционного отношения.

Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель ? - эмпирическое корреляционное отношение, задаваемое формулой

.

Для вычисления ? необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.

Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.

Вывод: Величина ?=0,81 является близкой к единице, что свидетельствует о тесной связи между факторным и результативным признаками.

б) на основе линейного коэффициента корреляции признаков.

В предположении, что связь между факторным и результативным признаками прямолинейная, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.

Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.

Вывод: Значение коэффициента корреляции r=0,91 лежит в интервале 0,9-0,99, что в соответствии со шкалой Чэддока, говорит о весьма тесной связи между факторным и результативным признаками.

Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.

Посредством показателя ? измеряется теснота связи любой формы, а с помощью коэффициента корреляции r - только прямолинейная, следовательно, значения ? и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.

Вывод: Теснота связи между факторным и результативным признаками весьма значительна.

Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.

Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.

Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверку его адекватности исследуемым фактическим данным.

В результате работы инструмента Регрессия были получены результативные таблицы 2.6 - 2.9 Рабочего файла.

Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид прямой.

Доверительные интервалы коэффициентов уравнения регрессии представлены в нижеследующей таблице:

Коэффициенты

Границы доверительных интервалов

с надежностью Р=0,68

с надежностью Р=0,95

Нижняя

Верхняя Нижняя

Верхняя а0

-94,29 -16,38 -133,66

22,99

а1 1,00 1,18 0,90

1,28 С увеличением надежности границы доверительных интервалов расширяются.

Экономическая интерпретация коэффициента регрессии а1 выражается в форме связи между вариацией факторного признака х и вариацией результативного признака у.

Коэффициент эластичности = 0,9*(384,38/366,84)= 0,94 при Р=0,95.

Экономическая интерпретация коэффициента эластичности Э:

Степень влияния изменения факторного признака х на изменение результативного признака у.

Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.

Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.

Уравнения регрессии и соответствующие им коэффициенты детерминации R2 приведены в следующей таблице:

Регрессионные модели связи1

Вид уравнения

Уравнение регрессии

Коэффициент

детерминации R2

Полином 2-го порядка

y=0,0005x2+0,6796x+25,022

0,8353 Полином 3-го порядка

y=9E-0,6x3-0,01x2+4,8666x-515,91

0,8381 Степенное

y=0,3816x1,1513 0,8372

Экспоненциальное

y=115,17e0,0029x

0,8272 Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным

Вывод: Максимальное значение коэффициента детерминации R2 =0,8372.

Вид искомого уравнения регрессии - полином третьего порядка.

Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния 2.2 Рабочего файла.

Так как значения коэффициентов детерминации кубического (R2) и линейного уравнения (?2), найденного с помощью инструмента Регрессия надстройки Пакет анализа, расходятся очень незначительно (на величину 0,0042), а для показателей тесноты связи имеет место неравенство , то в качестве адекватного исходным данным уравнения регрессии может быть принято y=9E-0,6x3-0,01x2+4,8666x-515,91

1 Коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел.

-

- 5

Показать полностью…
Похожие документы в приложении