Всё для Учёбы — студенческий файлообменник
1 монета
docx

Контрольная «Поиск параметров уравнения линейной регрессии» по Эконометрике (Горбатков С. А.)

Задача По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.). X 12 4 18 27 26 29 1 13 26 5 Y 21 10 26 33 34 37 9 21 32 14 Требуется: 1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. 2. Вы числить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков. 3. Проверить выполнение предпосылок МНК. 4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (? = 0,05). 5. Вычислить коэффициент детерминации, поверить значимость уравнения регрессии с помощью F-критерия Фишера (? = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. 6. Осуществить прогнозирование среднего значения показателя Y при значимости ? = 0,1, если прогнозное значение фактора X составит 80% от его максимального значения. 7. Представить графически: фактические и модельные значения Y, точки прогноза. 8. Составить уравнения нелинейной регрессии: * гиперболической; * степенной; * показательной. Привести графики построенных уравнений регрессии. 9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод. Решение 1. Поиск параметров уравнения линейной регрессии. Определим линейный коэффициент парной корреляции по следующей формуле: Можно сказать, что связь между объемом капиталовложений X и объемом выпуска продукции Y прямая, тесная. Уравнение линейной регрессии имеет вид: . Значения параметров a и b линейной модели определим, используя данные таблицы 1. t Y x 1 21 12 252 144 -2,7 7,29 -4,1 16,81 2 10 4 40 16 -13,7 187,69 -12,1 146,41 3 26 18 468 324 2,3 5,29 1,9 3,61 4 33 27 891 729 9,3 86,49 10,9 118,81 5 34 26 884 676 10,3 106,09 9,9 98,01 6 37 29 1073 841 13,3 176,89 12,9 166,41 7 9 1 9 1 -14,7 216,09 -15,1 228,01 8 21 13 273 169 -2,7 7,29 -3,1 9,61 9 32 26 832 676 8,3 68,89 9,9 98,01 10 14 5 70 25 -9,7 94,09 -11,1 123,21 Итого 237 161 4792 3601 0,00 956,1 0,00 1008,9 Среднее 23,7 16,1 479,2 360,1 Дисперсия 95,61 100,89 Уравнение линейной регрессии имеет вид: Экономическая интерпретация коэффициента регрессии С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции вырастет на 0,968 млн. руб. Это свидетельствует об эффективности работы предприятий. 2. Вычисление остатков, остаточной суммы квадратов, дисперсии остатков, построение графика остатков t Y 1 21 19,73248 1,267519 6,04% 1,606605 2 10 11,99098 -1,99098 -19,91% 3,964002 3 26 25,53861 0,461394 1,77% 0,212884 4 33 34,24779 -1,24779 -3,78% 1,556991 5 34 33,28011 0,719893 2,12% 0,518246 6 37 36,18317 0,81683 2,21% 0,667212 7 9 9,087918 -0,08792 -0,98% 0,007729 8 21 20,70017 0,299831 1,43% 0,089899 9 32 33,28011 -1,28011 -4,00% 1,638674 10 14 12,95867 1,041332 7,44% 1,084373 Итого 237 237 0,00 -7,67% 11,347 Дисперсия 0,005281 Остаточная сумма квадратов = 11,347, дисперсия остатков = 0,005. График остатков: 3. Выполнение предпосылок метода наименьших квадратов 1) следовательно, метод наименьших квадратов применим и решение существует. 2) Наличие (отсутствие) автокорреляции в отклонениях. Вычислим величину , , 0 < 2,987 < 4. Имеет место практическое отсутствие автокорреляции остатков. 3) Наличие (отсутствие) автокорреляции с помощью первого коэффициента автокорреляции. Табличное значение r(1) = 0,63. Так как табличное значение больше фактического, то принимается гипотеза об отсутствии автокорреляции в ряду. 4) Обнаружение гетероскедастичности. Для обнаружения гетероскедастичности обычно используют три теста, в которых делаются различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда-Квандта и тест Глейзера. При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда-Квандта. Данный тест используется для проверки такого типа гетероскедастичности, когда дисперсия остатков возрастает пропорционально квадрату фактора. При этом делается предположение, что случайная составляющая распределена нормально. Чтобы оценить нарушение гомоскедастичности по тесту Голдфельда-Квандта, необходимо выполнить следующие шаги. 1. Упорядочение n наблюдений по мере возрастания переменной x. t Y x 7 9 1 9 1 9 81 1 1 2 10 4 40 16 10 100 4 16 10 14 5 70 25 14 196 5 25 1 21 12 252 144 21 441 12 144 8 21 13 273 169 21 441 13 169 3 26 18 468 324 26 676 18 324 5 34 26 884 676 34 1156 26 676 9 32 26 832 676 32 1024 26 676 4 33 27 891 729 33 1089 27 729 6 37 29 1073 841 37 1369 29 841 2. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора x) и определение по каждой из групп уравнений регрессии. t Y x 7 9 1 9 1 9 81 1 1 2 10 4 40 16 10 100 4 16 10 14 5 70 25 14 196 5 25 1 21 12 252 144 21 441 12 144 8 21 13 273 169 21 441 13 169 t Y x 3 26 18 468 324 26 676 18 324 5 34 26 884 676 34 1156 26 676 9 32 26 832 676 32 1024 26 676 4 33 27 891 729 33 1089 27 729 6 37 29 1073 841 37 1369 29 841 3. Для первой группы a1 = 7,427, b1 = 1,082. Для второй группы a2 = 9,051, b1 = 0,927. Определение остаточной суммы квадратов для первой регрессии и второй регрессии 4. Вычисление отношений . В числителе должна быть большая сумма квадратов. Полученное отношение имеет F распределение со степенями свободы k1 =n1 - m и k2 = n - n1 - m (m - число оцениваемых параметров в уравнении регрессии). Поскольку , то гетероскедастичность имеет место. 4. Проверка значимости параметров уравнения с помощью t-критерия Стьюдента, вычисление коэффициента детерминации Рассчитаем коэффициент детерминации: tтабл = 2,31, tнабл = 25,809. tнабл > tтабл, следовательно , коэффициент корреляции существенно отличен от нуля и зависимость является достоверной. 5. Вычисление критерия Фишера, нахождение средней относительной ошибки аппроксимации, вывод о качестве модели Вариация результат Y (объема выпуска продукции) на 98,8 % объясняется вариацией фактора X (объемом капиталовложений). Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера: F < Fтабл = 5,32 для ? = 0,05; k1 = m = 1, k2 = n - m - 1 = 8. Уравнение регрессии с вероятностью 0,95 в целом является статистически значимым, т. к. F > Fтабл. Определим среднюю относительную ошибку: В среднем расчетные значения для линейной модели отличаются от фактических значений на 0,767 %. Коэффициент эластичности вычисляем по формуле: где - среднее значение x, - среднее значение y, b - коэффициент регрессии. 6. Прогнозирование 29 ? 80% = 23,2. Для получения прогнозных оценок зависимостей переменной по модели подставим в нее найденные прогнозные значения фактора Х Y23,2 = 8,120 + 0,968 ? 23,2 = 30,571. Величину отклонения от линии регрессии вычисляют по формуле . Величину S? находят: Коэффициент Стьюдента t? для m = 8 степеней свободы (m = n-2) и уровня значимости 0,1 равен 1,86. Таким образом, прогнозное значение будет находиться между верхней границей, равной 30,571 + 2,376 = 32,947 и нижней границей, равной 30,571 - 2,376 = 28,195. Таблица прогноза (р = 90%) Значение Прогноз Нижняя граница Верхняя граница 23,2 30,571 28,195 32,947 7. Графическое представление фактических и модельных значений Y, точки прогноза 8. Уравнения нелинейной регрессии Гиперболическое: Уравнение гиперболической функции: Произведем линеаризацию модели путем замены X = 1/x. В результате получим линейное уравнение . Рассчитаем его параметры по данным таблицы. t y x X yX X2 1 21 12 0,083 1,750 0,0069 -2,700 7,290 26,027 2 10 4 0,25 2,500 0,0625 -13,700 187,690 22,074 3 26 18 0,056 1,444 0,0031 2,300 5,290 26,685 4 33 27 0,037 1,222 0,0014 9,300 86,490 27,125 5 34 26 0,038 1,308 0,0015 10,300 106,090 27,091 6 37 29 0,034 1,276 0,0012 13,300 176,890 27,185 7 9 1 1 9,000 1 -14,700 216,090 4,285 8 21 13 0,077 1,615 0,0059 -2,700 7,290 26,179 9 32 26 0,038 1,231 0,0015 8,300 68,890 27,091 10 14 5 0,2 2,800 0,04 -9,700 94,090 23,259 Итого 237 161 1,814 24,146 1,124 0,000 956,1 237 Среднее 23,700 16,100 0,181 2,415 0,112 0,000 95,610 23,700 Получим следующее уравнение гиперболической модели: Y = 28,003 - 23,718/x. Определим индекс корреляции: Коэффициент детерминации: Определим среднюю относительную ошибку: В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 37,049%. Коэффициент эластичности вычисляем по формуле: где - среднее значение x, a, b - коэффициенты регрессии. График гиперболической регрессии: Степенное: Уравнение степенной модели имеет вид: . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: . Факт Y(t) Lg(Y) Переменная X(t) lg(X) 1 21 1,322 12 1,079 2 10 1,000 4 0,602 3 26 1,415 18 1,255 4 33 1,519 27 1,431 5 34 1,531 26 1,415 6 37 1,568 29 1,462 7 9 0,954 1 0,000 8 21 1,322 13 1,114 9 32 1,505 26 1,415 10 14 1,146 5 0,699 сумма 237 13,28313 161 10,47314 среднее 23,700 1,328 16,100 1,047 Обозначим , X = lg x, A = lg a. Тогда уравнение примет вид: Y = A + b X - линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы. y Y x X YX X2 1 21 1,322 12 1,079 1,427 1,165 22,017 2 10 1,000 4 0,602 0,602 0,362 13,384 3 26 1,415 18 1,255 1,776 1,576 26,456 4 33 1,519 27 1,431 2,174 2,049 31,791 5 34 1,531 26 1,415 2,167 2,002 31,252 6 37 1,568 29 1,462 2,293 2,139 32,837 7 9 0,954 1 0,000 0,000 0,000 7,142 8 21 1,322 13 1,114 1,473 1,241 22,830 9 32 1,505 26 1,415 2,130 2,002 31,252 10 14 1,146 5 0,699 0,801 0,489 14,808 Итого 237 13,28313 161 10,47314 14,84277 13,02396 233,7703 Среднее 23,700 1,328 16,100 1,047 1,484 1,302 23,377 , Уравнение регрессии будет иметь вид Y = 0,854 + 0,453 X. Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения . Получим уравнение степенной модели регрессии: . Определим индекс корреляции: Связь между показателем y и фактором x можно считать тесной. Коэффициент детерминации равен 0,951. Определим среднюю относительную ошибку: В среднем расчетные значения для степенной модели отличаются от фактических значений на 10,089%. Коэффициент эластичности вычисляем по формуле: где b - коэффициент регрессии. График степенной регрессии: Показательное: Уравнение показательной кривой: Для построения это модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: Обозначим: B = lg b, A = lg a. Получим линейное уравнение регрессии: Y = A + B x. Рассчитаем его параметры, используя данные таблицы. t y Y x Yx x2 1 21 1,322 12 15,867 144 -0,006 0,000 -4,100 16,810 17,533 2 10 1,000 4 4,000 16 -0,328 0,108 -12,100 146,410 11,997 3 26 1,415 18 25,470 324 0,087 0,008 1,900 3,610 23,305 4 33 1,519 27 41,000 729 0,190 0,036 10,900 118,810 35,714 5 34 1,531 26 39,818 676 0,203 0,041 9,900 98,010 34,059 6 37 1,568 29 45,478 841 0,240 0,058 12,900 166,410 39,267 7 9 0,954 1 0,954 1 -0,374 0,140 -15,100 228,010 10,406 8 21 1,322 13 17,189 169 -0,006 0,000 -3,100 9,610 18,385 9 32 1,505 26 39,134 676 0,177 0,031 9,900 98,010 34,059 10 14 1,146 5 5,731 25 -0,182 0,033 -11,100 123,210 12,580 Итого 237 13,28 161 234,64 3601 0,000 0,45476 0,000 1008,9 237,305 Среднее 23,700 1,328 16,100 23,464 360,100 0,000 0,045 0,000 100,890 23,731 , Уравнение будет иметь вид: Y = 0,997 + 0,021 x. Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения: Определим индекс корреляции: Связь между показателем y и фактором x можно считать тесной. Коэффициент детерминации: Определим среднюю относительную ошибку: В среднем расчетные значения для показательной модели отличаются от фактических значений на 10,602%. Коэффициент эластичности вычисляем по формуле: где - среднее значение x, b - коэффициент регрессии. График показательной регрессии: 9. Сравнение различных моделей Параметры Коэффициент детерминации R2 Коэффициент эластичности Э Средняя относительная ошибка Eотн Модель Линейная 0,988 0,657674 0,767% Степенная 0,951 0,453 10,089% Показательная 0,947 -62,51 10,602% Гиперболическая 0,468 0,056 37,049% Все модели имеют примерно одинаковые характеристики, но меньшее значение средней относительной ошибки и большее значение коэффициента детерминации R2 имеет линейная модель. Ее можно взять в качестве лучшей для построения прогноза. Наилучший коэффициент эластичности у гиперболической модели.

Показать полностью…
Похожие документы в приложении