Всё для Учёбы — студенческий файлообменник
1 монета
ppt

Студенческий документ № 015468 из ВАВТ

Гетероскедастичность

Лекция 6 Гетероскедастичность

• Природа гетероскедастичности

• Последствия гетероскедастичности

• Выявление гетероскедастичности (тесты)

• Средства для решения проблемы (преодоление) гетероскедастичности

Классические условия регрессионного анализа (условия Гаусса-Маркова)

• Регрессионная модель линейна по параметрам (коэффициентам)

и корректно специфицирована.

• Все объясняющие переменные являются детерминированными,

но достаточно вариабельными.

• Случайные возмущения имеют нулевое среднее.

• Случайные возмущения имеют постоянную дисперсию.

• Случайные возмущения не коррелируют друг с другом.

• Ни одна из объясняющих переменных не является строгой

линейной функцией других объясняющих переменных.

• Случайные возмущения распределены нормально (необязательное,

но часто используемое условие).

IV.Дисперсия случайного члена постоянна

- НЕ зависит от номера наблюдения

Модель гомоскедастичная

IV.Дисперсия случайного члена НЕпостоянна

- зависит от номера наблюдения

Модель гетероскедастичная

В матричной форме эти условия Гаусса-Маркова

(о дисперсии и автоковариациях возмущений)

можно записать следующим образом

где - ковариационная матрица ошибок,

а En - единичная матрица размера n.

Формальное выражение гетероскедастичности в матричной форме

где - ковариационная матрица ошибок,

а En - единичная матрица размера n.

Ковариационная матрица

случайных возмущений

В ней на главной диагонали стоят дисперсии случайных возмущений для каждого i, а остальные элементы этой матрицы - это ковариации для каждой пары i и j.

Разумеется, матрица симметрична

Кроме того, напомним, что

Пример гомоскедастичности

Пример гетероскедастичности

Еще пример гетероскедастичности

Пространственные выборки

(cross-section series)

Чаще гетероскедастичность возникает в моделях,

основанных на перекрестных выборках,

но встречается и во временных рядах.

ТИПИЧНЫЕ "БОЛЕЗНИ":

временные ряды-автокорреляция перекрестные выборки-гетероскедастичность

Виды гетероскедастичности

• Истинная гетероскедастичность (вызывается непостоянством дисперсии случайного члена, ее зависимостью от различных факторов)

• Ложная гетероскедастичность (вызывается ошибочной спецификацией модели регрессии)

Источники гетероскедастичности-1

1) Гетероскедастичность возникает часто

в пространственных выборках

если масштаб изменений зависимой переменной Y зависит от какой-то

другой переменной, называемой

фактором пропорциональности (Z).

Источники гетероскедастичности-2

2) Гетероскедастичность возникает также и во временных рядах, когда зависимая переменная имеет большой интервал существенно неоднородных значений или высокий темп изменения.

Источники гетероскедастичности-3

3) Гетероскедастичность возникает в любой модели в случае если качество данных варьирует внутри выборки.

Источники гетероскедастичности

Наиболее распространенный случай истинной гетероскедастичности: дисперсия Y растет с ростом одного из факторов

Мы будем рассматривать

только гетероскедастичность

простейшего вида

Z - фактор пропорциональности (переменная, включенная или не включенная в уравнение регрессии)

Последствия гетероскедастичности

• Истинная гетероскедастичность не приводит

к смещению оценок коэффициентов регрессии.

• Гетероскедастичность увеличивает дисперсию (т.е. ошибки) оценок коэффициентов.

• Гетероскедастичность вызывает занижение оценок стандартных ошибок коэффициентов регрессии.

Последствия гетероскедастичности

• Истинная гетероскедастичность не приводит

к смещению оценок коэффициентов регрессии.

• Гетероскедастичность увеличивает дисперсию (т.е. ошибки) оценок коэффициентов.

• Гетероскедастичность вызывает занижение оценок стандартных ошибок коэффициентов регрессии.

Последствия гетероскедастичности-2

• Иначе говоря, оценки коэффициентов регрессии классическим методом наименьших квадратов

в случае гетероскедастичности также являются несмещенными и состоятельными.

• Таким образом, для определения прогнозных значений зависимой переменной Y обычный МНК применим и для гетероскедастичной модели.

• Однако результаты, связанные с анализом точности и надежности модели, оценкой значимости и построением доверительных интервалов ее коэффициентов, оказываются непригодными.

• В этом случае оценки коэффициентов не будут эффективными (дисперсия не минимальна),

и при небольших выборках можно подучить оценки, существенно отличающиеся от истинных значений.

Обнаружение гетероскедастичности

Предварительная работа

• Подумать, нет ли очевидных ошибок

в спецификации модели?

• Можно ли содержательно предполагать какой-то вид гетероскедастичности?

• Рассмотреть графики зависимости квадратов остатков ei от и от X-ов.

Обнаружение гетероскедастичности

Предварительная работа

• Подумать, нет ли очевидных ошибок

в спецификации модели?

• Можно ли содержательно предполагать какой-то вид гетероскедастичности?

• Рассмотреть графики зависимости зависимой переменной Y от X-ов.

• Рассмотреть графики зависимости квадратов остатков ei от и от X-ов.

Обнаружение гетероскедастичности

Тесты на гетероскедастичность

• Тест Голдфельда-Куандта

(Goldfeld - Quandt test)

• Тест Бреуша-Пагана

(Breusch - Pagan test)

• Тест Уайта (White test)

• Тест ранговой корреляции Спирмена.

Отличия применения тестов на гетероскедастичность

Голдфельда-Куандта и Бреуша-Пагана

Кто "виноват" в гетероскедастичности?

• Тест Голдфельда-Куандта применяется,

когда есть предположение о прямой зависимости дисперсии ошибок от величины некоторой объясняющей переменной, входящей в модель.

• Тест Бреуша-Пагана применяется в тех случаях, когда предполагается, что дисперсии зависят

от некоторых дополнительных переменных,

не включенных в модель.

Тест Голдфельда-Куандта

• Выбирается фактор пропорциональности Z (один из X-ов, включенных в модель). Данные упорядочиваются в порядке возрастания величины Z.

• Выбрасывается средняя четверть d упорядоченных наблюдений.

Для первой и последней части строятся две отдельные регрессии,

используя спецификацию первоначального уравнения.

• Берутся суммы квадратов остатков ESS1 и ESS2 для регрессий по первой и последней части выборки и рассчитывается отношение большей из них к меньшей (количество наблюдений в них m одинаково).

• Используется F-тест для проверки гипотезы гомоскедастичности: если величина GQ превышает критическое значение F c m - k - 1 степенями свободы и для числителя, и для знаменателя (k - число факторов), то гипотеза гомоскедастичности отвергается.

Тест Голдфельда-Куандта

• Выбирается фактор пропорциональности Z (один из X-ов, включенных в модель). Данные упорядочиваются в порядке возрастания величины Z.

• Выбрасывается средняя четверть d упорядоченных наблюдений.

Для первой и последней части строятся две отдельные регрессии,

используя спецификацию первоначального уравнения.

• Берутся суммы квадратов остатков RSS1 и RSS2 для регрессий по первой и последней части выборки и рассчитывается отношение большей из них к меньшей (количество наблюдений в них m одинаково).

• Используется F-тест для проверки гипотезы гомоскедастичности: если величина GQ превышает критическое значение F c m - k - 1 степенями свободы и для числителя, и для знаменателя (k - число факторов), то гипотеза гомоскедастичности отвергается.

Тест Бреуша - Пагана (кратко)

• Провести обычную регрессию и получить остатки

(на множестве факторов без Z - "подозреваемого" X ).

При этом получают оценку

• Вычислить квадраты этих остатков и построить вторую регрессию , найти для нее объясненную часть вариации RSS.

• Вычислить статистику(RSS из второй регрессии!)

• Использовать тест (хи-квадрат) для проверки гипотезы гомоскедастичности: если величина BP превышает критическое значение c p степенями свободы (p - число переменных,

от которых по предположению зависит. Здесь p = 1),

то гипотеза гомоскедастичности отвергается.

Тест Уайта

Тест Уайта применяется, когда предполагается, что дисперсии ошибок представляют собой одну и ту же функцию от наблюдаемых значений независимых переменных. Чаще всего - квадратичную.

• Провести обычную регрессию и получить остатки

(на множестве исходных независимых переменных).

Вычислить квадраты этих остатков и приписать к матрице данных.

• Приписать к матрице данных квадраты исходных независимых переменных (и, возможно, их попарные произведения).

• Построить вторую регрессию квадратов остатков от расширенного множества регрессоров (исходных факторов и их квадратов) (b0 = 0).

• Для проверки гипотезы гомоскедастичности использовать значимость в целом уравнения второй регрессии : если уравнение второй регрессии в целом значимо, то гипотеза гомоскедастичности отвергается.

Тест ранговой корреляции Спирмена

• Выборка упорядочивается по фактору x. Рассчитываются ранги (порядковый номер) x.

• Рассчитывается уравнение регрессии

Yi = b0 + b1 X1i + b2 X 2i + ei

и вычисляются остатки ei = Yi - b? ?- b X 1 1i ?- b X 2 2 i

• Выборка снова упорядочивается повеличине остатков. Рассчитывается ранги (порядковый номер) остатков.

• Рассчитывается коэффициент ранговой корреляции Спирмена между рангами фактора x и остатков

e i = 6a D2 rx,e = 1 - n(n2 , - 1)

где Di - разность рангов x и e

• Рассчитывают статистику z = rx,e ? n - 1 , распределенную нормально N(0;1) при отсутствии гетероскедастичности.

Что делать при обнаружении гетероскедастичности

• Использовать взвешенный метод наименьших квадратов - WLS.

• Переопределить переменные

(например, перейти к логарифмам).

• Вычислять стандартные ошибки с поправкой

на гетероскедастичность (метод Уайта) - LS(h).

• Пересмотреть спецификацию модели.

При ложной гетероскедастичности добавить

в модель отсутствующую переменную.

Последствия гетероскедастичности

• Истинная гетероскедастичность не приводит

к смещению оценок коэффициентов регрессии.

• Гетероскедастичность увеличивает дисперсию (т.е. ошибки) оценок коэффициентов.

• Гетероскедастичность вызывает занижение оценок стандартных ошибок коэффициентов регрессии.

Взвешенный метод наименьших квадратов-1

В случае "чистой" гетероскедастичности ковариационная матрица случайных возмущений имеет диагональный вид

То есть случайные возмущения имеют разные дисперсии при каждом i, и при этом попарно независимы между собой.

Взвешенный метод наименьших квадратов-1а

Вспомним, что такое ковариационная матрица случайных возмущений

Взвешенный метод наименьших квадратов-2

• Случай. Эти разные дисперсии известны.

Поделим на

каждое i-е

уравнение

Взвешенный метод наименьших квадратов-3

Действительно,

и теперь можно применять теорему Гаусса-Маркова.

В новой модели нет свободного члена, а теперь служит коэффициентом при добавленном искусственном факторе

Взвешенный метод наименьших квадратов-4

Поэтому такая модель называется взвешенной,

так как в ней каждое i-e наблюдение умножается на

При этом, мы автоматически придаем наибольший вес наиболее точным наблюдениям, т.е. наблюдениям

с наименьшей дисперсией

Взвешенный и обобщенный МНК

В этом случае можно сказать, что взвешенный МНК -

- это обобщенный МНК, примененный к модели

с гетероскедостичностью, т.е. определение оценок коэффициентов регрессии по формуле

когда ковариационная матрица случайных возмущений является диагональной

Взвешенный метод наименьших квадратов-5

2. Случай. Эти разные дисперсии НЕизвестны.

Но предположим, что они пропорциональны

одному из показателей, например, z

Делим

теперь на:

Взвешенный метод наименьших квадратов-6

Действительно, если, то

и теперь опять можно применять теорему Гаусса-Маркова.

Взвешенный метод наименьших квадратов-6

Действительно, если, то

тогда

и теперь опять можно применять теорему Гаусса-Маркова.

Взвешенный метод наименьших квадратов-7

3. Случай.

Пусть по-прежнему эти разные дисперсии НЕизвестны.

Но предположим, что все наблюдения можно разделить на

две части: первые m и последние n - m, и в каждой части наблюдений дисперсия случайных возмущений постоянна

Строим общую модель обычным методом наименьших квадратов и, получив остатки ,

определяем оценки дисперсий для каждой части отдельно

Показать полностью…
499 Кб, 18 апреля 2013 в 7:56 - Россия, Москва, ВАВТ, 2013 г., ppt
Рекомендуемые документы в приложении