Всё для Учёбы — студенческий файлообменник
1 монета
doc

Студенческий документ № 043151 из НИТУ МИСиС

10.4 Решение задачи регрессии в ортогональном базисе

Порядок выполнения работы:

1. Для каждого значения фактора Xi найти среднее значение отклика Yi и оценку дисперсии, а затем сводную оценку дисперсии, характеризующую дисперсию каждого измерения Y.

2. Построить ортогональный базис из многочленов T1 = 1, T2 - первого и T3 - второго порядка. Провести нормировку T2 так, чтобы в точках эксперимента он принимал взаимопростые целые значения.

3. Получить оценки коэффициентов линейной и квадратичной моделей регрессии. Рассчитать для каждого значения фактора значения обеих моделей отклонения экспериментальных результатов Yi от моделей регрессии.

ВНИМАНИЕ. Ввиду громоздкости расчетов по п.3 для получения необходимых результатов рекомендуем воспользоваться программой REGRE.exe.

4. Найти доверительные интервалы коэффициентов регрессионных моделей и среднего квадратического отклонения. Принять доверительную вероятность P = 0.95.

5. Проверить адекватность линейной модели регрессии, приняв уровень значимости равным 0.05. экспериментальных данных от этих моделей.

6. Сделать выводы.

Литература

1. Карасёв В.А., Румшинский Л.З. Организация Эксперимента. -М.: МИСиС,1986,N105, стр.62-73.

4 Обработка данных методами регрессионного анализа

4.1 Теоретическое введение

4.1.1 Оценка коэффициентов регрессии

Важной задачей математической статистики является получение функциональной зависимости одной величины (y) от другой (x) по результатам эксперимента. Будем считать, что функциональная зависимость между величинами, называемая в дальнейшем моделью, известна из предварительных сведений с точностью до параметров ?1, ?2, ..., ?m и имеет вид

y = f (x, ?1, ?2, ..., ?m ). (4.1) Для отыскания неизвестных параметров проведено n наблюдений (xi, Yi ), i = 1, 2, ..., n. Но так как результаты наблюдений не свободны от погрешностей измерений, которые мы будем рассматривать как случайные ошибки, то по ним нельзя точно найти искомые параметры. Поэтому приходится ставить задачу об отыскании не значений параметров, а их оценок по результатам эксперимента.

Будем предполагать, что значения аргументов xi известны точно, а значения функции Yi - взаимно независимые случайные величины, включающие случайные ошибки Zi , т.е. Yi = f (xi, ?1, ?2, ..., ?m ) + Zi , где

M (Zi ) = 0; D(Zi ) = D(Yi ) = ?2.

Здесь мы предполагаем, что измерения равноточны. В дальнейшем будет рассмотрен более общий случай.

Для оценок параметров ?1, ?2, ..., ?m используется метод наименьших квадратов. В качестве оценок этих параметров принимаются значения , при которых имеет минимум функция

(Yi - f (xi, ?1, ?2, ..., ?m ))2. (4.2) Уравнение (4.1) называется уравнением регрессии, а отыскание оценок параметров и исследование получаемых моделей - регрессионным анализом.

Будем рассматривать уравнения регрессии, линейные относительно оцениваемых параметров ?1, ?2, ..., ?m :

f (x, ?1, ?2, ..., ?m ) = ?1?1(x) + ?2?2(x) + ... + ?m?m(x). (4.3) Функции ?1(x), ?2(x), ... , ?m(x) называются базисными функциями, их рассматривают на множестве точек (x1, x2, ..., xn ), где n - число экспериментов.

Формулы для оценки параметров регрессионной модели (4.3) значительно упрощаются, если базисные функции ортогональны, т.е. их скалярные произведения (?j , ?k ) = ?j(xi)?k(xi) равны нулю для любых j ? k.

Обозначим ортогональные базисные функции T1(x), T2(x), ..., Tm(x) и функцию регрессии в ортогональном базисе:

y = B1T1(x) + B2T2(x) + ... + BmTm(x). (4.4) Тогда оценки параметров регрессии определяются по формуле

. (4.5)

Оценки параметров регрессии в ортогональном базисе обладают следующими свойствами.

1. Каждая оценка находится только по "своей" базисной функции Tj и не зависит от остальных, что создает удобства при "достраивании" регрессионных моделей.

2. Каждая оценка является несмещенной оценкой истинного значения параметра Bj , т.е. M() = Bj .

3. Отклонения ?Yi = Yi - (xi) экспериментальных результатов Yi от рассчитанных по оценкам (1.63) значений ортогональны всем базисным функциям T1(x), ..., Tm(x), использованным в регрессионной модели:

(?Y, Tj ) = ?Yi·Tj(xi ) = 0, (4.6) что используется для контроля правильности проведенных вычислений.

Перейти от произвольного базиса ?1(x), ?2(x), ..., ?m(x) к ортогональному можно следующим образом. Положим, что T1(x) = ?1(x), T2(x) = ?2(x) + ?2T1(x) и определим коэффициент ?2 из условия ортогональности: (T2, T1) = (?2, T1) + ?2(T1, T1) = 0, откуда

?2 = - (?2, T1 ) / (T1, T1 ). (4.7) Далее положим T3(x) = ?3(x) + ?3T1(x) + ?3T2 (x) и найдем коэффициенты ?3 и ?3 из двух условий ортогональности:

(T3, T1) = (?3, T1) + ?3 (T1, T1) + ?3(T2, T1) = 0,

(T3, T2) = (?3, T2) + ?3 (T1, T2) + ?3 (T2, T2) = 0,

откуда ?3 = - (?3, T1) / (T1, T1), ?3 = - (?3, T2) / (T2, T2). (4.8) Рассмотрим более общий случай, когда результаты измерений Yi неравноточны, т.е. дисперсии величин Yi различны. Будем полагать в (4.2):

D (Yi) = D (Zi) = ?2 / Wi , (4.9) где Wi - известные веса измерений. В этом случае в методе наименьших квадратов (1.60) минимизируется функция:

(Yi - f (xi, ?1, ?2, ..., ?m ))2Wi , (4.10) скалярное произведения функций определяется следующим образом:

(?j , ?k ) = ?j (xi ), ?k (xi) Wi ,

и оценки параметров регрессии в ортогональном базисе находят по формуле

. (4.11) Линейную и квадратичную регрессионные модели будем записывать в разложении по ортогональным многочленам для множества точек x1, x2, ..., xn с весами W1, W2, ..., Wn ; ортогональные многочлены степеней 0, 1, 2 рассчитываются по формулам

T1 = 1; T2 = X; T3 = X 2 + ?X + ?,

где Х - кодированное значение аргумента :

, (4.12) а коэффициенты ? и ? вычисляются по следующим формулам соответственно:

. (4.13) Веса измерений используются и в том случае, когда экспериментальные значения y являются независимыми и равноточными, но для некоторых значений аргумента xi измерения проводятся несколько раз, т.е. дублируются. Пусть в точке xi эксперимент дублируется ni раз, результаты этого дублирования обозначим Yi j ( j = 1, 2, ..., ni ). Среднее арифметическое результатов эксперимента в точке xi обозначим Yi = Yi j / ni . Если измерения Yi j равноточны, т.е. D(Yi j ) = ?2, то дисперсии средних арифметических равны

D(Yi ) = ?2 / ni . (4.14) В этом случае построение регрессионных моделей производим по средним значениям Yi для каждого значения xi . Значения Yi в этом случае неравноточны. Сравнивая формулы (4.9) и (4.14), делаем вывод, что весами измерений в этом случае являются числа измерений ni , т.е. Wi = ni.

4.1.2 Построение доверительных интервалов для коэффициентов регрессии

Оценки параметров регрессии , определяемые формулами (4.5) и (4.11), являются точечными оценками истинных значений параметров Bj . Если результаты экспериментов независимы и подчиняются нормальному закону распределения с дисперсией ?2, то доверительный интервал с доверительной вероятностью P = 1 - ? для каждого параметра Bj можно определить неравенством

| Bj - | Dэкс (если модель неадекватна, отклонения экспериментальных точек от модели будут больше погрешностей эксперимента). Таким образом, задача сводится к проверке гипотезы о равенстве дисперсий, которая решается с помощью критерия Фишера. Вычисляем отношение

F = S2ад / S2экс . (4.19) Если при заданном уровне значимости ? отношение F окажется меньше квантили F1-?(k1, k2), где k1 = kад, k2 = kэкс, то рассматриваемая модель не противоречит результатам эксперимента и принимается; в противоположном случае модель отвергается с уровнем значимости ?, как противоречащая результатам эксперимента.

В построенной регрессионной модели (4.4) некоторые коэффициенты могут быть незначимы, т.е. может выполняться гипотеза H0 : Bj = 0. Для проверки этой гипотезы можно найти доверительный интервал для коэффициента Bj с уровнем значимости ?. Если этот интервал "накрывает" значение Bj = 0, гипотеза H0 принимается и коэффициент Bj признается незначимым, в противоположном случае коэффициент Bj значим.

4.2 Содержание типового расчета

В каждом варианте исходных данных для расчета приведены результаты серии независимых равноточных экспериментов по изучению зависимости одной величины (Y) от другой (X) (например, зависимости предела прочности ?B [кг/мм2] от диаметра зерна D [мкм] рекристаллизованного металла; зависимости удельного электросопротивления ? [мк · Ом · см] от содержания добавки магния q [%] к двойному сплаву Al - Si; зависимости твердости по Виккерсу HV от времени старения ? [час] дуралюмина). Для каждого значения аргумента xi величина функции Yi j определена по результатам испытаний нескольких ni образцов. Разброс значений функции при одном и том же значении аргумента объяснятся наличием случайных ошибок измерения или влиянием посторонних факторов, не учитываемых в данном исследовании.

По приведенным исходным данным требуется:

- построить линейную и квадратичную регрессионные модели;

- проверить адекватность построенных моделей в предположении о нормальном распределении результатов эксперимента;

- принять решение о выборе модели регрессии или о продолжении исследований.

4.3 Пример выполнения типового расчета

4.3.1 Первичная обработка результатов экспериментов

Для каждого значения аргумента xi, приведенного в исходных данных, вычислить среднее значение функции и эмпирическую дисперсию Si2 (i = 1, 2, ..., L). Используя результаты всех измерений, найти сводную оценку дисперсии (4.18), характеризующую дисперсию каждого отдельного измерения, и сводную оценку среднего квадратического отклонения.

Расчет производится по формулам (3.3), (3.5). Для удобства расчетов каждой эмпирической дисперсии Si2 результаты экспериментов Yi j в одной и той же точке xi кодируют, т.е. преобразуют по линейной формуле (4.22):

Yi j = ci + hUi j ; Ui j = (Yi j - ci ) / h; (j = 1, 2, ... ni ), (4.20) где ci - число, расположенное приблизительно посередине интервала значений величин Yi1, Yi2, ..., Yin, а масштабный коэффициент h выбирают так, чтобы числа ui j имели по возможности меньше значащих цифр (например, были целыми взаимно простыми числами).

При этом формулы (3.7) - (3.8) приводятся к следующему виду:

(4.21)

(4.22) Результаты расчета оформляются в табличном виде.

Задача 1. В первых двух столбцах табл. 1 приведены результаты экспериментов. Провести первичную обработку этих результатов. Найти сводную оценку дисперсии и сводную оценку среднего квадратического отклонения.

Таблица 1. Исходные данные и результаты расчета (к задаче 1)

xi Yi j ni ci Ui j ?Ui j 1 2 3 4 5 6 7 8 1 2,0 1,8 2,2 3 2,0 0 -2 2 0 0 2,0 3 4,3 4,0 4,0 3 4,0 3 0 0 3 1 4,1 5 6,2 6,0 6,1 5,7 4 6,1 1 -1 0 -4 -4 -1 6,0 7 6,9 6,8 7,3 7,0 4 7,1 -2 -3 2 -1 -4 -1 7,0 14 4,0 3,8 4,2 3 4,0 0 -2 2 0 0 4,0

Решение. В столбце 3 табл. 1 запишем числа ni измерений значений функции Y при данном значении аргумента х; в столбце 4 - выбранные значения ci ; в столбце 5 - кодированные значения результатов измерений Ui j , при этом масштабный коэффициент в формуле (4.21) выбран h = 0,1. В столбце 6 записаны суммы кодированных значений Ui j по строке; в столбце 7 - кодированные средние ; в столбце 8 - средние .

Для расчета эмпирических дисперсий по формуле (4.22) в столбце 9 запишем квадраты кодированных значений Ui j , в столбце 10 - суммы этих квадратов по строке; в столбце 11 - числа степеней свободы ki; в столбцах 12 и 13 - результаты расчета эмпирических дисперсий (табл. 2).

Таблица 2. Результаты расчета (к задаче 1)

xi Uij2 ?Uij2 ki kiSi2 Si2 1 9 10 11 12 13 1 0 4 4 8 2 8·10-2 4·10-2 3 9 0 0 9 2 6·10-2 3·10-2 5 1 1 0 16 18 3 14·10-2 4,7·10-2 7 4 9 4 1 18 3 14·10-2 4,7·10-2 14 0 4 4 16 2 8·10-2 4·10-2 ? - - 12 50·10-2 - В последней строке табл. 2 запишем суммы по столбцам 11 и 12 (по индексу i ) для расчета сводной оценки дисперсии (см. формулу (2.15)): S 2СB = 0,12 · 50/12 = 0,04167, SСB = = 0,204.

4.3.2 Подготовка данных для расчета моделей регрессии. Построение ортогональных многочленов

Для заданного множества точек {x1, x2, ..., xL} построить ортогональные многочлены Т1, Т2, Т3 степеней 0, 1, 2 соответственно. Многочлены рассчитать по формулам (4.12), (4.13), где Wi = ni (i = 1, 2, ..., L). Результаты расчета оформить в табличном виде (табл. 3).

Задача 2. По данным табл. 1 рассчитать ортогональные многочлены Т1, Т2, Т3 на множестве точек {1, 3, 5, 7, 14} с весами Wi = ni.

Решение. В последней строке табл. 3 записаны суммы по столбцам 2, 3, 6, 7. Подставляя их в формулы (4.12) и (4.13), получаем: ? = -102/17 = - 6; Т2 = х - 6 = X;

? = -302/17 = -17,76471; ? = -1080/302 = -3,57616; Т3 = -17,76471 - 3,57616 · X + X 2.

В значениях коэффициентов ?, ? сохраняем 5 знаков после запятой.

Таблица 3. Результаты расчета ортогональных многочленов (к задаче 2)

x W xW Т2 = X X 2 X 2W X 3W T3 XW Т3W XТ3W 1 2 3 4 5 6 7 8 9 10 11 1 3 3 -5 25 75 -375 25,11609 -15 75,34827 -376,74135 3 3 9 -3 9 27 -81 1,96377 -9 5,89131 -17,67393 5 4 20 -1 1 4 -4 -13,188855 -4 -52,75420 52,75420 7 4 28 1 1 4 4 -20,34087 4 -81,36348 -81,36348 14 3 42 8 64 192 1536 17,62601 24 52,87803 423,02424 ? 17 102 - - 302 1080 - 0 -0,00007 -0,00032 Для контроля ортогональности полученных многочленов дополняем табл. 3 столбцами 9 - 11. В последней строке записаны суммы по этим столбцам. Для рассматриваемого примера отклонения этих сумм от нуля не превосходят величины погрешностей округления, что свидетельствует об отсутствии ошибок вычисления.

4.3.3 Расчет линейной и квадратичной регрессионных моделей

Найти оценки параметров линейной и квадратичной моделей регрессии.

Расчет оценок параметров линейной и квадратичной регрессий, расчет значений соответствующих регрессионных моделей (Yлин, Yкв ), а также отклонений их от средних значений Yi можно произвести в учебно-вычислительном центре МИСиС по специализированной программе REGRE, работающей в диалоговом режиме.

По запросу программы необходимо ввести число заданных точек n (число различных значений аргумента или число экспериментов), затем поочередно для каждого эксперимента следующие данные: Xi - значение фактора, т.е. кодированное значение аргумента (столбец 4 табл. 3.6); Yi - значение отклика, т.е. среднее значение функции для i-го аргумента (столбец 8 табл. 3); Wi - вес эксперимента (столбец 2 табл. 3). После ввода данных всех экспериментов программа предоставляет возможность исправить любое ошибочно введенное число.

Затем следует ввести коэффициенты ? и ? базисного многочлена Т3 = X 2 + ?X + ?. При ошибочном вводе коэффициентов их также можно исправить.

После ввода всех данных на экране появляются результаты расчета:

- коэффициенты регрессии B1, B2, B3, т.е. оценки параметров линейной и квадратичной регрессий, рассчитанные по формуле (4.11);

- H1, H2, H3 - нормы многочленов Т1, Т2, Т3, рассчитанные по формуле (4.16).

Пользователю предлагается следующее меню:

ВВЕДИТЕ:

1 - РАСЧЕТ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ

2 - РАСЧЕТ КВАДРАТИЧНОЙ МОДЕЛИ РЕГРЕССИИ

3 - ВЫХОД ИЗ ПРОГРАММЫ

После выбора соответствующего пункта меню на экран выводятся исходные данные расчета - столбцы X, Y, W и результаты расчета Y ЛИН и DY ЛИН для линейной модели регрессии; Y КВ и DY КВ - для квадратичной модели регрессии (пример экранной формы приведен в табл. 4):

Y ЛИН = B1 * T1 + B2 * T2 = B1 + B2 * X;

Y КВ = Y ЛИН + B3 * T3 = B1 + B2 * X + В3 * (X 2 + ?X + ?);

DY ЛИН = ? Yлин = Y - Yлин; DYKB = ? Yкв = Y - Yкв.

В последних строках экранной формы приводятся взвешенные суммы квадратов отклонений (?Yлин)i2Wi или (?Yкв)i2Wi, а также контрольные числа - скалярные произведения отклонений ?Y на многочлены Т1, Т2, Т3. Для многочленов, участвующих в расчете, эти контрольные числа должны быть равны нулям с точностью до накапливаемых погрешностей округления.

Задача 3. По данным задачи 1 найти оценки параметров линейной и квадратичной моделей регрессии.

Решение. Экранная форма результатов расчета линейной и квадратичной моделей регрессии по программе REGRE приведена в табл. 4.

В рассматриваемой задаче отклонение контрольных чисел от нуля объясняется накоплением погрешностей округления, что свидетельствует об отсутствии вычислительных ошибок. Это позволяет считать, что линейная модель регрессии описывается формулой

Yлин = 4,81118 + 0,109603X,

а квадратичная модель - формулой

Yкв = 4,84118 + 0,109603Х - 0,0963418 (Х 2 - 3,57616Х - 17,76471),

где Х = х - 6.

Таблица 4. Результаты расчета линейной и квадратичной моделей регрессии (к задаче 3)

Коэфф. регр. В1 = 0,48411Е+01 В2 = 0,109603Е+00 В3 = -0,963418Е+01 Нормы многочл. 0,412311Е+01 0,173781Е+02 0,720195Е+02 Данные эксперимента Веса Расчетные данные и их отклонения № X Y W YЛИН DYЛИН YКВ DYКВ 1 -5,0000 2,0000 3 4,293163 -2,293163 1,873434 0,126566 2 -3,0000 4,1000 3 4,512368 -0,412368 4,323175 -0,223175 3 -1,0000 6,0000 4 4,731573 1,268427 6,002182 -0,002182 4 1,0000 7,0000 4 4,950779 2,049221 6,910455 0,089545 5 8,0000 4,0000 3 5,717997 -1,717997 4,019875 -0,019875 Суммы квадратов отклонений 0,483733Е+02 0,230755Е+00 Контроль DY T1 0,12Е-05 0,55Е-05 DY T2 0,14Е-04 -0,16Е-04 DY T3 xxxxxxx 0,19Е-03 4.3.4 Графический анализ результатов расчета

Для графического анализа результатов расчета необходимо построить графики отклонений линейной и квадратичной моделей регрессии от экспериментальных данных, т.е. от средних .

Задача 4. Сделать графический анализ полученных в задаче 3 результатов расчетов.

Решение. На рис. 1а представлен график отклонений ?Yлин, построенный на основании данных табл. 4. Рис. 1а наглядно демонстрирует не только непригодность линейной модели, что следует из больших значений отклонений ?Yлин, доходящих до ±2 при ошибках эксперимента порядка 0,2 - 0,3, но и целесообразность расчета квадратичной модели, так как расположение точек полученного графика напоминает график квадратичной зависимости - параболу.

а)

б) Рис. 1. График отклонения экспериментальных данных от линейной модели (а);

от квадратичной модели (б)

На рис. 1б представлен график отклонений ?Yкв, построенный на основании данных по той же табл. 4, но в другом масштабе с увеличением в 10 раз. На рис. 1б видно, что отклонения от параболы, т.е. |?Yкв|, малы (имеют порядок, не превышающий порядок ошибок эксперимента); это свидетельствует о соответствии квадратичной модели регрессии результатам эксперимента. Выяснение соответствия модели регрессии экспериментальным данным аналитически статистическими методами проводится на следующем - V этапе расчета. В том случае, когда отклонения экспериментальных точек от параболы оказываются все еще слишком большими, более детальный анализ рис. 1б позволяет выяснить, стоит ли подбирать многочлены третьей-четвертой степени, или стоит обратиться к регрессионным моделям других типов, либо следует подвергнуть сомнению некоторые результаты эксперимента и продолжить экспериментальное исследование.

Надо также графически сравнить линейную и квадратичную модели с экспериментальными точками. На рис. 2 такое сравнение проведено для рассматриваемой задачи; оно показывает соответствие квадратичной модели экспериментальными данными.

Рис. 2. Сравнение линейной и квадратичной моделей с экспериментальными данными

4.3.5 Проверка адекватности регрессионных моделей и принятие решения о выборе модели регрессии

Проверить адекватность полученных линейной и квадратичной моделей регрессии. Уровень значимости ? задает преподаватель.

Проверка адекватности регрессионных моделей проводится путем сравнения дисперсий адекватности со сводной оценкой дисперсии. Сводная оценка дисперсии S2св подсчитывается на первом этапе первичной обработки данных. Дисперсии адекватности линейной S2ад.лин и квадратичной S2ад.кв моделей вычисляются по формуле (4.17) с использованием сумм квадратов отклонений, рассчитываемых при построении каждой из моделей регрессии. Суммы квадратов отклонений можно найти с помощью программы REGRE.

Задача 5. На основании данных расчета, проведенного в задаче 3, проверить адекватность линейной и квадратичной моделей регрессии с уровнем значимости ? = 0,05.

Решение. Проверим адекватность линейной модели регрессии. В табл. 4 (см. задачу 3) находим для линейной модели ?(?Yлин)2W = 48,37; полагая kад = 5 - 2 = 3, вычисляем дисперсию адекватности S2ад.лин = 48,36/3 = 16,12; ее отношение к сводной оценке дисперсии S2св = 0,04167 составляет Fлин = S2ад.лин / S2св = 16,12/0,04167 = 387, что значительно превосходит табличное значение F0.95(3; 12) = 3,49; поэтому для рассматриваемого примера линейная модель отвергается, как противоречащая результатам эксперимента, с уровнем значимости ? = 0,05, т.е. линейная модель неадекватна.

Проверим адекватность квадратичной модели:

?(?Yкв)2W = 0,2308; kад = 5 - 3 = 2; ,

значение критерия Фишера для квадратичной модели составляет:

Fкв = S2ад.кв / S2св = 0,1154 / 0,04167 = 2,77,

что меньше табличного значения F0.95(2; 12) = 3,89; поэтому с уровнем значимости ? = 0,05 квадратичная модель не противоречит результатам эксперимента и принимается, т.е. квадратичная модель адекватна.

Заметим, что если бы и квадратичная модель оказалась неадекватной, то пришлось бы принимать решение о подборе других моделей или о продолжении эксперимента. В рамках данного типового расчета для соблюдения одинакового объема расчетов по различным вариантам такая работа не проводится, т.е. делается вывод о неадекватности обеих построенных моделей регрессии и на этом данный этап типового расчета заканчивается.

4.3.6 Построение доверительных интервалов

Построить доверительные интервалы для параметров регрессионных моделей и дисперсии значений функции Y с заданной доверительной вероятностью P. Величину доверительной вероятности P задает преподаватель.

Построение доверительных интервалов выполняется с помощью неравенств (4.15), (4.16) и (3.12). В силу принятого для типового расчета предположения о независимости и равноточности значений измеряемой функции Y все эмпирические дисперсии Si2 являются несмещенными оценками истинной дисперсии эксперимента ?2. Для построения доверительных интервалов рекомендуется использовать подсчитанную на I этапе сводную оценку дисперсии S2 = S2св, которая имеет число степеней свободы k = kсв = ki.

Задача 6. По данным задачи 1 построить доверительные интервалы для параметров полученных моделей регрессии и дисперсии значений измеряемой функции Y с доверительной вероятностью P = 0,95.

Решение. В задаче 1 было найдено k = 12; S2 = S2св = 4,167 · 10-2; S = 0,204. По табл. П2 приложения [1] находим квантиль распределения Стьюдента t0,975(12) = 2,18. Из табл. 4 (см. задачу 3) имеем: ||T1|| = 4,123; ||T2|| = 17,38; ||T3|| = 72,02. По формулам (4.15), (4.16) вычисляем:

?1 = 2,18 · 0,204 / 4,123 = 0,108; B1 = 4,841 ± 0,108;

?2 = 2,18 · 0,204 / 17,38 = 0,0256; B2 = 0,1096 ± 0,0256;

?3 = 2,18 · 0,204 / 72,02 = 0,0062; B3 = 0,0963 ± 0,0062.

Для построения доверительного интервала для дисперсии находим квантили ?2 - распределения: ?2?/2(k) = ?20,025(12) = 4,40; ?21-?/2(k) = ?20,975(12) = 23,3.

По формуле (3.12) получаем:

4,167 · 10-2 · 12 / 23,3 < ?2 < 4,167 · 10-2 · 12 / 4,40, откуда 0,0215 < ?2 < 0,1136.

4.3.7 Выводы по результатам типового расчета

После выполнения типового расчета необходимо сделать выводы об адекватности полученных моделей регрессии. Привести построенную модель регрессии в случае ее адекватности.

Если линейная модель адекватна, приводятся результаты построения только этой линейной модели. Строить квадратичную модель в этом случае нет необходимости. Если линейная модель неадекватна, а квадратичная модель адекватна, необходимо привести результаты построения квадратичной модели. Если неадекватны и линейная, и квадратичная модели, делается вывод о необходимости поиска другой модели. При этом результаты построения моделей не приводятся.

Задача 7. Сделать выводы по обработке данных задачи 3 методами регрессионного анализа.

Решение. Линейная модель неадекватна. Квадратичная модель адекватна (она не противоречит экспериментальным данным с уровнем значимости ? = 0,05):

Y = B1 + B2 · X + B3 · (X 2 - 3,57616 X - 17,76471); Х = х - 6;

B1 = 4,84 ± 0,11; B2 = 0,110 ± 0,026; B3 = 0,0963 ± 0,062;

S2св = 4,17 · 10-2; Sсв = 0,24; 0,0215 < ?2 < 0,1136.

Доверительные интервалы рассчитаны для доверительной вероятности P = 0,95.

Литература

1. Карасев В.А., Богданов С.Н., Лёвшина Г.Д. Теория вероятностей и математическая статистика. Раздел 2. Математическая статистика. Учеб.-метод. пособие. М.: МИСиС, 2005. 117 с. (Библ. № 1855).

Показать полностью…
283 Кб, 16 мая 2014 в 12:37 - Россия, Москва, НИТУ МИСиС, 2014 г., doc
Рекомендуемые документы в приложении