Всё для Учёбы — студенческий файлообменник
1 монета
doc

Курсовая «Статистические методы обработки экспериментальных данных» по Теории вероятностей и математической статистике (Джваршейшвили И. А.)

1. Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот

2. Нахождение точечных оценок математического ожидания и дисперсии

3. Выдвижение гипотезы о распределении случайной величины

4. Построение графика теоретической плотности распределения

5. Проверка гипотезы о распределении с помощью критерия согласия Пирсона

5.1. Группировка исходных данных

5.2 . Вычисление теоретических частот.

5.3. Статистика ² и вычисление ее значения по опытным данным

5.4. Распределение статистики ²

5.5. Правило проверки гипотезы о законе распределения случайной величины

5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в варианте

0;5 5;10 10;15 15;20 20;25 25;30 30;35 35;40 40;45 45;50 50;55

42 36 21 16 13 10 8 5 4 3 2

1. Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот

i – порядковый номер;

Ii – интервал разбиения;

xi – середина интервала Ii;

ni – частота (количество результатов наблюдений, принадлежащих данному интервалу Ii);

wi = - относительная частота (n = - объём выборки);

Hi = - плотность относительной частоты (h – шаг разбиения, т.е. длина интервала Ii).

i Ii xi ni wi Hi

1 2 3 4 5 6

7 8 9 10 11 0;5

5;10 10;15 15;20

20;25

25;30 30;35 35;40

40;45 45;50 50;55 2,5

7,5 12,5 17,5 22,5

27,5

32,5 37,5 42,5

47,5 52,5 42 36

21 16 13 10 8

5 4

3 2 0,2625 0,225

0,13125 0,1 0,08125

0,0625 0,05 0,03125

0,025

0,01875 0,0125 0,0525

0,045 0,02625 0,02

0,01625 0,0125 0,01

0,00625

0,005 0,00375 0,0025

Объём выборки:

n = =160,

wi = ni/160;

контроль: =1

Длина интервала

разбиения (шаг):

h = 5,

Hi =

 : 160 1,00000

Статистическим распределением называется соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами. Интервальное распределение – это наборы троек (Ii ; ni ; wi) для всех номеров i, а точечное – наборы троек (xi ; ni ; wi). Таким образом, в таблице имеются оба – и интервальное, и точечное - статистическое распределения.

Далее, строим полигон и гистограмму относительных частот.

Полигон относительных частот

Гистромма относительных частот

Полигон относительных частот – ломаная, отрезки которой последовательно (в порядке возрастания xi) соединяют точки (xi;wi). Гистограмма относительных частот – фигура, которая строится следующим образом: на каждом интервале Ii, как на основании, строится прямоугольник, площадь которого равна относительной частоте wi; отсюда следует, что высота этого прямоугольника равна Hi = wi/h – плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.

2. Нахождение точечных оценок математического ожидания и дисперсии

В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:

- для математического ожидания

= (выборочная средняя),

- для дисперсии

s2 = (исправленная выборочная),

где n – объём выборки, ni – частота значения xi .

Таким образом, в статистических расчетах используют приближенные равенства

MX  , DX  s2.

Нахождение точечных оценок математического ожидания и дисперсии по данным варианта осуществим с помощью расчетной таблицы.

i xi ni xi ni (xi - )2 ni

1 2 3 4 5

6 7 8 9 10 11 2,5

7,5 12,5 17,5 22,5

27,5

32,5 37,5 42,5

47,5 52,5 42 36

21 16 13 10 8

5 4

3 2 105 270 262,5

280 292,5 275 260

187,5 170 142,5

105 6241.04

1861.06 100.72 126.34

792.95 1640.96 2537.57

2601.48 3093.58

3229.49

2859.19

= =

xini/160 = 2350/160=14.69

s2 = =

= 25083.77/159 ≈ 157.8

 : 160 2350 25083.77

3. Выдвижение гипотезы о распределении случайной величины

При выдвижении гипотезы (предположения) о законе распределения изучаемой случайной величины мы опираемся лишь на внешний вид статистического распределения. Т.е. будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей.

Итак, изобразим график и выпишем формулу плотности с параметрами λ и хₒ, где λ>0, -x+:

Сравнение построенной гистограммы и графика плотности распределения приводит к следующему заключению о предполагаемом (теоретическом) законе распределения в рассматриваемом варианте исходных данных:

Вариант 12 – показательное (или экспоненциальное распределение)

4. Построение графика теоретической плотности распределения

Чтобы выписать плотность теоретического (предполагаемого) распределения, нужно определить значения параметров λ и xₒ и подставить их в соответствующую формулу.

Все параметры тесно связаны с числовыми характеристиками случайной величины, т.е.

MX = (1+хₒ)/λ,

DX = 1/λ² Поскольку значения математического ожидания и дисперсии неизвестны, то их заменяют соответствующими точечными оценками, т.е. используют (уже упомянутые ранее) приближенные равенства MX  , DX  s2 , что позволяет найти значения параметров распределения.

По исходным данным была выдвинута гипотеза о показательном распределении изучаемой случайной величины. Найдем параметры этого распределения:

= (1+хₒ)/λ, хₒ =( -1)/λ, xₒ= -s = 2.09

s2= 1/λ2 s =1/λ λ=1/s= 0.079

Следовательно, плотность предполагаемого распределения задается формулой

0.079e при х≥2,09,

f(x)=

0 при ххₒ (т.е. значение в серединах интервалов, больших хₒ). Для этого воспользуемся следующей схемой (ниже х=хₒ или х=хᵢ, где хᵢ>хₒ):

x →u =λ(x -xₒ) =0.079(x -2.09) → e →f(x )=λe =0.079e ;

значения фунцкии e при u=u находятся с помощью таблицы, имеющейся в любом учебнике или задачнике по теории вероятностей и математической статистике.

λ=0,079; хₒ = 2,09

xi u =λ(x -xₒ) e f(x ) =λe

2,09

2,5 7,5 12,5 17,5

22,5 27,5 32,5

37,5 42,5 47,5

52,5 0.00

0.03 0.43 0.82

1.22 1.61 2.01

2.4 2.8 3.19 3.59

3.98 1,00

0.97 0.65 0.44

0.3 0.2 0.13 0.09

0.06 0.04 0.03

0.02 0.079

0.077 0.051 0.035

0.024 0.016 0.010

0.007 0.005 0.003

0.002

0.001 Далее, на одном чертеже строим гистограмму и график теоретической плотности распределения: гистограмма была построена ранее, а для получения графика плотности наносим точки с координатами (x ; f(x )) и соединяем их плавной кривой.

5. Проверка гипотезы о распределении с помощью критерия согласия Пирсона

Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:

1) Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.

2) Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений.

Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion – средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо.

Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием 2 («хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.)

Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма.

Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.

5.1 Группировка исходных данных

Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через I количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что I = n.

Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:

1) количество n опытов достаточно велико, по крайней мере n100;

2) в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i 5 при любом i; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.

Пусть концами построенного разбиения являются точки zi , где z1  z2  …  zi – 1 , т.е. само разбиение имеет вид

(-   z0; z1) ,  z1; z2) ,  z2; z3) , … ,  zi – 1; zi   ).

После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +  (поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:

zi –1; zi - ; 5 5;10 10;15 15;20 20;25 25;30 30;35 35;40 40; +∞

i 42 36 21 16 13 10 8 5 9

5.2. Вычисление теоретических частот

Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты I определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее , находятся с помощью равенства

= n  pi ,

где n – количество испытаний, а pi   zi –1  x  zi - теоретическая вероятность попадания значений случайной величины в i-й промежуток (1  i  1). Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.

Здесь принята гипотеза о показательном распределении случайной величины. В этом случае теоретическая вероятность Рᵢ при любом i вычисляется по одной из следующих формул (в зависимости от взаимного расположения i-го промежутка и числа хₒ):

рᵢ=0, если zᵢ≤xₒ (т.е. i-й промежуток

расположен левее хₒ);

рᵢ=1-е , если zi-1≤xₒ

Показать полностью…
Похожие документы в приложении