Всё для Учёбы — студенческий файлообменник
1 монета
doc

Курсовая «Статистические методы обработки экспериментальных данных» по Теории вероятностей и математической статистике (Спиридонов М. Я.)

1. Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот.

Статистические распределения, а также используемые при построении гисто-граммы плотности относительных частот приведены в таблице 1. В этой таблице использованы следующие обозначения:

i – порядковый номер;

– интервал разбиения;

– середина интервала ;

– частота (количество результатов наблюдений, принадлежащих данному интервалу );

– относительная частота ( – объем выборки);

– плотность относительной частоты (h – шаг разбиения).

Объем выборки = 100, .

Контроль: .

Длина интервала разбиения (шаг) h = 3, .

Таблица 1

i

1 2 3 4 5 6

7 8

9 10 11 0; 3 3; 6

6; 9 9; 12 12; 15

15; 18 18; 21 21; 24

24; 27

27; 30 30; 33 1,5

4,5 7,5 10,5 13,5

16,5 19,5 22,5

25,5

28,5 31,5 4 6 9

11 14 18 13 11

7 4 3 0,04 0,06

0,09

0,11 0,14 0,18

0,13 0,11 0,07

0,04 0,03 0,01 0,02

0,03

0,04 0,05 0,06

0,04 0,04 0,02

0,01 0,01 100 1,00

Статистическим распределением называется соответствие между результата-ми наблюдений (измерений) и их частотами и относительными частотами. Интер-вальное распределение – это наборы троек ( ) для всех номеров i, а точечное – наборы троек ( ).

Таким образом, в таблице имеются оба – и интервальное, и точечное – стати-стических распределений.

Полигоном относительных частот называется ломаная, отрезки которой после-довательно (в порядке возрастания ) соединяют точки ( ). Строим полигон относительных частот (рис. 1).

Р и с. 1. Полигон относительных частот

Гистограммой относительных частот называется фигура, которая строится сле-дующим образом: на каждом интервале , как на основании, строится прямоуголь-ник, площадь которого равна относительной частоте ; отсюда следует, что высота этого прямоугольника равна - плотности относительной частоты. Строим гистограмму относительных частот (рис. 2):

Р и с. 2. Гистограмма относительных частот

2. Нахождение точечных оценок математического ожидания и дисперсии. В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:

- для математического ожидания

(выборочная средняя),

- для дисперсии

(исправленная выборочная дисперсия),

Таким образом, в статистических расчетах используют приближенные равенст-ва

, .

Нахождение точечных оценок математического ожидания и дисперсии по дан-ным осуществляем с помощью расчетной таблицы 2.

Таблица 2

1 1,5 4 6 829,44

2 4,5 6 27 779,76

3 7,5 9 67,5 635,04

4 10,5 11 115,5 320,76

5 13,5 14 189 80,64

6 16,5 18 297 6,48

7 19,5 13 253,5 168,48

8 22,5 11 247,5 479,16

9 25,5 7 178,5 645,12

10 28,5 4 114 635,04

11 31,5 3 94,5 730,08

: 100 1590 5310

3. Выдвижение гипотезы о распределении случайной величины. При вы-движении гипотезы (предположения) о законе распределения изучаемой случайной величины будем опираться лишь на внешний вид статистического распределения.

А именно, будем руководствоваться тем, что профиль графика плотности теоретиче-ского распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей.

Изобразим график и формулу плотностей:

Нормальное (или гауссовское) распределение с параметрами а и , где - ; > 0 ;

(здесь e=2.71828…

3.14159… )

4. Построение графика теоретической плотности распределения. Чтобы выписать плотность теоретического (предполагаемого) распределения, нужно опре-делить значения параметров (a и для нормального) и подставить их в соответст-вующую формулу.

Все параметры распределений тесно связаны с числовыми характеристиками случайной величины. Соответствующие формулы для нормального распределения приведены ниже:

Поскольку значения математического ожидания и дисперсии неизвестны, то их заменяют точечными оценками, то есть используют приближенные равенства

, ,

что позволяет найти значения параметров распределения.

По исходным данным варианта была выдвинута гипотеза о нормальном рас-пределении изучаемой случайной величины. Найдем параметры этого распределе-ния:

Следовательно, плотность предполагаемого (нормального) распределения зада-ется формулой:

Теперь необходимо вычислить значения теоретической плотности при (в серединах интервала) . Для этого воспользуемся следующей схемой (ниже или , где ):

;

Значения функции

при находятся с помощью таблицы (при этом следует учесть, что а при можно считать ).

Приведенная выше схема вычисления реализована в таблице 3.

Таблица 3

1,5 - 1,97 0,0573 0,008

4,5 - 1,56 0,1177 0,016

7,5 - 1,15 0,2062 0,028

10,5 - 0,74 0,3045 0,042

13,5 - 0,33 0,3795 0,052

16,5 0,08 0,3871 0,053

19,5 0,49 0,3538 0,048

22,5 0,90 0,2648 0,036

25,5 1,31 0,1688 0,023

28,5 1,72 0,0908 0,012

31,5 2,13 0,0412 0,006

Строим гистограмму и график теоретической плотности распределения, для которого наносим точки с координатами и соединяем их плавной кривой.

Рис. 3. Гистограмма теоретической плотности

Рис. 4. График теоретической плотности

5. Проверка гипотезы о распределении с помощью критерия согласия Пирсона. Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограммы) и предполагаемо теоретического (графика плотности) показывает наличие некото-рых расхождений между ними. На вопрос чем объяснить эти несовпадения можно ответить двояко:

1. Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т. п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.

2. Указанные расхождения являются существенными (неслучайными) и связа-ны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся с данными наблюдений.

Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Существуют различные критерии согласия. Будем рассмат-ривать критерий Пирсона, который выгодно отличается от остальных, во-первых, применимостью к любым (дискретным, непрерывным) распределениям и, во-вторых, простотой вычислительного алгоритма.

5.1. Группировка исходных данных. Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что .

Отметим, что критерий будет давать удовлетворительный для практиче-ских приложений результат, если:

1) количество n опытов достаточно велико, по крайней мере ;

2) в каждом промежутке окажется не менее 5…10 результатов измерений, то есть при любом i; если количество полученных значений в отдельных проме-жутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.

Пусть концами построенного разбиения являются точки ,где , то есть само разбиение имеет вид

.

Интервальные распределения, пригодные для непосредственного применения критерия Пирсона видны из таблицы 4:

Таблица 4

6;9 9;12 12;15 15;18 18;21 21;24 24;27

10 9 11 14 18 13 11 7 7

5.2. Вычисление теоретических частот. Критерий Пирсона основан на срав-нении эмпирических (опытных) частот с теоретическими. Эмпирические частоты определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее через , находятся с помощью равенства

, где n – количество испытаний, а - теоретическая вероятность попадания значений случайной величины в i-й промежуток . Теоретиче-ские вероятности вычисляются в условиях выдвинутой гипотезы о законе распреде-ления изучаемой случайной величины.

В нашем случае принята гипотеза о нормальном распределении случайной ве-личины вычисляется по формуле:

где: - выборочная средняя; - исправленная выборочная дисперсия:

- функция Лапласа

Процедура отыскания теоретических вероятностей и частот показана в расчет-ной таблице 5.

Таблица 5

Концы промежутков Аргументы

функции

Значения

функции

1

6 -1,35 -0,5000 -0,4115 0,0885 8,85

2 6 9 -1,35 -0, 94 -0,4115 -0,3264 0,0851 8,51

3 9 12 -0,94 -0,53 0,3264 -0,2019 0,1245 12,45

4 12 15 -0,53 -0,12 -0,2019 -0,0478 0,1541 15,41

5 15 18 -0,12 0,29 -0,0478 0,1141 0,1619 16,19

6 18 21 0,29 0,7 0,1141 0,2580 0,1439 14,39

7 21 24 0,7 1,1 0,2580 0,3643 0,1063 10,63

8 24 27 1,1 1,52 0,3643 0,4357 0,0714 7,14

9 27

1,52 0,4357 +0,5000 0,0643 6,43

: 1 100

5.3. Статистика и вычисление ее значения по опытным данным. Для того, чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределений.

В критерии Пирсона в качестве такой меры расхождения используется величи-на

,

называемая статистикой “хи-квадрат” или статистикой Пирсона.

Вычислим ее значение для нашего варианта:

Таблица 6

1 10 8,85 0,15

2 9 8,51 0,03 3 11 12,45 0,17

4 14 15,41 0,13 5 18 16,19 0,20

6 13 14,39 0,13 7 11 10,63 0,01

8 7 7,14 0,27

9 7 6,43 0,49 : 100 100 0,87

5.4. Правило проверки гипотезы о законе распределения случайной вели-чины с помощью - критерия Пирсона:

1) Проводят n независимых наблюдений случайной величины (принято считать ).

2) Разбивают всю числовую ось на несколько (на 8…12) промежутков

Так, чтобы количество результатов измерений в каждом из них (называемое эмпирической частотой ) оказалось не менее пяти (то есть при каждом i).

3) Выдвигают гипотезу о законе изучаемой случайной величины и находят па-раметры этого закона.

4) С помощью предполагаемого (теоретического) распределения находят тео-ретические вероятности и теоретические частоты попадания значений случайной величины в i-й промежуток.

5) По эмпирическим и теоретическим частотам вычисляют значение статисти-ки , обозначаемое через .

6) Определяют число r степеней свободы.

7) Используя заданное значение уровня значимости и найденное число r степеней свободы, по таблице находят критическое значение .

8) Формулируют вывод, опираясь на основной принцип проверки статистиче-ских гипотез:

- если наблюдаемое значение критерия принадлежит критической области, то есть если , то гипотезу отвергают как плохо согласующуюся с результа-тами эксперимента;

- если наблюдаемое значение критерия принадлежит области принятия гипоте-зы, то есть если , то гипотезу принимают как не противоречащую ре-зультатам эксперимента.

5.5. Вывод о соответствии выдвинутой гипотезы и опытных данных. Пра-вило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины реализовано в таблице 7.

Таблица 7

Название величины Обозначение и числовое значение

величины

Уровень значимости (задан в условии)

Количество промежутков разбиения l=9

Число степеней свободы r=6

Критическое значение (наход-ся по таблице) =12,57

Наблюдаемое значение критерия

Вывод Гипотеза принимается поскольку

Показать полностью…
Похожие документы в приложении