Всё для Учёбы — студенческий файлообменник
1 монета
doc

Курсовая «Статистические методы обработки экспериментальных данных» по Математике (Климова М. А.)

Факультет полиграфической техники и технологии

Дисциплина: Математика

Курсовая работа по теме

«Статистические методы обработки

экспериментальных данных»

Выполнил: студент Кузьмина Д.С.

курс 2 группа ДТпп-2-1

форма обучения дневная

Номер зачётной книжки ПД-141

Вариант № 10

Допущено к защите

Дата защиты

Результат защиты

Подпись преподавателя

Москва – 2010

Вариант № 10

Исходные данные к курсовой работе:

1;3 3;5 5;7 7;9 9;11 11;13 13;15 15;17 17;19 19;21 21;23

26 24 21 20 13 8 8 4 3 2 1

1. Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот

Статистическое распределение – соответствие между результатами наблюдений и их частотами и относительными частотами.

Интервальное распределение – наборы троек (Ii, ni, wi) для всех номеров i, а точечное – наборы троек(xi, ni, wi).

Полигон относительных частот — ломаная, отрезки которой в порядке возрастания xi соединяют точки (xi ;w).

Гистограмма относительных частот — фигура, которая строится следующим образом: на каждом интервале Ii, как на основании строится прямоугольник, площадь которого равна относительной частоте wi; отсюда следует, что высота этого прямоугольника равна – плотности относительной частоты.

Полигон и гистограмма являются формами графического изображения статистического распределения.

В работе используются следующие обозначения:

i - порядковый номер;

Ii - интервал разбиения;

xi - середина интервала Ii;

ni - частота (количество результатов наблюдений, принадлежащих данному интервалу Ii;

– относительная частота ( - объем выборки);

– плотность относительной частоты (h - шаг разбиения, т.е. длина интервала Ii);

Таблица 1

i Ii xi ni Wi Hi

1 1;3 2 26 0,2 0,1

2 3;5 4 24 0,1846 0,0923

3 5;7 6 21 0,1615 0,0807

4 7;9 8 20 0,1538 0,0769

5 9;11 10 13 0,1 0,05

6 11;13 12 8 0,0615 0,0307

7 13;15 14 8 0,0615 0,0307

8 15;17 16 4 0,0307 0,0153

9 17;19 18 3 0,0235 0,0117

10 19;21 20 2 0,0153 0,0076

11 21;23 22 1 0,0076 0,0038

∑:130 1,0000

2. Нахождение точечных оценок математического ожидания и дисперсии

В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:

— для математического ожидания

(выборочная средняя);

–– для дисперсии

(исправленная выборочная дисперсия),

где n – объем выборки, ni – частота значения xi.

Таким образом, в статистических расчетах используют приближенные равенства , .

Таблица 2

i 1 2 26 52 735,86

2 4 24 96 264,53

3 6 21 126 36,59

4 8 20 160 9,25 5 10 13 130 93,37

6 12 8 96 175,22

7 14 8 112 356,98

8 16 4 64 301,37

9 18 3 54 342,18

10 20 2 40 321,56

11 22 1 22 215,5

 : 130  : 952 : 2852,41

n = =130;  = 952

3. Выдвижение гипотезы о распределении случайной величины

При выдвижении гипотезы о законе распределения изучаемой случайной величины мы опираемся на внешний вид статистического распределения. А именно, руководствуемся тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы. Для этого мы середины верхних сторон прямоугольников, образующих гистограмму, соединяем плавной кривой. Эта линия представляет график плотности распределения вероятностей.

Для сравнения приведем графики и выпишем формулы плотностей трех основных распределений – нормального, показательного и равномерного.

а) Нормальное (или гауссовское) распределение с параметрами «а» и « », где σ>0:

Где =2,71828…=lim π=3.14159…

б) Показательное (или экспоненциальное) распределение с параметрами и , где ,

при при

в) Равномерное распределение на отрезке [А; В], где

при

при x<A и x>B

(λ=0,21; x0=2.62) Таблица 3

2,62 0 1,0000 0,2100

4 0,29 0,7483 0,1571

6 0,71 0,4916 0,1032

8 1,13 0,3230 0,0678

10 1,55 0,2122 0,0445

12 1,97 0,1394 0,0292

14 2,39 0,0916 0,0192

16 2,81 0,0602 0,0126

18 3,23 0,0395 0,0083

20 3,65 0,0259 0,0054

22 4,07 0,0171 0,0036

Далее, на одном чертеже строим гистограмму и график теоретической плотности распределения: гистограмма была построена ранее, а для получения графика плотности наносим точки с координатами (xj; f(xj)) и соединяем их плавной кривой.

5. Проверка гипотезы о распределении с помощью критерия согласия Пирсона.

Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:

1) Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.

2) Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений.

Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий как признак, на основании которого производится оценка, определение и классификация чего-либо.

Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием 2.

Критерий Пирсона выгодно отличается от остальных,

во–первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма.

Правило проверки статистических гипотез с помощью критерия Пирсона объясним на примерах.

5.1. Группировка исходных данных

Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через i результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что i = n.

Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:

1) количество n опытов достаточно велико, по крайней мере n100;

2) в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i 5 при любом i; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.

Пусть концами построенного разбиения являются точки zi,

где z1  z2  …  z1 – i , т.е. само разбиение имеет вид

(-   z0; z1) ,  z1; z2) ,  z2; z3) , … ,  zi – 1 ; zi   ).

После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +  (поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:

-;3 3;5 5;7 7;9 9;11 11;13 13;15 15; +

26 24 21 20 13 8 8 10

5.2. Вычисление теоретических частот

Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты I определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее , находятся с помощью равенства

= n  pi ,

где n – количество испытаний, а pi   zi –1  x  zi - теоретическая вероятность попадания значений случайной величины в i-й промежуток (1  i  1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.

В данном варианте принята гипотеза о показательном распределении случайной величины. В этом случае теоретическая вероятность pi при любом i вычисляется по одной из следующих трех формул (в зависимости от взаимного расположения i-го промежутка и числа x0):

pi=0, если zi x0, (т.е. i-ый промежуток расположен левее x0);

pi=1-е-λ(zi- x0), если zi-1 x0< zi (т.е i-ый промежуток содержит x0);

pi=1-е-λ(zi-1- x0) – е-λ(zi- x0), если x0< zi-1 (т.е. i-ый промежуток расположен правее x0).

Таблица 4

i Концы промежутков ui-1= λ(zi-1- x0)

(при x0< zi-1) ui= λ(zi- x0)

(при x0< zi) е-ui-1 е-ui pi= е-ui-1 – е-ui ν’ = n  pi ,

zi -1 zi

1 - 3 0,00 0,08 1,0000 0,9231 0,0769 9,997

2 3 5 0,08 0,50 0,9231 0,6065 0,3166 41,158

3 5 7 0,50 0,92 0,6065 0,3985 0,2080 27,04

4 7 9 0,92 1,34 0,3985 0,2618 0,1367 17,771

5 9 11 1,34 1,76 0,2618 0,1720 0,0898 11,674

6 11 13 1,76 2,18 0,1720 0,1130 0,059 7,67

7 13 15 2,18 2,60 0,1130 0,0742 0,0388 5,044

8 15 + 2,60 + 0,0742 0,0000 0,0742 9,646

 : 1,0000  : 130

5.3 Статистика 2 и вычисление ее значения по опытным данным

Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения.

В критерии Пирсона в качестве такой меры расхождения используется величина

,

называемая статистикой «хи - квадрат» или статистикой Пирсона (вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что всегда 2 , причем 2 = 0, тогда и только тогда, когда при каждом i , т.е. когда все соответствующие эмпирические и теоретические частоты совпадают. Во всех остальных случаях 2 ; при этом значение 2 тем больше, чем больше различаются эмпирические и теоретические частоты.

Прежде чем рассказать о применении статистики 2 к проверке гипотезы о законе распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через 2набл..

Таблица 5

i i

1 26 9,99 25,66

2 24 41,16 7,15 3 21 27,06 1,36

4 20 17,77 0,28 5 13 11,67 0,15

6 8 7,67 0,01

7 8 5,04 1,74 8 10 9,64 0,01

 : 130  : 130  : 36,36

5.4. Распределение статистики 2

Случайная величина имеет 2 – распределение с r степенями свободы (r = 1; 2; 3; …), если ее плотность имеет вид

где cr – которая положительная постоянная ( cr определяется из равенства ).

Для дальнейшего изложения важно лишь отметить, что, во – первых, распределение определяется одним параметром – числом r степеней свободы и, во – вторых, существуют таблицы, позволяющие произвольно найти вероятность попадания значений случайной величины в любой промежуток.

Вернемся теперь к статистике . Отметим, что она является случайной величиной, поскольку зависит от результатов наблюдений и, следовательно, в различных сериях опытов принимает различные, заранее не известные значения. Понятно, кроме того, закон распределения статистики зависит: 1) от действительного (но неизвестного нам) закона распределения случайной величины, измерения которой осуществляются (им определяются эмпирические частоты ) ; 2) от количества произведенных наблюдений (от числа n) и от способа разбиения числовой оси на промежутки (в частности, от числа i ); 3) от теоретического (выдвинутого в качестве гипотезы) закона распределения изучаемой случайной величины (им определяются теоретические вероятности pi и теоретические частоты = n  pi )

Если выдвинутая гипотеза верна, то очевидно, закон распределения статистики зависти только от закона распределения изучаемой случайной величины, от числа n и от выбора промежутков разбиения. Но на самом же деле, в этом случае (благодаря подобранному Пирсоном выражению для ) справедливо куда более серьезное утверждение. А именно, при достаточно больших n закон распределения статистики практически не зависит от закона распределения изучаемой случайной величины и ни от количества n произведенных опытов: при распределение статистики стремится к - распределению с r степенями свободы. Эта теорема объясняет, почему статистика Пирсона обозначается через .

Если в качестве предполагаемого выбрано одно их трех основных непрерывных распределений (нормальное, показательное или равномерное), то r = i – 3, где i – количество промежутков, на которые разбита числовая ось (количество групп опытных данных). В общем случае

где - количество параметров предполагаемого (теоретического) распределения, которые заменены вычисленными по опытным данным оценками.

Т.е. в данном варианте после группировки исходных данных получаем количество промежутков разбиения i = 11, = 3, т.к. количество параметров предполагаемого (теоретического) распределения, которые заменены вычисленными по опытным данным оценками, = 2 – это а и  для нормального распределения.

Следовательно

r = i- -1=11-3-1=7

Показать полностью…
Похожие документы в приложении