Всё для Учёбы — студенческий файлообменник
1 монета
docx

Лабораторная № 1 «Автоматизированный априорный анализ статистической совокупности в среде Excel» по Теории вероятностей и математической статистике (Пуляшкин В. В.)

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

ОТЧЕТ

О результатах выполнения компьютерной лабораторной работы № 1

"Автоматизированный априорный анализ статистической совокупности в среде MS Excel"

Вариант № 93

Выполнила: Катаева Евгения

Студентка 3 курса (ФНО), 5 гр. (ЭГ)

Специальность: "Бух. учет, анализ и аудит"

Номер зачетной книжки: 06УБД44093

Проверила: Брыкина Г. С.

Омск - 2009

Постановка задачи.

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции - как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процесса Excel в диапазоне ячеек В4:С35.

Таблица 1. Исходные данные.

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности

1. Выявить наличие среди исходных данных резко выделяющихся значений признаков ("выбросов" данных) с целью исключения из выборки аномальных единиц наблюдения.

2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую, моду, медиану, размах вариации, дисперсию, средние отклонения - линейное и квадратическое, коэффициент вариации, структурный коэффициент асимметрии К. Пирсона.

3. На основе рассчитанных показателей в предложении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду полученного интервального ряда и сравнить ее с модой несгруппированного ряда данных.

Статистический анализ генеральной совокупности.

1. Рассчитать генеральную дисперсию, генеральное среднее квадратическое отклонение и ожидаемых размах вариации признаков. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2. Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P = 0,683, P = 0,954, P = 0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3. Рассчитать коэффициенты асимметрии и эксцесса. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

Экономическое содержание задач статистического наблюдения.

1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?

- Построить точечный график-диаграмму рассеяния значений показателей.

- Выделить область диаграммы, отражающую группирование предприятий с близкими по значению показателями.

- выявить предприятия с резко выделяющимися характеристиками и исключить их из проводимого статистического исследования вследствие нетипичности (аномальности) этих предприятий для изучаемой совокупности.

Аномальные значения показателей являются предметом отдельного исследования.

2. Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных фондов и выпуска продукции?

- Рассчитать среднюю арифметическую значений каждого из показателей, а также среднее квадратическое отклонение.

- Установить, какие предприятия входят в диапазон (), включающий предприятия с наиболее характерными значениями показателей.

3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?

- Рассчитать коэффициенты вариации, используя вычисленные среднюю арифметическую и среднее квадратическое отклонение.

- Установить (по значению коэффициента вариации), насколько предприятия однородны по изучаемым экономическим характеристикам.

-Определить максимальное расхождение в значениях показателей (размах вариации).

4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показателя? Какие именно это предприятия?

- Произвести группировку (построить ряд распределения) предприятий по стоимости основных фондов.

- Найти модальный интервал и определить входящие в него предприятия (наиболее типичные).

- Установить, какие предприятия входят в группы с наименьшей и наибольшей стоимостью основных фондов.

- Определить удельный вес предприятий модального интервала и интервалов с наибольшими и наименьшими значениями показателя.

5. Носит ли распределение предприятий по группам закономерный характер, и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?

- Построить гистограмму ряда распределения и визуально установить, имеется ли в распределении определенная закономерность.

- В случае, если распределение близко к нормальному, рассчитать показатель асимметрии, по знаку которого определить, доминируют ли в совокупности предприятия с более высокой или с более низкой стоимостью основных фондов.

6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях показателя можно ожидать?

- Рассчитать предельную ошибку средней для каждого из показателей.

- Определить границы, в которых будут находиться средние значения показателей.

- Определить ожидаемый размах вариации показателей.

Рис. 1. Диаграмма рассеяния.

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12 1640,00 4125,00

31 5215,00

1375,00 Таблица 2. Аномальные единицы наблюдения.

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1 2960,00 2832,50

2 3482,50 3107,50

3 3592,50 3465,00

4 3785,00

3850,00 5 2465,00

1925,00 6 3977,50

3300,00 7 4087,50

4455,00

8 3070,00 3025,00

9 3757,50 3547,50

10 4335,00 4427,50

11 4747,50

4675,00 13 3620,00

3685,00 14 3977,50

4015,00 15 4555,00

4867,50

16 5215,00 5225,00

17 3895,00 3520,00

18 4307,50 4180,00

19 3427,50

2612,50 20 4362,50

3575,00 21 4857,50

4812,50 22 3345,00

2722,50

23 2657,50 2557,50

24 4445,00 4097,50

25 3977,50 3575,00

26 3702,50

3382,50 27 2877,50

2200,00 28 3867,50

3437,50 29 4472,50

3767,50

30 4252,50 3575,00

32 3125,00 3190,00

Таблица 2.1. Исходные данные после удаления аномальных значений.

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Столбец 1

Столбец 2

Среднее

3840 Среднее

3586,916667

Стандартная ошибка

121,4402909 Стандартная ошибка

144,8678393 Медиана

3881,25

Медиана 3561,25

Мода 3977,5

Мода 3575 Стандартное отклонение

665,1558671

Стандартное отклонение

793,4738342 Дисперсия выборки

442432,3276 Дисперсия выборки

629600,7256

Эксцесс -0,344943844

Эксцесс -0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448 Интервал

2750 Интервал

3300

Минимум 2465

Минимум 1925

Максимум

5215

Максимум

5225 Сумма

115200 Сумма

107607,5

Счет 30 Счет

30 Уровень надежности(95,4%)

253,1800598 Уровень надежности(95,4%)

302,0220714

Таблица 3. Описательные статистики.

Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Столбец 1

Столбец 2

Уровень надежности(68,3%)

123,6512071

Уровень надежности(68,3%)

147,5052724 Таблица 4а. Предельные ошибки выборки.

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Столбец 1

Столбец 2

Уровень надежности(99,7%)

393,3949013 Уровень надежности(99,7%)

469,2863374 Таблица 4б. Предельные ошибки выборки.

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Стандартное отклонение

653,9759807 Стандартное отклонение

780,1371897 Дисперсия

427684,5833 Дисперсия

608614,0347

Среднее линейное отклонение

526,1666667 Среднее линейное отклонение

600,9666667 Коэффициент вариации, %

17,0306245

Коэффициент вариации, %

21,74952089 Коэффициент асимметрии

-0,21025237 Коэффициент асимметрии

0,015275091

Таблица 5. Выборочные показатели вариации и асимметрии.

Таблица 6

Карман Частота

1 3015

3 3565 5 4115

11 4665 7 5215

3 Таблица 6. Итоговая таблица интервального вариационного ряда.

Таблица 7

Интервальный ряд распределения предприятий

по стоимости основных производственных фондов

Группы предприятий по стоимости основных фондов

число предприятий в группе

накопленная частость группы

2465 - 3015 4 13,33%

3015 - 3565 5 30,00%

3565 - 4115

11 66,67% 4115 - 4665

7 90,00% 4665 - 5215

3 100,00% итого

30 100,00%

Таблица 7. Интервальный ряд распределения предприятий по стоимости основных производственных фондов.

Рис. 2. Гистограмма.

Задача 1. Количество аномальных единиц 2, информация по ним представлена в таблице №2.

Задача 2.

Таблица 8. Описательные статистики выборочной совокупности.

Задача 3.

А) = 17,03% по среднегодовой стоимости ОПФ.

= 21,75% по выпуску продукции.

0% < 17,03% ? 40%

0% < 21,75% ? 40%

Степень колеблемости обоих признаков незначительная.

Б) 17,03% ? 33%, - совокупность количественно однородна по данному признаку.

21,75% ? 33% - совокупность количественно однородна по данному признаку.

В) - индикатор устойчивости данных, > 0,8 - если неравенство выполняется, то значения признака неустойчивы.

< 0,8 (для среднегодовой стоимости ОПФ)

< 0,8 (для выпуска продукции)

Значит, значения обоих признаков устойчивы.

Г) распределение значений признака по диапазонам рассеяния признака относительно

Границы диапазонов

Количество значений , находящихся в диапазоне

Среднегодовая стоимость ОПФ

Выпуск продукции

Среднегодовая стоимость ОПФ

Выпуск продукции

3186,02 ?? 4493,98

2806,76??4367,04

70% 63,3%

2532,04??5147,96

2026,62??5147,18

93,3% 93,3% 1878,06??5801,94

1246,48??5927,32

100% 100% Таблица 9. Распределение значения признака по диапазонам.

Сопоставим ожидаемое количество попадания значения признака в диапазон с фактическим. Ожидаемое получено по правилу "трех сигм".

Ожидаемое количество

Среднегодовая стоимость ОПФ

Выпуск продукции

68,3% 70% 63,3%

95,4% 93,3% 93,3%

99,7%

100% 100%

Задача 4.

а) По среднегодовой стоимости ОПФ = 653,9759807, значит, в среднем конкретные варианты значения признака отклоняются от среднего значения на величину 654.

D = 427684, 5833.

По выпуску продукции= 780,1371897, значит, в среднем конкретные варианты значения признака отклоняются от среднего значения на величину 780.

D = 608614, 0347.

Так как, значения и D по среднегодовой стоимости ОПФ меньше по величине, чем по выпуску продукции, то совокупность среднегодовой стоимости ОПФ более однородна и средняя величина более типична.

б) = 17,03% по среднегодовой стоимости ОПФ.

= 21,75% по выпуску продукции.

Так как коэффициент вариации среднегодовой стоимости ОПФ меньше, значит, эта совокупность более однородна, чем совокупность по выпуску продукции.

в) По среднегодовой стоимости ОПФ = 17,03% < 40%

По выпуску продукции = 21,75% < 40%.

Следовательно, по обоим признакам средняя величина является надежной характеристикой данной совокупности.

г) По среднегодовой стоимости ОПФ = - 0,21025237,

где - коэффициент асимметрии.

Так как < 0, значит асимметрия правосторонняя.

, значит асимметрия незначительная.

По выпуску продукции = 0,015275091. Так как > 0, значит асимметрия левосторонняя.

, значит асимметрия незначительная.

Распределение по среднегодовой стоимости ОПФ более асимметрично, чем распределение по выпуску продукции.

Задача 5.

Интервальный ряд распределения предприятий

по стоимости основных производственных фондов

Группы предприятий по стоимости основных фондов

число предприятий в группе

накопленная частость группы

2465 - 3015 4 13,33%

3015 - 3565 5 30,00%

3565 - 4115

11 66,67% 4115 - 4665

7 90,00% 4665 - 5215

3 100,00% итого

30 100,00%

Рис. 3. Гистограмма.

По виду гистограммы распределение по среднегодовой стоимости ОПФ близко к нормальному.

Для полученного интервального ряда вычислим моду по формуле:

, где h - величина модального интервала,

- нижняя граница модального интервала,

- частоты в модальном, предыдущем и следующем за модальным интервалах соответственно.

Мода из расчетов описательной статистики равна 3977,5. Значения этих двух показателей различны, т.к. первая рассчитана для интервального вариационного ряда, а вторая для несгруппированного ряда данных.

Задача 6.

Описательные статистики генеральной совокупности.

Среднегодовая стоимость ОПФ

Выпуск продукции

Стандартное отклонение ()

665,1558671 793,4738342

Дисперсия выборки()

442432,3276 629600,7256

Эксцесс (Ек)

-0,344943844 -0,205332365

Асимметричность (Аs)

-0,152503649 0,042954448

Размах вариации ()

2750 3300 Таблица 10. Описательные статистики генеральной совокупности.

Для вычисления генеральной дисперсии по выборочной дисперсии при малом числе наблюдений (особенно при ) используется формула: .

Для среднегодовой стоимости ОПФ:

= =442225,85

Для выпуска продукции.

= =629306,9 Полученные значения приблизительно совпадают со значениями , представленными в таблице 10 по обоим признакам.

Прогнозное значение вычислим по формуле: = 6

Для среднегодовой стоимости ОПФ: =6*653,9759807= 3923,856

Для выпуска продукции: =6*780,1371897= 4680,823

Полученные показатели отличаются от представленных значений в таблице 10, т.к. формулу = 6 можно использовать только для прогнозной оценки размаха вариации признака для нормальных распределений.

Задача 7. Предельные ошибки выборки и ожидаемые границы для генеральных средних.

Доверительная вероятность P

Коэффициент доверия t

Предельные ошибки выборки

Ожидаемые границы для средних

Для среднегодовой стоимости ОПФ

Для выпуска продукции

Для среднегодовой стоимости ОПФ

Для выпуска продукции

0,683

1 123,6512071

147,5052724

0,954 2 253,1800598

302,0220714

0,997

3 393,3949013

469,2863374

Таблица 11. Предельные ошибки выборки и ожидаемые границы для генеральных средних.

Определим среднюю ошибку выборки по формуле: (при n).

(для среднегодовой стоимости ОПФ)

(для выпуска продукции)

Предельную ошибку выборки вычислим по формуле .

для среднегодовой стоимости ОПФ:

при t=1 при t=2

при t=3 для выпуска продукции:

при t=1 при t=2

при t=3

Задача 8.

для среднегодовой стоимости ОПФ:

Асимметричность (Аs) -0,152503649

, значит асимметрия незначительная.

Эксцесс (Ек) -0,344943844

незначительно отличается от нуля.

Это указывает на умеренную величину асимметрии. Можно предположить, что распределение единиц генеральной совокупности будет близко к нормальному

для выпуска продукции:

Асимметричность (Аs) 0,042954448

, значит асимметрия незначительная.

Эксцесс (Ек) -0,205332365

незначительно отличается от нуля.

Значит, величина асимметрии умеренная, и можно предположить, что распределение единиц генеральной совокупности будет близко к нормальному.

Экономическая интерпретация статистического исследования предприятия.

1. На основании построенной диаграммы рассеяния (рис.1) можно сделать следующие выводы:

Предприятия типичны по своим экономическим показателям, исключение составляют два предприятия: со среднегодовой стоимостью ОПФ 1640 млн. руб. и 5125 млн. руб.; выпуском продукции на сумму 4125 млн. руб. и 1375 млн. руб. соответственно. Эти предприятия были исключены из изучаемой совокупности.

Рис. 4. Точечный график-диаграмма рассеяния значений показателей.

2. Наиболее характерное значение показателя среднегодовая стоимость основных фондов - 3840 млн. руб. У предприятий с наиболее характерными значениями показателя среднегодовая стоимость ОПФ, значения этого показателя лежат в интервале 3186,02 ?? 4493,98. Наиболее характерное значение показателя выпуск продукции - 3586,90 млн. руб. Величина выпуска продукции лежит в интервале 2806,76??4367,04 (для предприятий с наиболее характерными значениями показателя - выпуск продукции).

3. Возьмем данные о коэффициенте вариации из таблицы 8: для среднегодовой стоимости ОПФ - 17,03% и для выпуска продукции 21,75%. Так как эти значения меньше 33%, можно сказать, что предприятия однородны по изучаемым экономическим характеристикам. Максимальное расхождение в значениях показателей: по среднегодовой стоимости ОПФ - 2750 млн. руб., по выпуску продукции - 3300 млн. руб. (по данным таблицы 3).

4. Наиболее часто встречаются предприятия со среднегодовой стоимостью ОПФ в пределах 3565 - 4115 (млн. руб.). Число таких предприятий 11 их, удельный вес составляет 11/30=0,366. Предприятия со среднегодовой стоимостью ОПФ в пределах 2465 - 3015 (млн. руб.) входят в группу предприятий с наименьшей среднегодовой стоимостью ОПФ. Число таких предприятий 4, т.е. их удельный вес составляет 4/30=0,133.

Предприятия со среднегодовой стоимостью ОПФ в пределах 4665 - 5215 (млн. руб.) входят в группу предприятий с наибольшей среднегодовой стоимостью ОПФ. Число таких предприятий 3, т.е. их удельный вес составляет 3/30=0,1.

5. Распределение предприятий по группам носит закономерный характер, судя по виду гистограммы (рис. 1), распределение близко к нормальному. В совокупности доминируют предприятия с более низкой стоимостью основных фондов, т.к. коэффициент асимметрии - 0,21 отрицателен.

6. В таблице 11 приведены предельные ошибки средней для каждого из показателей. С доверительной вероятностью 0,954 можно утверждать, что ожидаемая средняя величина среднегодовой стоимости ОПФ для корпорации в целом будет лежать в пределах: т. е. 4082,88.

Можно ожидать максимальное расхождение в значениях показателя равное 3923,856.

Для выпуска продукции по корпорации в целом с доверительной вероятностью 0,954 можно утверждать, что ожидаемая средняя величина будет лежать в пределах: , т.е. . Ожидаемое максимальное расхождение в значениях показателя выпуск продукции - 4680,823.

5

Показать полностью…
Похожие документы в приложении