Лабораторная работа: Статистические методы обработки данных



Лабораторная
работа № 2
ПРОВЕРКА
СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Цель: Ознакомиться с методом проверки
основных статистических гипотез, используемых в экономике, с помощью ЭВМ.
1.
ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ (КРИТЕРИЙ СОГЛАСИЯ)
Используется для проверки
предположения о том, что полученные в результате наблюдений данные
соответствуют нормам. Рассматривается гипотеза о том, что отклонения от норм
невелики, и ими можно пренебречь. При этом задается доверительная вероятность p которая имеет смысл вероятности не
ошибиться при принятии гипотезы. Рассмотрим проверку на примере.
ПРИМЕР: 1. при производстве микросхем
процессоров используются кристаллы кварца. Стандартом предусмотрено, чтобы 50%
образцов не было обнаружено ни одного дефекта кристаллической структуры, у 15%
- один дефект, у 13% - 2 дефекта, у 12% - 3 дефекта, у 10% более 3 дефектов.
При анализе выборочной партии оказалось, что из 100 экземпляров распределение
по дефектам партии оказалось, что из 1000 экземпляров распределение по дефектам
следующего (вариант соответствует ЭВМ): Можно ли с вероятностью 0,99 считать,
что партия соответствует стандарту?
Введем в А1 заголовок
«НОРМА» и ниже в А2-А6 показатели – числа 500, 150, 130, 120, 100. в ячейку В1
введем заголовок «НАБЛЮДЕНИЯ» и ниже в В2-В6 наблюдаемые показатели 516, 148,
131, 110, 95. в третьем столбце вводятся формулы для критерия: С1 заголовок
«КРИТЕРИЙ», в С2 формулу «=(А2-В2)*(А2-В2)/А2». Автозаполнением размножим эту
формулу на С3-С6. в ячейку С7 запишем общее значение критерия – сумму столбца
С2-С6. для этого поставим курсор в С6 и вызвав функцию в категории
«Математический» найдем СУММ и в аргументе «Число 1» укажем ссылку на С2-С6.
получиться результат критерия Z=
1,629692308. Для ответа на вопрос, соответствуют ли опытные показатели нормам, Z сравнивают с критическим значением Zkp. Вводим в D1 текст “критическое значение» в Е1 вводим функцию ХИ2ОБР
(категория «Статистические») у которой два аргумента: «Вероятность» - вводим
уровень значимости α =1-p и
«Степени свободы» - вводят число n-1, где n – число норм). Результат 13,27670414.
видно, что критическое значение больше критерия, следовательно опытные данные соответствуют
стандартным и партия с заданной вероятностью можно отнести как соответствующую
стандарту.
Норма |
Наблюдения |
Критерий |
Критическое значение |
13,27670414 |
500 |
516 |
0,512 |
|
|
150 |
148 |
0,026666667 |
|
|
130 |
131 |
0,007692308 |
|
|
120 |
110 |
0,833333333 |
|
|
100 |
95 |
0,25 |
|
|
|
1000 |
1,629692308 |
|
|
2. ПРОВЕРКА
ГИПОТЕЗЫ О РАВЕНСТВЕ ДИСПЕРСИЙ
Используется в случае,
если нужно проверить различается ли разброс данных (дисперсии) у двух выборов.
Это может использоваться при сравнении точностей обработки деталей на двух
станках, равномерности продаж товара в течении некоторого периода в двух
городах и т.д. Для проверки статистической гипотезы, о равенстве дисперсий
служит F – критерий Фишера. Основной характеристикой критерия является уровень
значимости α, которой имеет смысла вероятности ошибиться, предполагая, что
дисперсии и, следовательно, точность, различаются. Вместо α в задачах так
же иногда задают доверительную вероятность p=1- α, имеющую смысл вероятности того, что дисперсии и в
самом деле равны. Обычно выбирают критическое значение уровня значимости,
например 0,05 или 0,1, и если α больше критического значения, то дисперсии
считаются равными, в противном случае, различны. При этом критерий может быть
односторонним, когда нужно проверить, что дисперсия конкретной выделенной
выборки больше, чем у другой, и двусторонним, когда просто нужно показать, что
дисперсии не равны. Существует два способа проверки таких гипотез. Рассмотрим
их на примерах.
ПРИМЕР 2. четыре станка в цеху обрабатывают
детали. Для проверки точности обработки, взяли выборку размеров деталей у
каждого станка. Необходимо сравнить с помощью F-теста попарно точности обработки всех станков (рассмотреть
пары 1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и сделать вывод, для каких станков точности
обработки (дисперсии) равны, для каких нет. Взять уровень значимости α=0,02.
1 станок |
29,1 |
26,2 |
30,7 |
33,8 |
33,6 |
35,2 |
23,4 |
29,3 |
33,3 |
26,7 |
2 станок |
29,0 |
28,9 |
34,0 |
29,7 |
39,4 |
28,5 |
35,9 |
32,6 |
37,1 |
28,0 |
3 станок |
25,7 |
27,5 |
25,4 |
28,9 |
29,9 |
30,1 |
29,0 |
36,6 |
24,8 |
27,8 |
4 станок |
32,1 |
31,0 |
27,2 |
29,3 |
30,4 |
31,7 |
30,4 |
27,3 |
35,7 |
31,5 |
Уровень значимости α=0,02.
вводим данные выборок (без подписей) в 4 строчки в ячейки А1-J1 и А2-J2 и т.д. соответственно. Для вычисления ФТЕСТ (массив1; массив2). Вводим А5 подпись А5 «Уровень значимости», а в В5
функцию, ФТЕСТ, аргументами которой должны быть ссылки на ячейку А1-J1 и А2-J2 соответственно. Результат 0,873340161 говорит о том, что
вероятность ошибиться, приняв гипотезу о различии дисперсий, около 0,9, что больше
критического значения, заданного в условии задачи 0,02. следовательно, можно
говорить что опытные данные с большей вероятностью подтверждают предположения о
том, что дисперсии одинаковы и точность обработки станков одинакова, такие же
результаты показало сравнение остальных пар. Следует отметить, что функции
ФТЕСТ выходит уровень значимости двустороннего критерия и если нужно
использовать односторонний, то результат необходимо уменьшить вдвое.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 |