Лабораторная работа: Статистические методы обработки данных
Используется для проверки
предложения о том, что среднее значения двух показателей, представленных
выборками, значимо различаются. Существует три разновидности критерия: один –
для связанных выборок, и два для несвязных выборок (с одинаковыми и разными
дисперсиями). Если выборки не связны, то предварительно нужно проверить
гипотезу о равенстве дисперсий, чтобы определить, какой из критериев
использовать. Так же как и в случае сравнения дисперсий имеются 2 способа
решения задачи, которые рассмотрим на примере.
ПРИМЕР 3. имеются данные о количестве продаж
товара в двух городах. Проверить на уровне значимости 0,01 статистическую
гипотезу о том, что среднее число продаж товара в городах различно.
23 |
25 |
23 |
22 |
23 |
24 |
28 |
16 |
18 |
23 |
29 |
26 |
31 |
19 |
22 |
28 |
26 |
26 |
35 |
20 |
27 |
28 |
28 |
26 |
22 |
29 |
|
|
Используем пакет «Анализ
данных». В зависимости от типа критерия выбирается один из трех: «Парный
двухвыборочный t-тест для средних» - для связных выборок, и «Двухвыборочных
t-тест с одинаковыми дисперсиями» или «Двухвыборочных t-тест с разными
дисперсиями» - для несвязных выборок. Вызовите тест с одинаковыми дисперсиями,
в открывшемся окне в полях «Интервал переменной 1» и «Интервал переменной 2»
вводят ссылки на данные (А1-N1 и
А2-L2, соответственно), если имеются
подписи данных, то ставят флажок у надписи «Метки» (у нас их нет, поэтому
флажок не ставится). Далее вводят уровень значимости в поле «Альфа» - 0,01.
Поле «Гипотетическая средняя разность» оставляют пустыми. В разделе «Параметры
вывода» ставят метку около «Выходной интервал» и поместив курсор в появившемся
поле напротив надписи, щелкают левой кнопкой в ячейке В7. вывод результата
будет осуществляться начиная с этой ячейки. Нажав на «ОК» появляется таблица
результата. Сдвиньте границу между столбцами В и С, С и D, D и Е увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные
характеристики выборки, t-статистику,
критические значения этих статистик и критические уровни значимости «Р(Т<=t) одностороннее» и «Р(Т<=t) двухстороннее». Если по модулю t-статистика меньше критического, то
средние показатели с заданной вероятностью равны. В нашем случае│-1,784242592│
< 2,492159469, следовательно, среднее число продаж значимо не отличается.
Следует отметить, что если взять уровень значимости α=0,05, то результаты
исследования будут совсем иными.
Двухвыборочный t-тест с одинаковыми дисперсиями
|
|
|
|
|
город 1
|
город 2
|
Среднее |
23,57142857 |
26,41666667 |
Дисперсия |
17,34065934 |
15,35606061 |
Наблюдения |
14 |
12 |
Объединенная дисперсия |
16,43105159 |
|
Гипотетическая разность средних |
0 |
|
df |
24 |
|
t-статистика |
-1,784242592 |
|
P(T<=t) одностороннее |
0,043516846 |
|
t критическое одностороннее |
2,492159469 |
|
P(T<=t) двухстороннее |
0,087033692 |
|
t критическое двухстороннее |
2,796939498 |
|
Лабораторная
работа №3
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 |