Лабораторная работа: Статистические методы обработки данных
Лабораторная работа: Статистические методы обработки данных
Лабораторная
работа №1
СТАТИСТИЧЕСКИЕ
МЕТОДЫ ОБРАБОТКИ ОПЫТНЫХ ДАННЫХ. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ВБОРКИ
Цель: Научиться основным методам
обработки данных, представленных выборкой. Изучить графические представления
данных. Овладеть навыками расчета с помощью ЭВМ основных числовых характеристик
выборки.
Основным объектом
исследования в эконометрике является выборка. Выборкой объема n
называются числа х1.х2….хn получаемые на практике при n – кратком
повторении эксперимента в неизменных условиях. На практике выборку чаще всего
представляют статистическим рядом. Для этого вся числовая ось, на которой лежат
значения выборки, разбивается на k интервалов
( это число выбирается произвольно от 5 до 10), которые обычно равны,
вычисляются середины интервалов zn и считается число элементов выборки, попадающих в каждый
интервал n1. статистическим рядом называется последовательность пар
(z1. n1). Рассмотрим решение задачи на ЭВМ и ППП EXCEL на следующей примере.
ПРИМЕР. Дана выборка чисел выручки магазина
за 30 дней:
72 |
74 |
69 |
71 |
73 |
68 |
73 |
77 |
76 |
77 |
76 |
76 |
76 |
64 |
65 |
75 |
70 |
75 |
71 |
69 |
72 |
69 |
78 |
72 |
67 |
72 |
81 |
75 |
72 |
69 |
Построим статистический
ряд, полигон, гистограмму и кумулятивную кривую.
Откроем книгу программы EXCEL. Введем в первый столбец (ячейки
А1-А30) исходные данные. Определим область чисел, на какой лежат данные. Для
этого найдем максимальный и минимальный элементы выборки. Введем в В1
«Максимум», а в В2 «Минимум», а в соседних ячейках С1 и С2 определим функции
«МАХ» и «МIN», в качестве аргументов которых (в графе «число») обведем область
данных (ячейки А1-А30). Результатом будут 64 и 81. видно, что все данные
укладываются на отрезке [64;81]. Разделим его на 9 (выбирается произвольно от 5 до 10) интервалов:
64-66; 66-68: 68-70: 70-72:
72-74, 74-76, 76-78, 78-80, 80-82. в ячейке D1-D10 вводим верхние
границы интегралов группировки – числа 66, 68, 70, 72, 74, 76, 78, 80, 82. Для
вычисления частот n1 используют функцию ЧАСТОТА, находящуюся в
категории «Статистические». Введем ее в ячейку Е1. в строке «Массив данных»
введем диапазон выборки (ячейки А1-А30). В строке «Двоичный массив» введем
диапазон верхних границ интервалов группировки (ячейки D1-D9). Результат
функции является массивом и выводится в ячейках Е1-Е9. для полного выбора (не
только первого числа в Е1) нужно выделить ячейки Е1-Е9, обведя их мышью, и
нажать F2, а далее одновременно
CTRL+SHIFT+ENTER. Результат – частоты интервалов 2,2,5,7,3,7,3,0,1.
Для построения
гистограммы нужно выбрать ВСТАВКА/ДИАГРАММА или нажать на соответствующий
значок на основной панели (при этом курсор должен стоять в свободной ячейке) далее
выбрать тип: ГИСТОГРАММА, вид по выборке, нажать «ДАЛЕЕ», в строке «ПОДПИСИ ОСИ
Х» ввести интервалы ячейках D1-D5, нажать «ДАЛЕЕ» ввести название
«ГИСТОГРАММА», подписи осей «ИНТЕВАЛЫ» и «ЧАСТОТА», нажать «ГОТОВО». Для
создания полигона сделать то же самое, только вместо типа диаграммы
«ГИСТОГРАММА», выбрать «ГРАФИК». Для построения кумулятивной кривой нужно
посчитать накопленные частоты. Для этого в ячейку F1 вводим «=Е1», в F2 – вводим «=F1+Е2» и
автозаполнением перетаскиваем эту ячейку до F9. далее строим график как и в случае полигона, но в строке
«ДИАПАЗОН» вводим накопленные частоты, ссылаясь на F1- F9, а на вкладке «РЯД», в строке «ПОДПИСИ ОСИ Х» вводим
интервалы в ячейках D1-D9.
Находим основные числовые
характеристики выборки. Для их ввода выделяем два столбца, например G и H, в первом вводим название характеристики, во втором –
функцию, в которой в качестве массива данных (строка»ЧИСЛО1»), указать ссылку
на А1-А30
Характеристика
|
Функция
|
Объем выборки |
30 |
Выборочное среднее |
72,46666667 |
Дисперсия |
15,63678161 |
Стандартное отклонение |
3,954337063 |
Медиана |
72 |
Мода |
72 |
Коэффициент эксцесса |
-0,214617804 |
Коэффициент асимметрии |
-0,154098799 |
Персентиль 40% |
72 |
Персентиль 80% |
76 |
Существует другой способ
вычисления числовых характеристик выборки. Для этого ставим курсор в свободную
ячейку (например D11). Затем
вызываем в меню «Сервис» подменю «Анализ данных». Если в меню «Сервис»
отсутствует этот пункт, то в меню «Сервис» нужно выбрать пункт «Надстройки» м в
нем поставить флажок напротив пункта «Пакет анализа». В окне «Анализ данных»
нужно выбрать пункт «Описательная статистика». В появившемся окне в поле
«Входной интервал» делаем ссылку на выборку А1-А23. Оставляем группирование «По
столбцам» в разделе «Параметры вывода» ставим флажок на «Выходной интервал» и в
соседнем поле создаем ссылку на верхнюю левую ячейку области вывода (например D11), ставим флажок напротив
«Описательная статистика», нажимаем «ОК». результат – основные характеристики
выборки (сделайте шире столбцов D,
переместив его границу в заголовок).
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 |