Курсовая работа: Решение задач с нормальными законами в системе "Статистика"
Необходимо
провести классификацию (дискриминацию) трех новых предприятий, образующих
группу М0 с известными значениями исходных переменных.
Решение:
1. Значения исходных переменных для обучающих подмножеств M1
и M2 (групп предприятий) записываются в виде матриц X(1)
и X(2) :


и для подмножества M0 группы предприятий, подлежащих
классификации в виде матрицы X(0):

Общее количество предприятий, составляющих множество М, будет
равно N = 3+4+5 = 12 ед.
2. Определяются элементы векторов средних значений по j
признакам для i-х объектов по каждой k-й выборке (k = 1,
2), которые представляются в виде двух векторов (по количеству обучающих выборок):

3. Для каждого обучающего подмножества M1 и M2
рассчитываются ковариационные матрицы Sk (размером р×р):


4. Рассчитывается объединенная ковариационная матрица:
 
5. Рассчитывается матрица обратная к объединенной ковариационной
матрице:

6. Рассчитываются дискриминантные множители (коэффициенты дискриминантной
функции) по всем элементам обучающих подмножеств:

7. Для каждого i-го объекта k-го подмножества М
определяется значение дискриминантной функции:
F1(1)=0,104743×224,228+2,046703×17,115+(-0,13635)×22,981=55,38211;
F2(1)=0,104743×151,827+2,046703×14,904+(-0,13635)×21,481=43,47791;
F3(1)=0,104743×147,313+2,046703×13,627+(-0,13635)×28,669=39,41138;
F4(2)=0,104743×152,253+2,046703×10,545+(-0,13635)×10,199=36,13924;
F1(2)=0,104743×46,757+2,046703×4,428+(-0,13635)×11,124=12,44351;
………………………………………………………………………………..
F5(2)=0,104743×63,979+2,046703×4,211+(-0,13635)×12,860=13,56655.
8. По совокупности найденных значений F(k)
рассчитываются средние значения для каждого подмножества Mk:


9. Определяется общее среднее (константа дискриминации) для дискриминантных
функций:

10. Выполняется распределение объектов подмножества М0
по обучающим подмножествам М1 и М2, для
чего по каждому объекту (i = 1, 2, 3) рассчитываются дискриминантные
функции:
F1(0)=0,104743×55,451+2,046703×9,592+(-0,13635)×12,840=23,68661
F2(0)=0,104743×78,575+2,046703×11,727+(-0,13635)×15,535=30,11366
F3(0)=0,104743×98,353+2,046703×17,572+(-0,13635)×20,458=23,68661
Затем рассчитанные значения дискриминантных функций F(0)
сравниваются с общей средней F=28,3556.
Поскольку , то i-й объект
подмножества М0 относят к подмножеству М1
при > 0
и к подмножеству М2 при <0. С учетом этого в данном
примере предприятия 2 и 3 подмножества М0 относятся к М1,
а предприятие 1 относится к М2.
Если бы выполнялось условие , то объекты М0
относились к подмножеству М1, при и к подмножеству М2
в противном случае.
11. Оценку качества распределения новых объектов выполним путем сравнения
с константой дискриминации F
значений дискриминантных функций Fi(k)=обучающих
подмножеств М1 и М2. Поскольку для всех найденных
значений выполняются неравенства , и , то можно предположить о
правильном распределении объектов и уже существующих двух классах и верно
выполненной классификации объектов подмножества М0.
3.2 Пример решения задачи дискриминантным анализом в системе STATISTICA
Исходя из данных по 10
странам (рис. 3.1), которые были выбраны и отнесены к соответствующим группам
экспертным методом (по уровню медицинского обслуживания), необходимо по ряду
показателей классифицировать еще две страны: Молдавия и Украина.
Исходными показателями послужили:
Х1 – Количество человек,
приходящихся на одного врача;
Х2 – Смертность на 1000
человек;
Х3 – ВВП, рассчитанный по
паритету покупательной способности на душу населения (млн. $);
Х4 – Расходы на
здравоохранение на душу населения ($).
Уровень медицинского
обслуживания стран подразделяется на:
- высокий;
- средний
(удовлетворительный);
- низкий.
|
Кол-во чел. на 1 врача
|
Расх. на здрав.
|
ВВП
|
Смертность
|
Класс
|
Азербайджан
|
256 |
99 |
3000 |
9,6 |
низкий |
Армения
|
198 |
152 |
3000 |
9,7 |
низкий |
Белоруссия
|
222 |
157 |
7500 |
14 |
высокий |
Грузия
|
182 |
152 |
4600 |
14,6 |
удовлетворительный |
Казахстан
|
265 |
154 |
5000 |
10,6 |
удовлетворительный |
Киргизия
|
301 |
118 |
2700 |
9,1 |
низкий |
Россия
|
235 |
159 |
7700 |
13,9 |
высокий |
Таджикистан
|
439 |
100 |
1140 |
8,6 |
низкий |
Туркмения
|
320 |
125 |
4300 |
9 |
удовлетворительный |
Узбекистан
|
299 |
116 |
2400 |
8 |
низкий |
Страницы: 1, 2, 3, 4, 5, 6, 7 |