Курсовая работа: Анализ предприятия с использованием регрессивного анализа
Например, некоторое увеличение аргумента
повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от
направленности) функции, тогда как конкретные значения у отдельных единиц
наблюдения будут отличаться от среднего. Такие зависимости встречаются
повсеместно. Например, в сельском хозяйстве это может быть связь между
урожайностью и количеством внесенных удобрений. Очевидно, что последние
участвуют в формировании урожая. Но для каждого конкретного поля, участка одно
и то же количество внесенных удобрений вызовет разный прирост урожайности, так
как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы
и др.), которые и формируют конечный результат. Однако в среднем такая связь
наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.
По направлению связи бывают прямыми,
когда зависимая переменная растет с увеличением факторного признака, и
обратными, при которых рост последнего сопровождается уменьшением функции.
Такие связи также можно назвать соответственно положительными и отрицательными.
Относительно своей аналитической формы
связи бывают линейными и нелинейными. В первом случае между признаками в
среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается
нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная
характеристика связей с точки зрения взаимодействующих факторов. Если
характеризуется связь двух признаков, то ее принято называть парной. Если
изучаются более чем две переменные – множественной.
Указанные выше классификационные
признаки наиболее часто встречаются в статистическом анализе. Но, кроме
перечисленных различают также непосредственные, косвенные и ложные связи.
Собственно, суть каждой из них очевидна из названия. В первом случае факторы
взаимодействуют между собой непосредственно. Для косвенной связи характерно
участие какой-то третьей переменной, которая опосредует связь между изучаемыми
признаками. Ложная связь – это связь, установленная формально и, как правило,
подтвержденная только количественными оценками. Она не имеет под собой
качественной основы или же бессмысленна.
По силе различаются слабые и сильные
связи. Эта формальная характеристика выражается конкретными величинами и
интерпретируется в соответствии с общепринятыми критериями силы связи для
конкретных показателей.
В наиболее общем виде задача статистики
в области изучения взаимосвязей состоит в количественной оценке их наличия и
направления, а также характеристике силы и формы влияния одних факторов на
другие. Для ее решения применяются две группы методов, одна из которых включает
в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же
время ряд исследователей объединяет эти методы в корреляционно-регрессионный
анализ, что имеет под собой некоторые основания: наличие целого ряда общих
вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Поэтому в данном контексте можно
говорить о корреляционном анализе в широком смысле – когда всесторонне
характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в
узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе
которого оцениваются ее форма и воздействие одних факторов на другие.
Задачи собственно корреляционного
анализа сводятся к измерению тесноты связи между варьирующими признаками,
определению неизвестных причинных связей и оценке факторов оказывающих
наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в
сфере установления формы зависимости, определения функции регрессии,
использования уравнения для оценки неизвестных значении зависимой переменной.
Решение названных задач опирается на
соответствующие приемы, алгоритмы, показатели, применение которых дает
основание говорить о статистическом изучении взаимосвязей.
3.
Корреляционно-регрессионный анализ
Для выявления наличия связи, ее
характера и направления в статистике используют методы: приведения параллельных
данных; аналитических группировок; графический, корреляции.
Корреляционно-регрессионный анализ
включает в себя измерение тесноты, направления связи и установление
аналитического выражения (формы) связи (регрессионный анализ).
Одним из методов корреляционно-регрессионного
анализа является метод парной корреляции, рассматривающий влияние вариации
факторного признака x
на результативный y.
Аналитическая связь между ними описывается уравнениями:
прямой
параболы
гиперболы и
т.д.
Оценка параметров уравнения регрессии
осуществляется методом наименьших квадратов, в основе которого лежит требование
минимальности сумм квадратов отклонений эмпирических данных yi
от выравненных (теоретических) yxi
Система нормальных уравнений для
нахождения параметров линейной парной регрессии имеет вид:
Для оценки типичности параметров
уравнения регрессии используется t-критерий
Стьюдента. При этом вычисляются фактические значения t-критерия
для параметров. Полученные фактические значения сравниваются с критическим,
которые получают по таблице Стьюдента с учетом принятого уровня значимости и
числа степеней свободы.
Полученные при анализе корреляционной
связи параметры уравнения регрессии признаются типичными, если t
фактическое больше t
критического.
По приведенным на типичность параметрам
уравнения регрессии производится синтезирование (построение) математической
модели связи. При этом параметры примененной в анализе математической функции
получают соответствующие количественные значения: один параметр показывает усредненное
влияние на результативный признак неучтенных (не выделенных для исследования)
факторов, а другой параметр – на сколько изменяется в среднем значение
результативного признака при изменении факторного на единицу его собственного
измерения.
Проверка практической значимости
синтезированных в корреляционно-регрессионном анализе математических моделей
осуществляется посредством показателей тесноты связи между признаками x
и y.
Для статистической оценки тесноты связи
применяются следующие показатели вариации:
1. общая дисперсия результативного
признака, отображающая общее влияние всех факторов;
2. факторная дисперсия результативного
признака, отображающая вариацию y
только от воздействия изучаемого фактора, которая характеризует отклонение
выровненных значений yx
от их общей средней величины y;
3. остаточная дисперсия, отображающая
вариацию результативного признака y
от всех прочих, кроме x
факторов, которая характеризует отклонение эмпирических (фактических) значений
результативного признака yi
от их выровненных значений yxi.
Соотношение между факторной и общей
дисперсиями характеризует меру тесноты связи между признаками x
и y
Этот показатель называется индексом
детерминации (причинности). Он выражает долю факторной дисперсии, т.е.
характеризует, какая часть общей вариации результативного признака y
объясняется изменением факторного признака x.
На основе предыдущей формулы определяется индекс корреляции R:
Используя правило сложения дисперсий,
можно вычислить индекс корреляции.
При прямолинейной форме связи показатель
тесноты связи определяется по формуле линейного коэффициента корреляции r:
Для оценки значимости коэффициента
корреляции r применяется t-критерий
Стьюдента с учетом заданного уровня значимости и
числа степеней свободы k.
Если ,
то величина коэффициента корреляции признается существенной.
Для оценки значимости индекса корреляции
R применяется F-критерий
Фишера. Фактическое значение критерия FR
определяется по формуле:
где m
– число параметров уравнения регрессии.
Величина FR
сравнивается с критическим значением FK,
которое определяется по таблице F
– критерия с учетом принятого уровня значимости и
числа степеней свободы k1=m-1
и k2=n-m.
Если FR>
FK,
то величина индекса корреляции признается существенной.
По степени тесноты связи различают
количественные критерии оценки тесноты связи.
Величина
коэффициента корреляции
|
Характер
связи
|
до
0,3 |
практически
отсутствует |
0,3-0,5 |
слабая |
0,5-0,7 |
умеренная |
0,7-1,0 |
сильная |
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 |