Методы статистического анализа деятельности предприятия
Факторный анализ - более мощный и сложный аппарат, чем метод главных компонент, поэтому он применяется в том случае, если результаты компонентного анализа не вполне устраивают. Но поскольку эти два метода решают одинаковые задачи, необходимо сравнить результаты компонентного и факторного анализов, т.е. матрицы нагрузок, а также уравнения регрессии на главные компоненты и общие факторы, прокомментировать сходство и различия результатов.
Основной целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Ковариационный анализ
- совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины Y от набора неколичественных факторов F и одновременно от набора количественных факторов X. По отношению к Y переменные X называют сопутствующими; факторы F задают сочетания условий качественной природы, при которых получены наблюдения Y и Х, и описываются с помощью так называемых индикаторных переменных; среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте); если случайная величина Y является вектором <http://www.ecsocman.edu.ru/db/msg/10078>, то говорят о многомерном анализе ковариационном.Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. В частности, если анализируются n наблюдений с р сопутствующими переменными (
)), k возможными типами условий эксперимента (
)), то линейная модель соответствующего анализа ковариационного задается уравнением:
(1),
где i = 1, .,n, индикаторные переменные равны 1, если j-е условие эксперимента имело место при наблюдении
, и равны 0 в ином случае. (
) могут соответствовать результатам дихотомизации номинального признака Р с градациями
. Номинальный же признак может быть сложным: каждой его градации может отвечать сочетание значений некоторых первичных, например, взятых из анкеты, признаков; коэффициенты
определяют эффект влияния j-го условия;
- значение сопутствующей переменной
, при котором получено наблюдение
, i = 1, .,n; s = 1, .,Р;
- значения соответствующих коэффициентов регрессии Y по
, вообще говоря, зависящие от конкретного сочетания условий эксперимента, т.е. от вектора
;
- случайные ошибки, имеющие нулевые средние значения.Основное назначение ковариационного анализа - использование в построении статистических оценок
и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели (1) постулировать априори
, то получится модель анализа дисперсионного; если из (1) исключить влияние неколичественных факторов (положить
), то получится модель анализа регрессионного. Своим названием ковариационный анализ обязан тому обстоятельству, что в его вычислениях используются разбиения ковариации величин Y и X точно так, же как в дисперсионном анализе используются разбиения суммы квадратов отклонений.