Методы статистического анализа деятельности предприятия
Факторный анализ - более мощный и сложный аппарат, чем метод главных компонент, поэтому он применяется в том случае, если результаты компонентного анализа не вполне устраивают. Но поскольку эти два метода решают одинаковые задачи, необходимо сравнить результаты компонентного и факторного анализов, т.е. матрицы нагрузок, а также уравнения регрессии на главные компоненты и общие факторы, прокомментировать сходство и различия результатов.
Основной целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Ковариационный анализ
- совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины Y от набора неколичественных факторов F и одновременно от набора количественных факторов X. По отношению к Y переменные X называют сопутствующими; факторы F задают сочетания условий качественной природы, при которых получены наблюдения Y и Х, и описываются с помощью так называемых индикаторных переменных; среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте); если случайная величина Y является вектором <http://www.ecsocman.edu.ru/db/msg/10078>, то говорят о многомерном анализе ковариационном.Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. В частности, если анализируются n наблюдений с р сопутствующими переменными ()), k возможными типами условий эксперимента ()), то линейная модель соответствующего анализа ковариационного задается уравнением: (1),
где i = 1, .,n, индикаторные переменные равны 1, если j-е условие эксперимента имело место при наблюдении , и равны 0 в ином случае. () могут соответствовать результатам дихотомизации номинального признака Р с градациями . Номинальный же признак может быть сложным: каждой его градации может отвечать сочетание значений некоторых первичных, например, взятых из анкеты, признаков; коэффициенты определяют эффект влияния j-го условия;
- значение сопутствующей переменной , при котором получено наблюдение , i = 1, .,n; s = 1, .,Р; - значения соответствующих коэффициентов регрессии Y по , вообще говоря, зависящие от конкретного сочетания условий эксперимента, т.е. от вектора ; - случайные ошибки, имеющие нулевые средние значения.Основное назначение ковариационного анализа - использование в построении статистических оценок и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели (1) постулировать априори , то получится модель анализа дисперсионного; если из (1) исключить влияние неколичественных факторов (положить ), то получится модель анализа регрессионного. Своим названием ковариационный анализ обязан тому обстоятельству, что в его вычислениях используются разбиения ковариации величин Y и X точно так, же как в дисперсионном анализе используются разбиения суммы квадратов отклонений.