9_факторный анализ. 9 факторный анализ
Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу.
Вращение бывает ортогональным и косоугольным. Цель ортогональных вращений — определение простой структуры факторных нагрузок, целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях. Поэтому ортогональное вращение предпочтительнее.
- Варимакс – критерий – индекс сложности каждого фактора, который пропорционален числу переменных, связанных с этим фактором. Метод «варимакс» максимизирует разброс квадратов нагрузок для каждого фактора, что приводит к увеличению больших и уменьшению малых значений факторных нагрузок. В результате простая структура получается для каждого фактора в отдельности;
- Квартимакс — – критерий – факторная сложность переменной, пропорциональна числу факторов, связанных с ней;
- Эквимакс — Метод вращения, объединяющий методы варимакс, упрощающий факторы, и квартимакс, упрощающий переменные. Минимизируется число переменных с большими факторными нагрузками и число факторов, требуемых для объяснения переменной.
- облимин – Метод косоугольного (неортогонального) вращения. Самое косоугольное решение соответствует дельте, равной 0 (по умолчанию). По мере того, как дельта отклоняется в отрицательную сторону, факторы становятся более ортогональными. Чтобы изменить задаваемое по умолчанию дельта (равное 0), введите число, меньшее или равное 0,8;
- Промакс-вращение. Косоугольное вращение в предположении, что факторы могут коррелировать между собой. Оно производится быстрее, чем вращение типа прямой облимин, поэтому оно полезно для больших наборов данных.
Главные факторы в сравнении с главными компонентами.
Данные для проведения факторного анализа (учебный пример)
Критическое значение коэффициента корреляции на уровне значимости 5% при 5 коррелирующих парах равна 0.878. Высокие корреляции в левом верхнем и правом нижнем квадрантах показывают, что взаимосвязаны оценки по стоимости и комфортабельности и оценки по температуре воздуха и температуре воды.
Собственные вектора и собственные значения:
Анализ собственных значений, равных соответственно 0.038; 0.004; 1.942; 2.016 показывает, что только для двух факторов значения достаточно велики, чтобы стать предметом дальнейшего рассмотрения.
Доля этих факторов в общей дисперсии составляет соответственно 50,4% и 48,5% общей дисперсии, а накопленная дисперсия – 98,9%.
Матрица факторных нагрузок отражает взаимосвязь между факторами и переменными:
Очевидно, что существенные значения факторных нагрузок наблюдаются только для двух факторов: третий столбец – это корреляции между первым значимым фактором и каждой переменной по очереди, четвертый столбец — корреляции между вторым значимым фактором и каждой переменной. Фактор интерпретируется на основе сильно связанных с ним (имеющих по нему высокие факторные нагрузки) переменных. Так первый фактор – «экономический» (цена+комфорт), а второй — «климатический» (температуры). При этом переменные, имеющие высокие факторные нагрузки по «климатическому» фактору взаимосвязаны положительно (униполярный фактор), а по «экономическому» — отрицательно (биполярный фактор).
Необходимо отметить, что выбор знака во время вычислений происходит случайным образом, и знаки не важны сами по себе, а используются для идентификации групп.