- АНАЛИЗ ПРИЧИННЫЙ
- – методы моделирования причинных отношений между признаками с помощью систем статистич. уравнений, чаще всего регрессионных. Существуют другие названия этой довольно обширной и постоянно развивающейся области методов: путевой анализ, как впервые наз. его основоположник С. Райт; методы структурных эконометрич. уравнений, как принято в эконометрике, и др. Причинные отношения иногда наз. структурными, каузальными и исследуются исходя из трех аспектов: правильности отображения направленности влияний признаков и возможного осуществления двух целей – прогнозирования и объяснения, решаемых для каждого из уравнений системы, описывающей причинные отношения. Каждый из трех аспектов требует разъяснения, тщательной проработки с применением содержательных и формальных соображений. Указанное операциональное определение причинного отношения не затрагивает сложных философских проблем, связанных с понятием причинности. А.п. предлагает операциональное понимание причинного коэффициента, с помощью к-рого разрабатывается математич. аппарат для проверки как прямых, так и косвенных причинно-следственных связей между признаками. На основе А.п. возможно раскрытие внутреннего смысла корреляционных коэффициентов между признаками в тех случаях, когда такая коррелированность допускается предположениями, накладываемыми на регрессионные уравнения. Задачи определения прямых и косвенных связей между признаками, а также раскрытия различ. компонент в корреляционных коэффициентах, связанных с прямыми, косвенными и мнимыми связями, осуществляются с помощью разложения корреляционного коэффициента, называемого разложением Райта. А.п. призван заполнить вакуум между содержательными теориями, с одной стороны, и математич. методами анализа, с другой стороны, создавая аппарат для проверок гипотез о причинно-следственных связях между признаками на основе эмпирич. интерпретации. Наличие общей теории моделируемых явлений и процессов, содержательных концепций и гипотез является важной предпосылкой успешного применения А.п. Процесс построения модели А.п. состоит из следующих этапов: построения диаграммы связей между признаками и формульного представления статистич. отношений в виде систем уравнений; идентификации (оценивания) параметров модели; проверки гипотез и интерпретации рез-тов. Основными понятиями А.п. являются: путевая (структурная, причинная) диаграмма, причинный (путевой) коэффициент, прямые, косвенные и мнимые компоненты связи между признаками. Путевая диаграмма отражает графически гипотетически предполагаемые причинные, направленные связи между признаками модели. Система признаков с однонаправленными связями наз. рекурсивной, матрица параметров статистич. уравнений, соответствующих такой системе, имеет треугольный вид. Нерекурсивные причинные системы учитывают также и обратные связи, напр., два признака системы могут быть одновременно и причиной, и следствием по отношению друг к другу. Все признаки делятся на признаки-следствия (зависимые, эндогенные) и признаки-причины (независимые, экзогенные). Однако в системе уравнений эндогенные признаки одного из уравнений могут быть экзогенными признаками др-уравнений. В случае четырех признаков рекурсивная диаграмма всех возможных связей между признаками имеет вид:
Построение диаграммы связей является необходимой предпосылкой математич. формулирования системы статистич. уравнений, отражающей влияния, представленные на диаграмме. Основные принципы построения системы регрессионных уравнений проиллюстрируем на примере тех же четырех признаков. Идя по ходу стрелок, начиная с Х1, находим первый эндогенный признак и отмечаем те признаки, к-рые на него влияют как прямо (непосредственно), так и косвенно (опосредствованно), через другие признаки. Первое стандартизированное регрессионное уравнение соответствует первому эндогенному признаку Х2 и выражает зависимость Х2 от тех признаков, к-рые на него влияют, т. е. от X1. Т.обр., первое уравнение имеет вид Х2=b21Х1. Затем выявляем второй эндогенный признак, к-рый имеет направленные на него связи. Это признак X ему соответствуют экзогенные переменные X1 и Х2, поэтому второе регрессионное уравнение в стандартизованном виде формулируется так: Х3=b31Х1 Ь32Х2. Третье регрессионное уравнение соответствует третьей эндогенной переменной и выражает следующую зависимость: Х4=b42Х1 b42Х2 b43Х3. Система стандартизированных регрессионных уравнений для нашей конкретной причинной диаграммы с учетом ошибок измерения U имеет вид:
х=U1
X=b31X b32X2 U3
х4=b41х b42х2 b43х3 U4
Чтобы оценить коэффициенты Ъ.., необходимо решить три уравнения при соблюдении предположений, к-рым должны удовлетворять данные. Перечислим эти предположения. 1. Отношения между признаками модели должны быть линейными, аддитивными и по возможности отвечающими изучаемым причинным связям. 2. Признаки-ошибки измерения не коррелируют между собой и с др. признаками системы. Экзогенные признаки в уравнениях могут коррелировать между собой, более того, метод призван объяснить корреляцию двух признаков с помощью компонент прямых и косвенных связей, существующих между ними. 3. Все переменные имеют интервальный уровень измерения. 4. Система признаков имеет только однонаправленные связи, обратные связи между признаками изучаются с помощью специальных методов для нерекурсивных систем. При выполнении всех указанных условий система регрессионных уравнений в стандартизованном виде имеет решение, коэффициенты bij можно определить методом наименьших квадратов, и они наз. причинными коэффициентами, обозначаемыми часто Рг. Т.обр., причинный коэффициент Р. показывает ту долю изменения вариации эндогенного признака г, к-рая происходит при изменении экзогенного признака j на единицу стандартного отклонения этого признака, при условии, что влияние остальных признаков уравнения исключается (см. Анализ регрессионный). Иначе говоря, Pij есть прямой эффект признака j на признак i . Косвенный эффект признака j на i вычисляется на основе учета всех путей влияния j на i, за исключением прямого. На диаграмме прямое влияние первого признака на четвертый схематически представлено прямой стрелой, непосредственно идущей от Х1 к Х4, символически изображаемое как 1– 4; оно равно коэффициенту причинного влияния Р14. Компоненты прямого, косвенного и мнимого влияний являются слагаемыми корреляционного коэффициента rij, между признаками X. и X., к-рые можно вычислить на основе формулы разложения Райта:
где k пробегает номера переменных, имеющих прямое влияние на признак j. Компонента прямого влияния есть первое слагаемое правой части формулы, под знаком суммы содержатся две компоненты косвенного и мнимого (ложного) влияний. Косвенное влияние всегда представимо в виде произведения прямых влияний. Напр., косвенное влияние Х1 на Х4, схематически представленное тремя путями опосредствованного влияния Х1 на Х4: 1-»2-»4, 1-»3-»4, 1-»2-»3-»4, вычисляется как сумма трех косвенных влияний Р42Р21, P43P31, P43P32P21. Мнимое влияние вычисляется как остаток от вычитания из величины корреляционного коэффициента суммы прямого и косвенного влияний. Величины прямых и косвенных эффектов дают возможность проверять на эмпирич. материале гипотезы о силе тех или иных влияний и правильности содержательных гипотез о причинных связях между признаками. Обычно проверяется значимость отличия коэффициентов bij=Рij от нуля, равенство нулю регрессионных коэффициентов равносильно отсутствию соответствующих коэффициентов прямого влияния. Качество модели А.п. или ее адекватность эмпирич. данным оценивается как степень совпадения коэффициентов корреляций, полученных по формуле Райта на основе рассчитанных параметров системы, с коэффициентами корреляций, вычисленными обычным путем по эмпирич. данным. Если коэффициенты, полученные по модели, хорошо воспроизводят эмпирич. коэффициенты, то можно говорить о соответствии теоретич. предположений о причинных влияниях реально существующим связям. При исключении слабых причинных влияний качество воспроизведения корреляционных коэффициентов может улучшиться, если модель адекватна данным. Если две конкурирующие модели дают одинаково хорошее качество воспроизведения корреляционной матрицы, то в рамках А.п. не существует средств выбора одной из моделей как наиболее правильной. Поэтому А.п. не может служить окончательным средством для построения теории о причинных связях, скорее всего, он дает формальный аппарат для проверок, подтверждения или опровержения гипотез о причинно-следственных связях между признаками. Начало применению А.п. положил сам создатель методов С.Райт, к-рый, начиная с 1918 г., использовал их для решения практич. задач в различн. областях: генетике, сельском хоз-ве, экономике. Общая теория структурных уравнений развивается в эконометрике, где причинные уравнения наз. структурными. Трудами Г.Волда, К. Ёрескога и др. развита теория нерекурсивных взаимозависимых систем. В социологии развивались, модифицировались и популяризовались в работах Блэйлока, Саймона, Лазарсфельда, Будона, Дункана. Недостатком методов, препятствующих широкому их использованию в социологии, является необходимость использования шкал высокого измерения (количественных, интервальных) для изучаемых признаков. Существенный вклад в развитие методов причинного моделирования качественных признаков внесли работы Таганова и его школы; в них развит т.н. информационный подход к построению таких моделей. Одно из направлений А.п. для классификационных признаков развивается в рамках лог-линейного анализа Гудмэном, Бишопом и др., оно основано на анализе различ. функций от перекрестных отношений таблиц сопряженностей, предложенных впервые Юлом. Др. развивающееся направление следует отнести к традиции К. Пирсона; его последователи (Ланкастер, Рой, Хэмдам, Хекман и др.) используют концепцию Пирсона, согласно к-рой в основе перекрестной классификации (таблицы сопряженности) лежит дву- или многомерное нормальное распределение признаков. Однако этому подходу не уделяется должного внимания. Оценка параметров моделей очень сложна даже в случае двух уравнений, потому что основана на расчете тетрахорических коэффициентов корреляций. Современное развитие А.п. в социологии идет по пути синтеза классич. эконометрич. и факторно-аналитич. подходов, определяемых спецификой данных социологич. типа, наличием прямо ненаблюдаемых признаков, прямых и обратных связей между признаками модели. Такое развитие осуществлялось в работах Волда, Ёрескога, Гудмэна, Блэйлока и др. Модели А.п. рекомендуется применять для выявления факторов влияния на нек-рые целевые (зависимые) признаки, напр, необходимо оценить в количественном отношении влияние факторов семьи, школы, товарищей на стремления и достижения молодежи или выявить факторы удовлетворенности работой при условии их направленного влияния друг на друга. Модели А.п. можно применять для проверки соответствия поведения установкам, для исследования панельных данных, для анализа ошибок в данных и во многих др. задачах. Лит.: Маленва Э. Статистические методы эконометрии. М., 1975; Математика в социологии: моделирование и обработка информации. М., 1977; Математическое моделирование в социологии. Новосибирск, 1977; Математико-статистические методы в социологических исследованиях. М. 1980; Хейс Д. Причинный анализ в статистических исследованиях. М., 1981; Елисеева И.И., Рукавишников В.О. Логика прикладного статистического анализа. М., 1982; Mosbaek E., Wold H. Interdependent systems: structure and estimation. L., 1969; Goldberger A.S. On Boudons method of linear causal analysis//Amer. Soc. Rewiew. 1970. Vol. 35, №1; Hauser R.M., Golderger A.S. The treatment of an observable variables in path analysis//Sociological methodology. 1971; Goodman L.A. The analysis of multidimentional contingency tables when some variables are posterior to others: a modified path analysis approach//Biometrica. 1973. Vol. 60. К.Д. Аргунова.
Российская социологическая энциклопедия. — М.: НОРМА-ИНФРА-М. Г.В. Осипов. 1999.