- АНАЛИЗ РЕГРЕССИОННЫЙ
- – статистич. метод исследования зависимости (регрессии) между зависимым признаком У и независимым (регрессорами, предикторами) Х1, ... ,Хр. решает задачи определения общего вида уравнения регрессии, нахождения оценок параметров этого уровня, оценки качества регрессии, проверки статистич. гипотез, к-рые служат двум основным целям. А.р. – предсказания и объяснения. В ситуации прогноза акцент смещается на получение оценок Y по значениям У-ов при минимизации суммы квадратов отклонений
реально наблюдаемых У и их оценок (N – объем выборки). При объяснительном подходе необходимо решить задачу оценки индивидуального вклада каждого из предикторов Х1, ... ,Хр в объяснение дисперсии зависимого признака. В случае многомерной линейной регрессии Y=bo b1X1 ... bp Xp исследованию подлежит модель: Y=bo b1X1-b2X2 ... BрХр l, к-рую можно представить в матричной форме: Y=Xb l, где Y – вектор наблюдений зависимого признака размерности (Nxl); X – матрица наблюдений предикторов размерности (NxP), b – вектор параметров размерности (pxl); l – вектор ошибок размерности (Nxl). Применение метода наименьших квадратов для оценивания параметров модели возможно при условии следующих предположений: 1) равенства условных дисперсий, т. е. D(Y/X)=const, 2) независимости ошибок от предикторов и нормального их распределения с нулевым средним и постоянной дисперсией, 3) попарного нормального распределения всех признаков модели. Решение нормальных уравнений записывается в виде b=(XX)-1 XY. Параметры bi являются частными коэффициентами корреляции, b2j интерпретируется как доля дисперсии Y, объясненная X при закрепленном влиянии остальных X, т. е. измеряет индивидуальный вклад х. в объяснение У. В случае коррелирующих X возникают проблемы неопределенности в оценках bi, к-рые становятся зависимыми от порядка включения X в модель. В таких случаях необходимо применение методов анализа корреляционного (см.) и пошагового регрессионного анализа. Построение доверительных интервалов для оценок параметров и проверка гипотезы об отсутствии связи (bi=0) производятся с помощью критерия Стьюдента, оценка значимости регрессии – с помощью критерия Фишера, для к-рого оценивается коэффициент множественной корреляции R, характеризующий общую связь всех признаков модели. R2показывает долю дисперсии, объясненную всеми признаками модели (1):
А.р. позволяет оценивать также и нелинейные отношения путем использования модели (1) с включением качественных признаков в уравнение. При этом метод оценки сохраняется, изменяется только интерпретация рез-тов. Методы А.р. широко используются в соц.-экономич. исследованиях для оценок отношений спроса, предложения, при изучении бюджетов семей и т. д. Лит.: Дрейнер Н., Смит Г. Прикладной регрессионный анализ. М., 1973; Статистические методы анализа информации в социологических исследованиях. М., 1979; Типология и классификация в социологических исследованиях. М„ 1982. К.Д. Аргунова
Российская социологическая энциклопедия. — М.: НОРМА-ИНФРА-М. Г.В. Осипов. 1999.