- МАТРИЧНО-АППРОКСИМАЦИОННЫЙ ПОДХОД К АНАЛИЗУ ДАННЫХ (МАТРИЧНО-АППРОКСИМАЦИОННЫЕ МЕТОДЫ АНАЛИЗА ДАННЫХ)
- - подход к анализу многомерной социологич. информации, ориентированный прежде всего на автоматизацию процесса построения многомерных группировок и основанный на представлении данных всех видов (признаков, группировок, структур и пр.) матрицами связей между объектами (наблюдениями). Аппроксимационный подход использует специальную математич. модель качественной информации - структурный признак, т. е. разбиение множества рассматриваемых наблюдений (объектов) на непересекающиеся группы с определенной структурой связей между этими группами. Группы соответствуют отдельным значениям признака, а структура связей определяется типом шкалы (см.) или иной информацией. Так, порядковой шкале соответствует упорядочение групп, номинальной шкале - отсутствие такового, атрибутивному свойству - выделенная группа и т. п. Эта качественная информация теоретически характеризуется количественными связями между объектами: для объектов, принадлежащих группам, связанным заданной структурой, степень связи оценивается одной числовой величиной (напр., единицей), а для объектов из несвязанных групп - другой (напр., нулем), в совокупности представляющими собой булеву квадратную матрицу простой структуры. Задачи анализа данных ставятся и решаются как задачи аппроксимации в этом матричном пространстве. В частности, задача автома-тич. классификации объектов на "компактные" группы (кластеры) формулируется как задача отыскания матрицы, соответствующей разбиению объектов со структурой, содержащей только петли (связи групп с самими собой), и ближайшей к сумме матриц, представляющих исходные данные. Показано, что такой аппрокси-мационный подход не противоречит др. концепциям кластерного анализа, а в определенной мере интегрирует их в единую схему и, более того, дает средства оптимального выбора параметров алгоритмов, таких, как число групп или порог существенности связи между наблюдениями. Аналогично конструируются и др. методы качественного анализа, в т. ч. аналоги количественных методов факторного анализа и анализа регрессионного (см.). Этот комплекс методов в определенной степени удовлетворяет следующим требованиям, необходимым для его использования специалистами-предметниками: а) универсальность относительно разных видов исходной информации и инвариантность относительно способов представления данных; б) адаптируемость к уровню понимания социологом формальных свойств данных; в) интерпретируемость рез-тов. Наиболее разработанными в рамках данного подхода являются методы решения следующих задач: а) формирование и анализ структуры матриц связи между признаками, в т. ч. разнотипными, направленными на выявление "компактных" или детерминирующих друг друга совокупностей признаков; б) относительная или типологич. группировка больших массивов анкетной информации для исследования связей между двумя группами признаков, в т. ч. автоматич. укрупнение градаций признаков и агрегирование неальтернативных вопросов; в) группировки объектов по матрице связей между ними, в т. ч. с выявлением структуры основных связей между группами, что необходимо для анализа организационных структур. Лит.: Миркин Б.Г. Анализ качественных признаков и структур. М., 1980; Методы анализа многомерной экономической информации. Новосибирск, 1981; Анализ и формирование организационной структуры предприятия. Новосибирск, 1981; Алгорит-социально-экономических исследований. Новосибирск, 1982. Б.Г. Миркин.
Российская социологическая энциклопедия. — М.: НОРМА-ИНФРА-М. Г.В. Осипов. 1999.