Основные цели анализа данных
На определенном этапе моделирования реальности в исходных данных условно выделяют два аспекта: ● содержательный уровень (совокупность реальных объектов, т.е. то, что в теории измерения называют эмпирической системой с отношениями); ● формальный уровень (совокупность математических конструктов, отражающих в результате измерения реальные объекты и отношения между ними - т.е. числовая система с отношениями). Статистические методы анализа используют именно формальные данные, при этом они предстают в виде совокупности значений каких либо признаков (характеристик, переменных, величин и т.п.), измеренных для каждого из изучаемых объектов. Каждый изучаемый объект рассматривается исследователем как последовательность чисел - значений для него некоторых признаков. Такие данные предстают в виде матрицы "объект - признак". В соответствии с представлениями исследователя, связи между признаками, отображенными в матрице, объясняются определенными закономерностями. Закономерность возникает как результат взаимодействия большого числа элементов, составляющих совокупность, и характеризует не столько поведение отдельного элемента совокупности, сколько совокупность в целом. Любая выявленная в процессе научного исследования закономерность является определенного рода "сжатием" какой-то информации (в нашем случае - матрицы "объект- признак"). Результаты такого сжатия чаще всего выражаются в виде определенных характеристик частотных распределений значений рассматриваемых признаков. Можно сказать также, что результат сжатия - некоторые числа, которые характеризуют данные в целом. Таким образом, выявление (подтверждение, корректировка) неких интересующих социолога статистических закономерностей, или, другими словами, - определенного рода сжатие, усреднение содержащихся в данных информации является основной целью анализа социологической информации. По выражению Дж. Тьюки, целью АД является "охват" содержания исходных данных значительного объема, который позволяет прийти к представлениям, легко доступным для понимания пользователя. Помимо этого в качестве целей анализа данных выделяют: ● объяснение интересующего социолога явления ● описание исходных данных ● предсказание того или иного явления Задача объяснения, которое понимается здесь как подведение явления под какой-либо закон, является актуальной для любого исследования. Объясняемым явлением может быть как сама совокупность наблюдаемых фактов (формальные данные), так и содержательные закономерности, определяющие характер исходных данных. В первом случае искомым законом будет коэффициент связи между определенными признаками (например, между образовательным уровнем и доходами), а во втором - некие содержательные представления о причинах, связывающих исходные данные (например, высокий образовательный статус подразумевает получение ответственной должности, которая оплачивается сравнительно более высоко). Описание - начальный этап анализа, который служит для элементарного упорядочивания данных. Достигается оно обычно при помощи самых простых алгоритмов сжатия исходной информации. Совокупность наиболее употребительных приемов получения закономерностей, описывающих изучаемое множество объектов называют описательной или дескриптивной статистикой. Прогноз тех или иных социальных характеристик или явлений служит целью выявления любой закономерности, поскольку изучать ту или иную сторону жизни общества нужно прежде всего для того, чтобы управлять какими-то процессами. Прогноз обычно осуществляется при помощи довольно сложных алгоритмов, например, регрессионного анализа. Основные этапы анализа данных. 4 основных этапа анализа: 1. Описание совокупности данных 2. Уплотнение исходной информации. 3. Углубление интерпретации и переход к объяснению 4. Прогноз развития явлений.
|