Тема 1. Табличное представление данных
Таблицы и графики в аналитическом отчете служат не просто иллюстративными материалами, а содержат в себе саму суть, ядро полученной в ходе исследования информации, так как без них просто невозможно выразить в чисто словесной форме выводы исследования. В этом параграфе речь пойдет как о технике составления и обработки, редактирования таблиц и, так и о некоторых областях их применения. Все группировки значений различных переменных, предусмотренные программой исследования, ложатся в основу статистических таблиц, которые обобщают обработанную первичную социологическую информацию. Таблица — это перечень сведений, обычно числовых данных, приведенных в определенную систему и разнесенных по графам — строкам и столбцам. Строго говоря, процедура составления таблиц не представляет собою какой-то особой математической операции. Это скорее определенная форма отображения рядов распределений, полученных в результате расчетов. Основное преимущество этой формы заключается в том, что в ней кратко и емко даются пояснения значений соответствующих группировок. Хорошо сконструированная таблица позволяет более четко представить, описать и объяснить смысл и сущность изучаемого социального явления. Построение таблицы производится по определенным правилам. Любая социологическая статистическая таблица описывается с помощью следующих параметров. Заголовок — название таблицы, которое раскрывает структуру группировки описываемых переменных, либо характер связи (зависимости) между двумя и более переменными. Наряду с этим в названии (или чаще в подзаголовке) иногда указываются общие для всех переменных единицы измерения (число ответов, проценты, средний балл и т. д.). Подлежащее — то, что подлежит описанию, то есть указание переменной, подвергаемой анализу, и тех конкретных значений, которые она может принимать. Сказуемое — само описание, то есть числовые значения, разнесенные по графам — ячейкам или клеткам таблицы. Таблицы бывают простые (линейные), групповые и комбинационные. Простые таблицы представляют собою простой перечень (список) отдельных значений той или иной переменной с количественной или качественной характеристикой каждой из них в отдельности. Поэтому иногда их называют также перечневыми. Примером простой таблицы могут служить одномерные распределения опрашиваемой совокупности по полу респондентов, по их возрасту или курсу обучения (см. напр. табл. 3.2). Что касается групповых таблиц, то они обычно содержат группировку единиц совокупности по одному признаку, а комбинационные — по двум и более признакам. Такие таблицы являют собою нечто большее, нежели простой перечень данных. Это одновременно и способ, и вместе с тем результат определенной систематизации данных. В комбинационных таблицах, чтобы избежать излишнего нагромождения данных, затрудняющего их восприятие, иногда опускают абсолютные величины (частоты) тех или иных значений переменных, оставляя лишь пропорции или проценты. Примером комбинационной разработки статистической таблицы может служить, например, таблица 4.1.
Таблица 4.1 Динамика изменения успеваемости по факультетам. (в % к числу опрошенных)
Такая таблица являет собою уже нечто большее, нежели простой перечень данных. Она, с одной стороны, является как способом, так и результатом определенной организации, систематизации данных, а с другой — может стать удобным инструментом для анализа связей между сразу тремя переменными — факультетом, уровнем довузовской подготовки и успеваемостью на момент исследования. Хорошо сконструированная таблица позволяет исследователю более четко представить и описать смысл и сущность изучаемого им социального явления. Прежде чем перейти к методическим рекомендациям по созданию и редактированию таблиц, следует отметить некоторые важные моменты, связанные с их конструированием. Прежде всего, следует отметить, что наиболее рациональным было бы продумать конструкцию таблиц еще на стадии разработки методического раздела программы социологического исследования, а именно той его части, которая называется «Логическая схема обработки и анализа данных». В этой части фактически и задается конструкция и формат таблиц. Обычно не возникает особых сложностей с конструкцией таблиц простых (линейных) распределений. Что же касается комбинационных таблиц, то здесь необходимо учитывать некоторые методические рекомендации, исходя из практического опыта проведения исследований. Большинство комбинационных таблиц при расчетах формируется в ходе операции, именуемой кросстабуляция. Получаемые в результате кросстабы должны быть, как и любые другие таблицы, наглядны, обозримы и, по возможности, размещаться в пределах одной страницы. Поэтому первая рекомендация состоит в следующем. Поскольку ориентация текста на странице в абсолютном большинстве случаев бывает «книжная», а не «альбомная» (то есть страница больше по высоте, чем по ширине), нужно обращать внимание на соотношение числа значений (вариантов) тех переменных, связь между которыми будет отражена в кросстабе. При этом целесообразно руководствоваться простым правилом: ту переменную, которая имеет больше возможных значений, лучше размещать по строкам, а ту, у которой значений меньше, — по столбцам. Вообще характер размещения переменных по строкам или по столбцам особо принципиального значения не имеет, однако такой вариант предпочтительнее в силу своей компактности и лучшей обозримости. Хотя, конечно, во многом здесь дело вкуса, и преимущества предлагаемого варианта становятся более очевидны, когда одна из переменных имеет достаточно большое число возможных значений. Однако для дальнейшего анализа необходимо принять во внимание еще одно правило: внимательно отслеживайте, где вы размещаете независимую переменную — по строкам или по столбцам, и, соответственно этому, при обработке массива данных задавайте команду на расчет процентов в кросстабе. Аналогично производится составление и редактирование таблиц в тех случаях, когда мы производим расчет не в процентах, а в средних значениях баллов тех или иных оценок. Иногда в аналитических целях возникает необходимость ранжировать полученные частоты и проценты с тем, чтобы сразу расставить приоритеты. Так, в нашем исследовании респондентам был задан вопрос относительно их оценки причин, мешающих повышению успеваемости. Этот вопрос был представлен в анкете в виде веера ответов и выглядел довольно хаотичным, чтобы подчеркнуть ценностный нейтралитет авторов анкеты, кодировка же — с 18 по 24 - просто определяет их порядок. В данном случае необходимо заготовить шаблон пустой таблицы и последовательно, раз за разом, перенести в ее ячейки все полученные значения. Теперь отразим полученную в результате расчетов таблицу, в которой расставим процент ответов, полученный каждым из этих значений в ходе опроса; при этом мы пока сохраняем тот порядок следования, который был принят в анкете (см. табл. 4.2).
Таблица 4.2
|