Основные этапы статистической обработки данных и программирование обработки данных с помощью статистического пакета для соц-ных наук.
1) Исходный предварительный анализ исследуемой системы. На этом этапе определяются: основные цели исл-ния (неформальный уровень); совокупность единиц, представляющих предмет иссл-ния; перечень отобранных из некоторого априорного набора показателей, характеризующих состояние или поведение каждого из обследуемых объектов, к-рые собираются использовать в исследовании; степень формализации соответствующих записей при сборе данных; общее время, трудозатраты, отведённые на планируемые работы (время, протяженность и объем); некоторые моменты, связанные с предварительной проверкой перед составлением плана исследования; сделать формализованную постановку задач, включая вероятностную модель изучаемого явления; сделать формы для сбора первичной инф-ции и для введения этой информации в ЭВМ. 2) Составление плана сбора исходной инф-ции – этап проектировки выборки. Необходимо учитывать схему дальнейшего анализа. Произвести расчёт разрешающей силы исследования. 3) Сбор исходной инф-ции, её подготовка и введение в ЭВМ. Вместе с вводом данных в компьютерную память необходимо занести и краткое описание используемых терминов. Т.о. независимо от того производится ли исследователем выбор метода и плана статистического обследования или он уже располагал результатами пассивного или эксперимента к моменту определения основного инструментария статистического исследования. 4) Первичная статистическая обработка данных: перекодировка данных; определяются пределы варьирования переменных, анализ редко выделяющихся переменных; восстановление проведённых наблюдений; проверка статистической независимости последовательности наблюдений, составляющих массив исходных данных; экспериментальный анализ закона распределения исследуемой статистической совокупности (итоги). Одномерное распределение линейка. 5) Выбор основных методов и алгоритмов статистической обработки данных, составление детального плана вычислительного анализа собранного материала: составление справки по собранному материалу и результатам предварительного анализа; определяются основные группы, по к-рым будет проводиться анализ; описываемая блок-схема анализа с указанием применяемых методов. 6) Вычисляется реальное, основное число статистически обработанных данных. Эффективное управление вычислительным процессом, путём формулировки задачи обработки и описания данных на входном языке пакета (язык, с помощью к-рого происходит ввод данных в ЭВМ, SPSS): статистическое иссл-ние зависимостей; классификация объектов и признаков; сжатое представление данных. 7) Итоги иссл-ния, представленные в отчёте. Исходные данные – это единицы анализа, представленные набором значений переменных, располагающихся на одной или нескольких записях. Последовательность этих значений представляет исходный файл. Данные в фиксируемом формате, т.е. значения каждого признака располагается в одном и том же месте в определённой записи. Кодирование инф-ции – сопоставление числовых кодов, значений, переменных, фиксируемых у единиц анализа. Переменные – вопросы анкеты; их значение – определённые варианты ответов. Различные ответы составляют числовые коды (номера, ответов на вопрос анкеты). Для каждого вопроса анкеты фиксируются номера позиций – местоположение вопроса в записи, длинна отчётов на один и тот же вопрос должна быть равной. Записи служат средством блокировки данных при занесении на машинный носитель и имеют фиксируемую длину – суммарное число цифр, к-рые не должны быть больше 80. В начале каждой записи заносятся номера анкет, фиксируемой длины доли номера записи – для контроля и сортировки инф-ции. Подготовка управляющей инф-ции для обработки данных начинается с их описания. - идентифицируется файл, содержащий обработанные данные. Он включает: - метки переменных, метки значений переменных и их местоположение; - те значения переменных, к-рые будут рассматриваться как отсутствующие.
|