Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Шкала смыслового дифференцирования.





Например:

Þ Продавцы этого магазина:

приятные 1 2 3 4 5 6 7 неприятные

хорошие 1 2 3 4 5 6 7 плохие

дружелюбные 1 2 3 4 5 6 7 недружелюбные

вежливые 1 2 3 4 5 6 7 грубые

 

* + создает сравнительные образы

 

Разработка форм для сбора данных. Организация сбора данных.

Построение форм для сбора данных. Структура анкеты. Определение потребности в информации, содержание, форма и порядок расположения вопросов. Особенности форм для сбора данных в зависимости от метода проведения опроса.

Построение форм для сбора данных в количественных исследованиях. Структура анкеты.

Существует 4 основных типа анкет:

Количественные исследования Качественные исследования
Стандартизированные открытые Нестандартизированные открытые
Стандартизированные закрытые Нестандартизированные закрытые

Стандартизированные открытые – вопросы задаются в совершенно одинаковой формулировке и одинаковом порядке для всех респондентов, что дает возможность сравнить полученные ответы. Недостаток: предложенные альтернативы ответов не учитывают мнение конкретного респондента, под влиянием анкеты он может выбрать ответ, не отражающий его реального отношения к проблеме.

Стандартизированные закрытые – объединяют преимущества скрытых подсознательных мотивов и предпочтений и с преимуществами формализованного подхода в вопросах расшифровки и оформления полученных ответов. Причина использования таких анкет – избежать предвзятости мнения, связанного с индивидуальными предпочтениями. Выясняется не мнение респондента, а его осведомленность по вопросу.

Нестандартизированные открытые – используются в тех случаях, когда цель исследования ясна, а ответ на вопрос остается открытым. Респонденты отвечают своими словами, не ограничены возможностью выбора из определенного набора альтернатив. У интервьюера существует только план анкеты с основными блоками вопросов.

Нестандартизированные закрытые – используются для выявления подсознательных мотивов потребительского поведения. Проекционный метод. Словесная ассоциация – вопросник, содержащий список слов, к которым респондент должен прибавить после их прочтения первое пришедшее в голову слово. Завершение предложения - вопросник, содержащий ряд предложений, которые респондент должен завершить первыми пришедшими в голову словами. Составление рассказа – составление рассказа на основе карикатур, фотографий, картинок. Тематический апперцепционный тест (ТАТ) – определенный набор рисунков, с помощью которых опрашиваемый должен составить небольшой рассказ.

Анкета, используемая в количественном исследовании, должна быть структурирована, информация, предоставляемая респонденту, может быть закрытой или открытой. В структурированной анкете задаваемые вопросы и ответы, допускаемые темой опроса, полностью предопределены.

Этапы разработки анкеты.

1. Определение необходимой информации. Подготовить список вопросов исследования. Создать макеты таблиц для регистрации информации, которая будет собираться.

2. Определение вида анкеты и метода сбора данных. Степень стандартизации анкеты определяется типом необходимых данных. Способы коммуникации с респондентом определяются в зависимости от типа анкеты.

3. Определение содержания отдельных вопросов. Анкета не должна быть очень длинной, следовательно, необходимо убедиться, насколько задаваемый вопрос необходим. Если определенный аспект исследования очень важен, предпочтительно раздробить вопрос на несколько отдельных. Респонденту следует задавать вопросы, имеющие для него смысл. Следует учитывать, что респондент может не помнить события, не имеющие для него важного значения, возможно ввести дополнительные вопросы, которые напомнят эту ситуацию. Необходимо учитывать размеры усилия, которое потребуется респонденту для ответа на вопрос. Деликатные вопросы следует помещать не в начале анкеты, такой вопрос должен быть среди других нейтральных вопросов. Формулироваться данный вопрос может в отношении других людей, ответы представлены в виде ряда категорий, а не конкретных цифр на шоу-карте.

4. Определение форм ответа на каждый вопрос. Многовариантные вопросы - респондент выбирает из предложенных вариант, наиболее точно отражающий его собственную позицию. Варианты ответов должны быть взаимоисключающими, если ответы пересекаются должна быть инструкция: отметьте наиболее важное, отметьте все возможное, проранжируйте все возможное от самой важной до наименее важной. Альтернативы ответов должны быть исчерпывающими, но их не должно быть очень много, т.к. человек не может одновременно анализировать большое количество высказываний (6-7 определений). Предлагается менять порядок расположения ответов (в печатном виде или при чтении интервьюером), особенно расположенных в начале и конце списка.

При покупке предметов гардероба Никогда Иногда Чаще всего
Универмаг Россия      
Специализированный магазин      
«Толпа»      
Другое      

5. Определение формулировки каждого вопроса. Плохая формулировка приводит к отказу отвечать на вопрос, провоцирует некорректные ответы. Основные правила: использовать простые слова, следует избегать: сомнительные слова и вопросы, наводящие вопросы, скрытые альтернативы и допущения, обобщения и оценки, двухканальные вопросы. Варианты ответов должны быть рядополагающими.

6. Определение последовательности вопросов. Начальные вопросы должны быть простыми и интересными. «Воронкообразный подход» – от общих вопросов к конкретной теме. Разветвленные вопросы – на основе ответов на предыдущие вопросы респондент отсылается к различным местам в анкете. Используя разветвленные вопросы необходимо: подготовить инструкции по различным схемам заполнения анкеты, размещать вопросы недалеко от исходных, размещать вопросы в таком порядке, чтобы респондент не догадался, какая дополнительная информация потребуется (наличие бытовой техники и подробности о ней). Классификационная информация (социально-демографические характеристики) располагается в конце анкеты.

7. Определение физических характеристик анкеты. Обеспечение привлекательного вида анкеты, продуманные вводные слова.

8. Перепроверка этапов 1 -7.

9. Предварительное тестирование.

Особенности разработки анкет в зависимости от способа сбора информации.

Опрос по почте. Коммуникация осуществляется визуальным путем, следовательно, необходимо привлечь внимание особенностями дизайна, чтобы мотивировать респондента ответить на вопросы. Предпочтительно печатать анкету в виде буклета с крупным четким шрифтом. Респондент не должен испытывать трудности при заполнении анкеты, для этого используются графическое изображение.

Опрос по телефону. Аудиальная коммуникация. Возможно использование специальных методов - CATI (computer-assistered teltphone interiewing). Вопросы должны быть максимально короткими и простыми. Длительность интервью не должна превышать 10- максимум 15 минут.

Опрос face-to-face. Данный способ сбора информации позволяет применять сложные вопросы. Дизайн анкеты зависит от того, кто ее заполняет: интервьюер (внешнее оформление аналогично анкете для телефона) или сам респондент (внешнее оформление аналогично анкете для почтового опроса). Для ответов на сложные или деликатные вопросы часто используются карточки с вариантами ответов (большой размер шрифта), которые предлагаются респонденту.


Методы анализа данных, в количественных исследованиях. Проверка гипотез и статистический анализ.

В маркетинговом исследовании большое значение имеют статистические методы сбора, обработки и анализа массовых количественных данных. Для каждой шкалы измерения присущ свой набор методов обработки информации. Применение инструментария, рассчитанного на другой тип шкалы, в большинстве случаев приводит к ошибочной интерпретации результатов.

Свойства зависимости между переменными: (a) величина зависимости и (b) надежность зависимости. Надежность зависимости непосредственно связана с репрезентативностью определенной выборки, на основе которой строятся выводы. Надежность определяет, насколько вероятно, что найденная зависимость, будет вновь обнаружена (иными словами, подтвердится) на данных другой выборки, извлеченной из той же самой популяции. Надежность найденных зависимостей между переменными выборки можно количественно оценить и представить с помощью стандартной статистической меры (называемой p-уровень или статистический уровень значимости).

Статистическая значимость результата представляет собой оцененную меру уверенности в его "истинности" (в смысле "репрезентативности выборки"), p-уровень это показатель, находящийся в убывающей зависимости от надежности результата, p-уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Например, p - уровень =.05 (т.е. 1/20) показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между переменными. Во многих исследованиях p-уровень.05 рассматривается как "приемлемая граница" уровня ошибки.

Слабые связи могут быть значимо доказаны только на больших выборках.

Основные статистические методы, используемые при проведении маркетингового исследования, можно условно разделить на 3 основные группы:

Сводка и группировка первичных данных. На теории группировок, например, базируются принципы сегментации рынка по комплексу социально-демографических, экономических, психографических и других признаков. Группировка может осуществляться как по количественным, так и по качественным признакам. Одномерная группировка (пол/возраст/социальное положение и т.п.).

Примером многомерной группировки методом многомерной классификации является кластерный анализ. Главное назначение кластерного анализа – разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Фактически, кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов"распределения объектов по кластерам".

Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков.

Цель кластерного анализа состоит в классификации объектов или людей по нескольким общим группам так, чтобы те, кто попал в одну группу, были похожи друг на друга насколько это возможно. Другими словами, все единицы, попавшие в один кластер, должны быть однородны, и сильно отличаться от тех единиц, которые попали в другой кластер.

Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.

Объекты i -ый и j -ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Х i и Хj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим. Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между Хi и Хj из Ер, где Ер - р -мерное евклидово пространство.

Существует множество процедур кластеризации, основанных на различных математических расчетах. Но все они базируются на использовании мер (критериев) близости. Самой распространенной мерой близости, "метрикой", на основе которй осуществляется разбиение объектов на группы, является евклидово расстояние между объектами:

Пусть имеются два объекта X=(X1,…,Xm) и Y=(Y1,…,Ym). Используя эту запись для объектов, определяются основные виды расстояний, используемых в процедуре кластер:

· Евклидово расстояние (Euclidian distance).

· Квадрат евклидова расстояния (Squared Euclidian distance)

В процессе формирования кластеров чаще всего используются так называемые агломеративные иерархические алгоритмы (иерархическое дерево), смысл которых состоит в последовательном объединении объектов, сначала наиболее близких, а затем все более отдаленных друг от друга. На каждом шаге работы алгоритма происходит объединение двух самых близких кластеров и соответственно преобразуется матрица расстояний. Работа алгоритма заканчивается, когда все объекты будут объединены в один кластер.

Описанный алгоритм не дает достаточно обоснованных правил остановки на каком-либо шаге кластеризации. Количество групп, как правило, устанавливается визуально. При этом во внимание принимается устойчивость групп на протяжении нескольких шагов алгоритма, а также возможность содержательной интерпретации образованных кластеров.

При наличии гипотезы относительно числа кластеров (по наблюдениям или по переменным). Возможно указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.

Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) - минимизировать изменчивость внутри кластеров, и (2) - максимизировать изменчивость между кластерами.

Обычно, когда результаты кластерного анализа методом K средних получены, можно рассчитать средние для каждого кластера по каждому измерению, чтобы оценить, насколько кластеры различаются друг от друга. В идеале вы должны получить сильно различающиеся средние для большинства, если не для всех измерений, используемых в анализе.

Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения: В частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов за счет замены их характеристиками обобщенных значений параметров кластера. При проведении классификации объектов игнорируется очень часто возможность отсутствия в рассматриваемой совокупности каких-либо значений кластеров.

Кластерный анализ можно применять к интервальным данным, частотам, бинарным данным. Важно, чтобы переменные изменялись в сравнимых шкалах.

Описательный (дескриптивный анализ). Этот вид анализа включает описательное представление отдельных переменных. В рамках данного вида анализа формируются частотные таблицы, вычисляются статистические характеристики. Также используются такие меры, как средняя, мода, среднее квадратическое отклонение, дисперсия и другие показатели центральной тенденции и вариации.

Аналитическая статистика. Задачей аналитической статистики является проверка статистических гипотез с целью обобщения полученных результатов. Она используется, например, для сравнения результатов исследования двух групп (или рыночных сегментов), а также для определения различий между ними, например, различий в поведении двух групп потребителей, в их реакции на одну и ту же рекламу и т.п.

Аналитическая статистика направлена на определение зависимости между двумя и более переменными. Здесь находят применение методы дисперсионного, корреляционно-регрессионного и многомерного анализа. Они могут быть использованы для обоснования маркетинговых решений, в основе которых лежит множество взаимосвязанных переменных, например, зависимость объема продаж от качества товара, цены на него, эффективности рекламных кампаний, уровня жизни населения и т.д.

Описательный (дескриптивный анализ).

Для описания информации, полученной на основе выборочных наблюдений, в маркетинговых исследованиях широко используются две группы методов дескриптивного анализа. Первая группа включает исследования "центральной тенденции", которые описывают типичного респондента или типичный ответ. Вторая группа включает анализ вариации, который описывает степень схожести, или несхожести, респондентов и их ответов с типичными респондентами или ответами.

К числу основных показателей, характеризующих центральную тенденцию, относятся мода, медиана и средняя.

"Истинное" среднее и доверительный интервал. Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Исследователю нужны такие статистики, которые позволяют сделать вывод относительно популяции в целом. Одной из таких статистик является среднее. Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия находится "истинное" (неизвестное) среднее популяции. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p =.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

Мода характеризует величину признака, которая встречается в изучаемой совокупности чаще, чем другие величины данного признака. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой. В интервальном вариационном ряду, тем более при непрерывной вариации признака, каждое значение признака встречается только один раз. Поэтому без вычислений можно определить лишь модальный интервал с наибольшей частотой. Внутри этого интервала находится условное значение признака, вблизи которого находится большинство значений признака. Это условное значение и считается точечной модой.

Медиана – это величина варьирующего признака, делящая совокупность на две равные части – со значениями признака меньше и больше медианы. В ранжированном вариационном ряду с нечетным числом единиц медианой является значение признака у средней в ряду единицы, а при четном числе единиц медиана определяется как средняя арифметическая двух значений признаков, находящихся в середине ряда.

Анализ связи между двумя и более переменных с помощью таблиц сопряженности (табуляция).

Слышали ли Вы название компании Здоровый Город? * возраст Crosstabulation

 

 

 

 

 

 

 

 

 

 

 

 

 

 

      возраст       Total
 
    18-29 30-39 40-49 старше 50  
 
да Count          
 
  % within Слышали ли Вы название компании Здоровый Город? 32,2% 21,9% 20,5% 25,3% 100,0%
 
  % within возраст 61,8% 59,3% 54,5% 43,0% 53,9%
 
  % of Total 17,3% 11,8% 11,1% 13,7% 53,9%
 
нет Count          
 
  % within Слышали ли Вы название компании Здоровый Город? 23,2% 17,6% 20,0% 39,2% 100,0%
 
  % within возраст 38,2% 40,7% 45,5% 57,0% 46,1%
 
  % of Total 10,7% 8,1% 9,2% 18,1% 46,1%
Total
  Count          
 
  % within Слышали ли Вы название компании Здоровый Город? 28,0% 19,9% 20,3% 31,7% 100,0%
 
  % within возраст 100,0% 100,0% 100,0% 100,0% 100,0%
 
  % of Total 28,0% 19,9% 20,3% 31,7% 100,0%
Таблицы сопряженности позволяют измерить связи между кросстабулированными переменными. Следующая таблица отчетливо показывает сильную связь между двумя переменными: переменная Возраст (Взрослый или Ребенок) и переменная - предпочитаемое Печенье (сорт A или сорт B).
  ПЕЧЕНЬЕ: A ПЕЧЕНЬЕ: B  
ВОЗРАСТ: ВЗРОСЛЫЙ      
ВОЗРАСТ: РЕБЕНОК      
       


Из таблицы видно, что все взрослые выбирают печенье A, а все дети печенье B. В данном случае, нет оснований сомневаться в надежности этого факта. Взглянув на таблицу, мало кто усомнится, что между предпочтениями детей и взрослых имеется отчетливое различие. Однако наблюдаемые на практике связи значительно слабее, и поэтому возникает вопрос: как измерить связи между табулированными переменными и оценить их надежность (статистическую значимость).

Гипотезы – это предположения или теории, которые исследователь выдвигает относительно некоторых характеристик генеральной совокупности, подлежащих обследованию. Проверка статистических гипотез позволяет рассчитать вероятность наступления какого-либо события. Проверка гипотезы осуществляется следующим образом. Выдвигаются нулевая и альтернативная гипотезы. Нулевая гипотеза H o предполагает, что наблюдаемые различия находятся в пределах случайных отклонений. Альтернативная гипотеза H а опровергает нулевую гипотезу, т.е. различия, демонстрируемые результатами исследования отражают действительно существующие различия. Обычно нулевая гипотеза формулируется таким образом, чтобы отказ от нее приводил к какому-либо желательному заключению. Например, оператору мобильной связи нужно ответить на вопрос: следует ли вводить новый тариф. Для оператора будет целесообразным введение нового тарифа при условии, что он заинтересует не менее 7% потенциальных потребителей. Формулировка гипотез:

H o < 0,07

Ha > 0,07

Это вариант однонаправленной проверки. В аналитической статистике разработаны методы вычисления тестовых (контрольных величин). Эти тестовые величины соответствуют определенным теоретическим распределениям и позволяют вычислить вероятность ошибки. Эта вероятность соответствует % ошибки, которую можно допустить, отвергнув нулевую гипотезу и приняв альтернативную. Эта вероятность определяется как величина, находящаяся в диапазоне от 0 до1. 0 < р < 1.

Вероятность ошибки р > 0,1, р > 0,05, р > 0,01, р > 0,001

Решение, принимаемое на основе ограниченного ряда наблюдений, неизбежно сопровождается вероятностью ошибочного решения, важно определить, насколько велика эта вероятность.

С вероятностью (a) гипотеза Ho может оказаться отвергнутой, в то время как на самом деле она является справедливой (ошибка первого рода), или, наоборот, с вероятностью (b) может быть принята Ho в то время, когда она является ошибочной (ошибка второго рода). При фиксированном объеме выборочных данных величину вероятности одной из этих ошибок можно выбирать. В частности, при фиксированном объеме выборки обычно задаются величиной (a) вероятности ошибочного отвержения проверяемой гипотезы H o.


Критерий хи-квадрат Пирсона. Хи-квадрат Пирсона - это наиболее простой критерий проверки значимости связи между двумя категоризованными переменными. Критерий Пирсона основывается на том, что в двувходовой таблице ожидаемые частоты при гипотезе "между переменными нет зависимости" можно вычислить непосредственно. Представьте, что 20 мужчин и 20 женщин опрошены относительно выбора газированной воды (марка A или марка B). Если между предпочтением и полом нет связи, то естественно ожидать равного выбора марки A и марки B для каждого пола.

Критерий хи-квадрат используется для определения соответствия между наблюдаемым и ожидаемым распределением переменных.

Рассмотрим ситуацию, когда менеджеру магазина электронной техники необходимо проверить эффективность трех мероприятий, проводимых в магазине с целью привлечения покупателей. Он хотел бы оценить эффект каждого мероприятия по числу покупателей магазина по следующим данным:

 

Мероприятие Месяц Число покупателей

 

1 апрель 12.800

 

2 май 13.100

 

3 июнь 12.600

 

всего 38.500

Менеджер должен выяснить, существенны ли различия между числом посетителей магазина в различные периоды времени. На этот вопрос позволяет ответить критерий хи-квадрат. Обычно используется следующая последовательность проведения проверки:

1. Выдвигается нулевая и альтернативная гипотезы:

H 0: число посетителей магазина во время проведения трех мероприятий одинаковое;

H a: существует значительная разница в численности посетителей магазина во время проводимых мероприятий.

2. Определяется ожидаемое (теоретическое) число посетителей в случае, если нулевая гипотеза верна. Естественно предположить, что численность посетителей должна быть одинакова при условии отсутствия влияния других факторов.

Ожидаемое число посетителей можно определить по формуле:

38.500

Е= ---------- = 12.833

3. Рассчитывается величина хи-квадрат по формуле:

 

X2 i=1 (Q1-E1)

E1

 

где Oi – наблюдаемая частота в каждой категории;

Ei - ожидаемая частота.

 

(12.800 - 12.833)2 (13.100 - 12.833)2 (12.600 - 12.833)2

x2= ------------------------ + ------------------------ + ------------------------ = 9.87

12.833 12.833 12.833

 

 

Выбирается уровень значимости a. Если a = 0,05, то табличное значение x2= 5,991 (для числа степеней свободы (к – 1) = 2);

Сравнивается табличное значение x2 с расчетным. Так как расчетное значение x2 больше, чем табличное значение, нулевая гипотеза отвергается. Следовательно, можно сделать вывод с вероятностью 95 %, что посетители магазина реагируют на проводимые мероприятия. Однако такая проверка не позволяет ответить на вопрос, насколько эффективность каждого мероприятия отличается от эффективности остальных.

хи-квадрат – критерий для двух независимых выборок

Маркетинговым исследователям часто бывает необходимо определить, существует ли связь между двумя и более переменными. Чтобы сформулировать маркетинговую стратегию, необходимо найти ответ на такие вопросы, как: существуют ли различия в группировках мужчин и женщин на активных, умеренных и слабых потребителей, или одинаково ли деление лиц, покупающих и не покупающих данный товар, на группы с низким, средним и высоким доходом. В описанных ситуациях обычно используется критерий x2 для двух независимых выборок.

Техника проведения проверки проиллюстрирована в таблице. Предположим, что менеджеру необходимо определить природу связи, если она есть, между полом покупателей и частотой посещения магазинов. Частота посещения магазинов изучалась в трёх категориях:

А) 1 – 5 посещений в месяц – слабые потребители;

Б) 6 – 11 посещений – умеренные потребители;

В) 15 и более раз – активные потребители.

Группировка исходных данных

  Мужчины Женщины Итого  
1 – 5      
6-14      
15 и более      
Итого      

Определить ожидаемые частоты для каждой группы, попавшей в исследование, используя итоговые данные по соответствующим строкам и столбцам;

Расчет ожидаемых (теоретических) частот

Частота посещений Мужчины Женщины
1 – 5 (97*54):215=24.36 (118*54):215=29.64
6-14 (97*135): 215=60.91 (118*135):215=74.09
15 и более (97*26):215=11.73 (118*26):215=14.27

Рассчитать величину x2 по формуле:

 

X2 i=1 (Q1-E1)2

E1

где Oij – наблюдаемое число в каждой i-ой строке j-ой колонки;

Eij - ожидаемое число в i-ой строке j-ой колонки.

Для нашего случая:

(13 - 24.36)2 (41 - 29.64)2 (72 - 60.91)2 (63 - 74.09)2 (12 - 11.73)2 (14 - 14.27)2

x2= ------------------- + ------------------ + --------------- + --------------- + --------------- + ---------------

24.36 29.64 60.91 74.09 11.73 14.27

x2= 13,35

Сравнить табличное значение x2 с расчетным. Табличное значение x2 (для уровня значимости 0.05 и (r – 1)* (k – 1) = 2 степеней свободы) равно 5.991. Так как расчетное значение x2 = 13.35 больше, чем табличная величина, нулевая гипотеза отвергается, и можно сделать вывод о том, что существуют различия между мужчинами и женщинами по частоте посещения магазина.

Степень взаимосвязи между указанными признаками определяется с помощью коэффициента корреляции Пирсона.

Корреляция представляет собой меру зависимости переменных. Наиболее известна корреляция Пирсона. При вычислении корреляции Пирсона предполагается, что переменные измерены, как минимум, в интервальной шкале. Некоторые другие коэффициенты корреляции могут быть вычислены для менее информативных шкал. Коэффициенты корреляции изменяются в пределах от -1.00 до +1.00. Значение -1.00 означает, что переменные имеют строгую отрицательную корреляцию. Значение +1.00 означает, что переменные имеют строгую положительную корреляцию. Значение 0.00 означает отсутствие корреляции.

Разведочный анализ корреляционных матриц. Во многих исследованиях первый шаг анализа состоит в вычислении корреляционной матрицы всех переменных и проверке значимых (ожидаемых и неожиданных) корреляций. После того как это сделано, следует понять общую природу обнаруженной статистической значимости.


Организация сбора данных.

Организация процесса полевых работ. Тренинг и контроль интервьюеров. Основные ошибки, возникающие в ходе сбора данных: систематические и несистематические ошибки. Типология ошибок и методы их снижения.

Технические работы – печать анкет, шоу-карты и т.п.

Определение количества интервьюеров (учитываются сроки, сложность достижения респондентов, психологические характеристики самих интервьюеров и т.п.).

Рекрутинг интервьюеров и сбор для тренинга. Подготовка инструкций и маршрутных листов для интервьюеров. Предварительное распределение анкет по географии, количеству и т.п.

Проведение тренинга. Введение в курс дела – цели, задачи. Ознакомление с инструкциями. Изучение анкеты. Изучение маршрутных листов, списков опрашиваемых и т.п.

Контроль работы интервьюеров (10% - 80%). Виды контроля. Регулярность отчетности. Контроль качества ведения интервью и редактирования. Он заключается в участии контролёра в опросах или наблюдениях совместно с полевыми сотрудниками для проверки соблюдения процедуры и правильной фиксации данных. Контролёры также ежедневно должны собирать и просматривать формы для своевременного выявления ошибок и осуществления полевого редактирования (подробнее об этом изложено в главе Также проверяется выполнение графика работ.

Выборочный контроль. Проверка следования сотрудников плану выборочного отбора. Для этого ежедневно фиксируется, сколько было сделано попыток контактов, сколько неудачных, по каким причинам.

Контроль для предотвращения мошенничества. Заключается в пресечении подделки ответов на часть вопросов или целых анкет или форм интервьюерами или наблюдателями.

Проверка результатов полевых работ заключается в определении достоверности, подлинности представленных результатов. Одним из методов является связь с респондентами (наблюдаемыми) и выяснение того, действительно ли полевые сотрудники их опрашивали (наблюдали). Также у респондентов выявляется продолжительность, качество опроса, поведение интервьюера. Кроме того, его просят предоставить основные демографические данные для сопоставления с данными в анкете.

В течение предыдущих этапов полевых работ осуществляется оценка работы полевого персонала. Такая оценка производится для своевременного исключения неквалифицированных или недобросовестных сотрудников и поощрения наиболее успешных как средство мотивации.

Оценка производится по следующим критериям: доля ответивших в общем количестве опрошенных; качество проведения интервью; качество полученных данных.

Ошибки, проявляющиеся в ходе сбора данных, могут быть разделены на две группы:

Ошибки в выборке. Они связаны с несоответствие параметров изучаемой выборки и генеральной совокупности. Такие ошибки возникают на стадии проектирования выборки.

Систематические ошибки. В эту группу входят все остальные ошибки, не являющиеся ошибками выборки. Они возникают в результате несовершенной концепции или логики исследования, неправильной интерпретацией ответов, а также ошибок на стадии обработки, анализа данных и представления информации.

Систематические ошибки делятся на два вида:

Случайные. Такие ошибки приводят к отклонениям от истинного значения на случайную величину и в случайную сторону.

Неслучайные. Такие ошибки приводят к одностороннему отклонению результата от истинного значения.

Систематические ошибки более опасны, чем ошибки в выборке: их труднее измерить. Величина систематической ошибки может в десять раз превысить ошибку выборки.

Систематические ошибки могут быть сокращены с помощью специальных методов. Для того, чтобы их правильно применить, необходимо определить основные источники систематических ошибок.

Классификация систематических ошибок по источникам возникновения

 

Ошибка ненаблюдения связана с невозможностью получить данные от части элементов исследуемой совокупности. Такая ошибка может возникнуть по двум основным причинам:

часть объекта исследования не представлена в выборке (ошибка неохвата, получение данных от наиболее доступных им респондентов, социально активных и т.п.). Ошибки неохвата возникают вследствие недостаточно тщательного анализа процедуры формирования выборки.

Часть элементов выборки не представила данных (ошибка неполучения данных из-за отсутствия на месте либо отказа от интервью). Для измерения возможной величины этой ошибки в практике маркетинговых исследований при опросах применяется специальный показатель – доля ответивших. Доля ответивших – отношение количества полных интервью к общему количеству приемлемых респондентов в выборке, пример с маршрутным листом при фик







Дата добавления: 2015-08-12; просмотров: 644. Нарушение авторских прав; Мы поможем в написании вашей работы!




Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Тема: Изучение приспособленности организмов к среде обитания Цель:выяснить механизм образования приспособлений к среде обитания и их относительный характер, сделать вывод о том, что приспособленность – результат действия естественного отбора...

Тема: Изучение фенотипов местных сортов растений Цель: расширить знания о задачах современной селекции. Оборудование:пакетики семян различных сортов томатов...

Тема: Составление цепи питания Цель: расширить знания о биотических факторах среды. Оборудование:гербарные растения...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Studopedia.info - Студопедия - 2014-2025 год . (0.015 сек.) русская версия | украинская версия