Лекция №2: «ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ.
Трансакционную лояльность можно соотнести с лояльностью (поведенческой), но эти понятия не идентичны. Перцепционная лояльность также полностью не идентична понятию приверженности, так как субъективные мнения потребителей совершенно необязательно будут предполагать полную эмоциональную вовлеченность, полное удовлетворение брендом. Истинная лояльность наиболее близка по значению, а именно к типу «приверженность + лояльность», поэтому мы будем считать, что подтип «истинная лояльность» соответствует смешанному типу лояльности (приверженность + лояльность). Ложная лояльность совпадает по значению с подтипом «лояльность без приверженности». Латентная (скрытая лояльность) идентична по значению подтипу «приверженность без лояльности». Типы лояльности выделяются на основании следующих условий: a) эмоциональная привязанность потребителя к марке; б) нечувствительность к действиям конкурентов; в) регулярность покупок марки; г) временнoй фактор.
2. Для определения степени лояльности потребителей чаще всего рекомендуют использовать следующие показатели: 1 База клиентов - общее количество всех потребителей продукции компании Это количество определяется как сумма покупателей, совершивших покупку впервые. Важно учитывать именно активных покупателей и клиентов, вступивших в контакт с компанией относительно недавно (срок устанавливается индивидуально для каждой компанииії). 2 Уровень содержания новых покупателей Этот показатель отражает процент покупателей, совершивших покупку впервые и вернулись во второй раз в течение определенного периода времени. 3 Уровень удержания клиентов - процент потребителей, которые осуществили определенное количество покупок в течение установленного периода времени 4 Доля расходов покупателя - процент общего числа покупок в конкретной категории продуктов или услуг, которые осуществляет покупатель в этой компании 5 Среднее число новых покупателей за месяц 6 Частота покупок. 7 Средняя сумма покупки. 8 Уровень потерь - среднегодовой процент покупателей, которые утрачены или по какой-то причине стали неактивными покупателями (разочарованы или, изменившие адрес) Лекция №2: «ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ. СВОЙСТВА ЭМПИРИЧЕСКИХ ХАРАКТЕРИСТИК»
1. Точечные оценки параметров 2. Свойства эмпирических характеристик 3. Методы нахождения оценок параметров
ЛИТЕРАТУРА
1. Морозов Ю.В. Основы высшей математики и статистики. М., «Медицина», 2004, § 9.3. 2. Павлушков И.В. и др. Основы высшей математики и математической статистики. М., «ГЭОТАР-Медиа», 2006, § 8.2.
1) Требуется оценить некоторый параметр θ;, связанный со случайной величиной X, используя выборку Xn = {x1, x2, …, xn}. Пусть в качестве такой оценки выбрана однозначная функция от элементов выборки θ* = θ*(x1, x2, …, xn). Для конкретных значений элементов выборки эта оценка представляет собой одно число. Такие оценки называются точечными оценками параметров, так как на числовой оси они изображаются одной точкой. Числовые характеристики случайных величин, найденные на основе экспериментальных данных, называются точечными оценками этих характеристик или эмпирическими характеристиками. Задача состоит в том, чтобы найти такую оценку θ*, которая была бы в определённом смысле наиболее близкой к оцениваемому параметру θ;. Как функция элементов выборки, оценка θ* является случайной величиной. Определим её математическое ожидание. Оно, очевидно, будет зависеть от истинных числовых характеристик изучаемой величины X и от объёма выборки n. Пусть получено равенство:
M{θ*} = θ + φ(θ, n), (1)
где φ(θ, n) – некоторая функция истинного значения параметра θ;. Желательно, чтобы функция φ(θ, n) равнялась нулю. Это бы означало, что математическое ожидание оценки параметра равно истинному значению этого параметра.Оценка θ*, обладающая таким свойством, называется несмещённой оценкой параметра θ;. Если φ(θ, n)≠ 0, то θ* называется смещённой оценкой параметра θ;, а сама функция φ(θ, n) называется смещением. Если при n→∞; оценка параметра сходится по вероятности к истинному значению параметра, то оценка θ* называется состоятельной оценкой параметра θ;. Для дальнейшего изучения свойств оценки θ* можно определить её дисперсию, которая также окажется функцией от истинных числовых характеристик изучаемой случайной величины X и от объёма выборки n, т.е. D{θ*} = D(θ, n). Если оценка состоятельная, то D(θ, n) стремится к нулю при n→∞;. Различные оценки одного и того же параметра будут иметь разные дисперсии. Та из них, которая имеет наименьшую дисперсию, называется эффективной оценкой данного параметра. 2) Проведём краткий анализ эмпирических числовых характеристик. Найдём математическое ожидание и дисперсию оценки mx* истинного математического ожидания m x случайной величины X:
Здесь учтено, что элементы выборки xi, являясь независимыми реализациями случайной величины X, имеют те же самые характеристики, что и сама величина X. Таким образом,
, (2)
Из этого следует, что mx* является несмещённой и состоятельной оценкой истинного математического ожидания mx случайной величины Аналогичный анализ для эмпирической дисперсии Dx* показывает, что
Таким образом, эмпирическая дисперсия является смещённой оценкой дисперсии. Смещение равно (–Dx/n) и стремится к нулю при n→∞;. Однако при малом объёме выборки это смещение оказывается существенным. Для его устранения вводится поправочный коэффициент, при умножении которого на Dx* получается другая оценка дисперсии, не имеющая смещения. Эта оценка обозначается обычно через S2:
, (3)
Очевидно, что M{S2} = Dx. Вычисление дисперсии величины S2 не представляет принципиальных трудностей, но оказывается достаточно громоздким. Вычисления показывают, что эта дисперсия пропорциональна величине 1/n и, следовательно, стремится к нулю при n→∞;. Таким образом, величина S2 является несмещённой и состоятельной оценкой истинной дисперсии Dx. Её рекомендуется использовать вместо оценки Dx*, особенно при малых значениях n.
3) Рассмотрим кратко методы нахождения оценок. Один из методов предполагает задание структуры оценки с точностью до неизвестных параметров, которые определяются из условия минимума дисперсии оценки. Примером применения этого метода является определение оценки математического ожидания случайной величины в случае неравноточных измерений. Пусть по выборке Xn = {x1, x2, …, xn} требуется оценить параметры mx и Dx, причём измерения xi были произведены с разной точностью, т.е.
Чем меньше дисперсия измерения, тем больше доверия этому измерению, т.е. измерения должны учитываться оценкой с разными весовыми коэффициентами. Исходя из этого, выберем следующую структуру оценки:
, (4)
Чтобы оценка была несмещённой, необходимо выполнение условия:
Проводя минимизацию, получим:
, (5)
Итак, при неравноточных измерениях для оценки математического ожидания следует пользоваться формулой (4), подставляя в неё коэффициенты bi из (5). Второй метод – метод наибольшего правдоподобия. Этот метод требует знания закона распределения случайной величины с точностью до неизвестных параметров. Предположим, что плотность распределения вероятностей величины X равна fX(x, θ), где θ; – неизвестный параметр, который требуется оценить. Тогда каждое измерение xi из выборки Xn = {x1, x2, …, xn} будет иметь плотность распределения fX(xi, θ). Элементы выборки xi являются статистически независимыми, поэтому n – мерная плотность распределения вероятностей выборки равна произведению одномерных плотностей, т.е.
(6)
Эту плотность называют функцией правдоподобия. Можно предполагать, что в выборке чаще встречаются те возможные значения величины X, для которых плотность распределения имеет относительно большие значения. Из этого следует, что в качестве оценки параметра θ логично взять такое значение, которое максимизирует функцию правдоподобия. Однако с целью упрощения вычислений используют не функцию правдоподобия непосредственно, а её натуральный логарифм:
, (7)
Доказано, что эта функция имеет максимум, причём значение θ = θ*(x1, x2, …, xn), при котором достигается этот максимум, является оценкой параметра θ;, обладающей наименьшей дисперсией. Таким образом, для определения оценки нужно решить уравнение
, (8)
Решение этого уравнения θ*(x1, x2, …, xn) и будет оценкой параметра θ;. Оценки, найденные таким способом, называются оценками максимального (или наибольшего) правдоподобия. Оценки максимального правдоподобия всегда являются эффективными оценками. Пример 1. По выборке объёма n = 20 найдена оценка дисперсии Dx* случайной величины X: Dx* = 4,8. Определить несмещённую оценку S2 неизвестной дисперсии. Решение. Воспользуемся формулой (3):
Пример 2. Некоторая постоянная величина C была измерена тремя измерительными приборами по 4 раза каждым. Измерения, полученные с помощью первого прибора, равны 4,75, 4,9, 5,05, 4,85, с помощью второго прибора – 4,9, 5,1, 4,7, 5,15, с помощью третьего прибора – 4,7, 4,95, 5,05, 5,25. Класс точности измерительных приборов такой, что первый из них обеспечивает среднее квадратическое отклонение измерений σ1 = 0,1, второй – σ2 = 0,15, третий – σ3 = 0,2. Требуется оценить истинное значение величины C. Решение. Измерения величины C являются неравноточными. Поэтому применим для оценки формулу (4). Вычислим коэффициенты bi по формулам (5):
Поскольку каждым прибором было сделано по 4 измерения, то n = 12, и, следовательно,
Таким образом,
Подставим найденные значения и соответствующие измерения в формулу (5):
Итак, в качестве оценки истинного значения величины C следует взять C* = 4,94.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Какие оценки параметров распределения называются точечными? 2. Что такое эмпирические характеристики? 3. Какая оценка параметра распределения называется несмещенной? смещенной? состоятельной? эффективной? 4. Что является смещенной и состоятельной оценкой истинного математического ожидания случайной величины? 5. Приведите формулу для смещенной оценки дисперсии. 6. Как определяется оценка математического ожидания при неравноточных измерениях? 7. Что называется функцией правдоподобия? 8. Какие оценки являются оценками наибольшего правдоподобия?
|