Подгонка параметров распределения

⇐ Предыдущая 35 36 37 38 394041 42 43 44 Следующая ⇒

Как и в процедуре, описанной в главе 3, по поиску оптимального f при нормальном распределении, мы должны преобразовать необработанные торговые данные в стандартные единицы. Сначала мы вычтем среднее из каждой сделки, а затем разделим полученное значение на стандартное отклонение. Далее мы будем работать с данными в стандартных единицах. После того как

мы приведем сделки к стандартным значениям, можно отсортировать их в порядке возрастания. На основе полученных данных мы сможем провести тест К-С. Нашей целью является поиск таких значений LOC, SCALE, SKEW и KURT, которые наилучшим образом подходят для фактического распределения сделок. Для определения «наилучшего приближения» мы полагаемся на тест К-С. Рассчитаем значения параметров, используя «метод грубой силы двадцатого века». Мы просчитаем каждую комбинацию для KURT от 3 до 0,5 с шагом -0,1 (мы можем также взять интервал от 0,5 до 3 с шагом 0,1, так как направление не имеет значения). Далее просчитаем каждую комбинацию для SCALE от 3 до 0,5 с шагом -0,1. Пока оставим LOC и SKEW равными 0. Таким образом, нам надо обработать следующие комбинации:

LOC	SCALE	SKEW	KURT

о			2,9
о			2,8
о			2,7
о			2,6
о			2,5
о			2,4
о			2,3
о			2,2
о			2,1
о
о * * *	* * *	* * *	1,9 * * *
о	2,9
о * * *	2,9 * * *	* * *	2,9 * * *
о	0,5		0,6
о	0,5		0,5

Для каждой комбинации проведем тест К-С. Комбинацию, которая даст наименьшую статистику К-С, будем считать оптимальной для параметров SKALE и KURT (на данный момент). Чтобы провести тест К-С для каждой комбинации, нам необходимо как фактическое распределение, так и теоретическое распределение (определяемое параметрами тестируемого характеристического распределения). Мы уже знаем, как создать функцию распределения вероятности X/N, где N является общим числом сделок, а Х является рангом (от 1 до N) данной сделки. Теперь нам надо рассчитать ФРВ для теоретического распределения при данных значениях параметров LOC, SCALE, SKEW и KURT. У нас есть характеристическая функция регулируемого распределения, она задается уравнением (4.06). Чтобы получить ФРВ из характеристической функции, необходимо найти интеграл характеристической функции. Мы обозначаем интеграл, т.е. площадь под кривой характеристической функции в точке X, как N(X). Таким образом, так как уравнение (4.06) дает первую производную интеграла, мы обозначим уравнение (4.06) как N'(X). В большинстве случаев вы не сможете вывести интеграл функции, даже если вы опытный математик. Поэтому вместо интегрирования функции (4.06) мы будем использовать другой метод. Этот метод потребует больших усилий, но он применим к любой функции.

Вероятность для любой точки на графике характеристической функции можно оценить, если распределение представить себе как последовательность узких прямоугольников. Тогда для любого данного прямоугольника в распределении вы можете рассчитать вероятность, ассоциированную с этим прямоугольником, как отношение суммы площадей всех прямоугольников слева от вашего прямоугольника (включая площадь вашего прямоугольника) к сумме площадей всех прямоугольников в распределении. Чем больше прямоугольников вы используете, тем более точными будут полученные вероятности. Если бы вы использовали бесконечное число прямоугольников, то ваш расчет был бы точным. Рассмотрим процедуру поиска площадей под кривой характеристического распределения на примере. Допустим, мы хотим найти вероятности, ассоциированные с каждым отрезком длиной 0,1 в интервале от -3 до +3 сигма. Отметьте, что в таблице (с. 183) рассмотрен интервал от -5 до +5 сигма. Дело в том, что лучше выйти на 2 сигмы за ограничительные параметры (-3 и +3 сигма в нашем случае), чтобы получить более точные результаты. Отметьте, что Х — это число стандартных единиц, на которое мы смещены от среднего значения. Далее идут значения четырех параметров. Следующий столбец — это столбец N'(X), который отражает высоту кривой в точке Х при этих значениях параметров. N'(X) рассчитывается из уравнения (4.06). Воспользуемся уравнением (4.06). Допустим, нам надо рассчитать N'(X) для Х= -3 со значениями параметров 0,02, 2,76, 0 и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Сначала рассчитаем показатель асимметрии для уравнения (4.06). Формула для расчета С задается уравнением (4.07):

Х	LOG	SCALE	SKEW	KURT	N'(X) Ур. (4.06)	Накопленная сумма	N(X)
-5,0	0,02	2,76		1,78	0,0092026741	0,0092026741	0,000388
-4,9	0,02	2,76		1,78	0,0095350519	0,018737726	0,001178
-4,8	0,02	2,76		1,78	0,0098865117	0,0286242377	0,001997
-4,7	0,02	2,76		1,78	0,01025857	0,0388828077	0,002847
-4,6	0,02	2,76		1,78	0,0106528988	0,0495357065	0,003729
-4,5	0,02	2,76		1,78	0,0110713449	0,0606070514	0,004645
-4,4	0,02	2,76		1,78	0,0115159524	0,0721230038	0,005598
-4,3	0,02	2,76		1,78	0,0119889887	0,0841119925	0,006590
-4,2	0,02	2,76		1,78	0,0124929748	0,0966049673	0,007622
-4,1	0,02	2,76		1,78	0,0130307203	0,1096356876	0,008699
-4,0	0,02	2,76		1,78	0,0136053639	0,1232410515	0,009823
-3,9	0,02	2,76		1,78	0,0142204209	0,1374614724	0,010996
-3,8	0,02	2,76		1,78	0,0148798398	0,1523413122	0,012224
-3,7	0,02	2,76		1,78	0,0155880672	0,1679293795	0,013509
-3,6	0,02	2,76		1,78	0,0163501266	0,184279506	0,014856
-3,5	0,02	2,76		1,78	0,0171717099	0,2014512159	0,016270
-3,4	0,02	2,76		1,78	0,0180592883	0,2195105042	0,017756
-3,3	0,02	2,76		1,78	0,0190202443	0,2385307485	0,019320
-3,2	0,02	2,76		1,78	0,0200630301	0,2585937786	0,020969
-3,1	0,02	2,76		1,78	0,0211973606	0,2797911392	0,022709
-3,0	0,02	2,76		1,78	0,0224344468	0,302225586	0,024550
-2,9	0,02	2,76		1,78	0,0237872819	0,3260128679	0,026499
-2,8	0,02	2,76		1,78	0,0252709932	0,3512838612	0,028569
-2,7	0,02	2,76		1,78	0,0269032777	0,3781871389	0,030770
-2,6	0,02	2,76		1,78	0,0287049446	0,4068920835	0,033115
-2,5	0,02	2,76		1,78	0,0307005967	0,4375926802	0,035621

Продолжение
X	LOG	SCALE	SKEW	KURT	N'(X) Ур. (4.06)	Накопленная сумма	N(X)
-2,4	0,02	2,76		1,78	0,0329194911	0,4705121713	0,038305
-2,3	0,02	2,76		1,78	0,0353966362	0,5059088075	0,041186
-2,2	0,02	2,76		1,78	0,0381742015	0,544083009	0,044290
-2,1	0,02	2,76		1,78	0,041303344	0,5853863529	0,047642
-2,0	0,02	2,76		1,78	0,0448465999	0,6302329529	0,051276
-1,9	0,02	2,76		1,78	0,0488810452	0,6791139981	0,055229
-1,8	0,02	2,76		1,78	0,0535025185	0,7326165166	0,059548
-1,7	0,02	2,76		1,78	0,0588313292	0,7914478458	0,064287
-1,6	0,02	2,76		1,78	0,0650200649	0,8564679107	0,069511
-1,5	0,02	2,76		1,78	0,0722644105	0,9287323213	0,075302
-1,4	0,02	2,76		1,78	0,080818341	1,0095506622	0,081759
-1,3	0,02	2,76		1,78	0,0910157581	1,1005664203	0,089007
-1,2	0,02	2,76		1,78	0,1033017455	1,2038681658	0,097204
-1,1	0,02	2,76		1,78	0,1182783502	1,322146516	0,106550
-1,0	0,02	2,76		1,78	0,1367725028	1,4589190187	0,117308
-0,9	0,02	2,76		1,78	0,1599377464	1,6188567651	0,129824
-0,8	0,02	2,76		1,78	0,1894070001	1,8082637653	0,144560
-0,7	0,02	2,76		1,78	0,2275190511	2,0357828164	0,162146
-0,6	0,02	2,76		1,78	0,2776382822	2,3134210986	0,183455
-0,5	0,02	2,76		1,78	0,3445412618	2,6579623604	0,209699
-0,4	0,02	2,76		1,78	0,4346363128	3,0925986732	0,242566
-0.3	0,02	2,76		1,78	0,5550465747	3,6476452479	0,284312
-0,2	0,02	2,76		1,78	0,7084848615	4,3561301093	0,337609
-0,1	0,02	2,76		1,78	0,8772840491	5,2334141584	0,404499
0,0	0,02	2,76		1,78		6,2334141584	0,483685
0,1	0,02	2,76		1,78	0,9363557429	7,1697699013	0,565363
0,2	0,02	2,76		1,78	0,776473162	7,9462430634	0,637613

Продолжение
X	LOG	SCALE	SKEW	KURT	N'(X) Ур. (4.06)	Накопленная сумма	N(X)
0,3	0,02	2,76		1,78	0,6127219404	8,5589650037	0,696211
0,4	0,02	2,76		1,78	0,4788099392	9,0377749429	0,742253
0,5	0,02	2,76		1,78	0,377388991	9,4151639339	0,778369
0,6	0,02	2,76		1,78	0,3020623672	9,7172263011	0,807029
0,7	0,02	2,76		1,78	0,2458941852	9,9631204863	0,830142
0,8	0,02	2,76		1,78	0,2034532796	10,1665737659	0,849096
0,9	0,02	2,76		1,78	0,1708567846	10,3374305505	0,864885
1,0	0,02	2,76		1,78	0,1453993995	10,48282995	0,878225
1,1	0,02	2,76		1,78	0,1251979811	10,6080279311	0,889639
1,2	0,02	2,76		1,78	0,1089291462	10,7169570773	0,899515
1,3	0,02	2,76		1,78	0,0956499316	10,8126070089	0,908145
1,4	0,02	2,76		1,78	0,0846780659	10,8972850748	0,915751
1,5	0,02	2,76		1,78	0,0755122067	10,9727972814	0,922508
1,6	0,02	2,76		1,78	0,0677784099	11,0405756913	0,928552
1,7	0,02	2,76		1,78	0,0611937787	11,10176947	0,933993
1,8	0,02	2,76		1,78	0,0555414402	11,1573109102	0,938917
1,9	0,02	2,76		1,78	0,0506530744	11,2079639847	0,943396
2,0	0,02	2,76		1,78	0,0463965419	11,2543605266	0,947490
2,1	0,02	2,76		1,78	0,0426670018	11,2970275284	0,951246
2,2	0,02	2,76		1,78	0,0393804519	11,3364079803	0,954707
2,3	0,02	2,76		1,78	0,0364689711	11,3728769515	0,957907
2,4	0,02	2,76		1,78	0,0338771754	11,4067541269	0,960874
2,5	0,02	2,76		1,78	0,0315595472	11,4383136741	0,963634
2,6	0,02	2,76		1,78	0,0294784036	11,4677920777	0,966209
2,7	0,02	2,76		1,78	0,0276023341	11,4953944118	0,968617
2,8	0,02	2,76		1,78	0,0259049892	11,5212994011	0,970874
2,9	0,02	2,76		1,78	0,0243641331	11,5456635342	0,972994

Продолжение
X	LOG	SCALE	SKEW	KURT	N'(X) Ур. (4.06)	Накопленная сумма	N(X)
3,0	0,02	2,76		1,78	0,0229608959	11,5686244301	0,974990
3,1	0,02	2,76		1,78	0,0216791802	11,5903036102	0,976873
3,2	0,02	2,76		1,78	0,0205051855	11,6108087957	0,978653
3,3	0,02	2,76		1,78	0,0194270256	11,6302358213	0,980337
3,4	0,02	2,76		1,78	0,0184344179	11,6486702392	0,981934
3,5	0,02	2,76		1,78	0,0175184304	11,6661886696	0,983451
3,6	0,02	2,76		1,78	0,0166712734	11,682859943	0,984893
3,7	0,02	2,76		1,78	0,0158861285	11,6987460714	0,986266
3,8	0,02	2,76		1,78	0,0151570063	11,7139030777	0,987576
3,9	0,02	2,76		1,78	0,014478628	11,7283817056	0,988826
4,0	0,02	2,76		1,78	0,0138463263	11,742228032	0,990020
4,1	0,02	2,76		1,78	0,0132559621	11,7554839941	0,991164
4,2	0,02	2,76		1,78	0,012703854	11,7681878481	0,992259
4,3	0,02	2,76		1,78	0,0121867187	11,7803745668	0,993309
4,4	0,02	2,76		1,78	0,0117016203	11,7920761871	0,994316
4,5	0,02	2,76		1,78	0,0112459269	11,8033221139	0,995284
4,6	0,02	2,76		1,78	0,0108172734	11,8141393873	0,996215'
4,7	0,02	2,76		1,78	0,0104135298	11,8245529171	0,997110
4,8	0,02	2,76		1,78	0,0100327732	11,8345856903	0,997973
4,9	0,02	2,76		1,78	0,0096732643	11,8442589547	0,998804
5,0	0,02	2,76		1,78	0,0093334265	11,8535923812	0,999606

Затем подставляем С = 1 в уравнение (4.06):

Таким образом, в точке Х = -3 N'(X) = 0,02243444681 (отметьте, что мы рассчитываем значения в столбце N'(X) для каждого значения X).

Рассчитаем очередной столбец, текущую сумму N'(X), накапливающуюся с ростом X. Это сделать достаточно просто. Далее рассчитаем столбец N(X) для вероятности, ассоциированной с каждым значением Х при данных значениях параметров. Формула для расчета N(X) выглядит следующим образом:

где С = текущее количество точек X;

М = общее количество точек X.

Уравнение (4.12) означает, что при каждом изменении Х необходимо добавить текущую сумму при данном значении Х к текущей сумме предыдущего значения X, затем разделить полученную сумму на 2. Далее полученный результат следует разделить на последнее значение в столбце текущей суммы N'(X) (накопленная сумма значений N'(X)). Это даст нам вероятность для значения Х при данных значениях параметров.

Таким образом, для Х = -3 текущая сумма N(X) = 0,302225586, а для предыдущего значения Х = -3,1 текущая сумма равна 0,2797911392. Сумма двух этих величин равна 0,5820167252. При делении на 2 мы получаем 0,2910083626. Разделив эту величину на последнее значение в столбце накопленной суммы N'(X), равное 11,8535923812, мы получаем 0,02455022522. Это и есть вероятность N(X) при стандартном значении Х = -3.

После того как мы вычислили накопленные вероятности для каждой сделки в фактическом распределении и вероятности для каждого приращения стандартного значения в нашем характеристическом распределении, мы можем осуществить тест К-С для значений параметров характеристического распределения, которые используются в настоящий момент. Однако сначала рассмотрим два важных момента.

В примере с таблицей накопленных вероятностей, показанной ранее для нашего регулируемого распределения, мы рассчитывали вероятности с приращением стандартных значений 0,1. Это было сделано для наглядности. На практике вы можете получить большую степень точности, используя меньший шаг приращения. Приращение 0,01 в большинстве случаев является вполне приемлемым.

Скажем несколько слов о том, как для регулируемого распределения выбрать ограничительные параметры, то есть количество сигма с каждой стороны от среднего. В нашем примере мы использовали 3 сигма, но в действительности следует использовать абсолютное значение самой отдаленной точки от среднего. Для нашего примера с 232 сделками крайнее левое (самое меньшее) стандартное значение составляет -2,96 стандартной единицы, а крайнее правое (самое большое) составляет 6,935321 стандартной единицы. Так как 6,93 больше, чем ABS(-2,96), мы должны взять 6,935321. Теперь добавим еще 2 сигма к этому значению для надежности и найдем вероятности для распределения от -8,94 до +8,94 сигма. Так как нам нужна хорошая точность, мы будем использовать приращение 0,01. Рассчитаем вероятности для стандартных значений:

-8,94

-8,93

-8,92

-8,91 * * *

+8,94

Последнее, что мы должны сделать, прежде чем провести тест К-С, — это округлить фактические стандартные значения отобранных сделок с точностью 0,01 (так как мы используем 0,01 в качестве шага для теоретического распределения). Например, значение 6,935321 не будет иметь соответствующей теоретической вероятности, ассоциированной с ним, так как оно находится между значениями 6,93 и 6,94. Так как 6,94 ближе к 6,935321, мы округляем 6,935321 до 6,94. Прежде чем начать процедуру оптимизирования наших параметров регулируемого распределения путем применения теста К-С, мы должны округлить фактические отсортированные нормированные сделки в соответствии с выбранным шагом. Вместо округления стандартных значений сделок до ближайшего десятичного Х можно использовать линейную интерполяцию по таблице накопленных вероятностей, чтобы вычислить вероятности, соответствующие фактическим стандартным значениям сделок. Чтобы больше узнать о линейной интерполяции, посмотрите хорошую книгу по статистике, например «Управление деньгами на товарном рынке» Фреда Гема. Другие интересные книги указаны в списке рекомендованной литературы. До настоящего момента мы оптимизировали только параметры KURT и SCALE. Может показаться, что при нормировании данных параметр LOC должен быть приравнен к 0, а параметр SCALE — к 1. Это не совсем верно, так как реальное расположение распределения может не совпадать со средним арифметическим, а оптимальное значение ширины отличаться от единицы. Значения KURT и SCALE сильно связаны друг с другом. Таким образом, мы сначала попытаемся приблизительно определить оптимальные значения параметров KURT и SCALE. Для наших 232 сделок получаем SCALE =2,7, а KURT =1,9. Теперь попытаемся найти наиболее подходящие значения параметров. Этот процесс займет достаточно много времени, даже если у вас хороший компьютер. Мы проведем цикл, изменяя параметр LOC от 0,1 до -0,1 по -0,05, параметр SCALE от 2,6 до 2,8 по 0,05, параметр SKEW от 0,1 до -0,1 по -0,05 и параметр KURT от 1,86 до 1,92 по 0,02. Результаты этого цикла дают оптимальное (самое низкое значение статистики К-С) при LOC = О, SCALE = 2,8, SKEW =0 и KURT =1,86. Затем мы осуществим третий цикл. На этот раз будем просматривать LOC от 0,04 до -0,04 по -0,02, SCALE от 2,76 до 2,82 по 0,02, SKEW от 0,04 до -0,04 по -0,02 и KURT от 1,8 до 1,9 по 0,02. Результаты третьего цикла дают оптимальные значения LOC = 0,02, SCALE = 2,76, SKEW = 0 и KURT = 1,8. Мы нашли оптимальную окрестность, в которой параметры дают наилучшее приближение регулируемой характеристической функции к распределению реальных данных. Для последнего цикла мы будем просматривать LOC от 0 до 0,03 по 0,01, SCALE от 2,76 до 2,73 по -0,01, SKEW от 0,01 до -0,01 и KURT от 1,8 до 1,75 по -0,01. Результаты этого последнего прохода дают следующие оптимальные параметры для наших 232 сделок: LOC = 0,02, SCALE =2,76, SKEW = 0 и KURT =1,78.

⇐ Предыдущая 35 36 37 38 394041 42 43 44 Следующая ⇒

Дата добавления: 2015-10-12; просмотров: 448. Нарушение авторских прав; Мы поможем в написании вашей работы!

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Концептуальные модели труда учителя В отечественной литературе существует несколько подходов к пониманию профессиональной деятельности учителя, которые, дополняя друг друга, расширяют психологическое представление об эффективности профессионального труда учителя...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

ФАКТОРЫ, ВЛИЯЮЩИЕ НА ИЗНОС ДЕТАЛЕЙ, И МЕТОДЫ СНИЖЕНИИ СКОРОСТИ ИЗНАШИВАНИЯ Кроме названных причин разрушений и износов, знание которых можно использовать в системе технического обслуживания и ремонта машин для повышения их долговечности, немаловажное значение имеют знания о причинах разрушения деталей в результате старения...

Различие эмпиризма и рационализма Родоначальником эмпиризма стал английский философ Ф. Бэкон. Основной тезис эмпиризма гласит: в разуме нет ничего такого...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и регистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия