Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Использование параметров для поиска оптимального f





Теперь, когда найдены наиболее подходящие значения параметров распределе­ния, рассчитаем оптимальное f для этого распределения. Мы можем применить процедуру, которая была использована в предыдущей главе для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что вероятности для каждого стандартного значения (значения X) рассчитываются с помощью уравнений (4.06) и (4.12). При нормальном распределении мы находим столбец ассоциированных вероятностей (вероятностей, соответствующих опре­деленному стандартному значению), используя уравнение (3.21). В нашем случае, чтобы найти ассоциированные вероятности, следует выполнить процедуру, де­тально описанную ранее:

1. Для данного стандартного значения Х рассчитайте его соответствующее N'(X) с помощью уравнения (4.06).

2. Для каждого стандартного значения Х рассчитайте накопленную сумму зна­чений N'(X), соответствующих всем предыдущим X.

3. Теперь, чтобы найти N(X), т.е. итоговую вероятность для данного X, прибавьте текущую сумму, соответствующую значению X, к текущей сумме, соответствующей предыдущему значению X. Разделите полу­ченную величину на 2. Затем разделите полученное частное на общую сумму всех N'(X), т.е. последнее число в столбце текущих сумм. Это но­вое частное является ассоциированной 1-хвостой вероятностью для данного X.

Так как теперь у нас есть метод поиска ассоциированных вероятностей для стан­дартных значений Х при данном наборе значений параметров, мы можем найти оптимальное f. Процедура в точности совпадает с той, которая применяется для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что мы рассчитываем столбец ассоциированных вероятностей дру­гим способом. В нашем примере с 232 сделками значения параметров, которые получа­ются при самом низком значении статистики К-С, составляют 0,02, 2,76, О и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Мы получили эти значения параметров, используя процедуру оптимизации, описанную в дан­ной главе. Статистика К-С == 0,0835529 (это означает, что в своей наихудшей точке два распределения удалены на 8,35529%) при уровне значимости 7,8384%. Рисунок 4-10 показывает функцию распределения для тех значений параметров, которые наилучшим образом подходят для наших 232 сделок. Если мы возьмем полученные параметры и найдем оптимальное f по это­му распределению, ограничивая распределение +3 и -3 сигма, используя 100 равноотстоящих точек данных, то получим f= 0,206, или 1 контракт на каж­дые 23 783,17 доллара. Сравните это с эмпирическим методом, который покажет, что оптимальный рост достигается при 1 контракте на каждые 7918,04 доллара на балансе счета. Этот результат мы получаем, если ограничиваем распределение 3 сигма с каж­дой стороны от среднего. В действительности, в эмпирическом потоке сделок у нас был проигрыш наихудшего случая 2,96 сигма и выигрыш наилучшего случая 6,94 сигма. Теперь, если мы вернемся и ограничим распределение 2,96 сигма слева от среднего и 6,94 сигма справа (и на этот раз будем использовать 300 равноотсто­ящих точек данных), то получим оптимальное f = 0,954, или 1 контракт на каждые 5062,71 доллара на балансе счета. Почему оно отличается от эмпирического опти­мального f= 7918,04?

Проблема состоит в «грубости» фактического распределения. Вспомни­те, что уровень значимости наших наилучшим образом подходящих парамет­ров был только 7,8384%. Давайте возьмем распределение 232 сделок и помес­тим в 12 ячеек от -3 до +3 сигма.

 

Ячейки Количество сделок
-3,0 -2,5  
-2,5 -2,0  
-2,0 -1,5  
-1,5 -1,0  
-1,0 -0,5  
,sr„. -0,5 0,0  
ь -' 0,0 0,5  
0,5 1,0  
1,0 1,5  
1,5 2,0  
2,0 2,5  
2,5 3,0  

 

Отметьте, что на хвостах распределения находятся пробелы, т.е. области, или ячейки, где нет эмпирических данных. Эти области сглаживаются, когда мы приспосабливаем наше регулируемое распределение к данным, и именно эти сглаженные области вызывают различие между параметрическим и эмпири­ческим оптимальным f. Почему же наше характеристическое распределение при всех возможностях регулировки его формы не очень хорошо приближено к фактическому распределению? Причина состоит в том, что наблюдаемое распределение имеет слишком много точек перегиба. Параболу можно направить ветвями вверх или вниз. Однако вдоль всей параболы направление вогнутости или выпуклости не изменяется. В точке перегиба направление вогнутости изменяется. Парабола имеет 0 точек перегиба,

Рисунок 4-10 Регулируемое распределение для 232 сделок

Рисунок 4-11 Точки перегиба колоколообразного распределения

 

так как направление вогнутости никогда не изменяется. Объект, имеющий форму буквы S, лежащий на боку, имеет одну точку перегиба, т.е. точку, где вогну­тость изменяется. Рисунок 4-11 показывает нормальное распределение. Отметьте, что в колоколообразной кривой, такой как нормальное распределение, есть две точ­ки перегиба. В зависимости от значения SCALE наше регулируемое распре­деление может иметь ноль точек перегиба (если SCALE очень низкое) или две точки перегиба. Причина, по которой наше регулируемое распределение не очень хорошо описывает фактическое распределение сделок, состоит в том, что реальное распределение имеет слишком много точек перегиба. Означает ли это, что полученное характеристическое распределение не­верно? Скорее всего нет. При желании мы могли бы создать функцию рас­пределения, которая имела бы больше двух точек перегиба. Такую функцию можно было бы лучше подогнать к реальному распределению. Если бы мы создали функцию распределения, которая допускает неограниченное коли­чество точек перегиба, то мы бы точно подогнали ее к наблюдаемому распре­делению. Оптимальное f, полученное с помощью такой кривой, практически совпало бы с эмпирическим. Однако чем больше точек перегиба нам при­шлось бы добавить к функции распределения, тем менее надежной она была бы (т.е. она хуже представляла бы будущие сделки). Мы не пытаемся в точности подогнать параметрическое ik наблюдаемому, а ста­раемся лишь определить, как распределяются наблюдаемые данные, чтобы можно было предсказать с большой уверенностью будущее оптимальное 1(если данные бу­дут распределены так же, как в прошлом). В регулируемом распределении, подо­гнанном к реальным сделкам, удалены ложные точки перегиба.

Поясним вышесказанное на примере. Предположим, мы используем дос­ку Галтона. Мы знаем, что асимптотически распределение шариков, падаю­щих через доску, будет нормальным. Однако мы собираемся бросить только 4 шарика. Можем ли мы ожидать, что результаты бросков 4 шариков будут рас­пределены нормально? Как насчет 5 шариков? 50 шариков? В асимптотическом смысле мы ожидаем, что наблюдаемое распределение будет ближе к нормальному при увеличении числа сделок. Подгонка теорети­ческого распределения к каждой точке перегиба наблюдаемого распределения не даст нам большую степень точности в будущем. При большом количестве сде­лок мы можем ожидать, что наблюдаемое распределение будет сходиться с ожидае­мым и многие точки перегиба будут заполнены сделками, когда их число стремится к бесконечности. Если наши теоретические параметры точно отражают распределение реальных сделок, то оптимальное f, полученное на основе теоретического распреде­ления, при будущей последовательности сделок будет точнее, чем оптимальное f, рассчитанное эмпирически из прошлых сделок. Другими словами, если наши 232 сделки представляют распределение сделок в будущем, тогда мы можем ожидать, что распределение сделок в будущем будет ближе к нашему «настроенному» теоретическому распределению, чем к наблюдаемому, с его многочисленными точками перегиба и «зашумленностью» из-за конечного количества сделок. Таким образом, мы можем ожидать, что буду­щее оптимальное f будет больше похоже на оптимальное f, полученное из теоре­тического распределения, чем на оптимальное f, полученное эмпирически из на­блюдаемого распределения.

Итак, лучше всего в этом случае использовать не эмпирическое, а пара­метрическое оптимальное f. Ситуация аналогична рассмотренному случаю с 20 бросками монеты в предыдущей главе. Если мы ожидаем 60% выигрышей в игре 1:1, то оптимальное f= 0,2. Однако если бы у нас были только эмпири­ческие данные о последних 20 бросках, 11 из которых были выигрышными, наше оптимальное f составило бы 0,1. Мы исходим из того, что параметрическое оптимальное f ($5062,71 в этом случае) верно, так как оно оптимально для функ­ции, которая «генерирует» сделки. Как и в случае только что упомянутой игры с броском монеты, мы допускаем, что оптимальное f для следующей сделки опре­деляется параметрической генерирующей функцией, даже если параметрическое f отличается от эмпирического оптимального f.

Очевидно, что ограничительные параметры оказывают большое влияние на оптимальное f. Каким образом выбирать эти ограничительные парамет­ры? Посмотрим, что происходит, когда мы отодвигаем верхнюю границу. Следующая таблица составлена для нижнего предела 3 сигма с использова­нием 100 равноотстоящих точек данных и оптимальных параметров для 232 сделок:

 

Верхняя граница f f$
3 Sigmas 0,206 $23783,17
4 Sigmas 0,588 $8332,51
5 Sigmas 0,784 $6249,42
6 Sigmas 0,887 $5523,73
7 Sigmas 0,938 $5223,41
8 Sigmas * * * 0,963 * * * $5087,81 * * *
100 Sigmas 0,999 $4904,46

 

Отметьте, что при постоянной нижней границе, чем выше мы отодвигаем верхнюю границу, тем ближе оптимальное f к 1. Таким образом, чем больше мы отодвигаем верхнюю границу, тем ближе оптимальное f в долларах будет к нижней границе (ожи­даемый проигрыш худшего случая). В том случае, когда наша нижняя граница нахо­дится на -3 сигма, чем больше мы отодвигаем верхнюю границу, тем ближе в пределе оптимальное f в долларах будет к нижней границе, т.е. к $330,13 -(1743,23 * 3) = = -$4899,56. Посмотрите, что происходит, когда верхняя граница не меняется (3 сигма), а мы отодвигаем нижнюю границу Достаточно быстро арифметическое математи­ческое ожидание такого процесса оказывается отрицательным. Это происходит потому, что более 50% площади под характеристической функцией находится слева от вертикальной оси. Следовательно, когда мы отодвигаем нижний ограни­чительный параметр, оптимальное f стремится к нулю. Теперь посмотрим, что произойдет, если мы одновременно начнем отодвигать оба ограничительных параметра. Здесь мы используем набор оптимальных пара­метров 0,02, 2,76, 0 и 1,78 для распределения 232 сделок и 100 равноотстоящих точек данных:

 

Верхняя и нижняя граница F f$
3 Sigmas 0,206 $23783,17
4 Sigmas 0,158 $42 040,42
5 Sigmas 0,126 $66 550,75
6 Sigmas 0,104 $97 387,87
* * * * * * * * *
100 Sigmas 0,053 $322625,17

 

Отметьте, что оптимальное f приближается к 0, когда мы отодвигаем оба ограни­чительных параметра. Более того, так как проигрыш наихудшего случая увеличи­вается и делится на все меньшее оптимальное f, наше f$, т.е. сумма финансирова­ния 1 единицы, также приближается к бесконечности.

Проблему наилучшего выбора ограничительных параметров можно сфор­мулировать в виде вопроса: где могут произойти в будущем наилучшие и наи­худшие сделки (когда мы будем торговать в этой рыночной системе)? Хвосты распределения в действительности стремятся к плюс и минус бесконечности, и нам следует финансировать каждый контракт на бесконечно большую сум­му (как в последнем примере, где мы раздвигали обе границы). Конечно, если мы собираемся торговать бесконечно долгое время, наше оптимальное f в долларах будет бесконечно большим. Но мы не собираемся торговать в этой рыночной системе вечно. Оптимальное f, при котором мы собираемся торговать в этой рыночной системе, является функцией предполагаемых наилучших и наи­худших сделок. Вспомните, если мы бросим монету 100 раз и запишем, какой будет самая длинная полоса решек подряд, а затем бросим монету еще 100 раз, то полоса ре­шек после 200 бросков будет скорее всего больше, чем после 100 бросков. Таким же образом, если проигрыш наихудшего случая за нашу историю 232 сделок равнялся 2,96 сигма (для удобства возьмем 3 сигма), тогда в будущем мы должны ожидать проигрыш больше 3 сигма. Поэтому вместо того, чтобы ограничить наше распределение прошлой историей сделок (-2,96 и +6,94 сигма), мы огра­ничим его -4 и +6,94 сигма. Нам, вероятно, следует ожидать, что в будущем именно верхняя, а не нижняя граница будет нарушена. Однако это обстоятель­ство мы не будем принимать в расчет по нескольким причинам. Первая состоит в том, что торговые системы в будущем ухудшают свою результативность по сравнению с работой на исторических данных, даже если они не используют оп­тимизируемых параметров. Все сводится к принципу, что эффективность меха­нических торговых систем постепенно снижается. Во-вторых, тот факт, что мы платим меньшую цену за ошибку в оптимальном f при смещении влево, а не вправо от пика кривой f, предполагает, что следует быть более консервативными в прогнозах на будущее. Мы будем рассчитывать параметрическое оптимальное f при ограничи­тельных параметрах -4 и +6,94 сигма, используя 300 равноотстоящих точек данных. Однако при расчете вероятностей для каждой из 300 равноотстоя­щих ячеек данных важно, чтобы мы рассмотрели распределение на 2 сигмы до и после выбранных ограничительных параметров. Поэтому мы будем оп­ределять ассоциированные вероятности, используя ячейки в интервале от -6 до +8,94 сигма, даже если реальный интервал -4 — +6,94 сигма. Таким образом, мы увеличим точность результатов. Использование оптимальных параметров 0,02, 2,76, 0 и 1,78 теперь даст нам оптимальное f =0,837, или 1 контракт на каждые 7936,41 доллара. Пока ограничительные параметры не нарушаются, наша модель точна для выбранных границ. Пока мы не ожидаем проигрыша больше 4 сигма ($330,13 -(1743,23 * 4) =-$6642,79) или прибыли больше 6,94 сигма ($330,13 + + (1743,23 * 6,94) = $12 428,15), можно считать, что границы распределения бу­дущих сделок выбраны точно. Возможное расхождение между созданной моделью и реальным распределе­нием является слабым местом такого подхода, то есть оптимальное f, полученное из модели, не обязательно будет оптимальным. Если наши выбранные параметры будут нарушены в будущем, f может перестать быть оптимальным. Этот недоста­ток можно устранить с помощью опционов, которые позволяют ограничить воз­можный проигрыш заданной суммой. Коль скоро мы обсуждаем слабость данного метода, необходимо указать на последний его недостаток. Следует иметь в виду, что реальное распределение торговых прибылей и убытков является распределением, где параметры по­стоянно изменяются, хотя и медленно. Следует периодически повторять на­стройку по торговым прибылям и убыткам рыночной системы, чтобы отслежи­вать эту динамику.

Проведение тестов «что если»

После того как найдено параметрическое оптимальное f, можно реализовывать сценарии «что если» с помощью полученной функции распределения. Для этого нужно варьировать параметры функции распределения LOC, SCALE, SKEW и KURT для моделирования различных ожидаемых результатов (различных рас­пределений, которые могут быть в будущем). Мы знаем, как применять проце­дуру растяжения и сжатия в нормальном распределении, и похожим образом можем работать с параметрами LOC, SCALE, SKEW и KURT регулируемого распределения.

Рисунок 4-12 Изменение параметра расположения распределения

Сценарии «что если» при параметрическом подходе помогают смоделировать из­менения фактического распределения торговых P&L. Параметрические методы позволяют увидеть воздействие изменений на распределение фактических торго­вых прибылей и убытков до того, как они произойдут.

Когда вы работаете с параметрами, следует помнить о важной детали. При поис­ке оптимального f вместо того, чтобы изменять LOC, т.е. расположение распределе­ния, лучше изменять долларовую арифметическую среднюю сделку, используемую в качестве входного данного. Это видно из рисунка 4-12. Отметьте (см. рисунок 4-12), что изменение параметра расположения LOC передвигает распределение вправо или влево в «окне» ограничительных пара­метров, но сами ограничительные параметры при этом не двигаются. Таким образом, изменение параметра LOC также затрагивает количество равноотсто­ящих точек данных слева и справа от моды распределения. Если изменить фактическое среднее арифметическое (или использовать переменную сжатия при поиске f в нормальном распределении), «окно» ограничительных пара­метров передвинется. Когда вы изменяете арифметическую среднюю сделку или изменяете переменную сжатия в механизме нормального распределения, у вас остается то же число равноотстоящих точек данных справа и слева от моды распределения.







Дата добавления: 2015-10-12; просмотров: 386. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Правила наложения мягкой бинтовой повязки 1. Во время наложения повязки больному (раненому) следует придать удобное положение: он должен удобно сидеть или лежать...

ТЕХНИКА ПОСЕВА, МЕТОДЫ ВЫДЕЛЕНИЯ ЧИСТЫХ КУЛЬТУР И КУЛЬТУРАЛЬНЫЕ СВОЙСТВА МИКРООРГАНИЗМОВ. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА БАКТЕРИЙ Цель занятия. Освоить технику посева микроорганизмов на плотные и жидкие питательные среды и методы выделения чис­тых бактериальных культур. Ознакомить студентов с основными культуральными характеристиками микроорганизмов и методами определения...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Разновидности сальников для насосов и правильный уход за ними   Сальники, используемые в насосном оборудовании, служат для герметизации пространства образованного кожухом и рабочим валом, выходящим через корпус наружу...

Дренирование желчных протоков Показаниями к дренированию желчных протоков являются декомпрессия на фоне внутрипротоковой гипертензии, интраоперационная холангиография, контроль за динамикой восстановления пассажа желчи в 12-перстную кишку...

Деятельность сестер милосердия общин Красного Креста ярко проявилась в период Тритоны – интервалы, в которых содержится три тона. К тритонам относятся увеличенная кварта (ув.4) и уменьшенная квинта (ум.5). Их можно построить на ступенях натурального и гармонического мажора и минора.  ...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия