Параметрическое оптимальное f
Мы немного познакомились с математикой нормального и логарифмически нормального распределения и теперь посмотрим, как находить оптимальное f по нормально распределенным результатам. Формула Келли является примером параметрического оптимального f, где f является функцией двух параметров. В формуле Келли вводные параметры — это процент выигрышных ставок и отношение выигрыша к проигрышу. Однако формула Келли даст вам оптимальное f только тогда, когда возможные результаты имеют бернуллиево распределение. Другими словами, формула Келли даст правильное оптимальное f, когда есть только два возможных результата, в противном случае, как, например, в нормально распределенных результатах, формула Келли не даст вам правильное оптимальное f2. Параметрические методы гораздо мощнее эмпирических. Рассмотрим ситуацию, которую можно полностью описать бернуллиевым распределением. Мы можем рассчитать оптимальное f либо из формулы Келли, либо с помощью эмпирического метода. Допустим, мы выигрываем 60% времени. Предположим, мы бросаем несимметричную монету, и при долгой последовательности 60% бросков будут приходиться на лицевую сторону. Поэтому мы каждый раз ставим на то, что монета будет выпадать на лицевую сторону, и выигрыш составляет 1:1. Из формулы Келли следует, что надо ставить 0,2 нашего счета. Также допустим, что из прошлых 20 бросков 11 выпали лицевой стороной, а 9 обратной. Если бы мы использовали эти 20 сделок в качестве вводных данных для эмпирического метода расчета f, результатом было бы то, что следует рисковать 0,1 нашего счета при каждой следующей ставке. Какое значение правильно, 0,2, полученное параметрическим методом (формула Келли с бернуллиевым распределением), или 0,1, найденное эмпирически на основе 20 последних бросков? Правильным ответом является значение 0,2, найденное с помощью параметрического метода. Причина в том, что каждый последующий бросок имеет 60% вероятность выпасть лицевой стороной, а не 55% вероятность, что следует из результатов 20 последних бросков. Хотя мы рассматриваем только 5% отклонение в вероятности, то есть 1 бросок из 20, результаты после применения разных значений f будут сильно отличаться. Вообще параметрические методы внутренне более точны, чем эмпирические (при условии, что мы знаем распределение результатов). Это первое преимущество параметрического метода. Самый большой недостаток параметрических методов состоит в том, что мы должны знать, каким распределение результатов будет в течение длительного времени. Второе преимущество состоит в том, что для эмпирического метода требуются исторические данные, в то время как для параметрического в этом нет необходимости. Кроме того, эта история должна быть довольно протяженной. В только что рассмотренном примере можно предположить, что, если бы у нас была история 50 бросков, мы бы получили эмпирическое оптимальное f ближе к 0,2. При истории 1000 бросков оно было бы еще ближе. Тот факт, что эмпирические методы требуют довольно большого объема исторических данных, свел все их использование к механическим торговым системам. Тот, кто в торговле использует что-либо отличное от механических торговых систем, будь то волны Эллиотта или фундаментальные данные, практически не имеет возможности использовать метод оптимального f. С параметрическими методами дело обстоит иначе. Например, тот, кто желает слепо следовать какому-нибудь рыночному гуру, имеет теперь возможность использовать оптимальное f. В этом состоит третье преимущество параметрического метода — он может использоваться любым трейдером на любом рынке. В том случае, когда не используется механическая торговая система, следует помнить о важном допущении. Оно состоит в том, что будущее распределение прибылей и убытков будет напоминать распределение в прошлом (поэтому мы и рассчитываем оптимальное f), это может оказаться менее вероятным, чем в случае использования механической системы. Все вышесказанное заставляет по-иному взглянуть на ожидаемую работу любого не полностью механического метода. Даже профессионалы («фундамента-листы», последователи Ганна или Эллиотта и т.п.), использующие такие методы, обречены на неудачу, если они находятся далеко справа от пика кривой f. Если они слишком далеко слева от пика, то получат геометрически более низкие прибыли, чем их опыт и навыки в этой области позволяют. Более того, практики не полностью механических методов должны понимать, что все сказанное об оптимальном f и чисто механических методах будет иметь прямое отношение и к их системам. Это надо учитывать при использовании подобных методов. Помните, что проигрыши могут быть значительными, но это не означает, что метод не следует применять. Четвертое и, возможно, наибольшее преимущество параметрического метода определения оптимального f состоит в том, что параметрический метод позволяет создавать модели «что если». Например, вы решили торговать по рыночной системе, которая работала достаточно успешно, но хотите подготовиться к ситуации, когда эта рыночная система прекратит хорошо работать. Параметрические методы позволяют варьировать ваши вводные параметры для отражения возможных изменений, и благодаря этому показать, когда рыночная система прекратит хорошо работать. Еще раз повторюсь: параметрические методы намного мощнее эмпирических. Зачем вообще использовать эмпирические методы? Они интуитивно более очевидны, чем параметрические. Следовательно, эмпирические методы необходимо изучать до перехода к параметрическим. Мы уже достаточно подробно рассмотрели эмпирический подход и поэтому готовы изучать параметрические методы.
Распределение торговых прибылей и убытков (P&L) Рассмотрим следующую последовательность 232 торговых прибылей и убытков в пунктах. Не имеет значения, к какому товару или системе относится этот поток данных — это может быть любая система на любом рынке.
Если мы хотим определить приведенное параметрическое оптимальное f, нам придется преобразовать эти торговые прибыли и убытки в процентные повышения и понижения (основываясь на уравнениях с (2.10а) по (2.10в)). Затем мы преобразуем эти процентные прибыли и убытки, умножив их на текущую цену базового инструмента. Например, P&L № 1 составляет 0,18. Допустим, что цена входа в эту сделку была 100,50. Таким образом, процентное повышение по этой сделке будет 0,18/100,50 = 0,001791044776. Теперь предположим, что текущая цена базового инструмента составляет 112,00. Умножив 0,001791044776 на 112,00, мы получаем приведенное P&L = 0,2005970149. Чтобы получить полные приведенные данные, необходимо проделать эту процедуру для всех 232 торговых прибылей и убытков. Независимо от того, будем мы проводить расчеты, используя приведенные данные, или нет (в этой главе мы не будем использовать приведенные данные), мы все равно должны рассчитать среднее (арифметическое) и стандартное отклонение совокупности этих 232 торговых прибылей и убытков. В нашем случае это 0,330129 и 1,743232 соответственно (если бы мы проводили операции на приведенной основе, нам бы понадобилось определять среднее и стандартное отклонение по приведенным торговым P&L). Теперь мы можем использовать уравнение (3.16), чтобы преобразовать каждую отдельную торговую прибыль и убыток в стандартные единицы. (3.16) Z=(X-U)/S, где U = среднее значение данных; S = стандартное отклонение данных; Х = наблюдаемая точка данных.
Для сделки № 1 преобразуем прибыль 0,18 в стандартные единицы: Z= (0,18-0,330129)/1,743232 =-0,150129/1,743232 =-0,08612106708 Таким же образом следующие три сделки -1,11; 0,42 и -0,83 преобразовываются в -0,8261258398; 0,05155423948 и -0,6655046488 стандартных единицы. После того, как мы преобразуем все торговые прибыли и убытки в стандартные единицы, можно собрать в ячейки теперь уже нормированные данные. Вспомните, что при наличии ячеек теряется часть информации о распределении (в нашем случае о распределении отдельных сделок), но характер распределения остается тем же. Допустим, мы помещаем эти 232 сделки в 10 ячеек. Количество ячеек выбрано произвольно — мы могли бы выбрать 9 или 50 ячеек. Рисунок 3-16 232 сделки в 10 ячейках от -2 до +2 сигмы и нормальное распределение Когда мы размещаем данные в ячейки, то должны выбрать интервал значений, в котором расположены ячейки. Мы выберем интервал от -2 до +2 сигмы. Это означает, что у нас будет 10 одинаковых ячеек между -2 стандартными единицами и +2 стандартными единицами. Так как между -2 и +2 4 стандартных единицы и мы делим этот диапазон на 10 равных частей, то получаем 4 / 10 = 0,4 стандартных единицы в качестве размера или «ширины» каждой ячейки. Поэтому наша первая ячейка будет содержать те сделки, которые были в диапазоне от -2 до -1,6 стандартных единиц, следующая ячейка будет содержать сделки от-1,6 до-1,2, затем от -1,2 до -0,8, и так далее, пока последняя ячейка не вместит сделки между 1,6 и 2 стандартными единицами. В нашем случае те сделки, которые менее –2 стандартных единиц или больше +2 стандартных единиц, не будут размещены в ячейки, и мы их проигнорируем. Если бы мы пожелали, то включили бы их в крайние ячейки, разместив точки данных менее -2 в ячейку от -2 до -1,6, и таким же образом поступили бы в отношении тех точек данных, которые больше 2. Конечно, мы могли бы выбрать более широкий диапазон, но эти сделки находятся за пределами выбранных ячеек, и мы их не учитываем. Другими словами, мы не рассматриваем сделки, P&L в которых меньше, чем 0,330129 - (1,743232 * 2) = = -3,1563, или больше, чем 0,330129 + (1,743232 * 2) = 3,816593. Мы сейчас создали распределение торговых P&L системы. Распределение содержит 10 точек данных, так как мы решили работать с 10 ячейками. Каждая точка данных отражает число сделок, которые попадают в эту ячейку Каждая сделка не может попасть более чем в 1 ячейку и если сделка находится за пределами 2 стандартных единиц с любой стороны среднего (P&L < -3,156335 или > 3,816593), тогда она не будет представлена в этом распределении. Рисунок 3-16 показывает распределение, которое мы только что рассчитали. Может показаться, что распределение P&L торговой системы должно всегда быть смещено вправо за счет больших выигрышей. Наше распределение 232 торговых P&L представляет систему, которая в основном приносит небольшие прибыли. Многие трейдеры имеют ошибочное мнение, что распределение P&L должно быть смещено вправо для всех торговых систем. Это не всегда верно, что и подтверждает рисунок 3-16. Разные рыночные системы имеют различные распределения, и вам не следует ожидать, что все они будут одинаковыми. Также на рисунке 3-16 показано нормальное распределение для 232 торговых P&L, если бы они были нормально распределены. Это было сделано для того, чтобы вы могли графически сравнить торговые P&L для полученного и нормального распределения. Сначала нормальное распределение рассчитывается для границ каждой ячейки. Для самой левой ячейки это Z =-2 и Z=-1,6. Теперь подставим полученные значения Z в уравнение (3.21), чтобы рассчитать вероятность. В нашем примере это соответствует 0,02275 для Z = -2 и 0,05479932 для Z = -1,6. Затем возьмем абсолютное значение разности этих двух значений, которое в нашем примере будет ABS(0,02275 - 0,05479932) = = 0,03204932. Затем умножим полученный ответ на количество точек данных, то есть на 232 (мы все еще должны использовать 232 сделки, хотя некоторые исключаются, так как находятся вне диапазона выбранных ячеек). Таким образом, если бы данные были нормально распределены и размещены в 10 ячеек равной ширины между -2 и +2 сигма, тогда самая левая ячейка содержала бы 0,03204932 * 232 = 7,43544224 элемента. Если сделать расчет для каждой из 10 ячеек, мы получим нормальную кривую, показанную на рисунке 3-16.
|