Параметрические методы для других распределений
Из предыдущей главы мы узнали, как найти оптимальное f и его побочные продукты при нормальном распределении. Тот же метод применим к любому другому распределению, где известна функция распределения вероятности (то есть интеграл плотности распределения вероятности). О многих известных распределениях и об их функциях распределения вероятности рассказано в приложении В. К сожалению, большинство распределений торговых P&L плохо описываются функциями нормального и других распределений. В этой главе мы сначала обратимся к проблеме неопределенной природы распределения торговых P&L и далее изучим метод планирования сценария — естественное продолжение идеи оптимального/. Этот метод широко применяется и позволяет находить оптимальное f по ячеистым распределениям. Далее мы перейдем к следующей главе, посвященной опционам и одновременной торговле по нескольким позициям. Прежде чем смоделировать реальное распределение торговых P&L, мы должны найти метод сравнения двух распределений. Тест Колмогорова-Смирнова (К-С) Хи-квадрат тест, без сомнения, является наиболее популярным из всех методов сравнения двух распределений. Так как многие ориентированные на рынок приложения, помимо рассматриваемых в этой главе, часто используют хи-квадрат тест, то он описан в Приложении А. Однако для наших целей наилучшим методом будет тест К-С. Этот очень эффективный тест применим к неячеистым распределениям, которые являются функцией одной независимой переменной (в нашем случае, прибыль за одну сделку). Все функции распределения вероятности имеют минимальное значение 0 и максимальное значение 1. То, как они ведут себя между ними, и отличает их. Тест К-С измеряет очень простую переменную D, которая определяется как максимальное абсолютное значение разности между двумя функциями распределения вероятности. Тест К-С достаточно прост. N объектов (в нашем случае сделок) нормируются (вычитается среднее значение, и полученная разность делится на стандартное отклонение) и сортируются в порядке возрастания. Когда мы проходим эти отсортированные и нормированные сделки, накопленная вероятность рассматриваемого количества сделок делится на N. Когда мы берем первую сделку в отсортированной последовательности с наименьшим стандартным значением, функция распределения вероятности (cumulative density function, далее — ФРВ) равна 1/N. Для каждого стандартного значения, которое мы проходим, приближаясь к наибольшему стандартному значению, к числителю прибавляется единица. В конце последовательности наша ФРВ будет равна N/N, или 1. Для каждого стандартного значения мы можем рассчитать теоретическое распределение. Таким образом, мы можем сравнить фактическую функцию распределения вероятности с любой теоретической функцией распределения вероятности. Переменная D, или статистика К-С (К-С statistic), равна наибольшему расстоянию между значением нашей фактической функции распределения вероятности и значением теоретического распределения ФРВ при этом же стандартном значении. При сравнении фактической ФРВ для данного стандартного значения с теоретической ФРВ для этого же стандартного значения мы должны также сравнить теоретическую ФРВ предыдущего стандартного значения с фактической ФРВ текущего стандартного значения. Для того чтобы прояснить эту ситуацию, посмотрим на рисунок 4-1. Отметьте. что в точке А фактическая кривая находится выше теоретической. Поэтому мы сравниваем текущее значение фактической ФРВ с текущим теоретическим значением для нахождения наибольшей разности. Однако в точке В фактическая кривая находится ниже теоретической. Поэтому мы сравниваем предыдущее фактическое значение с текущим теоретическим значением. Идея состоит в том, что в результате мы выберем наибольшую разность. Для каждого стандартного значения нам надо взять абсолютное значение разности между текущим значением фактической ФРВ и текущим значением теоретической ФРВ. Нам также надо взять абсолютное значение разности между предыдущим значением фактической ФРВ и текущим значением теоретической ФРВ. Повторив эту операцию для всех стандартных значений точек, где фактическая ФРВ делает скачок вверх на 1/N, и взяв наибольшую разность, мы определим переменную D. Рисунок 4-1 Тест К-С Чем ниже значение D, тем больше похожи два распределения. Мы можем преобразовать значение D в уровень значимости с помощью следующей формулы: где SIG = уровень значимости для данного D и N; D = статистика К-С; N = количество сделок, по которым определена статистика К-С; % = оператор, означающий остаток после деления. Здесь J%2 дает остаток после деления J на 2; ЕХР() = экспоненциальная функция. Нет необходимости суммировать значения J от 1 до бесконечности. Уравнение сходится (обычно очень быстро) к определенному значению. После того как предел достигнут (согласно допуску, установленному пользователем), нет необходимости продолжать суммирование значений. Рассмотрим уравнение (4.01) на примере. Допустим, у нас есть 100 сделок, а значение статистики К-С равно 0,04: J1 = (1 % 2) * 4 - 2 * ЕХР(-2 * 1^2 * (100^(1/2) * 0,04) л 2) =1*4-2* ЕХР(-2 * ^ 2 * (10 * 0,04)^ 2) = 2 * ЕХР(-2 * 1^2 * 0,^ 2) = 2*ЕХР(-2*1*0,16) = 2 * ЕХР(-0,32) = 2 * 0,726149 = 1,452298 Таким образом, нашим первым значением является 1,452298. Теперь прибавим следующее значение: J2 = (2 % 2) * 4 - 2 * ЕХР(-2 * 2^ 2 * (100^ (1/2) * 0,04)^2) =0*4-2* ЕХР(-2 * 2^ 2 * (10 * 0,04)^ 2) = -2 * ЕХР(-2 * 2^ 2 * 0,4^ 2) = -2*ЕХР(-2*4*0,16) = -2*ЕХР(-1,28) = -2 * 0,2780373 = -0,5560746 Прибавив -0,5560746 к нашей текущей сумме 1,452298, мы получим новую текущую сумму 0,8962234. Затем снова увеличим J на 1, теперь оно будет равно 3, и решим уравнение. Получившееся значение прибавим к текущей сумме 0,8962234. Следует поступать таким образом и дальше, пока текущая сумма в пределах допуска не перестанет изменяться. В нашем примере предельное значение будет равно 0,997. Этот ответ означает, что при 100 сделках и значении статистики К-С 0,04 мы можем быть уверены на 99,7%, что фактическое распределение генерировано функцией теоретического распределения. Другими словами, мы можем быть на 99,7% уверены, что функция теоретического распределения представляет фактическое распределение. В данном случае это очень хороший уровень значимости.
|