Идентификация коинтегрированных пар акций на фондовых рынках

в 7:05, , рубрики: анализ временных рядов, коинтеграция, математика, регрессия, случайные процессы, тест Энгла-Грэнджера, метки: ,

Цель данной статьи — поделиться результатами исследования по выявлению коинтегрированных пар акций, которые представлены на Московской и Нью-Йоркской биржах, с помощью теста Энгла-Грэнджера.

Если мы возьмём две акции со стационарными приращениями, и найдём их некоторую линейную комбинацию (спред), которая будет стационарна, то такой временной ряд будет называться коинтегрированным. Наличие коинтеграции даёт нам возможность захеджироваться акциями и построить рыночно-нейтральную стратегию. Почему это возможно?

Принцип, на котором строится извлечение прибыли

Все мы знаем, что цена акции, рассматриваемая как временной ряд, может меняться весьма значительно. Если мы будем делать позицию в какой-то одной бумаге, то в большинстве случаев это будет очень рискованная игра, так как все риски, связанные с её волатильностью, мы возьмём на себя. Однако встречаются такие акции, от которых можно ожидать, что, будучи объединёнными в пару, подобные ряды будут не слишком далеко удаляться друг от друга. Эта концепция получила название долгосрочного динамического равновесия.

В контексте стационарности долгосрочное динамическое равновесие приобретает более точную форму. Если мы возьмём стационарный ряд спреда, построенного между двумя коинтегрированными бумагами, он будет иметь свойство возврата к среднему, то есть при любом отклонении от некоторого равновесия будет стремиться вернуться обратно. На этом принципе и строится рыночно-нейтральная стратегия.

Как на фондовых рынках находить пары, связанные долгосрочным динамическим равновесием?

Корреляция

Первая мысль, которая приходит в голову — это вычислить корреляцию между двумя бумагами и торговать пары с сильной корреляцией. Этот подход терпит неудачу по двум причинам.

Во-первых, если бы ряды цен двух акций имели бы идеальную корреляцию, то есть если бы они изменялись в одном и том же направлении и в одной и той же пропорции, разность между рядами была бы равна нулю, и мы не смогли бы заработать никаких денег, потому что ни одна из акций никогда не будет слишком дорогой или слишком дешёвой.

Во-вторых, корреляция не даёт нам достаточной информации о взаимосвязи двух акций в долгосрочной перспективе. Например, возьмём большой и диверсифицированный портфель акций. Пусть эти акции также входят в фондовый индекс, и пусть веса акций в портфеле определяются их весами в индексе. Хотя портфель в долгосрочной перспективе должен двигаться в соответствии с индексом, будут периоды, когда акции, которые находятся в индексе, но не в портфеле, будут иметь необычные движения цен. Следовательно, эмпирические корреляции между портфелем и индексом в течение некоторого времени могут быть довольно низкими. Из-за этого при анализе мы просто отбросим такой портфель и упустим возможность заработать. Отсюда следует, что корреляция не является хорошим способом идентификации пар.

Лучше для идентификации пар использовать коинтеграцию.

Коинтеграция

Часто для обеспечения стационарности экономических рядов мы берём разности. Это приводит к следующему определению интеграции.

Временной ряд называется интегрированным порядка $inline$k$inline$ и обозначается $inline$x_t sim I(k)$inline$, если он и его разности до порядка $inline$k-1$inline$ включительно нестационарны, а его разность порядка $inline$k$inline$ стационарна.

Нам для получения практических результатов потребуются только значения $inline$k=0$inline$ и $inline$k=1$inline$. Если $inline$k=0$inline$, то сам ряд будет стационарным, и я для краткости далее буду обозначать такие ряды $inline$I(0)$inline$. Для $inline$k=1$inline$ ряд будет нестационарным со стационарными приращениями (разностями первого порядка), и я для краткости далее буду обозначать такие ряды $inline$I(1)$inline$.

Пусть у нас есть два $inline$I(1)$inline$ ряда, $inline$x_t$inline$ и $inline$y_t$inline$. Пусть, кроме того, их линейная комбинация $inline$y_t - beta x_t$inline$ является $inline$I(0).$inline$ В этом случае ряды $inline$x_t$inline$ и $inline$y_t$inline$ называются коинтегрированными:

$$display$$varepsilon_t = y_t - beta x_t sim I(0).$$display$$

По сути, коинтеграция — это регрессия нестационарных рядов. Она означает, что, если $inline$varepsilon_t$inline$ имеет нулевое среднее, то этот ряд будет редко далеко отклоняться от нуля и часто пересекать нулевой уровень. Иными словами, время от времени будет достигаться точное равновесие или близкое к нему состояние.

Коинтеграция логарифмов цен

Мы можем рассматривать коинтеграцию не только между ценами, но и между их логарифмами. К сожалению, коинтеграция между логарифмами цен двух акций менее очевидна и интуитивно понятна, чем просто коинтеграция между ценами двух акций. Тем не менее, почему коинтеграция возможна и в случае логарифмов?

Объясняется это «гипотезой эффективного рынка», моделью ценообразования опционов и леммой Ито. На самом деле, у гипотезы эффективного рынка нет строгой формализации. Эта гипотеза предполагает, что на ликвидном рынке, где цена актива будет результатом уравновешенного спонтанного спроса и предложения, текущая цена будет точно отражать всю информацию, которая доступна игрокам на рынке. Будущие изменения в цене могут быть только результатом «новостей», которые по определению непредсказуемы, так что лучший прогноз цены на любую будущую дату — это просто цена сегодня. Другими словами, цена сегодня — это вчерашняя цена плюс случайный элемент.

Гипотеза эффективного рынка связана с основной моделью ценообразования опционов. Фундаментальное предположение этой модели заключается в том, что цена базового актива $inline$S$inline$ удовлетворяет процессу геометрического броуновского движения (GBM):

$$display$$frac{dS}{S} = mu dt + sigma dW,$$display$$

где $inline$mu$inline$ и $inline$sigma$inline$ — константы, которые представляют собой, соответственно, смещение в цене актива и волатильность доходности, а $inline$W$inline$ — это винеровский процесс, то есть приращения $inline$dW$inline$ независимы и нормально распределены с нулевым средним и дисперсией $inline$dt$inline$.

Чтобы увидеть, как уравнение GBM связано с гипотезой эффективного рынка, нужно применить к нему лемму Ито. В чём она заключается? Допустим, что значения переменной $inline$x$inline$ подчиняются стохастическому дифференциальному уравнению (СДУ)

$$display$$dx = mu dt + sigma dW,$$display$$

где $inline$W$inline$ — это винеровский процесс, а $inline$mu$inline$ и $inline$sigma$inline$ – функции, которые зависят от переменных $inline$x$inline$ и $inline$t$inline$. Допустим также, что функция $inline$f$inline$ зависит от переменных $inline$x$inline$ и $inline$t$inline$ и имеет производные $inline$frac{partial f}{partial t}$inline$, $inline$frac{partial f}{partial x}$inline$, $inline$frac{partial^2 f}{partial x^2}$inline$. Лемма Ито утверждает, что данная функция подчиняется уравнению

$$display$$df = (frac{partial f}{partial t} + mu frac{partial f}{partial x} + frac{sigma^2}{2} frac{partial^2 f}{partial x^2})dt + sigma frac{partial f}{partial x} dW.$$display$$

По сути, лемма Ито — это формула замены переменных в СДУ, где при определённых условиях функция от некоторого СДУ также является СДУ.

Вернёмся к уравнению GBM и преобразуем его в виде

$$display$$dS = mu Sdt + sigma SdW.$$display$$

Полагая $inline$f=f(S,t)$inline$, по лемме Ито получаем:

$$display$$df=(frac{partial f}{partial t} + mu S frac{partial f}{partial S} + frac{sigma^2 S^2}{2} frac{partial^2 f}{partial S^2})dt + sigma S frac{partial f}{partial S} dW.$$display$$

Введём функцию $inline$f(S)=ln ⁡S$inline$. Поскольку

$$display$$frac{partial ln ⁡S}{partial S}=frac{1}{S}, frac{partial^2 ln ⁡S}{partial S^2}=-frac{1}{S^2}, frac{partial ln ⁡S}{partial t} = 0,$$display$$

получаем:

$$display$$d ln ⁡S=(frac{partial ln ⁡S}{partial t} + mu S frac{partial ln ⁡S}{partial S} + frac{sigma^2 S^2}{2} frac{partial^2 ln ⁡S}{partial S^2})dt + sigma S frac{partial ln ⁡S}{partial S} dW = \ = (0 + mu S frac{1}{S} - frac{sigma^2 S^2}{2} frac{1}{S^2})dt + sigma S frac{1}{S} dW = (mu - frac{sigma^2}{2})dt + sigma dW.$$display$$

Уравнение

$$display$$d ln ⁡S = (mu - frac{sigma^2}{2})dt + sigma dW$$display$$

можно переписать в дискретном виде

$$display$$Delta ln S_t = c + varepsilon_t,$$display$$

где $inline$c = mu - sigma^2/2$inline$, а $inline$varepsilon_t sim NID(0, sigma^2)$inline$, то есть здесь процесс $inline$varepsilon_t$inline$ не просто стационарный, а является белым шумом. Понятие стационарного процесса шире, чем белый шум, и оно отличается тем, что стационарный процесс имеет постоянное матожидание, но оно не обязательно должно равняться нулю, как в случае с белым шумом.

Дискретную версию уравнения, приведённого выше, можно, в свою очередь, записать в виде:

$$display$$ln⁡ S_t = c + ln S_{t-1} + varepsilon_t.$$display$$

Данное уравнение – это модель случайного блуждания (RW), которая обычно применяется для моделирования логарифмов цен на эффективных финансовых рынках, и которая является примером $inline$I(1)$inline$ процесса. Таким образом, коинтеграция также может относиться и к логарифмам цен акций.

Несмотря на то, что некоторые скептики (в частности, я) могут сомневаться относительно адекватности описания цены акции уравнением GBM и, следовательно, возможности коинтеграции между логарифмами цен, эмпирические данные успешно развеивают этот скептицизм. Я проверяла: если коинтегрированы цены, то коинтегрированы и их логарифмы.

Тестирование коинтеграции

Первыми метод тестирования коинтеграции придумали Роберт Энгл и Клайв Грэнджэр. Они в 2003 году получили Нобелевскую премию по экономике за разработку метода коинтеграции для анализа временных рядов. Описали они его за 15 лет до премии, в 1987 году в статье «Cointegration and error correction: representation, estimation and testing».

Концептуально, для того, чтобы по имеющимся наблюдениям определить, являются ли временные ряды $inline$x_t$inline$ и $inline$y_t$inline$ коинтегрированными, нам необходимо провести тестирование нулевой гипотезы $inline$H_0: varepsilon_t sim I(1)$inline$ на отсутствие коинтеграции между рядами $inline$x_t$inline$ и $inline$y_t$inline$ против альтернативной гипотезы $inline$H_0: varepsilon_t sim I(0)$inline$. Если нулевая гипотеза отвергается, признаётся наличие коинтеграции.

Оригинальный тест на коинтеграцию получил название теста Энгла-Грэнджера в честь его основателей. Он представляет собой двухшаговый процесс, которому предшествует проверка $inline$x_t$inline$ и $inline$y_t$inline$ на интегрируемость первого порядка, $inline$x_t sim I(1)$inline$ и $inline$y_t sim I(1)$inline$. Мы это подробно обсуждали в статье про стационарные приращения. По сути, там описаны все подготовительные работы, которые необходимо сделать до того, как приступить непосредственно к тесту Энгла-Грэнджера. Допустим, мы это сделали.

Ряды $inline$x_t$inline$ и $inline$y_t$inline$ являются коинтегрированными, если их спред $inline$y_t - beta x_t sim I(0)$inline$, то есть является стационарным. Первый шаг в тесте Энгла-Грэнджера заключается в получении состоятельной оценки $inline$hat{beta}$inline$. Это делается с помощью применения МНК (метода наименьших квадратов) для линейной регрессии к уравнению $inline$y_t = beta x_t + varepsilon_t$inline$. Второй шаг заключается в проверке на стационарность остатков $inline$varepsilon_t$inline$, полученных при МНК-оценивании коинтеграционного уравнения.

Обычно стационарность мы проверяем тестом Дики-Фуллера. Однако в 1990 году Филлипс и Улиарис в статье «Asymptotic properties of residual based tests for cointegration» показали, что к проверке ряда $inline$varepsilon_t$inline$ нельзя применять тест Дики-Фуллера.

Дело в том, что МНК «выбирает» остатки так, чтобы они имели наименьшую возможную вариацию, поэтому, даже если переменные не коинтегрированы, МНК делает остатки «похожими» на стационарные. Из-за этого при использовании теста Дики-Фуллера гипотеза нестационарности отвергается слишком часто и, соответственно, ошибочно принимается гипотеза наличия коинтеграции.

Если мы изучим статью авторов, то увидим, что в приложении они дают таблицы с критическими значениями, однако они оказались довольно неточными. Позднее, в 1991 году, Энгл и Грэнджер издали книжку «Long-Run Economic Relationship». В ней в 13-ой главе под названием «Critical value for cointegration tests» МакКиннон привёл уточнённые асимптотические критические значения $inline$t$inline$-статистики, которые были получены имитационным моделированием и подходят для данного случая.

В 1993 году МакКиннон вместе с Дэвидсоном издали свою книжку «Estimation and Inference in Econometrics», где тоже привели уточнённые критические значения. Таким образом, если $inline$varepsilon_t sim I(0)$inline$ (остатки стационарны), то $inline$y_t - beta x_t sim I(0)$inline$ (спред тоже стационарен), что означает наличие коинтеграции между $inline$x_t$inline$ и $inline$y_t$inline$.

В общем, метод Энгла-Грэнджера сводится к:

  1. оценке $inline$beta$inline$ с помощью МНК;
  2. вычислению спреда $inline$varepsilon_t = y_t - beta x_t$inline$ и тестированию $inline$varepsilon_t$inline$ на стационарность с помощью уточнённых критических значений.

В стандартных пакетах типа матлаба этот тест уже написан, давайте им воспользуемся.

Тестирование коинтеграции в MATLAB

Итак, у нас есть два ряда цен акций, $inline$x_t$inline$ и $inline$y_t$inline$. Мы хотим, чтобы $inline$x_t$inline$ и $inline$y_t$inline$ были коинтегрированными, то есть чтобы спред $inline$varepsilon_t = y_t - beta x_t$inline$ был стационарным. Если мы хотим получить стационарный ряд с нулевым средним, то можем включить постоянную в уравнение, так что спред будет выглядеть как $inline$varepsilon_t = y_t - beta x_t - alpha$inline$.

Начнём с результатов, полученных на Московской бирже, которые я описывала в статье про стационарные приращения. Там я нашла пять $inline$I(1)$inline$ рядов. Составим из них всевозможные комбинации и проверим на коинтеграцию с помощью теста Энгла-Грэнджера.

Сначала выберем из базы данных Microsoft SQL Server, в которой я храню спарсенные с Московской биржи значения цен акций, нужные нам бумаги и импортируем их в виде массива:

conn = database.ODBCConnection('uXXXXXX.mssql.masterhost.ru', 'uXXXXXX', 'XXXXXXXXXX');
curs = exec(conn, 'SELECT ALL PriceId, StockId, Date, Price FROM StockPrices WHERE StockId IN (52, 55, 67, 75, 162) AND Date >= ''2016-01-01 00:00:00.000'' AND Date < ''2017-01-01 00:00:00.000''');
curs = fetch(curs);
data = curs.Data
sqlquery = 'SELECT ALL StockId, ShortName, Code FROM Stocks WHERE StockId IN (52, 55, 67, 75, 162)';
curs = exec(conn, sqlquery);
curs = fetch(curs);
names = curs.Data
close(conn);

В этом массиве для четырёх из пяти акций есть данные с января за 252 торговых дня. Однако, для одной из акций сделки начали совершаться только в феврале, так что данные есть только за 215 торговых дней. Нам критически важно, чтобы у всех акций массив цен был одинаковой длины, поэтому в таких ситуациях у нас есть два варианта.

Первый вариант — исключить акцию с коротким массивом цен из эксперимента и использовать максимальное количество измерений цены для того, чтобы получить более точные результаты. Второй вариант — пожертвовать частью данных и включить все акции в угоду большей практичности. Я проводила оба эксперимента, и в данном случае разницы в результатах никакой не было, поэтому давайте просто обрежем январские данные:

dates = unique(datetime(data(:,3)));
% Cut dates array until price of stock with StockId=67 is not empty.
dates(1:37,:) = [];
prices = zeros(length(dates),length(names));
for i = 1:length(names)
    % Indexes with current stock's data
    indexes = find(cell2mat(data(:,2)) == cell2mat(names(i,1)));
    if length(indexes) == 252
        indexes(1:37,:) = [];
    end
    for j=1:length(dates)
        % Fill prices according to date
        prices(j,i) = cell2mat(data(indexes(j),4));
    end
end

Тест Энгла-Грэнджера выполняется с помощью функции egcitest, которая на вход принимает массив из временных рядов, в данном случае размера $inline$n times 2$inline$, где $inline$n$inline$ — количество торговых дней. На выходе функция возвращает логическое значение, равное 1, если нулевая гипотеза отвергается в пользу альтернативной, и 0 – иначе.

Следующая задача, которую нам надо решить, — какую акцию принять за $inline$x_t$inline$, а какую — за $inline$y_t$inline$. По-хорошему, надо попробовать и то, и другое, а затем сравнить тестовые статистики. В большинстве случаев, будет существовать как прямая, так и обратная регрессия. Давайте начнём со случая, когда $inline$x_t < y_t$inline$.

Составим все возможные пары из пяти выявленных $inline$I(1)$inline$ рядов и выполним тест Энгла-Грэнджера как для регрессии со свободным членом (по умолчанию), так и без него (задаётся аргументом 'creg' со значением 'nc'):

isCoint = zeros(length(nchoosek(names(:,1),2)), 3);
k=1;
for i=1:length(names)
    for j=i+1:length(names)
        if mean(prices(:,i)) < mean(prices(:,j))
            isCoint(k,1) = cell2mat(names(j,1));
            isCoint(k,2) = cell2mat(names(i,1));
            testPrices(:,1) = prices(:,j);
            testPrices(:,2) = prices(:,i);
        else
            isCoint(k,1) = cell2mat(names(i,1));
            isCoint(k,2) = cell2mat(names(j,1));
            testPrices(:,1) = prices(:,i);
            testPrices(:,2) = prices(:,j);
        end
        isCoint(k,3) = egcitest(testPrices);
        isCoint(k,4) = egcitest(testPrices, 'creg', 'nc');
        k = k + 1;
    end
end

В случае регрессии со свободным членом программа два раза отвергает нулевую гипотезу в пользу альтернативной модели, выявляя коинтегрированные пары акций с тикерами (NKHP, VTRS), (NKHP, ZHIV). В случае регрессии без свободного члена программа один раз отвергает нулевую гипотезу в пользу альтернативной, выявляя коинтегрированную пару акций с тикерами (VSYDP, NKHP).

В случае обратной регрессии ($inline$y_t < x_t$inline$) со свободным членом программа два раза отвергает нулевую гипотезу в пользу альтернативной модели, выявляя коинтегрированные пары акций с тикерами (VTRS, NKHP), (ZHIV, NKHP). В случае регрессии без свободного члена программа четыре раза отвергает нулевую гипотезу в пользу альтернативной, выявляя коинтегрированные пары акций с тикерами (GRNT, VTRS), (GRNT, VSYDP), (GRNT, ZHIV), (GRNT, NKHP).

Давайте оценим значения $inline$beta$inline$ и $inline$alpha$inline$, которые могут быть получены в качестве возвращаемых значений функции egcitest, и нарисуем спред:

% NKHP and VTRS
indexY = 5;
indexX = 1;
testPrices(:,1) = prices(:,indexY);
testPrices(:,2) = prices(:,indexX);
[h,pValue,stat,cValue,reg1,reg2] = egcitest(testPrices);
alpha = reg1.coeff(1);
beta = reg1.coeff(2);
spread = reg1.res;
plot(dates,spread)
legend(strcat(names(indexY,3),'-',names(indexX,3)));

Для акций с тикерами NKHP и VTRS получаем спред с коэффициентами $inline$beta = 37,5523$inline$ и $inline$alpha = 197,4397$inline$:

Идентификация коинтегрированных пар акций на фондовых рынках - 1

Для обратной регрессии получаем «зеркальный» спред с коэффициентами $inline$beta = 0,0185$inline$ и $inline$alpha = -3,0064$inline$:

Идентификация коинтегрированных пар акций на фондовых рынках - 2

Для акций с тикерами NKHP and ZHIV получаем спред с коэффициентами $inline$beta = 3,3527$inline$ и $inline$alpha = 239,3471$inline$:

Идентификация коинтегрированных пар акций на фондовых рынках - 3

Для обратной регрессии получаем спред с коэффициентами $inline$beta = 0,2194$inline$ и $inline$alpha = -49,6077$inline$:

Идентификация коинтегрированных пар акций на фондовых рынках - 4

Для акций с тикерами VSYDP and NKHP получаем спред с коэффициентом $inline$beta = 35,6527$inline$:

Идентификация коинтегрированных пар акций на фондовых рынках - 5

Аналогичные эксперименты были проведены для акций Нью-Йоркской фондовой биржи (NYSE). В результате для прямой регрессии было получено 158 коинтегрированных пар в случае регрессии со свободным членом и 130 коинтегрированных пар в случае регрессии без свободного члена. Для обратной регрессии было получено 170 коинтегрированных пар в случае регрессии со свободным членом и 144 коинтегрированные пары в случае регрессии без свободного члена.

Регрессионная статистика

Давайте посмотрим на регрессионную статистику коинтегрированной регрессии для пары (NKHP, VTRS).

Статистика Прямая регрессия Обратная регрессия
Коэффициенты $inline$beta = 37,5523$inline$, $inline$alpha = 197,4397$inline$ $inline$beta = 0,0185$inline$, $inline$alpha = -3,0064$inline$
Тестовая статистика $inline$t_{calc} = -3,7562$inline$, $inline$t_{crit} = -3,3654$inline$ $inline$t_{calc} = -3,5906$inline$, $inline$t_{crit} = -3,3654$inline$
$inline$t$inline$-статистика $inline$t_beta = 21,9754$inline$, $inline$t_alpha = 53,3845$inline$ $inline$t_beta = 21,9754$inline$, $inline$t_alpha = -12,8953$inline$
$inline$F$inline$-статистика 482,9196 482,9196
Статистика Дарбина-Уотсона 0,2548 0,2203
Коэффициент детерминации 0,6939 0,6939
Скорректированный коэффициент детерминации 0,6925 0,6925
Информационный критерий Акаике 1726,5 88,8336
Баесовский информационный критерий Шварца 1733,2 95,5748
Информационный критерий Ханнана-Куинна 1729,2 91,5574

Тестовая статистика как в прямой, так и в обратной регрессии говорит нам, что переменная $inline$beta$inline$ в данном случае незначима ($inline$t_{calc} < t_{crit}$inline$). Это означает, что цена может быть слабо экзогенной, даже несмотря на то, что переменные коинтегрированы.

Для применения критерия Стьюдента и критерия Фишера необходимо, чтобы статистика имела нормальное распределение. В нашем случае, статистика имеет распределение, подобное тому, что было установлено Дики и Фуллером (о нём я тоже писала в статье про стационарные приращения), поэтому расчётные значения этих статистик будут довольно большими и ничего содержательного нам не скажут.

Статистика Дарбина-Уотсона приемлемая (при положительной автокорреляции статистика стремится к нулю). В случае обратной регрессии она немного лучше, чем в случае прямой.

Коэффициент детерминации приемлемый (для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%). Судя по этому критерию, никакой разницы между прямой и обратной регрессией нет.

Судя по информационным критериям, обратная регрессия сильно выигрывает перед прямой (считается, что наилучшей будет модель с наименьшим значением критерия).

Посмотрим на регрессионную статистику коинтегрированной регрессии для пары (NKHP, ZHIV).

Статистика Прямая регрессия Обратная регрессия
Коэффициенты $inline$beta = 3,3527$inline$ и $inline$alpha = 239,3471$inline$ $inline$beta = 0,2194$inline$ и $inline$alpha = -49,6077$inline$
Тестовая статистика $inline$t_{calc} = -3,4762$inline$, $inline$t_{crit} = -3,3654$inline$ $inline$t_{calc} = -3,3878$inline$, $inline$t_{crit} = -3,3654$inline$
$inline$t$inline$-статистика $inline$t_beta = 24,3444$inline$, $inline$t_alpha = 137,974$inline$ $inline$t_beta = 24,3444$inline$, $inline$t_alpha = -19,8524$inline$
$inline$F$inline$-статистика 592,652 592,652
Статистика Дарбина-Уотсона 0,2614 0,2104
Коэффициент детерминации 0,7356 0,7356
Скорректированный коэффициент детерминации 0,7344 0,7344
Информационный критерий Акаике 1695 1108,8
Баесовский информационный критерий Шварца 1701,7 1115,5
Информационный критерий Ханнана-Куинна 1697,7 1111,5

Тестовая статистика как в прямой, так и в обратной регрессии говорит нам, что переменная $inline$beta$inline$ в данном случае незначима. Статистика Дарбина-Уотсона приемлемая, в случае обратной регрессии немного лучше, чем в случае прямой. Коэффициент детерминации приемлемый, разницы между прямой и обратной регрессией не наблюдается. По информационным критериям, обратная регрессия немного выигрывает перед прямой.

Регрессионная статистика коинтегрированной регрессии для пары (VSYDP, NKHP).

Статистика Прямая регрессия
Коэффициенты $inline$beta = 35,6527$inline$
Тестовая статистика $inline$t_{calc} = -2,8339$inline$, $inline$t_{crit} = -2,7761$inline$
$inline$t$inline$-статистика 82,5035
$inline$F$inline$-статистика $inline$infty$inline$
Статистика Дарбина-Уотсона 0,1305
Коэффициент детерминации 0,1928
Скорректированный коэффициент детерминации 0,1928
Информационный критерий Акаике 3823,8
Баесовский информационный критерий Шварца 3827,1
Информационный критерий Ханнана-Куинна 3825,1

Переменная $inline$beta$inline$, судя по тестовой статистике, опять незначима. Критерий Фишера улетел в космос. Статистика Дарбина-Уотсона приемлемая. Коэффициент детерминации маленький, поэтому модель считается плохой.

Выводы

На фондовых рынках существует достаточное количество коинтегрированных акций, то есть таких, что их спред представляет собой стационарный процесс. Наличие таких пар даёт почву для дальнейших исследований и стабильного извлечения прибыли, но о конкретных стратегиях мы поговорим в следующий раз.

Что почитать по теме?

Роберт Ф. Энгл, К. У. Дж. Грэнджер. Коинтеграция и коррекция ошибок: представление, оценивание и тестирование // Прикладная эконометрика. — 2015. — 39 (3). — С. 107-135.

Это перевод оригинальной статьи авторов 1987 года, там более подробно изложено определение коинтеграции. Также можно продолжать читать Магнуса, которого я рекомендовала в статье про стационарные приращения, там тоже есть раздел про коинтеграцию.

Автор: Ксения Кузнецова

Источник

Поделиться

* - обязательные к заполнению поля