N-е число Фибоначчи за O(log N)

Читая статью об устройстве на работу в ABBYY ^[1], встретил в ней упоминание задачи:

быстро – за O( log N ) арифметических операций над числами – найти N-е число Фибоначчи

Я задумался над ней и понял, что сходу в голову приходят только решения, работающие за время O(N). Однако позже решение было найдено.

Для удобства я перейду от обозначения к . Также я буду использовать обозначения множеств: $mathbb{N}_0=left { 0, 1, 2, 3, ... right }$ — целые неотрицательные числа, $mathbb{N}_1=left { 1, 2, 3, ... right }$ — целые положительные числа. Дело в том, что в разных математических традициях множество натуральных чисел может включать или не включать 0. Поэтому сейчас в международных математических текстах предпочитают указывать это явно.

Итак, решение

Кнут [1, с. 112 ^[2]] приводит матричное тождество следующего вида:

Тождество приводится без доказательства, но довольно просто доказывается по индукции.
Матрица слева иногда называется Q-матрицей.
Обозначим:

Из тождества получаем, что $F_n=Q^{n-1}left (% 1,1 right )$ . Т.е. для вычисления нам нужно вычислить матрицу $Q^{n-1}$ и взять первый элемент первой строки (нумерация с 1).

Так как вычисление свелось к возведению матрицы в степень, то рассмотрим этот процесс подробнее.
Пусть у нас имеется некоторая матрица , которую необходимо возвести в степень $nin mathbb{N}_1$ . Предположим также, что является степенью двойки, т.е. $n=2^i,iin mathbb{N}_0$ .
можно представить в виде дерева:
N е число Фибоначчи за O(log N)
Имеется в виду:
.
Соответственно, для вычисления матрицы нужно вычислить матрицу и умножить саму на себя. Для вычисления нужно тоже самое проделать с и т.д.
Очевидно, что высота дерева равна .
Оценим время вычисления . Матрица в любой степени имеет постоянный размер. Поэтому умножение двух матриц в любой степени можно выполнить за . Всего таких умножений нужно выполнить . Следовательно, сложность вычисления равна .

А если n — не степень двойки?

Теперь же встает вопрос: что делать, если не является степенью двойки? Любое натуральное число можно разложить как сумму чисел, являющихся степенью двойки, причем без повторений (мы занимаемся этим каждый раз, когда переводим число из двоичной системы счисления в десятичную). Т.е.
$n=sum_{pin P}2^p$ ,
где $P_n subset mathbb{N}_0$ — множество степеней, через которые выражается конкретное . Если вспомнить, что — это степень матрицы, то мы получим:
$M^n=prod_{p in P_n}M^{2^p}$ .
Хотя в общем произведение матриц не коммутативно, т.е. порядок операндов при умножении важен, но для т.н. перестановочных матриц коммутативность соблюдается. Матрица является перестановочной для , $i,j in mathbb{N}_0$ . Следовательно, нам не придется иметь в виду порядок операндов при умножении, что несколько облегчает дело.

Итак, алгоритм вычисления можно представить в виде следующих шагов:

Разложить на сумму степеней двойки в виде множества .
Вычислить все элементы множества $S=left {M^p|p in P_n right }$ .
Вычислить $M^n=prod_{s in S}s$ .

Оценим время работы данного алгоритма.
Первый шаг выполняется за время , где — количество двоичных разрядов в .
Второй шаг выполняется за , т.к. нам нужно выполнить не более возведение матрицы в степень.
Третий шаг выполняется за , т.к. нам нужно выполнить умножение матриц не более раз.

Оптимизация

Можно ли улучшить время работы данного алгоритма? Да, можно. Заметим, что во втором шаге в общем-то не оговаривается метод вычисления матриц, входящих во множество . Нам известно о них то, что для каждой из них является степенью двойки. Если вернуться к рисунку с деревом, это означает, что они все лежат на тех или иных ярусах дерева и для вычисления больших необходимо вычисление меньших. Если мы применим методику мемоизации ^[3] и будем сохранять вычисленные матрицы на всех ярусах дерева, то сможем сократить время работы второго шага до и время выполнения всего алгоритма также до . Именно это и требуется нам по условию задачи.

Код

Перейдем к кодированию. Я реализовал алгоритм на Python по двум причинам:

он достаточно выразителен, чтобы заменить псевдокод;
в нем прозрачная длинная арифметика ^[4].

Получается такое:

class MatrixFibonacci:
    Q = [[1, 1],
         [1, 0]]

    def __init__(self):
        self.__memo = {}

    # умножение матриц
    # ожидаются матрицы в виде списка список размером 2x2
    def __multiply_matrices(self, M1, M2):
        a11 = M1[0][0]*M2[0][0] + M1[0][1]*M2[1][0]
        a12 = M1[0][0]*M2[0][1] + M1[0][1]*M2[1][1]
        a21 = M1[1][0]*M2[0][0] + M1[1][1]*M2[1][0]
        a22 = M1[1][0]*M2[0][1] + M1[1][1]*M2[1][1]
        r = [[a11, a12], [a21, a22]]
        return r

    # возведение матрицы в степень
    # ожидается p равная степени двойки
    def __get_matrix_power(self, M, p):
        if p == 1:
            return M
        if p in self.__memo:
            return self.__memo[p]
        K = self.__get_matrix_power(M, int(p/2))
        R = self.__multiply_matrices(K, K)
        self.__memo[p] = R
        return R

    # получение n-го числа Фибоначчи
    # в качестве n ожидается неотрицательное целое число
    def get_number(self, n):
        if n == 0:
            return 0
        if n == 1:
            return 1
        # разложение переданной степени на степени, равные степени двойки
        # т.е. 62 = 2^5 + 2^4 + 2^3 + 2^2 + 2^0 = 32 + 16 + 8 + 4 + 1
        powers = [ int(pow(2, b)) for (b, d) in enumerate(reversed(bin(n-1)[2:])) if d == '1' ]
        # тоже самое, но менее pythonic: http://pastebin.com/h8cKDkHX

        matrices = [ self.__get_matrix_power(MatrixFibonacci.Q, p) for p in powers ]
        while len(matrices) > 1:
            M1 = matrices.pop()
            M2 = matrices.pop()
            R = self.__multiply_matrices(M1, M2)
            matrices.append(R)
        return matrices[0][0][0]<source lang="ruby">

mfib = MatrixFibonacci()
for n in range(0, 128):
    num = mfib.get_number(n)
    print(num)

Бенчмарк

Я хотел сравнить производительность моего алгоритма с классическим итерационным алгоритмом, основанным на последовательном вычислении с сохранением предыдущих двух чисел. Я реализовал его так:

def get_number(self, n):
    if n == 0:
        return 0
    a = 0
    b = 1
    c = 1
    for i in range(n-1):
        c = a + b
        a = b
        b = c
    return c

Применялась следующая методика тестирования производительности. Число принимает значения . Для каждого создаются объекты классов MatrixFibonacci и IterationFibonacci (класс, вычисляющий числа Фибоначчи итерационно). Далее 10 000 раз генерируется случайное целое . Каждый из объектов вычисляет с замером времени. На выходе теста получается множество строк вида: n <tab> T1 <tab> T2. По данным строкам строится график.
N е число Фибоначчи за O(log N)
Как видно из графика, матричный алгоритм начинает уверенно обгонять итерационный начиная где-то с (cтоит заметить, что $F_{94}$ уже не влезет в 64 бита без знака). Мне кажется, что можно говорить о непрактичности данного алгоритма, хотя и имеющего хорошую теоретическую скорость.
Полный код с бенчмарком выложен тут ^[5]. Код для gnuplot для построения графика по данным — тут ^[6].

P.S. Хотел попросить прощения за то, что TeX-формулы в виде картинок не всегда адекватно выравниваются внутри строчки. И похоже, что на Хабре нельзя сделать выравнивание руками.

Дональд Кнут. Искусство программирования, том 1. Основные алгоритмы. — 3-е изд. — М.: «Вильямс», 2006.

Автор: Ivanhoe

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/algoritmy/12036

Ссылки в тексте:

[1] статью об устройстве на работу в ABBYY: http://habrahabr.ru/company/abbyy/blog/91837/

[2] 1, с. 112: #1

[3] мемоизации: http://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D0%BC%D0%BE%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F

[4] длинная арифметика: http://en.wikipedia.org/wiki/Arbitrary-precision_arithmetic

[5] тут: http://pastebin.com/ZJ65ydLP

[6] тут: http://pastebin.com/MBEbQpeK

Нажмите здесь для печати.