Примитивно-рекурсивные функции и функция Аккермана

2020-02-03 в 7:59, admin, рубрики: dsu, math, Алгоритмы, математика, теоретические модели вычислений, функция аккермана

Функция Аккермана — одна из самых знаменитых функций в Computer Science. С ней связан как минимум один фундаментальный результат и как минимум один просто важный. Фундаментальный результат, говоря аккуратно и непонятно, таков: существует всюду определённая вычислимая функция, не являющаяся примитивно-рекурсивной. Важный результат заключается в том, что лес непересекающихся множеств (также известный как disjoint set union) работает очень быстро.

Мне очень нравится изучать функцию Аккермана, т.к. всё, что с ней связано, очень красиво и изящно. Вот и записанный выше фундаментальный результат понять намного проще, чем это может показаться.

Из текста ниже вы узнаете, что такое примитивно-рекурсивные функции и как выяснить, что функция Аккермана к таковым не относится. И, конечно, этот текст убедит вас в том, что это невероятно красивая конструкция и невероятно красивое рассуждение!

1. Почему это может быть интересно

Рассуждение о связи между примитивно-рекурсивными функциями и функцией Аккермана является примером решения стандартной в теории вычислимости задачи: дана некоторая модель вычислений, некоторая функция, и необходимо определить, является ли эта функция вычислимой в данной модели.

Другие подобные примеры связаны, например, с алгоритмической разрешимостью, эквивалентностью различных моделей вычислений (машин Тьюринга, частично-рекурсивных функций, нормальных алгорифмов Маркова и так далее). А через них мы связываемся уже с совершенно практической областью определения Тьюринг-полноты языков программирования, эквивалентных преобразований текстов программ и прочих интересностей.

Функция Аккермана как будто специально создана для того, чтобы быть изящным примером решения такого рода вопросов. Скоро вы в этом убедитесь.

2. Функция Аккермана

Определение из Википедии для наших целей подходит плохо, поэтому я использую определение из книжки Верещагина и Шеня «Вычислимые функции». Эта конструкция и идейно, и технически несколько отличается от изначальной, придуманной Аккерманом, но сейчас это не так важно.

Введём последовательность функций $a_0, a_1, ..., a_n, ...$ одного аргумента. Определим их рекурсивно:

$a_0(x)=x + 1$

$a_{i+1}(x)=a_{i}[x+2](x)$

Здесь $f[n](x)=fBig(f(...(f(x))...)Big)$ — в квадратных скобках записывается число $n$ , и тогда ровно $n$ раз функция применяется к своему аргументу. Таким образом, значение каждой следующей функций из нашей последовательности определяется так: возьмём предыдущую функцию, $x+2$ раза применим её к числу $x$ — получится значение следующей функции на числе $x$ .

Кстати, все аргументы здесь натуральные либо ноль — довольно типичный расклад для теории алгоритмов, да и для дискретной математики вообще.

Такое определение набора функций проще всего записать следующим кодом:

def Foo(number, argument):
    if number == 0:
        return argument + 1

    result = argument
    for i in range(argument + 2):
        result = Foo(number - 1, result)

    return result

Для определения значения $a_i(x)$ достаточно вычислить значение Foo(i, x).

Так определённый набор функций обладает полезными свойствами монотонности. Во-первых, по аргументу: $a_i(x) > x$ для любых $i$ и $x$ . Ну, действительно, $a_0(x)=x + 1 > x$ , а функции со следующими номерами многократно применяют $a_0$ к своему аргументу.

Во-вторых, по номеру функции: $a_{i+1}(x) gt a_i(x)$ для любых $i$ и $x$ . Раз все функции строго монотонны по аргументу, а функция со следующим номером применяет функцию с предыдущим номером к этому же аргументу более одного раза — стало быть, итоговое значение получится больше. Чуть подробнее:

$a_{i+1}(x)=a_i[x+2](x) ge a_i[2](x)=a_iBig(a_i(x)Big) > a_i(x)$

Отдельно стоит запомнить, что

$a_{i+1}(x) ge a_iBig(a_i(x)Big)$

3. Примитивно-рекурсивные функции (ПРФ)

ПРФ являются примером «математического исчисления». Исчисление — это способ определять множества объектов через набор аксиом и правил вывода из этих аксиом. В современной математике такой подход распространён широко: его можно встретить и в теории алгоритмов, и в математической логике, и в теории групп, и в куче других мест.

Что такое примитивно-рекурсивная функция? Начнём с «аксиом». Примитивно-рекурсивными функциями являются:

Функция, тождественно равная нулю:
Функция прибавления единицы:
Функция-проекция:

Назовём эти функции базисными. Теперь о «правилах вывода»:

Подстановка. Если — функция аргументов, а — функции аргументов, то из них можно собрать функцию аргументов : берём аргументов, подставляем их в каждую из функций , получившиеся значения используем как аргументы функции . Типичная подстановка!

$F(x_1,...,x_n)=fBig(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n)Big)$

Примитивная рекурсия. Если — функция аргументов, а — функция аргументов, то из них можно собрать функцию, определённую следующим образом:

$F(x_1,...,x_k,0)=f(x_1,...,x_k)$

$F(x_1,...,x_k,y+1)=gBig(x_1,...,x_k,y,F(x_1,...,x_k,y)Big)$

В случае примитивной рекурсии легко угадать признаки того, что мы обыкновенно называем рекурсией. Тут есть конец рекурсии: он происходит, когда последний аргумент обращается в ноль. Есть рекурсивный вызов: для вычисления значения функции с последним аргументом, отличным от нуля, необходимо вычислить значение с уменьшенным значением последнего аргумента. Такое определение является достаточно общим, т.к. в процессе вычислений доступна и сама переменная, по которой осуществляется рекурсия.

Итак, ПРФ — это базисные функции, а также любые функции, полученные из базисных при помощи операций композиции и примитивной рекурсии.

В терминах ПРФ легко построить описания простых всем известных функций.

Например, сложение двух чисел сделаем через рекурсию по второму слагаемому. Если к числу прибавить ноль, то надо вернуть само это число. В противном случае надо к результату прибавить единицу, из второго слагаемого вычесть единицу и запустить рекурсию:

$Sum(x,0)=P_1^1(x)$

$Sum(x,y+1)=SBig(P_3^3(x,y,Sum(x,y))Big)$

Теория алгоритмов — часть математики, а поэтому требует строгости. В данном случае оператор примитивной рекурсии требует, чтобы при нулевом втором аргументе вызывалась некоторая функция одного аргумента. Хотелось бы написать $Sum(x,0)=x$ , но я не могу, т.к. просто $x$ не является функцией. Это вынуждает меня использовать функцию $P_1^1$ . В случае же рекурсивного вызова правила требуют, чтобы в правой части равенства стояла функция трёх конкретных аргументов: $x,y,Sum(x,y)$ . Из них всех мне нужен только третий аргумент, поэтому я достаю его при помощи функции $P_3^3$ , а уже затем прибавляю единичку.

Похожим образом можно определить умножение:

$Mult(x,0)=Null(x)$

$Mult(x,y+1)=SumBig(P_3^1(x,y,Mult(x,y)),P_3^3(x,y,Mult(x,y))Big)$

Ну и давайте определим что-нибудь поинтереснее. Скажем, последовательность Фибоначчи! Напомню, что она определяется следующим образом:

$Fib_0=0$
$Fib_1=1$
$Fib_{n+2}=Fib_n + Fib_{n+1}$

В данном случае придётся помнить два предыдущих значения, а не одно; значит, придётся выкручиваться!

Введём не одну функцию, а сразу две. Первая функция, пусть это будет $F$ , будет производить искомые числа Фибоначчи. А вторая функция, пусть это будет $G$ , будет производить числа Фибоначчи со следующим номером, то есть:

$F(n)=Fib_n$
$G(n)=Fib_{n+1}$

В таком случае первые несколько значений функции $F$ должны равняться 0, 1, 1, 2, 3, 5; функции $G$ , соответственно, 1, 1, 2, 3, 5, 8. Тогда рекурсия должна выглядеть следующим образом:
$G(n+1)=G(n) + F(n)$
$F(n+1)=G(n)$

Осталось только записать это строго:

$F(0)=Null()$

$G(0)=S(Null())$

$F(y+1)=P_2^1Big(G(y),F(y)Big)$

$G(y+1)=SumBig(F(y),G(y)Big)$

Соответствующая реализация выглядит следующим образом:

def G(x):
    if x == 0:
        return 1
    return G(x - 1) + F(x - 1)

def F(x):
    if x == 0:
        return 0
    return G(x - 1)

Итак, мы только что доказали, что сложение, умножение, вычисление $n$ -го числа Фибоначчи являются примерами примитивно-рекурсивных функций!

4. Функция Аккермана и ПРФ, часть первая

Оказывается, примитивно-рекурсивные функции не могут «безгранично быстро» расти. Точнее говоря: для любой примитивно-рекурсивной функции $k$ аргументов $f$ найдётся такое $n$ , что:

$f(x_1,...,x_k)<a_n(max(x_1,...,x_k))$

Доказывать такие утверждения для исчислений — одно удовольствие. Вначале докажем его для базисных функций, а затем проверим, что свойство сохраняется при применении операций.

Что же, для базисных операций всё понятно:

$Null(x_1,...,x_k)=0<max(x_1,...,x_k) + 1=a_0(max(x_1,...,x_k))$

$S(x)=x+1=a_0(x)<a_1(x)$

$P_k^i(x_1,...,x_k)=x_ile max(x_1,...,x_k)<a_0Big(max(x_1,...,x_k)Big)$

В первом случае используем то, что тождественный ноль всегда меньше единицы, а даже функция $a_0$ прибавляет к своему аргументу единицу (помним: мы в дискретном мире, тут все аргументы либо натуральные числа, либо ноль). Во втором случае прибавление единицы — в точности результат применения функции $a_0$ , которая по монотонности меньше функции $a_1$ . В третьем случае функция-проекция возвращает один из своих аргументов, который точно меньше, чем максимальный из всех аргументов, увеличенный на единицу.

Теперь займёмся правилами вывода. Здесь используем математическую индукцию: в предположении, что утверждение верно для функций, из которых составляется результирующая, покажем, что и для утверждение верно и для результирующей функции.

Пусть функция $F$ получена операцией композиции из функций $f,g_1,...,g_k$ , и все эти функции в совокупности ограничены некоторой функцией $a_M$ . Докажем, что тогда и функция $F$ тоже ограничена. И действительно:

$F(x_1,...,x_n)=fBig(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n)Big)<$

$$display$$<a_MBig(max(g_1(x_1,...,x_n),...,g_k(x_1,...,x_n))Big)<$$display$$

$<a_MBig[maxBig(a_M(max(x_1,...,x_n)),...,a_M(max(x_1,...,x_n))Big)Big]$

$<a_MBig(a_M(max(x_1,...,x_n))Big) le a_{M+1}Big(max(x_1,...,x_n)Big)$

Здесь вначале использована ограниченность функции $f$ , затем ограниченность каждой из функций $g_i$ , после чего внешний максимум оказывается применён к набору из $k$ одинаковых чисел, а поэтому может быть исключён. В итоге оценка сводится к двукратному применению функции $a_M$ к своему аргументу, а такой результат ограничивается значением следующей фукнции $a_{M+1}$ .

Пусть теперь функция $F$ получена операцией примитивной рекурсии из функций $f$ и $g$ , каждая из которых ограничена функцией $a_M$ .

Посмотрим для начала, что будет, когда аргумент рекурсии равняется нулю. Тут всё просто: можем использовать оценку для функции $f$ :

$F(x_1,...,x_k,0)=f(x_1,...,x_k)<a_MBig(max(x_1,...,x_k)Big)$

Теперь посмотрим, что будет, если последний аргумент равен единице:

$F(x_1,...,x_k,1)=gBig(x_1,...,x_k,0,F(x_1,...,x_k,0)Big)<$

$$display$$<a_MBig(max(x_1,...,x_k,0,a_M(max(x_1,...,x_k))Big)<$$display$$

$<a_MBig(a_M(max(x_1,...,x_k)Big)=a_M[2](max(x_1,...,x_k))$

Здесь сначала используется уже полученная оценка для $F$ , а также оценка для $g$ . После этого используется монотонность функции $a_M$ : ясно, что

$a_MBig(max(x_1,...,x_k)Big)>max(x_1,...,x_k, 0)$

Продолжая это рассуждение по индукции, получим, что

$F(x_1,...,x_k,y)<a_M[y+1](max(x_1,...,x_k))$

А свойства введённой последовательности функций гарантируют, что

$a_M[y+1](max(x_1,...,x_k))<a_{M+1}Big(max(x_1,...,x_k,y)Big)$

Окончательно:

$F(x_1,...,x_k,y)<a_{M+1}Big(max(x_1,...,x_k,y)Big)$

И на этом наше доказательство закончено. Забавно, что получилось, что каждое применение композиции или примитивной рекурсии увеличивает необходимый по условиям утверждения номер функции на единицу.

5. Функция Аккермана и ПРФ, часть вторая

Итак, мы знаем, что для любой примитивно-рекурсивной функции найдётся функция $a_M$ , которая будет расти быстрее. Теперь можно определить следующую функцию:

$A(n)=a_n(n)$

Фактически, вводя последовательность функций одного аргумента, мы ввели функцию двух аргументов: первый из них задаёт номер функции в последовательности, второй — собственно аргумент. Приравняв номер и аргумент, получим функцию одного аргумента.

Теперь верно следующее утверждение: введённая функция не является примитивно-рекурсивной.

Действительно, предположим, что эта функция является примитивно-рекурсивной. Тогда по доказанному в пункте 4 существует такой номер $M$ , что $A(x)<a_M(x)$ для всех $x$ . Но это точно не так, например:

$A(M+1)=a_{M+1}(M+1)>a_M(M+1)$

Таким образом, новая функция не является примитивно-рекурсивной. Этого-то мы и добивались, ура! Её и будем называть функцией Аккермана.

6. А насколько она в действительности велика?

Возвращаясь к практике, нам может быть интересно знать, насколько же всё-таки быстро растёт функция Аккермана, с чем её вообще можно сравнить. Выше мы уже видели, что суммы и произведения определяются некоторыми ПРФ. Через ПРФ можно определить операцию возведения в степень и даже функцию $n^n$ . Более того, любая функция вида

$n^{n^{...^{n^n}}}$

с наперёд заданным количеством возведений в степень, является примитивно-рекурсивной. Не поленюсь и докажу это. Для начала построю функцию $n^y$ :

$Pow(n,0)=S(Null())$

$Pow(n,y+1)=MultBig(P_3^1(n,y,Pow(n,y)),P_3^3(n,y,Pow(n,y))Big)$

Теперь использую её для определения функции $n^n$ :

$SPow(n)=Pow(P_1^1(n),P_1^1(n))$

Как видите, это делается простой подстановкой. Теперь нет сложности с тем, чтобы определить функцию $n^{n^n}$ :

$SSPow(n)=Pow(P_1^1(n),SPow(n))$

Действуя по аналогии, можно построить функцию, в которой $n$ возводится в степень $n$ пять раз, десять раз, сто раз, миллион раз. Функция Аккермана растёт быстрее любой из этих функций. Вот насколько быстро она растёт!