Естественные преобразования. Часть 1

2026-02-06 в 11:16, admin, рубрики: естественные преобразования, линейная алгебра, теория категорий

Углубленно изучая линейную алгебру, любой студент-математик, а иногда физик или инженер, натыкается на такое понятие как двойственное пространство. И в рамках изучения свойств данного объекта возникает следующее утверждение

Утверждение 1. Конечномерное векторное пространство канонически изоморфно второму двойственному пространству $V^{astast}$ :

$ev:V rightarrow V^{astast} v mapsto ev_v$

где для любого $f in V^{ast}$ .

После формулировки утверждения авторы книги/преподаватели на лекции спешат пояснить, что "канонически" = "без выбора базиса", оставляя читателя/слушателя в легком недоумении - почему мы вообще различаем изоморфизм с выбором базиса и без выбора базиса?

На Хабре уже есть одна неплохая статья про естественные преобразования Категории типов. Часть 3. Естественные преобразования, однако не раскрывает некоторые аспекты, которую я хотел бы обсудить (да и страдает от отсутствия примеров за рамками программирования). В этой статье планируется сначала рассказать про двойственное векторное пространство, после чего уже перейти к азам теории категорий и самим естественным преобразованиям. Более предметное обсуждение вопроса, поставленного в начале статьи, будет в следующей части. Стоит предупредить, что статья будет изобиловать этой самой теорией категорий.

Пререквизиты: Векторное пространство, изоморфизм, линейная функция. Ну и не бояться коммутативных диаграмм.

Примечание

Весь материал ниже изложен для векторных пространств над , однако легко обобщается на векторные пространства над произвольным полем , в частности, евклидовы пространства придется заменить на векторные пространства с симметричной невырожденной билинейной формой.

Глава 0: Двойственные пространства

Прежде чем начать обсуждать естественное преобразование потребуется немного поработать с двойственными пространствами. Читателю будет полезно ознакомиться со статьей про двойственные пространства, в которой приведено довольно много наглядных примеров.

Первое двойственное пространство

Определение 1. Двойственное к векторному пространству пространство $V^{ast}$ есть набор всевозможных линейных функций (линейных функционалов) , на котором сложение и умножение на скаляр определяются поэлементно, т.е $forall f, g in V^{ast}, alpha in mathbb{R}$

Для каждого базиса в можно построить двойственный базис $e^{ast}=(e_1^{ast}, e_2^{ast}, ldots, e_n^{ast})$ в $V^{ast}$ , где $e^{ast}_i (x_1 e_1 + x_2 e_2 + ldots + x_n e_n) :=x_i$ , т.е. $e_i^{ast}(e_j)=0$ при и $e_i^{ast}(e_i)=1$ . Тогда координаты произвольного линейного функционала $f in V^{ast}$ определяются значениями на базисных векторах

$f(v)=f(sum_{i=1}^n x_i e_i)=sum_{i=1}^n x_i f(e_i)=sum_{i=1}^n e^{ast}_i(v)f(e_i)=(sum_{i=1}^n e^{ast}_if(e_i))(v)$

Т.е. $f=e_1^{ast} f(e_1) + ldots + e_n^{ast} f(e_n)$ , откуда координаты в базисе $e^{ast}$ определяются набором . Это позволяет нам получить равенство $dim V^{ast}=dim V=n$ , что делает справедливым следующее утверждение

Утверждение 2. Конечномерное векторное пространство изоморфно двойственному пространству $V^{ast}$ .

Доказательство

Зафиксируем базис в и двойственный к нему $e^{ast}$ в $V^{ast}$ , тогда изоморфизм можно построить, сопоставляя с $e_i^{ast}$ .

Стоит заметить, что при построение изоморфизма мы выбирали базис в , что наводит на мысль о том, что и $V^{ast}$ не изоморфны канонически, если только не существует какого-то способа построить такой изоморфизм без выбора базиса (или рассмотреть такую категорию, в которой только такой изоморфизм и существует).

Но самым важным аспектом двойственного пространства является его следующее свойство

Утверждение 3. Для любого линейного отображения существует двойственное ему линейное отображение $phi^{ast}: W^{ast} to V^{ast} f mapsto f circ phi$ , которое каждому линейному функционалу сопоставляет линейный функционал $phi^{ast} f: V to mathbb{R}$ такой, что его значение на векторе равно $(phi^{ast} f)(v) :=f(phi (v))$ .

Доказательство

Необходимо убедиться, что- линейный функционал, что немедленно следует из линейности и

Линейность самого $phi^{ast}$ при этом проверяется совершенно аналогично

$phi^{ast} (alpha f + beta g)=(alpha f + beta g) circ phi=(alpha f) circ phi + (beta g) circ phi=alpha cdot (f circ phi) + beta cdot (g circ phi )$

Таким образом, $phi^{ast}$ - линейное отображение.

Второе двойственное пространство

Теперь второе двойственное пространство $V^{astast}$ можно определить как двойственное пространство к $V^{ast}$ , т.е. набор линейных функционалов $phi: V^{ast} to mathbb{R}$ . С первого взгляда абсолютно не понятно, что за функционалы могут лежать в таком пространстве. Однако некоторые функционалы из этого пространства можно довольно легко определить - это функционалы вычисления , которые берут произвольный линейный функционал из $V^{ast}$ и считают его значение на заданном векторе ; остается только убедиться в их линейности

Тогда Утверждение 1 говорит нам следующее - если конечномерно, то в $V^{astast}$ нет никаких других функционалов, кроме .

Предпосылкой этого утверждение является двойственность $V^{astast}$ по отношению к $V^{ast}$ . Зафиксируем базис в , к нему имеется двойственный $e^{ast}$ в $V^{ast}$ , а к нему имеется двойственный $e^{astast}$ в $V^{astast}$ . Для произвольного $f in V^{ast}$ имеем $f=e_1^{ast} f(e_1) + ldots + e_n^{ast} f(e_n)$ , откуда $e^{astast}_i(f)=f(e_i)$ , т.к. $e_i^{astast}(e^{ast}_j)=0$ при и $e_i^{astast}(e^{ast}_j)=1$ при . Это наблюдение позволяет заключить, что $e^{astast}_i=ev_{e_i}$ и второй двойственный базис целиком состоит из функционалов вычисления $e^{astast}=(ev_{e_1}, ldots, ev_{e_n})$ .

Очевидно, что $dim V^{astast}=dim V^{ast}=dim V=n$ , откуда $V^{astast}$ изоморфно . При этом изоморфизм, определенный в Утверждение 1 сопоставляет базис базису $e^{astast}$ , однако это лишь половина утверждения. Вторая половина говорит нам об естественности этого изоморфизма.

Глава 1. Немного о категориях

Довольно долго мы сторонились слона в комнате - теории категорий. Теперь придется к ней обратиться. И нет, это не от того, что автор хочет выпендриться или он в этой вашей математике так погряз, что уже без теории категорий не может. Проблема в том, что "естественное преобразование" - понятие, которое напрямую зависит от выбранной категории. Например, построенный нами выше изоморфизм и $V^{ast}$ не является естественным в случае конечномерных векторных пространств, однако если задать на структуру евклидового пространства и выбрать в качестве отображений ортогональные преобразования, то изоморфизм станет естественным.

Стоит сказать что вообще такое категория. Если говорить простым языком, то это такой своеобразный контейнер, содержащий объекты и стрелки (т.е. отображения между объектами), который удовлетворяет следующим двум аксиомам:

Если в категории есть объект , то всуществует тождественная стрелка $text{id}_A: A to A$ .
Если в категории есть две стрелки и , то всуществует стрелка, являющаяся их композицией, т.е. .

Определим интересные нам категории

Для примеров я буду иногда использовать категорию всех множеств и отображений между ними.

Среди разнообразных категорий векторных пространств нас интересует категория $mathbf{Vect_{f, i}}$ конечномерных векторных пространств, стрелками которой являются изоморфизмы векторных пространств и категория $mathbf{Vect_f}$ конечномерных векторных пространств и всевозможных линейных отображений между ними. А также нас интересует категория $mathbf{Eucl_f}$ конечномерных евклидовых пространств и ортогональных преобразований между ними.

И еще несколько нужных понятий

Определим понятие (ковариантного) функтора.

Определение 2. Функтором из категории в категорию называется отображение, которое каждому конечномерному объекту сопоставляет объект , а каждой стрелке сопоставляет стрелку , причем и $F(text{id}_A)=text{id}_{F(A)}$ . Тогда эндофунктор это функтор из категории в саму себя.

Пример. Самый простым эндофунктором, определенным для любой категории, является тождественный (или тривиальный) эндофунктор $I_mathbf{C}$ , который каждому объекту сопоставляет тот же самый объект, а стрелке сопоставляет ее саму.

Пример. Классический пример нетривиального эндофунктора находится в категории . Там имеется эндофунктор , который множеству сопоставляет его множество всех подмножеств . Отображению он сопоставляет отображение , которое подмножеству сопоставляет образ . Очевидно, что $mathcal{P}(text{id}_A)=text{id}_{mathcal{P}(A)}$ . Проверим сохранение композиции; пусть имеются два отображения и , тогда для всякого подмножества справедливо:

Пример. Еще примером нам послужит двойственное пространство и категория $mathbf{Vect_{f,i}}$ . Эндофунктор $D': mathbf{Vect_{f,i}} to mathbf{Vect_{f,i}}$ сопоставляет конечномерному пространству его двойственное пространство $V^{ast}$ , а всякой стрелке стрелку $D'(phi): W^{ast} to V^{ast} f mapsto phi^{-1} circ f$ , определенную как $D'(phi)=(phi^{ast})^{-1}$ , т.е. обратную стрелку к стрелке $phi^{ast}: W^{ast} to V^{ast}$ , определенной в Утверждении 3. На первый взгляд такое сопоставление очень неестественно - в предыдущем примере нам не требовалось существование обратной стрелки и само сопоставление выглядело куда более интуитивным. Связано это с тем, что "естественная" для этого эндофунктора стрелка $phi^{ast}: W^{ast} to V^{ast}$ действует в другую сторону, поэтому нам пришлось рассматривать не категорию $mathbf{Vect_f}$ , а категорию $mathbf{Vect_{f, i}}$ , чтобы гарантировать, что стрелку $phi^{ast}$ удастся обратить. (стоит заметить, что само сопоставление векторных пространств не сопровождается выбором базиса или построением изоморфизма между ними). Композиция и сохранение тождественной стрелки проверяются непосредственно.

Примечание

Вообще эндофунктор $D: mathbf{Vect_f} to mathbf{Vect_f}, D(V)=V^{ast}, D(phi)=phi^{ast}$ является контравариантным, т.е. на объектах он ведет себя так же, как и обычный (ковариантный) эндофунктор, однако он оборачивает стрелки, т.е. стрелка переходит в и композиция оборачивается . Это позволяет говорить об ковариантном функторе в двойственную категорию $D^{op}: mathbf{Vect_f} to mathbf{Vect_f^{op}}, D^{op}(V)=V^{ast}, D^{op}(phi)=phi^{ast}$ (не стоит цепляться здесь за слово "двойственная", это универсальное свойство любого контравариантного функтора). Именно поэтому мы спускаемся в подкатегорию $mathbf{Vect_{f, i}}$ , т.к. она изоморфна своей двойственной категории $mathbf{Vect_{f, i}^{op}}$ , что в свою очередь позволяет превратить функтор $D^{op}: mathbf{Vect_{f,i}} to mathbf{Vect_{f,i}^{op}}$ в эндофунктор $D': mathbf{Vect_{f,i}} to mathbf{Vect_{f,i}}$ . Делается это при помощи композиции функтора обращения стрелок $R: mathbf{Vect_{f,i}^{op}} to mathbf{Vect_{f,i}}, R(V)=V, R(phi)=phi^{-1}$ и функтора $D^{op}$ , т.е. $D'=R circ D^{op}$ .

Ну и настало время последнего понятия из теории категорий - естественное преобразование или стрелка между функторами

Определение 3. Естественным преобразованием функторов называется функция , которая всякому объекту сопоставляет стрелку таким образом, что для всякой стрелки следующая диаграмма коммутирует

Естественные преобразования. Часть 1 - 158

Тогда естественный изоморфизм между функторами есть естественное преобразование, для которого существует обратное естественное преобразование $eta^{-1}: G to F$ , т.е. такое естественное преобразование, что $eta circ eta^{-1}=text{id}_G$ и $eta^{-1} circ eta=text{id}_F$ (про $text{id}_F$ написано чуть ниже).

Пример. Очевидно, что для всякого эндофунктора существует тождественное преобразование $text{id}_F: F to F$ , которая всякому объекту сопоставляет тождественную стрелку $text{id}_{F(X)}: F(X) to F(X)$ , что автоматически приводит к равенству $text{id}_{F(Y)} circ F(f)=F(f) circ text{id}_{F(X)}$ для любой стрелки . (так мы скоро и 2-категорию определим)

Пример. В нашей категории для примеров существует известное естественное преобразование $eta: I_{mathbf{Set}} to mathcal{P}$ . Каждому множеству оно сопоставляет стрелку $eta_X: X to mathcal{P}(X) x mapsto {x}$ . Тогда необходимо проверить коммутативность следующей диаграммы для каждой стрелки

Естественные преобразования. Часть 1 - 177 — $eta_Y circ f=mathcal{P}(f) circ eta_X$

Для любой точки с одной стороны

$(eta_Y circ f )(x)=eta_Y(f(x))={f(x)}$

А с другой стороны

$(mathcal{P}(f) circ eta_X) (x)=mathcal{P}(f)({x})=f({x})={f(x)}$

Таким образом, диаграмма выше действительно коммутирует, а это значит, что $eta: I_{mathbf{Set}} to mathcal{P}$ действительно естественное преобразование. За этими всеми формальными преобразованиями скрывается довольно простая интуиция - эндофунктор в некотором смысле содержит в себе эндофунктор $I_{mathbf{Set}}$ .

Пример/Утверждение 1. Настало время завершить доказательство Утверждения 1, т.е. частично ответить на поставленный в начале статьи вопрос. Для начала придется определить эндофунктор второго сопряженного пространства $D^2: mathbf{Vect_f} to mathbf{Vect_f}$ . Очевидно, что каждому $V in mathbf{Vect_f}$ он сопоставляет $V^{astast} in mathbf{Vect_f}$ , а вот преобразование стрелок определить чуть сложнее. Для этого каждой стрелке мы сопоставим двойственную стрелку $phi^{ast}: W^{ast} to V^{ast} f mapsto f circ phi$ из Утверждения 3, а ей в свою очередь сопоставим такую же двойственную стрелку $phi^{astast}: V^{astast} to W^{astast} ev_{v} mapsto ev_{v} circ phi^{ast}$ . Пока не очень ясно, что вообще такое $ev_{v} circ phi^{ast}$ . Однако мы знаем, что $phi^{ast}$ принимает на вход линейные функционалы $g in W^{ast}$ . Тогда справедлива следующая цепочка

$(ev_v circ phi^{ast})(g)=ev_v (phi^{ast}(g))=ev_v(g circ phi)=(g circ phi)(v)=g(phi(v))=ev_{phi(v)}(g)$

Таким образом $ev_v circ phi^{ast}=ev_{phi(v)} in W^{astast}$ - функционал вычисления, который функционалу $g in W^{ast}$ сопоставляет значение в точке . Остается только проверить композицию и действие на тождественной стрелке. Пусть и , тогда $psi^{astast}: V^{astast} to U^{astast} ev_v mapsto ev_{psi(v)}$ и $phi^{astast}: U^{astast} to W^{astast} ev_u mapsto ev_{phi(u)}$ , что позволяет сказать, что

$(phi circ psi)^{astast}(ev_v)=ev_{(phi circ psi)(v)}=ev_{phi(psi(v))}=phi^{astast} (ev_{psi(v)})=phi^{astast} (psi^{astast}(ev_v))=(phi^{astast} circ psi^{astast})(ev_v)$

Для тождественной стрелки все проще

$(text{id}_V)^{astast}(ev_v)=ev_v=text{id}_{V^{astast}}(ev_v)$

Примечание

Эндофунктор $D^2: mathbf{Vect_f} to mathbf{Vect_f}$ обычно определяется как композиция контравариантного функтора $D: mathbf{Vect_f} to mathbf{Vect_f}$ с самим собой.

Построив функтор второго двойственного пространства, мы теперь можем определить тождественное преобразование $ev: I_{mathbf{Vect}_f} to D^2$ аналогичным Утверждению 1 образом, т.е. $ev_V: V rightarrow V^{astast} v mapsto ev_v$ . Тогда для любой стрелки необходимо проверить на коммутативность следующую диаграмму

Естественные преобразования. Часть 1 - 209 — $ev_W circ f=f^{astast} circ ev_V$

Для произвольной точки с одной стороны имеем

$(ev_W circ f)(v)=ev_W (f(v))=ev_{f(v)}$

А с другой стороны

$(f^{astast} circ ev_V)(v)=f^{astast}(ev_v)=ev_{f(v)}$

Действительно, является естественным преобразованием, обратное к нему преобразование $ev^{-1}: D^2 to I_{mathbf{Vect}_f}$ определяется достаточно прямолинейным образом $ev^{-1}_V: V^{astast} rightarrow V ev_v mapsto v$ .

Примечание

Здесь, кстати, существенно, что изоморфно $V^{astast}$ как векторное пространство, это позволяет нам гарантировать, что все функционалы в $V^{astast}$ есть функционалы вычисления , а это уже позволяет сказать, что для всякого функционала точно найдется вектор , который можно однозначно сопоставить . В общем случае для произвольных векторных пространств это не так (в частности, это всегда не так для бесконечномерных пространств).

Проверка происходит совершенно аналогично проверке выше, поэтому я ее пропущу. Таким образом, изоморфизмы $ev_V: V rightarrow V^{astast} v mapsto ev_v$ на самом деле представляют собой естественный изоморфизм эндофункторов $I_{mathbf{Vect}_f}$ и . В рамках линейной алгебры этот факт можно трактовать так - если конечномерно, то $V^{ast}$ есть двойственное пространство к , а есть двойственное пространство к $V^{ast}$ .

Примечание

У этого факта в рамках линейной алгебры есть довольно хорошее применение - на всяком конечномерном вектором пространстве можно ввести билинейное отображение $V times V^{ast} to mathbb{R} (v, f) mapsto f(v)$ . Если при этом зафиксировать базис в , а в $V^{ast}$ взять двойственный $e^{ast}$ , то записав и в координатах наших базисов, мы получим

$f(v)=f(sum_{i=1}^n v_i e_i)=sum_{i=1}^n v_i f(e_i)=sum_{i=1}^n v_i f_i$

Т.е. получим в точности скалярное произведение. Стоит заметить, что это неканоническая конструкция, т.к. взяв в $V^{ast}$ другой базис, мы получим другое скалярное произведение. В бесконечномерном случае все сложнее - схожая конструкция существует, однако ее не получиться построить через $V times V^{ast} to mathbb{R} (v, f) mapsto f(v)$ .

Пока на этом все, в этой части я изложил весь теормин, чтобы в следующей части говорить более предметно. Во второй части планируется поговорить про неестественность изоморфизма и $V^{ast}$ , как говорить о базисе, как о стрелке, да и в общем некоторые необходимые условия для того, чтобы называть какой-то изоморфизм каноническим или неканоническим.