- PVSM.RU - https://www.pvsm.ru -
Сначала я хотел не углубляться в тензоры и описать их мимоходом, касаясь только используемого мной функционала. Однако я изменил свое мнение и решил рассказать больше. Добро пожаловать в многомерный мир.
Пожалуй наилучшим определением тензора будет цитата Tamara G. Kolda:
A tensor is a multidimensional array
Проще некуда. Идеи с тензорами возникли изначально в линейной алгебре. Поэтому лучший путь — описать все используя линейную алгебру. В линейной алгебре мы пользуемся скалярами, векторами, матрицами и можем совершать операции сложения, вычитания и умножения. Скаляр состоит из 1 элемента, вектор состоит из N элементов и матрица состоит из MN элементов. Тензоры включают в себя все что может линейная алгебра и даже немного больше. Приводя примеры из линейной алгебры: вектор — это тензор первого порядка, а матрица — это тензор второго порядка. Следовательно порядок тензора определяется количеством пространств в которых тензор имеет больше чем один элемент. Чем больше у Вас пространств, тем выше получается порядок тензора. Достаточно просто, верно?
Давайте сразу приведем пример тензора третьего порядка. Знакомьтесь, с этим тензором Вы сегодня будете работать и на нем увидите немного тензорной магии. Я выписал его фронтальные срезы ниже.
Линейная алгебра определяет нам произведение между двумя матрицами следующим образом:
В этом произведении задано две размерности и операция между объектами с размерностью больше двух не определена. Тензорная алгебра дает инструменты как обойти это ограничение, используя особенности большего количества пространств в линейной алгебре. Для начала я введу три матричные операции, без которых в тензорной алгебре и шагу не ступишь:
В тензорной алгебре одно из ключевых понятий — «unfolding» (Я буду называть его развертка для уменьшения англицизмов) или представление тензора через матрицу. Развертка это отображение тензора на одно из его пространств. Тензор при этой операции записывается как матрица, количество строк которой равно количеству элементов развертываемого пространства. Элементы в строке имеют тот же порядковый номер по заданному пространству.
Количество возможных разверток равно порядку тензора или его размерности. У тензора из нашего примера есть 3 развертки. Выше представлены развертки для нашего тензора, и я надеюсь по ним Вам будет значительно проще понять, чем по объяснениям. Тензоры показались мне гораздо понятнее в интуитивном смысле, нежели чем по определениям.
Следующая операция которую я хочу описать, это произведение тензора с матрицей по заданному пространству. Записывается оно следующим образом и в сущности это произведение двух матриц, где правая матрица — это развертка тензора по умножаемому пространству, а слева матрица с которой собственно и умножают.
Важный момент, умножение записывается справа, а происходит слева от тензора. В результате получается матрица являющаяся разверткой нового тензора, который можно собрать обратно в привычный тензор. Важно отметить, что в результате этой операции размерность пространства с которым происходит умножение может измениться, остальные не могут. Пример ниже
Тензор единичного ранга — это такой тензор размерности N, который можно получить если умножить единицу на N векторов, по одному на каждое пространство. Как это выглядит визуально для тензора третьего порядка я показал ниже. Тензор единичного ранга является аналогом одной компоненты для SVD матрицы, где сложная матрица раскладывается на матрицы единичного ранга. Тензор единичного ранга может быть как комплексным так и вещественным, в зависимости от требований которые мы к нему предъявляем.
Самое важное и интересное в тензорах это их разложения. Я надеюсь многие из Вас знают или слышали о разложении матрицы на сингулярные значения. При помощи него мы можем представить матрицу как сумму матриц единичного ранга, и оценить их вклад в общую матрицу. Чуть ниже представлен пример такого разложения.
Очень похожий аналог есть в тензорной алгебре и называется он «CP», его называют еще «CANDECOMP» или «PARAFAC». «CP» раскладывает любой тензор на сумму тензоров единичного ранга. У этой формулировки есть две формы записи, простая из которых действительно записывает тензор как сумму множества тензоров единичного ранга, другая же записывает разложение через матрицы по каждому из пространств. Кроме разложения «CP» в тензорной алгебре существует большое количество его аналогов, в зависимости от нормирования компонент и прочих особенностей.
Посмотрите, если записать вектора каждого из пространств одно за другим, будет получено N матриц. Каждая из матриц представляет некий «базис» по своему пространству. Такая форма записи напоминает SVD матрицы. Из этих матриц можно получить обратно тензор, если взять единичный тензор и попеременно умножить его на все матрицы-базисы по пространствам.
Из разложения тензора третьего порядка легко вывести выражение развертки, оно позволит отделить одну из матриц обычным матричным произведением. Посмотрите ниже, видите, матрица А записывается через произведение с другой матрицей, которая в свою очередь является продуктом произведения Хатри-Рао. Зная продукт произведения и исходную развертку, мы можем вычислить матрицу А используя линейную алгебру. Это значительно упрощает работу алгоритмов подсчета разложения для тензоров третьего порядка и дает удобные формулы для итераций.
Зачем вообще нужна эта ерунда, мы же могли сделать SVD развертки? Конечно могли, но в общем случае разложение тензора позволяет гораздо проще описать данные, их становится проще сжать или найти закономерности. Особенно это важно для больших объемов данных, так как с увеличением размерностей ранг изменяется значительно слабее.
У этого разложения при всей его прелести есть две проблемы. Первая: ранг этого разложения нужно узнать Вам самим. Зачастую это нетривиальная задача, особенно если данные имеют шум.
Алгоритм был по поиску GPS сигнала при вычислении корреляции полифазным преобразованием Фурье. При этом размерность выходных данных на корреляторе была равна четырем (время, частота, код, сдвиг полифазного преобразования).
Вторая проблема — вычисление самого разложения. Самый распространенный на данный момент алгоритм это ALS или ПМНК. Существует так же алгоритм с романтичным названием SECSI, но про него я возможно расскажу в будущем. ПМНК или перемежающийся метод наименьших квадратов прост до безобразия, алгоритм у него следующий:
Недостатков у этого метода огромное множество, это и локальные минимумы, и вычислительная сложность, но он все равно остается одним из наиболее используемых алгоритмов в настоящее время.
А теперь перейдем ближе к технологии GFDM. Существует другое разложение, которое называется PARATUCK2, и это аббревиатура от двух других аббревиатур «PARAFAC» и «TUCKER2». Да, аббревиатура состоящая из двух других аббревиатур, как же это замечательно.
Это разложение записывает тензор через три матрицы и два тензора. Матрица посередине называется ядром разложения, тензоры называются объединяющими. Крайние две матрицы не имеют особого названия. То как считать тензор из этого разложения это отдельная история.
Тензор из разложения считается послойно, в каждом слою выбирается только соответствующий слой тензоров взаимосвязи. В результате получаются 5 матриц, перемножив которые мы и получаем значения тензора. Эта операция повторяется по каждому из слоев, и результаты собираются один за другим. Количество строк первой матрицы равно количеству строк у тензора, аналогично со столбцами третьей матрицы и тензора, а так же с глубиной тензоров взаимосвязи. Мне было это очень сложно понять в первый момент. И что самое интересное, эта модель действительно может Вам помочь при анализе данных.
Так зачем нам нужно это разложение? Оно достаточно сложное и состоит из пяти элементов, как оно вообще может помочь с GFDM? Давайте сначала вспомним и закрепим немного о GFDM. Ниже представлен метод формирования символов, который отправляет передатчик. Блок данных можно сформировать как матрицу, где строки это поднесущие, а столбцы это временные позиции в блоке. Общий блок данных получается суммированием всех элементов, иначе говоря надо умножить поэлементно вектор поднесущей с вектором оконной функции и все это на символ который мы передаем. Таким образом каждый символ находится на пересечении двух векторов с которыми и перемножается. Операция достаточно простая, однако ее сложно описать через произведение матрицы модуляции на вектор символов. Форма записи же через матрицу модуляции является основным кирпичиком для построения приемников.
Если присмотреться повнимательнее, PARATUCK2 действительно может описать GFDM. Для этого необходимо взять в качестве крайних матриц единичные вектор строку и вектор столбец, а в тензоры взаимосвязи по главном диагоналям добавить оконные функции и поднесущие. Если в матрице-ядре окажутся символы, результат будет вектором в третьем измерении и соответствовать переданным данным.
Лихо завернуто, неправда ли? Когда я писал диплом, было сложно понять, как это можно упростить и привести к приемлемому виду, но это возможно! Через это разложение можно упростить выражение модуляционной матрицы в произведение двух матриц. Однако я думаю рассказать в следующий раз, вместе с теорией Zero-forcing, Matched filter и Minimal mean squared error приемников.
Хорошей Вам недели.
Только зарегистрированные пользователи могут участвовать в опросе. Войдите [1], пожалуйста.
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/matematika/214624
Ссылки в тексте:
[1] Войдите: https://geektimes.ru/auth/login/
[2] gfdm: https://geektimes.ru/search/?q=%5Bgfdm%5D&target_type=posts
[3] тензоры: https://geektimes.ru/search/?q=%5B%D1%82%D0%B5%D0%BD%D0%B7%D0%BE%D1%80%D1%8B%5D&target_type=posts
[4] линейная алгебра: https://geektimes.ru/search/?q=%5B%D0%BB%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D0%B0%D1%8F%20%D0%B0%D0%BB%D0%B3%D0%B5%D0%B1%D1%80%D0%B0%5D&target_type=posts
[5] математика: https://geektimes.ru/search/?q=%5B%D0%BC%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D0%BA%D0%B0%5D&target_type=posts
[6] обработка данных: https://geektimes.ru/search/?q=%5B%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%5D&target_type=posts
[7] Подробнее: https://www.pvsm.ru/adblock/
[8] Реклама: https://special.geektimes.ru/advertising/
[9] Компании и сервисы: https://www.pvsm.ru/posts/services/
[10] Программное обеспечение: https://www.pvsm.ru/posts/software/
[11] Железо и гаджеты: https://www.pvsm.ru/posts/hardware/
[12] Научно-популярное: https://www.pvsm.ru/posts/science/
[13] Разное: https://www.pvsm.ru/posts/others/
[14] @zedroid: https://www.pvsm.ru/users/zedroid
[15] Обеспечение приватности математическими методами: новый подход к сохранности данных: https://www.pvsm.ru/post/281166/
[16] Первый интерактивный учебник по линейной алгебре: https://www.pvsm.ru/post/262068/
[17] Электронная библиотека для PocketBook: автоматическая обработка: https://www.pvsm.ru/post/143492/
[18] Сейчас: #broadcast_posts_now
[19] Сутки: #broadcast_posts_today
[20] Неделя: #broadcast_posts_week
[21] Месяц: #broadcast_posts_month
[22] Титан может быть наилучшим местом для колонии в Солнечной системе: https://geektimes.ru/post/283092/
[23] Как худеют наши ракеты: https://geektimes.ru/post/283088/
[24] Почему у нас нет младенческих воспоминаний: https://geektimes.ru/post/283070/
[25] Боли в руках при работе за компьютером. Часть 3. Синдром лестничной мышцы: https://geektimes.ru/post/283096/
[26] Микросхеме Intel 4004 исполнилось 45 лет. Немного истории ИТ: https://geektimes.ru/post/283094/
[27] История мировых эпидемий, часть 3: https://geektimes.ru/post/283054/
[28] Либо это необычные звёзды, либо 234 инопланетные цивилизации шлют нам свой привет: https://geektimes.ru/post/283066/
[29] Ещё раз про китайские лампочки: всё очень плохо: https://geektimes.ru/company/lamptest/blog/282848/
[30] Невероятно громкий звук, обошедший Землю четыре раза: https://geektimes.ru/post/282898/
[31] Полный кошмар: USB-C и Thunderbolt 3: https://geektimes.ru/post/282824/
[32] Нейросеть Google Translate составила единую базу смыслов человеческих слов: https://geektimes.ru/post/282976/
[33] Перепродал Google Pixel — получил блок аккаунта Google или почему не стоит держать все яйца в одной корзине: https://geektimes.ru/post/282894/
[34] 11.11. Всемирный день «липовых» скидок: https://geektimes.ru/post/282368/
[35] Маркетологи уже победили или почему я никогда не куплю себе топовый смартфон: https://geektimes.ru/post/282056/
[36] Инженер Google сравнил антивирусы с мёртвой канарейкой: https://geektimes.ru/post/282760/
[37] Рак. Что с этим делать и чего делать не надо. Личный опыт: https://geektimes.ru/post/282014/
[38] Источник: https://geektimes.ru/post/283100/
Нажмите здесь для печати.