- PVSM.RU - https://www.pvsm.ru -


Недавно я описывал, благодаря чему роботы завтра начнут НАМНОГО лучше соображать (пост про аппаратное ускорение нейросетей [1]). Сегодня разберем, почему роботы скоро будут НАМНОГО лучше видеть. В ряде ситуаций намного лучше человека.
Речь пойдет про камеры глубины, которые снимают видео, в каждом пикселе которого хранится не цвет, а расстояние до объекта в этой точке. Такие камеры существуют уже больше 20 лет, однако в последние годы скорость их развития выросла многократно и уже можно говорить про революцию. Причем многовекторную. Бурное развитие идет по следующим направлениям:
Кому интересно, как это будет выглядеть, а также сравнение разных подходов и их текущее и завтрашнее применение — добро пожаловать под кат!
Итак! Разберем основные направления развития камер глубины или фактически разные принципы измерения глубины. С их плюсами и минусами.
Начнем, пожалуй, с одного из самых простых, старых и относительно дешевых способов измерения глубины — структурированного света. Этот метод появился по сути сразу, как только появились цифровые фотоаппараты, т.е. более 40 лет назад и сильно упростился чуть позднее, с появлением цифровых проекторов.
Основная идея крайне проста. Ставим рядом проектор, который создает, например, горизонтальные (а потом вертикальные) полоски и рядом камеру, которая снимает картину с полосками, как это изображено на этом рисунке:

Источник: Autodesk: Structured Light 3D Scanning [9]
Поскольку камера и проектор смещены друг относительно друга, то и полоски также будут смещаться пропорционально расстоянию до объекта. Измеряя это смещение мы можем рассчитывать расстояние до объекта:
Источник: http://www.vision-systems.com/ [10]
По сути, с самым дешевым проектором (а их цена начинается с 3000 рублей) и смартфоном можно измерять глубину статических сцен в темной комнате:



Источник: Autodesk: Structured Light 3D Scanning [9]
Понятно, что при этом придется решить целую пачку задач — это калибровка проектора, калибровка камеры телефона, распознавание сдвига полос и так далее, но все эти задачи вполне по силам даже изучающим программирование продвинутым школьникам старших классов.
Наиболее широко известен этот принцип измерения глубины стал, когда в 2010 году компания Microsoft выпустила сенсор глубины MS Kinect [11] по цене 150$, что на тот момент было революционно дешево.

Источник: Partially Occluded Object Reconstruction using Multiple Kinect Sensors [12]
При том, что помимо собственно измерения глубины с ИК-проектором и ИК-камерой Kinect также снимал обычное RGB видео, имел четыре микрофона с функцией подавления шумов и мог сам настраиваться на человека по высоте, автоматически наклоняясь вверх или вниз, тут же внутри была встроена обработка данных, которая выдавала на консоль сразу готовую карту глубины:

Источник: Implementation of natural user interface buttons using Kinect [13]
Всего было продано порядка 35 миллионов устройств, что сделало Kinect первой массовой камерой глубины в истории. И если учесть, что до нее камеры глубины конечно были, но продавались обычно максимум сотнями и стоили минимум на порядок дороже — это была революция, обеспечившая большие вложения в эту область.
Важной причиной успеха было то, что к моменту выхода у Microsoft на Xbox 360 уже было несколько игр, которые активно использовали Kinect как сенсор. Взлет был стремителен:

Более того, Kinect даже умудрился войти в книгу рекордов Гиннеса как самый быстро продаваемые гаджет в истории. Правда Apple вскоре потеснила Microsoft с этого места, но тем не менее. Для нового экспериментального сенсора, который работает в дополнение к основному устройству стать самым быстро продаваемым электронным устройством в истории, это просто великолепное достижение:

При чтении лекций мне нравится спрашивать аудиторию, откуда взялись все эти миллионы покупателей? Кто были все эти люди?
Как правило, никто не угадывает, но иногда, особенно если в аудитории люди постарше и поопытнее — дают правильный ответ: продажи двигали американские родители, которые с восторгом увидели, что их дети могут играть на приставке и при этом не сидеть толстой попой на диване, а скакать перед телевизором. Это был прорыв!!! Миллионы мам и пап кинулись заказывать девайс для своих чад.
Вообще, когда заходит речь о распознавании жестов, то обычно люди наивно полагают, что просто данных с 2D-камеры достаточно. Ведь они видели много красивых демок! Реальность намного более сурова. Точность распознавания жестов от 2D видеопотока с камеры и точность распознавания жестов с камеры глубины отличаются на порядок. С камеры глубины, а точнее — с RGB камеры, совмещенной с камерой глубины (последнее важно), можно намного точнее и с меньшими затратами распознавать жесты (даже если в комнате темно) и ровно это принесло успех первой массовой камере глубины.
Про Kinect на Хабре в свое время писали очень много [14], поэтому совсем кратко как это работает.
Инфракрасный проектор дает в пространстве псевдослучайный набор точек, по смещению которых определяется глубина в данном пикселе:

Источник: Depth Sensing Planar Structures: Detection of Office Furniture Configurations [15]
Разрешение камеры заявлено как 640х480, однако реально там где-то примерно 320x240 с довольно сильной фильтрацией и картинка на реальных примерах выглядит так (то есть довольно страшна):

Источник: Partially Occluded Object Reconstruction using Multiple Kinect Sensors [12]
Хорошо видны «тени» от объектов, поскольку камера и проектор разнесены довольно далеко. Видно, что для предсказания глубины берутся сдвиги нескольких точек проектора. Кроме того, идет (жесткая) фильтрация по непосредственным соседям, но все равно карта глубины достаточно шумная, особенно на границах. Это приводит к достаточно заметному шуму на поверхности получающихся объектов, который необходимо дополнительно и нетривиально сглаживать:

Источник: J4K Java Library for the Microsoft's Kinect SDK [16]
И тем не менее всего 150$ (сегодня уже 69$ [17], хотя лучше ближе к 200$ [18], конечно) — и вы «видите» глубину! Серийных продуктов реально много [19].
Кстати, в феврале этого года был анонсирован новый Azure Kinect [20]:

Источник: Microsoft announces Azure Kinect, available for pre-order now [21]
Его поставки разработчикам в США и Китае должны начаться 27 июня, т.е. буквально прямо сейчас. Из возможностей, помимо заметно лучшего разрешения RGB и лучшего качества depth камер (обещают 1024x1024 [22] на 15 FPS и 512х512 на 30 FPS и более высокое качество хорошо на глаз видно по демо [23], камера ToF) заявлена поддержка совместной работы нескольких устройств из коробки, меньшая засветка на солнце, ошибка менее 1 см на расстоянии 4 метров и 1-2 мм на расстоянии менее 1 метра, что звучит КРАЙНЕ интересно, так что ждем, ждем:

Источник: Introducing Azure Kinect DK [24]
Следующим же массовым продуктом, где была реализована камера глубины на структурированном свете была не игровая консоль, а… (барабанная дробь) правильно — iPhone X [25]!
Его технология Face ID — это типичная камера глубины с типичным инфракрасным Dot projector и инфракрасной камерой (кстати, теперь вы понимаете, почему они находятся на краях «челки», разнесенные максимально далеко друг от друга — это стереобаза [26]):

Разрешение карты глубины даже меньше, чем у Kinect — около 150х200. Понятно, что если сказать: «Наше разрешение примерно 150х200 пикселей или 0,03 мегапиксела», народ скажет кратко и ёмко: «Отстой!». А если сказать «Dot projector: More than 30,000 invisible dots are projected onto your face» [27], пипл скажет: «Вау, 30 тысяч невидимых точек, круто!». Некоторые блондинки поинтересуются, не появятся ли от невидимых точек веснушки? И тема пойдет в массы! Поэтому в рекламе был дальновидно выбран второй вариант. Разрешение невелико по трем причинам: во-первых, требования миниатюрности, во-вторых, энергопотребления, а в-третьих, цены.
Тем не менее это очередная камера глубины на структурированном свете, ушедшая в серию миллионными тиражами и уже повторенная другими производителями смартфонов, например, (сюрприз-сюрприз!) Huawei [28] (который обошел Apple по продажам смартфонов в прошлом году). Только у Huawei камера справа, а проектор — слева, но тоже, разумеется, по краям «челки»:

Источник: Huawei Mate 20 Pro update lets users add a second face for face unlock [29]
При этом заявляется 300.000 точек, то есть в 10 раз больше, чем у Apple [30], и фронтальная камера получше, и шрифт крупнее. Есть ли преувеличение касательно 300 тысяч — сказать сложно, но Huawei демонстрирует весьма неплохое 3D сканирование объектов с фронтальной камерой [31]. Независимые тесты более страшны [32], но это явно самое начало темы и младенчество технологии миниатюрных энергоэффективных камер глубины и анонсы камер буквально на конец этого года уже заметно лучше по характеристикам.
При этом понятно, почему технологию идентификации лиц использовали в телефонах. Во-первых, теперь нельзя обмануть детектор, показав фото лица (или видео с планшета). Во-вторых, лицо сильно меняется при изменении освещения, а его форма — нет, что позволяет вместе с данными с RGB камеры точнее идентифицировать человека:

Источник: фото одного и того же лица из материалов TI [33]
Очевидно, что у инфракрасного сенсора есть врожденные проблемы. Во-первых, солнце нам на раз-два засвечивает наш относительно слабый проектор, поэтому на улице такие камеры не работают. Даже в тени, если рядом белая стена здания освещена солнцем, у вас могут быть большие проблемы с Face ID. Уровень шумов в Kinect также зашкаливает, даже когда солнце закрыто тучами:
Источник: эта и две следующие картинки — материалы Basler AG [34]
Другая большая проблема — это отражения и переотражения. Поскольку инфракрасный свет также отражается, то заснять дорогой чайник из нержавейки, стол с лаковым покрытием или стеклянный плафон с Kinect будет проблематично:

И, наконец, две камеры, снимающие один объект могут мешать друг-другу. Интересно, что в случае структурированного света можно заставить проектор мерцать и понимать где наши точки, а где нет, но это отдельная и достаточно непростая история:

Теперь вы знаете, как сломать FaceID…
Впрочем, для мобильных устройств структурированный свет выглядит наиболее разумным компромиссом на сегодня:

Источник: Smartphone Companies Scrambling to Match Apple 3D Camera Performance and Cost [35]
Для структурированного света дешевизна обычного сенсора такова, что его использование в большинстве случаев более, чем оправдано. Что вызвало к жизни большое количество стартапов, действующих по формуле: дешевый сенсор + сложный софт = вполне приемлемый результат.
Например, наш бывший аспирант Максим Федюков [36], занимавшийся 3D реконструкцией с 2004 года, создал компанию Texel [37], основной продукт которой — платформа с 4 камерами Kinect и программное обеспечение, которое за 30 секунд превращает человека в потенциальный памятник. Ну или настольную статуэтку. Это у кого на сколько денег хватит. Или можно дешево и сердито друзьям фото своей 3D модели отправить (пока почему-то наиболее востребованный кейс). Сейчас они отправляют свои платформы и софт за рубеж от Великобритании до Австралии:
Источник: Создание 3D модели человека за 30 секунд [38]
Как балерина красиво стоять я не могу, поэтому лишь задумчиво смотрю на плавник проплывающей мимо акулы:

Источник: материалы автора
Вообще, новый вид сенсоров породил новые арт-проекты. Зимой видел довольно любопытный VR фильм, снятый с Kinect. Ниже интересная визуализация танца, тоже сделанная с Kinect (похоже, использовалось 4 камеры), причем в отличие от предыдущего примера с шумами никак не боролись, они скорее добавляли забавной специфики:

Источник: A Dance Performance Captured With a Kinect Sensor and Visualized With 3D Software [39]
Какие тренды можно наблюдать в области:
Как следствие:
В любом случае, то, что мы наблюдаем сейчас — младенчество технологии. Первые массовые изделия, на которых только-только идет отладка производства и использования нового непривычного типа данных — видео с глубиной.
Следующий способ получения глубины интереснее. Он основан на измерении round-trip задержки света (ToF — Time-of-Flight [3]). Как известно скорость современных процессоров высока, а скорость света мала. За один такт процессора на 3 ГГц свет успевает пролететь всего 10 сантиметров. Или 10 тактов на метр. Масса времени, если кто низкоуровневой оптимизацией занимался. Соответственно устанавливаем импульсный источник света и специальную камеру:

Источник: The Basler Time-of-Flight (ToF) Camera [43]
Фактически нам нужно измерить задержку, с которой свет возвращается в каждую точку:


Источник: The Basler Time-of-Flight (ToF) Camera [43]
Либо, если у нас несколько сенсоров с разным временем накопления заряда, то, зная сдвиг по времени относительно источника для каждого сенсора и снятой яркости вспышки, мы можем рассчитать сдвиг и, соответственно, расстояние до объекта, причем увеличивая количество сенсоров — увеличиваем точность:


Источник: Larry Li «Time-of-Flight Camera – An Introduction» [33]
В итоге получается такая схема работы камеры со светодиодной или, реже, лазерной (VCSEL [44]) инфракрасной подсветкой:

Источник: очень годное описание работы ToF на allaboutcircuits.com [45]
Картинка при этом получается достаточно низкого разрешения (ведь нам нужно расположить рядом несколько сенсоров с разным временем опроса), но потенциально с высоким FPS. И проблемы в основном на границах объектов (что характерно для всех камер глубины). Зато без «теней», типичных для структурированного света:

Источник: видео Basler AG [46]
В частности, именно камеры такого типа (ToF) в свое время активно тестировал Google в проекте Google Tango [47], хорошо представленном в этом видео [48]. Смысл был прост — объединить данные гироскопа, акселерометра, RGB камеры и камеры глубины, построив трехмерную сцену перед смартфоном:

Источник: Google's Project Tango Is Now Sized for Smartphones [49]
Сам проект не пошел (мое мнение — из-за того, что несколько опередил свое время), но создал важные предпосылки в создании волны интереса к AR — дополненной реальности — и, соответственно, разработке сенсоров, которые могут с ней работать. Сейчас все его наработки влиты в ARCore [50] от Google.
Вообще, объем рынка ToF камер растет примерно на 30% каждые 3 года, что вполне себе экспоненциальный рост, причем так быстро растут мало какие рынки:

Источник: Potential of Time-of-Flight Cameras & Market Penetration [51]
Серьезным драйвером рынка на сегодня является бурное (и также экспоненциальное) развитие промышленных роботов, для которых ToF камеры — идеальное решение. Например, если у вас робот упаковывает коробки, то с обычной 2D камерой определить, что вы начинаете заминать картон, — это крайне нетривиальная задача. А для ToF камеры это тривиально как «увидеть», так и обработать. Причем очень быстро. Как следствие, мы наблюдаем бум промышленных ToF камер [52]:




Естественно, к появлению домашних продуктов с использованием камер глубины это тоже приводит. Вот, например, охранная камера с блоком ночного видео и ToF камерой глубины от немецкой PMD Technologies [53], которая разрабатывает 3D камеры уже больше 20 лет [54]:

Источник: 3D Time-of-Flight Depth Sensing Brings Magic to the New Lighthouse Smart Home Camera [55]
Помните плащ-невидимку, под которым прятался Гарри Поттер?

Источник: Harry Potter’s Invisibility Cloak Gets an Origin Story and May Soon Exist in Real Life [56]
Боюсь, что немецкая камера его на раз-два обнаружит. И экран с картинкой поставить перед такой камерой будет затруднительно (это вам не отвлекающийся охранник):

Источник: Фрагмент фильма «Миссия невыполнима: протокол Фантом» [57]
Похоже, что для новых камер видеонаблюдения потребуется недетская магия Хогвартса, чтобы обмануть их ToF камеру глубины, способную и в полной темноте снять такое видео:

Прикинуться стенкой, экраном и прочими способами защититься от того, что комбинированная ToF+RGB камера засечет посторонний объект, становится технически кардинально сложнее.
Другое массовое мирное применение камер глубины — распознавание жестов. В ближайшее время можно ожидать телевизоров, приставок и роботов-пылесосов, которые будут в состоянии воспринимать не только голосовые команды, как умные колонки, но и небрежное «убери там!» со взмахом руки. Тогда пульт дистанционного управления (он же ленивчик) к смарт телевизору станет окончательно не нужен, и фантастика войдет в жизнь. В итоге то, что было фантастичным в 2002 году [58], стало экспериментальным в 2013 [59], и, наконец, серийным в 2019 [60] (при этом пипл не будет знать, что внутри камера глубины, какая разница, как работает эта магия?):


Источник: статья [58], эксперименты [59] и продукт [60]
А полная линейка применений еще шире, разумеется:



Источник: видео сенсоров глубины от Terabee [61] (кстати, а что за мыши у них бегают по полу на 2 и 3 видео? Видите их? Шучу, это пыль в воздухе — плата за малый размер сенсора и близкое расположение источника света к сенсору)
Кстати — в знаменитых «магазинах без кассиров» Amazon Go под потолком тоже много камер:

Источник: Inside Amazon’s surveillance-powered, no-checkout convenience store [62]
Причем, как пишет TechCrunch [62]: «They’re augmented by separate depth-sensing cameras (using a time-of-flight technique, or so I understood from Kumar) that blend into the background like the rest, all matte black.» То есть чудо определения, с какой именно полки взят йогурт, обеспечивают в том числе таинственные черные матовые ToF камеры (хороший вопрос, они ли на фото):

К сожалению, часто прямую информацию найти сложно. Зато есть косвенная. Например, была такая компания Softkinetic [63], которая с 2007 года разрабатывала ToF камеры. 8 лет спустя их купила Sony [64] (которая, к слову, готова покорять новые рынки под брендом Sony Depthsensing [65]). Так один из топовых сотрудников [66] Softkinetic сейчас работает как раз на Amazon Go. Такое вот совпадение! В течении пары лет, когда доведут технологию и подадут основные патенты, детали скорее всего раскроют.
Ну и как обычно зажигают китайцы. Компания Pico Zense [67], например, представила на CES 2019 весьма впечатляющую линейку ToF камер, в том числе для уличного применения:

Они обещают революцию везде. Фуры будут загружаться плотнее за счет автоматизированной загрузки, банкоматы станут безопаснее, за счет камер глубины в каждом, навигация роботов станет проще и точнее, людей (и, главное, детей!) будут считать в потоке на порядок лучше, появятся новые фитнес-тренажеры c возможностью контролировать правильность выполнения упражнений без инструктора и так далее, и тому подобное. Естественно, дешевые китайские камеры глубины нового поколения для всего этого великолепия уже готовы. Берите и встраивайте!
Интересно, что свежайший серийный Huawei P30 Pro имеет ToF сенсор рядом с основными камерами, т.е. многострадальный Huawei умеет лучше Apple делать фронтальные structured light сенсоры и, похоже, удачнее Google (Project Tango, который был закрыт [68]) внедрил рядом с основными камерами ToF камеру:

Источник: обзор новых технологий Huawei от Ars Technica на конец марта 2019 [69]
Подробности использования, естественно, не раскрываются, но помимо ускорения наведения фокуса (что актуально для трех основных камер с разными объективами) этот сенсор можно использовать для увеличения качества размытия фона фотографий (имитация малой ГРИП [70]).
Также очевидно, что уже следующее поколение сенсоров глубины рядом с основными камерами будет использоваться в AR приложениях, что позволит поднять точность AR с текущего «прикольно, но часто глючит» до массово работающего уровня. И, очевидно, в свете успехов китайцев большой вопрос — насколько Google захочет поддержать в ARCore [50] революционное китайское железо. Патентные войны могут заметно замедлить выход технологий на рынок. Развитие этой драматической истории мы увидим буквально в ближайшие два года.
Примерно 25 лет назад, когда только появились первые автоматические двери, лично наблюдал, как вполне солидные дядьки периодически перед такими дверями ускорялись. Успеет открыться или не успеет? Она же большая, тяжелая, стеклянная! Примерно то же самое я наблюдал во время экскурсии вполне себе солидных профессоров на автоматическом заводе в Китае недавно. Они чуть отставали от группы, чтобы посмотреть что будет, если встать у робота, мирно перевозящего детали и играющего тихую приятную мелодию, на пути. Я тоже, каюсь, не удержался… Вы знаете, останавливается! Может плавно. Может, как вкопанный. Работают сенсоры глубины-то!

Источник: Inside Huawei Technology's New Campus [71]
В отеле тоже работали роботы-уборщики, которые выглядели примерно так:

При этом над ними издевались сильнее, чем над роботами на заводе. Не так жестко, как в бесчеловечном во всех смыслах Bosstown Dynamics [72], конечно. Но лично наблюдал, как у них вставали на дороге, робот пытался объехать человека, человек смещался, перекрывая дорогу… Этакие кошки-мышки. В общем, похоже, что когда беспилотные автомобили появятся на дорогах, первое время их будут подрезать чаще обычного… Эх, люди-люди… Мда-м… Впрочем, мы отвлеклись.
Резюмируя ключевые моменты:


Вы еще сомневаетесь в идущей революции?
Это была первая часть! Общее сравнение будет во второй.
В следующей серии ждите:
Карфаген должен быть разру… Всё видео до конца века станет трехмерным!
Stay tuned! (Если хватит времени — до конца года опишу новые камеры, в том числе тесты свежего Kinect.)
Автор: Dmitriy Vatolin
Источник [76]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/gadzhety/322002
Ссылки в тексте:
[1] аппаратное ускорение нейросетей: https://habr.com/ru/post/455353/
[2] Structured Light камеры: https://en.wikipedia.org/wiki/Structured-light_3D_scanner
[3] Time of Flight камеры: https://en.wikipedia.org/wiki/Time-of-flight_camera
[4] Depth from Stereo камеры: https://docs.opencv.org/3.1.0/dd/d53/tutorial_py_depthmap.html
[5] Light Field Camera: https://en.wikipedia.org/wiki/Light-field_camera
[6] подробный пост: https://habr.com/ru/post/440652/
[7] Lidar-технологиях: https://en.wikipedia.org/wiki/Lidar
[8] Solid State Lidars: https://www.google.com/search?q=Solid+State+Lidars
[9] Autodesk: Structured Light 3D Scanning: https://www.instructables.com/id/Structured-Light-3D-Scanning/
[10] http://www.vision-systems.com/: http://www.vision-systems.com/sponsors/a-h/flir-integrated-imaging-solutions.html
[11] MS Kinect: https://en.wikipedia.org/wiki/Kinect
[12] Partially Occluded Object Reconstruction using Multiple Kinect Sensors: http://sci-hub.se/10.1117/12.2053938
[13] Implementation of natural user interface buttons using Kinect: https://www.semanticscholar.org/paper/Implementation-of-natural-user-interface-buttons-Ollila/bb4c451e29a3b2efcc9abc983518c90c0e37cf3c
[14] очень много: https://www.google.com/search?q=kinect+site%3Ahabr.com+-%D0%B7%D0%B0%D0%BA%D0%BB%D0%B0%D0%B4%D0%BA%D0%B8
[15] Depth Sensing Planar Structures: Detection of Office Furniture Configurations: https://www.semanticscholar.org/paper/Depth-Sensing-Planar-Structures%3A-Detection-of-O%27Shaughnessy/2a003536afeaa53306c41ce2edb343cbd6e72fa4
[16] J4K Java Library for the Microsoft's Kinect SDK: https://research.dwi.ufl.edu/ufdw/j4k/
[17] сегодня уже 69$: https://www.amazon.com/LilBit-Recognition-Camera-Microphone-Conference/dp/B06Y2WLNFN/
[18] лучше ближе к 200$: https://www.amazon.com/Intel-RealSense-Depth-Camera-D415/dp/B07JVGRQZT/ref=sr_1_4?keywords=depth+camera&qid=1561197036&s=gateway&sr=8-4#HLCXComparisonWidget_feature_div
[19] реально много: https://www.amazon.com/s?k=depth+camera&ref=nb_sb_noss
[20] Azure Kinect: https://next.reality.news/news/microsofts-azure-kinect-standalone-depth-sensor-powers-major-augmented-reality-improvements-for-399-0194185/
[21] Microsoft announces Azure Kinect, available for pre-order now: https://www.neowin.net/news/microsoft-announces-azure-kinect-available-for-pre-order-now/
[22] 1024x1024: https://opdhsblobprod03.blob.core.windows.net/contents/503db294612a42b3b95420aaabac44cc/77342d6514e7dbbcf477614ed3a7acda?sv=2015-04-05&sr=b&sig=FxpjsC3Njkwo26ppGk%2BFjrKpftp48oswIVvA%2FzrAh%2F0%3D&st=2019-06-23T17%3A14%3A13Z&se=2019-06-24T17%3A24%3A13Z&sp=r
[23] хорошо на глаз видно по демо: https://youtu.be/aa8DzmvLxus?t=51
[24] Introducing Azure Kinect DK: https://www.youtube.com/watch?v=jJglCYFiodI
[25] iPhone X: https://www.extremetech.com/mobile/255771-apple-iphone-x-truedepth-camera-works
[26] стереобаза: https://ru.wiktionary.org/wiki/%D1%81%D1%82%D0%B5%D1%80%D0%B5%D0%BE%D0%B1%D0%B0%D0%B7%D0%B0
[27] «Dot projector: More than 30,000 invisible dots are projected onto your face»: https://www.apple.com/lae/iphone-xr/face-id/
[28] например, (сюрприз-сюрприз!) Huawei: https://www.systemplus.fr/reverse-costing-reports/the-huawei-mate-20-pros-3d-depth-sensing-system/
[29] Huawei Mate 20 Pro update lets users add a second face for face unlock: https://www.xda-developers.com/huawei-mate-20-pro-update-second-face-unlock/
[30] в 10 раз больше, чем у Apple: https://www.engadget.com/2017/11/28/huawei-claims-face-detection-system-can-beat-apple/
[31] 3D сканирование объектов с фронтальной камерой: https://www.youtube.com/watch?v=Lo61GM_2BpY
[32] более страшны: https://www.gizmodo.co.uk/2018/11/huawei-mate-20-pro-toy-scanning/
[33] фото одного и того же лица из материалов TI: http://www.ti.com/lit/wp/sloa190b/sloa190b.pdf
[34] материалы Basler AG: https://youtu.be/OMDfQC0m4i4?t=272
[35] Smartphone Companies Scrambling to Match Apple 3D Camera Performance and Cost: http://image-sensors-world.blogspot.com/2018/03/smartphone-companies-scrambling-to.html
[36] Максим Федюков: http://clip-russia.ru/speaker/feduykov/
[37] Texel: https://texel.graphics/ru/
[38] Создание 3D модели человека за 30 секунд: https://www.youtube.com/watch?v=VLaZ_jDuZ30
[39] A Dance Performance Captured With a Kinect Sensor and Visualized With 3D Software: https://www.pinterest.ru/pin/173951604333717281/
[40] блокирующие фильтры: https://en.wikipedia.org/wiki/Infrared_cut-off_filter
[41] художественной съемки в инфракрасном диапазоне: http://lightroom.ru/photomaster/1567-nevidimyj-mir-osnovy-infrakrasnoj-semki-primery-foto.html
[42] специальным фильтром: https://www.google.com/search?q=ir+pass+filter
[43] The Basler Time-of-Flight (ToF) Camera: https://www.baslerweb.com/en/products/cameras/3d-cameras/time-of-flight-camera/
[44] VCSEL: https://en.wikipedia.org/wiki/Vertical-cavity_surface-emitting_laser
[45] очень годное описание работы ToF на allaboutcircuits.com: https://www.allaboutcircuits.com/technical-articles/how-do-time-of-flight-sensors-work-pmdtechnologies-tof-3D-camera/
[46] видео Basler AG: https://youtu.be/OMDfQC0m4i4?t=209
[47] Google Tango: https://en.wikipedia.org/wiki/Tango_(platform)
[48] этом видео: https://www.youtube.com/watch?v=Qe10ExwzCqk
[49] Google's Project Tango Is Now Sized for Smartphones: https://gizmodo.com/hands-on-googles-project-tango-is-now-sized-for-smartp-1707811301
[50] ARCore: https://developers.google.com/ar/
[51] Potential of Time-of-Flight Cameras & Market Penetration: https://www.baslerweb.com/en/products/cameras/3d-cameras/time-of-flight-camera/an-overview-of-time-of-flight/
[52] бум промышленных ToF камер: https://www.google.com/search?q=industrial+tof+camera&source=lnms&tbm=isch
[53] PMD Technologies: https://pmdtec.com/mwc/
[54] больше 20 лет: https://en.wikipedia.org/wiki/PMD_Technologies
[55] 3D Time-of-Flight Depth Sensing Brings Magic to the New Lighthouse Smart Home Camera: https://www.businesswire.com/news/home/20180223005227/en/pmd%E2%80%99s-3D-Time-of-Flight-Depth-Sensing-Brings-Magic
[56] Harry Potter’s Invisibility Cloak Gets an Origin Story and May Soon Exist in Real Life: https://www.vanityfair.com/hollywood/2015/09/harry-potter-invisibility-cloak-jk-rowling
[57] Фрагмент фильма «Миссия невыполнима: протокол Фантом»: https://youtu.be/4SVKtXom7vs?t=67
[58] было фантастичным в 2002 году: https://www.researchgate.net/publication/2530570_Hand_Gesture_Recognition_using_Multi-Scale_Colour_Features_Hierarchical_Models_and_Particle_Filtering/figures?lo=1&utm_source=google&utm_medium=organic
[59] стало экспериментальным в 2013: https://www.youtube.com/watch?v=wDmosRnEfiw
[60] серийным в 2019: https://www.amazon.co.uk/singlecue-Gesture-Control-Entertainment-Devices-Black/dp/B016ICIBOU
[61] видео сенсоров глубины от Terabee: https://www.terabee.com/sensors-modules/3d-tof-cameras/
[62] Inside Amazon’s surveillance-powered, no-checkout convenience store: https://techcrunch.com/2018/01/21/inside-amazons-surveillance-powered-no-checkout-convenience-store/
[63] Softkinetic: https://en.wikipedia.org/wiki/Softkinetic
[64] купила Sony: https://techcrunch.com/2015/10/08/sony-buys-gesture-tracker-and-3d-sensor-maker-softkinetic/
[65] Sony Depthsensing: https://www.sony-depthsensing.com/
[66] топовых сотрудников: https://www.linkedin.com/in/laurent-guigues-77290b5/
[67] Pico Zense: https://www.pico-interactive.com/zense
[68] был закрыт: https://www.anandtech.com/show/12166/google-to-shut-down-project-tango-in-favor-of-arcore
[69] обзор новых технологий Huawei от Ars Technica на конец марта 2019: https://arstechnica.com/gadgets/2019/03/new-huawei-phone-has-a-5x-optical-zoom-thanks-to-a-periscope-lens/
[70] ГРИП: https://ru.wikipedia.org/wiki/%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%B0_%D1%80%D0%B5%D0%B7%D0%BA%D0%BE_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B0%D0%B5%D0%BC%D0%BE%D0%B3%D0%BE_%D0%BF%D1%80%D0%BE%D1%81%D1%82%D1%80%D0%B0%D0%BD%D1%81%D1%82%D0%B2%D0%B0
[71] Inside Huawei Technology's New Campus: https://www.gettyimages.com/detail/news-photo/robot-center-right-transports-boxes-of-finished-products-as-news-photo/1083192424
[72] Bosstown Dynamics: https://youtu.be/dKjCWfuvYxQ?t=26
[73] ОЧЕНЬ много и чего (кого) там только нет: https://www.google.com/search?q=tof+sensor&source=lnms&tbm=nws
[74] Hexa-cam Sony phone gets camera specs revealed: https://www.gsmarena.com/hexacam_sony_phone_gets_camera_specs_revealed-news-37637.php
[75] Limited Smartphone 3D Sensing Market Growth in 2019; Apple to be Key Promoter of Growth in 2020: https://press.trendforce.com/node/view/3226.html
[76] Источник: https://habr.com/ru/post/457524/?utm_source=habrahabr&utm_medium=rss&utm_campaign=457524
Нажмите здесь для печати.