用光创造黑暗!Magic Leap 技术解析

Magic Leap 向来不爱向外界透露其技术的细节信息,仅从我们的片面认识来看,它绝对是一个能力远超大家所熟悉的现有同类产品的新颖系统。它不愿意与外界分享其技术的细节也完全可以理解,毕竟有许多公司试图模仿这项足以让消费者们高潮的技术。

这项技术有潜在的革命性,并且相比同时代其它产品是一个真正意义上的创新,听上去像是苹果公司所向往的产品。

这项技术也是微软公司拼了老命想在 HoloLens 上实现却没能实现的功能。这个产品最初从 Google Glass 中获得灵感,但如今已经成熟到远甩谷歌几条街。

如此让人心驰神往的神器到底是什么呢?又是怎么工作的呢?小编通过结合访谈,专利,职位申请,以及公司职员的背景来揭开它的面纱。MINI-AR-Glasses1

Osterhout Design Group 的 AR 眼镜,Magic Leap 的眼镜可能与之类似

简单科普一下,我们先来大概了解下 Magic Leap 会是什么样子。简单来说,Magic Leap 就是一个能将物品呈现在人类视野中的设备,并且其真实水平远超目前市场上我们熟悉的其他设备。

它将会由两部分组成:

一副眼镜。

一个小小的便携投影仪兼运算装置。

你可以想象一个手机大小的小长方体,但是没有屏幕。这个便携装置将通过电缆与眼镜连接。

眼镜在设计和大小上将与人们如今佩戴的眼镜类似,不过它会比一般的眼镜稍微厚重一些。

这个头显的小体积正是这款产品最根本的特点,这意味着即使在公共场合携带也不会有什么不妥,而且给了它未来连接智能手机的可能性。

anker-battery-bank便携装置的大小可能与之类似

便携投影仪兼运算装置

Magic Leap 的一个很独特的把戏就是把一些必要的硬件从眼镜中取出,并放入一个独立的装置里。HoloLens 则是完全相反的例子,HoloLens 将所有硬件都装在眼镜里,并非常出色地将眼镜的尺寸减小,但毕竟有那么多元件在,再小也小不到哪儿去。

那 Magic Leap 的便携装置会包含什么呢?如下:

电池

设备需要的电量需求和一个现代智能手机差不多,而且很可能对电池的依赖性更高。如果它想要取代智能手机,那肯定需要一个容量更大的电池,我个人认为至少 5000 毫安时。

CPU/GPU

这部分元件应该会是最新一代的手机 CPU,我猜他们会从高通公司中获得此类资源。好消息是他们可以省去高端图形处理器的需求,因为混合现实只需要渲染部分内容,而非整个场景。这就可以排除 VR 所面临的高强度图形处理的问题。

内存

与智能手机的要求差不多,我估计在 3-4G 左右。

定制芯片

即时定位与地图构建过程中将会需要这个元件,要将虚拟物体放置在现实世界中,这个处理过程是必不可少的。他们也许会自制芯片,或者采用 Movidius 之类公司的芯片。

4G,WiFi,蓝牙连接,SIM 卡和 GPS 芯片也会具备。

相机

眼镜上肯定需要许多架相机,但这不代表便携装置上就不需要相机了。为了即时定位与地图构建,头显上的相机要求与优秀的消费品相机也非常不同。

考虑到眼镜的尺寸限制,他们很可能会在眼镜上放弃高功率的相机,而将其置于便携装置上。这样有个好处就是可以避免隐私问题,因为这样的话就无法利用眼镜直接拍照了。

激光投影仪

这是他们创新的核心。将投影系统从眼镜中抽离出来,单独设置成便携设备,对于减少最终成品的体积有着至关重要的作用。

投影灯光由便携设备发出,然后通过光纤电缆传输到头显中。在后文中会更细节地解释它是怎么运作的。

GIF1眼镜

他们在便携设备里塞满了元件,那眼镜里还剩什么呢?我想以下这些元件肯定是要包括的:

IMU(惯性测量装置)

想必加速计,陀螺仪和指南针肯定是具备的

耳机

也许他们也会像 Google Glass 一样采用骨传导耳机,这和他们与身体共同运作的哲学是一致的。骨传导耳机的优势在于你既可以听到播放的音频,也能听到外界的声音。

麦克风,光学元件和相机

光学元件和相机应该是最有趣的组成部分了,让我们来进一步探索一下。

光学元件

通过 Magic Leap 的专利申请我们可以发现,他们所使用的光学元件,相比 HoloLens 或者 Google Glass 的传统投影系统,可以非常显著得减少占用体积。从图示可以看出光源和头显主体是相互独立的,也正是如此我们才有理由推测便携装置将负责驱动灯光。

patent-image-1其次,图中展示的透镜系统非常小。尽管图片显然不是严格按比例画出来的,但是能看出大概的元件比例。目前为止我们唯一见过的元件只有光子芯片。将图中的元件 5、6、7、8 和芯片的尺寸对比,它们的大小我们能猜出个大概。magic-leap-lens-system所以到底发生了什么?他们是怎么把光学元件弄得这么小,同时又拥有光场显示、高分辨率的出色视野的呢?

答案有两个方面,一个是光纤扫描显示屏,另外一个则是光子光场芯片

光纤扫描显示屏images光纤扫描显示屏是一个完完全全新颖的显示系统,在此之前从未在任何消费商品中使用过。关于这项技术我们了解的一切都来自于 2013 年的一项专利申请。

这项申请距今已经有一些时日了,所以我们有理由相信它在画面的表现上应该可以做的更出色,但整体的思路还是和从前意义昂。这套系统采用执行光纤电缆来扫描远大于光纤孔径大小的图像并输出,工作原理与传统电视类似。不过传统电视是扫描电子,这套设备扫描光本身。

通过压电制动器来完成扫描,扫描频率可以维持在 24kHz。一般帧率是无法达到这么高的,因为它需要经过好多路径(专利中举了 250 圈的例子)才能达到全帧。

这改变了我们对分辨率的认识,有了这项技术,分辨率的变化将取决于光纤扫描率,光纤能对焦到的最小的点的大小(这会决定像素的大小),创造全帧所需的扫描次数,以及希望达到的帧率。

考虑到这项专利申请已经过去了这么久,他们也许已经在性能上优化了不少,我们可以期待它的分辨率将远高于目前市场上所有的消费系统。fiber-scan-tubes尽管分辨率和帧率对于创造真实的全息图而言非常重要,视野也拥有同等重要的地位。关于这个内容,可以看看这段摘自专利中背景信息介绍,十分有趣。

“安装在头部的显示器(HMD)的视野(FOV)可能由微显示器图像的大小以及观察光学系统共同决定的。人类的视觉系统拥有水平面 200 度,纵向 130 度的范围,但是大部分 HMD 只能提供 40 度的视野……角分辨率达到 50-60 角秒时才能达到 20/20 的视敏度表现,而这取决于微显示器的像素密度。

为了最完美地匹配人类视觉系统的能力,HMD 需要提供 20/20 视敏度,同时视野范围大于 40*40 度,所以当角分辨率在 50 角秒的时候,这大概等于 800 万像素。如果增大到理想下的 120*80 度视野就需要将近 5000 万像素。”fov-lens-magic-leap-300x164

这就让两件事显眼了起来。一是目前的消费显示屏的视野水平比起人类所需要达到的要低好几个量级。这样一看我们就明白了为什么 HoloLens 如此执着地要创造大视野。

还有一个就是让我们感受到了 Magic Leap 的雄心壮志。他们希望能制造出 120*80 度的视野,这将会比 Oculus Rift 的视野还要大,并且像素更高。

那么他们做到了吗?这很难说,但专利中确实给我们了这些数据作为参考,而且已经过去 3 年了,他们很可能已经进一步完善了自己的技术。

像素间距是指一个像素的中心到旁边一个像素中心的距离,在像素生成时是一个限制因素。像 HoloLens 用的那种传统微显示器,像素间距大约是 4-5 微米。这就限制了这些显示器的像素大小,从而也限制了能生成的视野大小。

这项专利指出光线扫描显示器能生成的像素间距可小至 0.6 微米,这和其他同期产品根本不是一个量级的水平。

那这样生成的像素是多少呢?他们在专利的一个模块中提到,是 4375*2300,但我不认为这就是他们的全部实力。这个例子仅仅是在他们初期的一个简单尝试,他们还未开始讨论多核光纤对其优化效果。所以我相信真正的分辨率肯定远远超出那个数字。如果我们想得到一个大视野,这是至关重要的。

为了体现他们 120 度视野的雄心壮志,最后一句话被着重标出:

“以上描述的是一项可以推动超高分辨率,且支持大视野的头戴显示器或近眼显示装置的技术。”

我想这所说的一切都足以让我们确信,我们至少会拥有视野远大于 40 度,其实说接近 120 度都不夸张的显示设备。如果要我赌的话,我赌 90 度。

光子光场芯片

当我第一次听 Rony Abovitz 称他的透镜为光子光场芯片时我满脸嫌弃,明明是已经存在的东西为什么要起个奇奇怪怪的名字,他就叫透镜啊 Rony!

但随着我研究的深入,我越来越意识到这远不止一个简单的透镜。那么它的工作原理是什么,为什么比一般的透镜有趣的多呢?我们先来聊聊衍射光学器件(diffractive optical elements)。diffractive-optical-element-300x197衍射光学器件(DOEs)可以理解成很薄很薄的透镜,能帮助光束成型,光束分裂,光扩散或者光的均匀化。Magic Leap 运用线性衍射光栅来将光束波前分裂,然后生成光束形成他们想得到的焦点。

换句话说就是将处理过的光传入你的眼睛,让它看上去像是在正确的焦平面上。不过这说起来比做起来容易的不是一点两点,更何况说起来都挺复杂的。我得到的所有信息都是从那份专利文件中提取出来的,原文比我解释的还要冗长得多。

为了建立光场,Magic Leap 设立了由两个独立元件组成的光子芯片。其中一个元件(图中的6)接收光源并添加到另一个元件(1)中,由 1 将光重新送入你的眼球。photonic-chip-doe两个元件都利用 DOE 来完成它们的工作。DOE 的主要缺点就是功能非常单一,只能针对某一特定工作。它们无法同时处理不同波长的光,也不能通过改变属性来实时生成不同的焦点。

为了解决这个问题,Magic Leap 叠了好多层 DOE,于是看上去就像是一个大大的透镜一样的元件,经过这样的调试它就可以处理不同波长的光并生成不同的焦平面。

这些 DOEs 非常非常薄,它们和它们所处理得光波长是同一个量级的因此也不会为装置增加什么厚度。而这套光学系统的核心就在于,Magic Leap 可以选择打开或关闭其中任意一层衍射光学器件,这样就可以改变光进入眼球的路径。这也是他们改变图像焦点,实现真正的光场的手法。专利里这么说道:

“举个例子,当系统中的第一层 DOE 打开,观察者在看向平面光波导的初始面和放射面时,系统可以模拟距离观察者1米的位置生成光学图像。而当第二层 DOE 打开,光学图像就会在 1.25 米的位置。”

这听上去似乎限制很高,需要非常多的层数才能创造一个全范围的焦点,但其实不是这样。DOE 的不同组合也会产生不同的输出结果。因此并不是每一层 DOE 对应一个焦平面,而是每个 DOE 组合对应一个焦平面。

改变正活跃的 DOE 组合就可以改变光在光子光场芯片中的路径,正如视频所示。他们的层数肯定会比这个图示更多,但具体是多少层没人知道。

最后我们发现 Magic Leap 成功地利用光创造出了黑暗,他们过去曾声称自己可以做到。如果我们取一片外层透镜和一层内层透镜,我们就可以用它们来抵消光束,就像降噪耳机的原理类似。专利中说道:

“这样可以用来抵消来自背景或者现实世界中平面光波导的光束,从某些角度来看类似于耳机降噪。”

所以为什么要叫它芯片呢?嗯…一个典型的电子芯片在特定情况下改变电子的流向,Magic Leap 的光子光场芯片在特定参数下改变光子的路径,听上去是蛮像芯片呀。

好了,我们说到哪儿了。我们现在了解了光子光场芯片,和高分辨率投影仪,那我们到底如何生成图像呢?图像通过组合生成。图像被分摊在不同的层面上,不同的元件将其投影在副帧的不同焦段上。意思就是,有许许多多的路径来构成一个完整的单一画幅,每一个焦平面都被单独制定。Magic-Leap-Dragon

相机

Magic Leap 试图利用相机技术达成 3 个不同的目标。第一个也是最显而易见的,就是来拍摄每日的日常照片。这也是相机技术最被人熟知的用途,他们很可能会用与最新智能手机市场里类似的感应器。这个感应器是会在眼镜里还是在便携设备里还依旧无从知晓,但它配备的相机一定有能力排除非常不错的相片。

另外两个用途要有趣的多。Magic Leap 一直在反复强调设备理解这个世界的能力,在一场采访中,他们提到这台设备有能力识别物体,比如小刀或者叉子。

如果想要实现这个功能,就必须要有大量的相机组。在这方面 HoloLens 的表现尤为出色。HoloLens 包含 4 个环境传感相机与一个深度感测相机共同运作。我们从专利文件中获得了不少关于 Magic Leap 的信息。camera-magic-leap-diagram-components从上面图表中可以看出,我们可以展望产品有两个面朝外的相机,叫“世界相机 world camera”。这些专利的命名也暗示了新产品中一定会有超过两台相机,在专利中也提到“每一边一个或多个面朝外或者观察世界的相机”。

直到这里我们依旧不知道这套系统里到底会有多少台相机,Magic Leap 能把这么多元件缩小到什么水平也无从知晓,但我们知道它们将被安装在眼镜上,而且对即时定位与地图构建至关重要。

相机的最后一个用途在上方图表中也有描述。至少有两台相机会对准你的眼球,这是为了追踪你的目光和聚散度,这样就可以运算出焦点和目光的方向。还会有一个红外 LED 对准你的眼睛帮助两个相机照明。这个眼球追踪在用户界面也很关键。

我能想象“你在看哪里”这个问题将在你与 Magic Leap 互动时显得尤为重要且基本。它最终很有可能成为主要的互动工具,类似于鼠标。magic-leap-mockup-image

显然,就目前而言我也无法证实这些消息的真实性,但是这一切加起来确实像是 Magic Leap 正在制造的产品。无论最终它会大卖与否,这都会成为很长一段时间以来科技行业见证的第一个真正意义上的创新。

转自:moduo魔多