增强现实智能交互的幕后英雄:神秘的Movidius

联想Phab2 Pro 增强现实手机发售在即,身为藏身其后的技术公司之一,9月份被英特尔收购的Movidius公司渐渐浮出水面。联系到今日传闻Facebook收购瑞士计算机视觉项目ZurichEye的消息,计算机视觉技术无疑日益凸显其重要性。

为计算机赋予视觉

Movidius公司成立于2006年,技术高层包括P.A.Semi的创始人 Daniel Dobberpuhl、卡内基梅隆计算机视觉专家金出武雄、以及前苹果工程副总裁 David Tupman。而Movidius公司目前正在尝试做的事是“为计算机赋予视觉”。

movidius%e4%b8%bb%e8%a6%81%e5%9b%a2%e9%98%9f%e6%88%90%e5%91%98%ef%bc%9a%e5%b7%a62%e4%b8%ba%e5%85%b6ceo%e9%9b%b7%e7%b1%b3
Movidius主要团队成员:左二为其CEO Remi

我们用一个简单的例子来说明这件事的重大意义:当有苹果向你扔来时,你会把它接住。整个过程看似简单却相当复杂。首先,苹果的图像进入眼睛,通过视觉神经传达至大脑;大脑对图像进行分析,识别出物体的类别、大小、形状、飞行速度等信息,并预计出接下来的轨迹;最终给予判断,支配你伸出双手将其接住。这一切都发生在一秒不到的时间内。

整个事件中,大致可以分为四个阶段:看到——描述——理解——行为。那么,如何让计算机(机器人)模仿上述过程呢?

“看到”:需要更为先进的传感器和图像处理器。比如相机能够拍摄每秒数千张的图像并进行距离测量,这个目前看来是相对容易实现的;

“描述”:也就是模式识别,让计算机识别出眼前的物体是什么,属于哪类。这是一个对计算量要求极高的过程,将采集到的图像数据与数据库里的图像做比对,判断是苹果还是菜刀或者别的什么物体,苹果可以接,菜刀你要躲。人脑可以快速完成,而如果让手机来完成,需要当前手机计算性能提升120倍。

“理解”:即便克服重重困难突破上述两个阶段,计算机依旧无法得出结论:下一步该干什么呢?是否可以吃,是否要接住?所以,还需要实现“理解”,最好机器还能举一反三,灵活应对。这更是难上加难。

 使用Movidius芯片的FLIR内核热成像效果图

使用Movidius芯片的FLIR内核热成像效果图

而这正是Movidius公司的使命,他们试图使机器实现理解,在最终极意义上实现“为计算机赋予视觉”。在半导体领域、机器视觉、数字信号处理等方面,Movidius积累了一大批技术人才,深耕九年,最终诞生了他们的芯片Myriad2。

也正是通过谷歌的Project Tango技术,Movidius成功地将移动端的图像处理技术带给了联想的Phab2 Pro 增强现实手机。

技术核心与应用范围

实现“描述”的过程,需要处理大量数据信息。而Movidius公司的芯片能够24小时主动不间断地拍摄图像并处理信息,通过对数据进行分析对比,使其在一定程度上获得“理解”周围环境的能力。

而对于像无人机或者无人驾驶的车辆来说,依靠它能够实现实时感应和躲避障碍物。也因此,全球著名的无人机公司大疆在其智能无人机Phantom 4以及最新推出的Mavic产品上均采用了Movidius公司的芯片。

243132762048467830

强大的图像数据处理能力主要得益于Myriad系列芯片。Movidius公司将其命名为VPU(视觉处理单元),以此区别开GPU(图像处理器)。二者的区别在于GPU倾向于静态图片的处理,而VPU则能够做到动态图片的处理。

Myriad 芯片做到了相对于传统移动芯片而言的1/10 的功耗、1/5 的尺寸和 1/5 的价格,10倍的视觉处理性能。Myriad2芯片则是在上一代产品上实现了速率的重大提升,速率为此前的20倍,体积也更小,每秒钟消耗仅为500毫瓦。

可以举个简单例子说明这种区别,它使得此前仅支持拍照功能的产品上升到了兼具摄像的功能。而这也并非玩笑,Movidius的CEO在此前声称,Myriad 2能够让智能手机摄像头在某些程度上达到单反的水平,比如对焦速度、低光成像表现。

_wwxwcqb_uzwzvxrhq7hh

这得益于Myriad2拥有12个可编程的核心,一个图像信号处理器(ISP)和硬件加速器。在晶体管时代,越多的晶体管也就意味着越快的运算速率,更高的功耗,在遭遇瓶颈时,诞生了单芯片多核的处理方案。而多核对于运算速率的提升效果非常明显。另外,硬件加速器能够使得数学运算在硬件中实现,这比在软件中实现更快,效率更高。

除此以外,值得注意的是,此前我们看到虚拟现实(VR)相关的动作追踪,目标识别等计算任务都是由GPU来完成的。而使用Myriad2 12核VPU进行处理,“那么其中两个用于图像深度,两个用于动作位置追踪,一个用于眼部追踪,剩下的则可以根据用户的不同需求来处理不同的碎片信息。”这意味着所有的处理可能是同时完成的,这无疑将带给VR领域前所未有的体验。

movidius-myriad-2-arch-1024x576

无论在人工智能,还是在虚拟现实世界,我们都将看到像Movidius这样的视觉计算公司大显身手。而目前联想Phab2 Pro 增强现实手机仅仅是它所展现的冰山一角。

此前Tango手机所展示的使用手机测距便是机器视觉的一部分。非接触测量技术,它在测量速度和精度上都能达到极高的水准,我们在不接触物体的情形下就能够进行数据的测量。对于我们不愿接触的物体或者不能接触的物体,都能够采取这项技术对其进行精准测量。尝试着幻想一下,当你戴上VR/AR眼镜,对方身高、胸围、腰围等指标一一暴露在你面前,会不会瞬间就不知自己身在何处了?

除了用于联想这款增强现实手机中3D扫描建模外,Movidius公司的这款芯片还可以用于VR/AR头显,室内导航,360°全景视频等等领域。而这些无疑与VR/AR息息相关。

1477546658-vion-graphic_1425_830_s_c1

投资与收购后的Movidius

无论是人工智能还是AR/VR领域,它都有着广泛的运用前景。也正因为此,嗅觉灵敏的投资者和科技巨头将他们的目光转向了Movidius这样的计算机视觉公司。

2015年4月,Movidius公司宣布其获得了高达4000万美元的E轮融资。历数数次融资金额,Movidius融资总额高达8650万美元。与融资同时而来的还有各个公司想要收购Movidius的消息,包括大疆科技在内的多家公司都曾向Movidius提出过收购邀约。

%e4%b8%bamovidius%e6%8a%95%e8%b5%84%e7%9a%84%e5%85%ac%e5%8f%b8
投资Movidius的公司

我们也不会忽视为Movidius注入活力的那些资本。在E轮融资中的华山资本便是这样一家公司。与我们想象的不同,也正是像华山资本这样的投资公司,在投资后,协助Movidius招聘和建立了中国区早期团队,并为其引入了战略合作伙伴,像大疆、海康威视、大华等国内企业。

英特尔收购邀约到来的时候,Movidius正在准备新一轮的融资,当时海内外资本都跃跃欲试。而就在2-3月内,Movidius便被英特尔纳入囊中。

英特尔的收购,我们不得不引用华山资本创始合伙人杨镭所说的话,“它盯了很久了”,“收购不只是钱的问题,更多是战略的考虑。”

%e8%8b%b1%e7%89%b9%e5%b0%94%e6%94%b6%e8%b4%admovidius

Movidius显然更看重英特尔公司在人工智能以及VR/AR等领域的布局。收购能够使得它在一个更大的平台上实现自己的使命“为机器赋予视觉”

Movidius的CEO Remi在官方声明中指出,日后将与英特尔的RealSense技术相配合。而其芯片也仍将独立发售。但是合作显然不止于此,据悉,Movidius的芯片将用于英特尔自主研发的无线独立式MR头显Project Alloy二代之中。

而正如自豪的Remi所说的那样:“如果没有使用Movidius,那绝算不上大的AR平台。”原因只在于使用Movidius的这款体积小、功耗低的芯片能够使得头显小型化,从而大幅度减轻困扰着我们的头显重量。

零镜网观点

Movidius独到之处在于“为计算机赋予视觉”,依靠雄厚技术实力解决行业“痛点”。在VR/AR领域,他们能做的事还有很多,包括通过使用他们的芯片来使头显小型化,通过同时处理多个任务降低延迟、打造沉浸感等。我们乐于见到Movidius这样的计算机视觉公司为我们在虚拟现实领域带来的进步,这意味着我们能够体验到更好的沉浸效果。

【本文由零镜网(微信号:ZeroneVR)原创,转载请注明出处!零镜网由多名从业超过10年的资深IT媒体人创立,为VR/AR从业者提供全产业链资源对接,分享前沿技术和应用方案,打造专业硬件评测及VR电竞赛事。】