发布在即!企业 AIGC 应用程度测评,3 步定制专属评估报告。抢首批测评权益>>> 了解详情
写点什么

智能眼镜产业现状及开发者的新机遇

  • 2014-09-25
  • 本文字数:7042 字

    阅读完需:约 23 分钟

今年的 QCon 上海大会有一个跟以往不同的专场:由李大维出品的智能硬件专场。本场的分享者当中有一家台湾公司,目前在全球智能眼镜市场中非常活跃。近日,InfoQ 中文站编辑与该公司中国区负责人李传勍(Tibor Lee)进行了采访,Tibor 分享了当前智能眼镜市场的现状以及他对该行业发展的一些思考。

本文是《给软件人讲硬件》系列访谈的第三篇。

受访者简介

李传勍,JORJIN 中国区负责人/ 中国智能眼镜产业联盟部长,出生于台湾之安徽人,十余年高集成、小型化光学CCM(CMOS Camera Module)及无线模块(Wireless Module: WIFI/BT/FM/GPS/Zigbee/NFC…)、应用处理器模块(AP Module-Application Processor Module: Cortex-A8, A9, A15…)产业经验,致力于提供简便易用之各式高性能模块协助客户缩短产品开发周期、降低设计开发、生产制程门坎,利于快速产品化及提高良率以降低生产成本,于发展进步飞快之电子产业中扮演桥梁与整合者角色,透过专业化之SiP(System in Package)及SoM(System on Module)服务,让客户们能够更加专注于各自之行业领域应用专长与市场需求之满足,减少重复劳动以及提升创新效益。

智能眼镜的生产

InfoQ:请先简单的介绍一下你们所做的事情吧。

Tibor:我们是一家台湾公司,专门做微构装、高集成、小型化、低功耗的应用处理器及无线通信核心模块解决方案,目前世界上已经量产且在行业中批量商用的智能眼镜都是用我们方案开发的。

这两颗板子,一颗是 PoP(Package on Package)3D 构装 Cortex-A9 1.5~1.8GHz 双核加上存储及电源管理的 CPU 的模块,一颗是比指甲还小的小型化无线通讯的模块,WiFi、BT、FM、GPS 四合一。我们可以理解成,这就是一个平板电脑,或者这就是一个手机的主板,这两颗加起来就是智能眼镜的主板了。

图 JORJIN 之应用处理器与无线通信模块

它跟谷歌的 IC 方案一样是 OMAP4 系列,比谷歌用的更高端:谷歌用的是 OMAP4430,只有 1GHz;我们模块用的是 OMAP4460 和 4470,主频可以到 1.5GHz 到 1.8GHz。谷歌眼镜到今天其实也没出多少货,因为它是出给开发者,谷歌本身并没有打算要运营这个产品。但是我们的合作伙伴与客户——EPSON 及 VUZIX 他们所做的智能眼镜,包括我现在跟中科院在做的智能眼镜,全部都是为了要量产,都是已经在面对商用及行业应用,面对一些个具体的需求的案子。

InfoQ:你们不光是做模块,也做后面的产品和渠道整合的工作吗?

Tibor:这里分两边。我的台湾公司那里做模块,不会去做整机与品牌产品;但是我在中国做,是做整个生态链及整合生态系统。

中科院希望跟我们合作中国智能眼镜产业联盟,就是为了要去把智能眼镜整个产业扶持起来。智能眼镜是个非常新的东西,而且是门槛非常高的产品,这里面涉及到好多光机电整合的技术,它整个成像技术、人机交互方式是与手机平板完全不一样的。成像在眼睛这个地方,甚至有各种不同的成像原理,有LCoS 的、有OLED、有DLP 的,跟手持终端差异太大了。

智能眼镜所需要的微构装、小型化要求也不是做一般手机的能够马上进得来的,你要能够做到那么小的板子,还有那么低功耗,因为它只有很小的电池,我的几款眼镜都是非常小的电池,这需要光机电的整合:微电子,光学,微机电。

再加一个人体工学。外国设计的智能眼镜产品,拿进来给我们东方人戴是不合适,要考虑到镜架的技术与美观。穿戴式戴在脸上的要比戴在其他部位的要复杂的多,因为好看差异很大,舒不舒服也是斤斤计较的。

所以我们跟中科院会有联合实验室,一方面做各种有关眼镜的最先进的技术的研发跟引进,最重要的是中科院希望我们大家能够一起努力去把整个产业快速的整合起来,去落地。元器件的技术,软件的应用,比如说AR,增强现实,比如人脸识别,车牌识别,视讯会议系统,等等的一大堆的这些东西,都要合作,整个产业链要配合要整合。

用我的方案做而且已经在量产的有联想买单的那款VUZIX M100 以及 EPSON BT-200,这两款都已经在市场上卖了。

图 Vuzix 智能眼镜产品

图 产品电路板

图 产品开发板

这就是VUZIX,联想买单就是这一款,你把它打开,里面的电路板就是这个。在9 月25 号中科院的智能眼镜产业联盟的新闻发布会上,你也会看到另外几款在本地做的中国智能眼镜。

InfoQ:这个底层是 Linux 吗?

Tibor:现在都是安卓系统,但你可以是 WinCE。我 25 号会发布全世界第一款 Windows 的智能眼镜。

智能眼镜的应用

InfoQ:介绍一下现在智能眼镜市场的应用状况吧。

Tibor:2013 年,日本的运营商 Docomo 已经拿着 Vuzix 去做翻译。日本人看到英文就很讨厌,但是生活里面有很多的英文,尤其是有很多行业的说明书、标识牌都是英文,所以他们用眼镜去做翻译。Docomo 已经做完了文字翻译,他们现在做语音翻译,想象一下未来日本索尼跟美国索尼的人,他们可以在任何有 3G、4G、WiFi 无线网络的地方通过智能眼镜远程开会,而且重要的是你可以看到我的摄像头的画面,我的第一视角——我现在在做一份什么工作,维修着什么东西,看一个什么文件——你可以通过我的摄像头看到,你可以指导我,跟我交互,而且你讲英文,我讲日文,我听到的就是日文,你听到的就是英语,这就是即时语音翻译。

InfoQ:这个应用层是谁来给他们做呢?

Tibor:Docomo 自己有云端,自己做 APP。其实这就像以前运营手机一样,思路是完全一样的,只不过现在运营商们不想只玩手机了,去玩眼镜去了。中文的语音翻译我们也做了,科大讯飞是我们的合作伙伴。

智能眼镜有好几个非常重要的价值:第一视角是一个,另一个是解放双手。

VUZIX 的这一款眼镜是给 SAP 做的,你看一下这两个智能眼镜的应用视频。你去想象一下,SAP 要在软件上面要下多少工夫才能够做到这件事情,云端需要有怎样的 content 才能做到这些事情,智能眼镜是怎么去让人跟云端去做交互。

这个视频是 SAP 的一个客人,他们做大型灯光系统。有一个足球场的灯光系统坏了,云端接到指令,马上下一个工作任务给他们的维修人员,通知他赶到那边去。维修人员所戴的这一款智能眼镜,里面就是用我的模块做的。维修人员可能第一次来现场,他怎么知道那个坏掉的电箱在那里呢?室内导航会告诉他怎么走。遇到这个密码锁,他怎么知道密码是几号呢?云端会推送下来让他知道。图像识别,没错就是这个电箱,云端就会告诉你接下来应该做什么,这里到底哪里坏了。双手修东西,修好了,这个灯一直闪,维修人员不知道为什么会一直闪,他可以叫后台来帮忙,后台的专家通过他的摄像头看到工作现场,指导他解决这个问题。

SAP 以前的载体是什么?早期用 PDA,后来是平板,上面可以看到整套系统的物料与流程情况。但是客户说,平板会占掉我们两只手,工作人员拿平板什么事都不要干了。所以 SAP 就跟 VUZIX 谈合作,定义一款眼镜取代平板。

行业应用的不可能是那种通用的设备,所以他们定义的智能眼镜,就是这款 VUZIX,里面有很多细节都是为了行业应用设计的。比如说为什么要把这个光机包起来,不像 Google Glass 是露出来的?因为露出来,外面太阳光一晒你就什么也看不到了。而且人家有可能要去外面巡检,大太阳底下干活,汗滴到棱镜上面就开始侵蚀。再来,它这个前面的摄像头角度,整个光机的角度都可以调的,这都是 Google Glass 做不到的。

再看第二个视频,美国一个工厂的应用案例。工人双手开个叉车,怎么知道车开去哪里呢?云端透过智能眼镜不断的跟你下指令,告诉你要去哪里,拿什么货,拿多少。然后室内导航,扫条码,你眼镜看到哪里就扫到哪里,不需要再拿一个手持机了。你这里拿一件,云端就少一件,所有的信息都是同步的,绝对不会错。我今天要量电压,我可能看不懂,没关系,后台的人可以看得到。云端叫他把东西送到第18 号门去,他看到18,云端就告诉你工作完成;你今天扫的不是18,它就叫你重做。

接下来所有的管理系统都会基于这个智能眼镜:SAP 的系统,日本丰田现在也在评估,国内的沃尔玛也在评估,联想更不要说了,已经做完新闻发布会了。

SAP 是一个纯软件公司,它不会做硬件,但是现在要动员整个产业进行资源整合,智能眼镜产业要做的事情是大家要协作,要分工,让大家的工作能够更有效率,Gopgle Glass 只是拿出一个概念,他告诉你说,接下来人类的跟设备之间互动模式,将不会是再用手指头去点了,是用语音、用图像来做识别检索与控制、来做交互。他提出了这个概念以后,接下来大家真正要去用到各个生活领域、工作领域去的时候,需要靠很多很多的公司去当产品运营商,去定义他。

InfoQ:他们开发用的 SDK 是你们提供的吗?

Tibor:我提供的是最底层,上面很多应用层是我的合作伙伴提供:联想会有自己的 ROM,有自己的中文化界面,有他自己的云端。

联想智能眼镜的一大应用场景在于电器维修,无论是平板、服务器、路由器、空气清净机还是汽车都不要紧。想象一下,未来联想的工程师维修电脑直接就是戴着智能眼镜先扫一下,就知道这台电脑的型号,然后直接下载电子维修手册,照着去修,有任何问题后台马上可以接手,后台可以通过智能眼镜上之摄像头看到我今天到底遇到什么问题。联想一年培训维修工程师要花很多钱的,以后就不要训练了,随便去找一个人进来,眼镜戴上,他就会修了。

这是 EPSON BT-200 智能眼镜的电路板。这上面做了两条模块,一个影像处理器模块,一个无线通讯的模块,做成分离式的——镜架跟主机分离。为什么做分离的?日本人考虑的很周严,他说如果我把这个主板也放在镜框这里,重量太重,再来分离了以后,我可以做到一件事情,就是在主机这里放一个大电池。很多行业——物流业,医疗,医生,尤其医生,动一台手术,有时候超过十小时,所以弄一个大电池放在口袋里面,确保整个工作中绝对不会有电力的问题。

BT-200 已经在量产,这一款是娱乐版,你可以在他官方网站买到,不一定要开发者,任何人都可以买,才卖 699 美金,比 Google Glass 卖一千五百块美金便宜多了。这一款可以用双眼你让看蓝光 DVD,可以让你打增强现实虚拟现实游戏,影像品质非常棒。

一样的电路板做一个不同的外壳,就可以拿来当医院医疗用。这个医疗级的外壳抗菌耐腐蚀,是他们找 Evena 合作做的,Evena 是一家专门做医疗器材的公司。而且这款眼镜加了一个红外线功能,可以帮助这些护理人员看到肉眼看不到的血管,扎针绝对不会错。

图 EPSON/Evena Medical Application

飞利浦现在在跟谷歌合作做医疗应用。医生是非常需要很多信息提醒的,一个医生今天匆匆忙忙的有一个人要去开刀,翻一翻病例,问一些问题,他就进去手术了。忙中总有错,我们看到太多的新闻,本来应该割左边的,割成右边,你要怪医生,医生也觉得他好冤,有了智能眼镜这种事情就不会发生的。所有的报告统统会叠加到眼镜这里来,甚至于直接迭加你的影像,直接告诉你从哪个地方下刀,都有可能,这完全看你软件怎么做。这里面有一点,谷歌眼镜是不适合做行业应用的,一个原因就是那个摄像头是固定的,医生的视角与摄像头中心焦点无法透过摄像头角度调整达成一致。

InfoQ:这个现在已经在生产环境使用了吗?

Tibor:医生现在非常想要戴智能眼镜,因为现在医疗纠纷很多,每个人都想要保护自己。上海六院刚刚做了一件轰动全世界的事情,他拿谷歌眼镜来做第一视角的医疗直播。所有想要学习怎么开刀的学生,只有从这个角度看过去,他才能真的理解那个刀到底是怎么下的,那个线到底是怎么缝的,那个骨头到底怎么弄的。

我告诉你个更神奇的,美国华盛顿大学有一个研究团队,他们集合了光学的专家、生物学的专家、组织细胞学的专家、医学的专家、药学专家等各行各业专家,研究说怎么让智能眼镜分辨出哪里是癌细胞,哪里不是癌细胞。可能吗?已经做到了,他用不同波长的光打在细胞上,会有不同的反射光谱,如果那里是癌细胞,它的光谱跟正常细胞反射的光谱是不一样的。这可能是不可见光,人眼看不见,但机器眼睛能看见。

智能眼镜还有一个很重要的应用场景,就是旅游与文化传播。想象一下外国观光客来到我们上海要观光,他戴着智能眼镜看到了我们的外滩,他可以同步的分享去全世界他的所有朋友。还有一个更有趣的应用是,假设我今天出国旅游,我妈妈在家里,我想要帮我妈妈买个礼物,我可以跟她交互;或者我去看球赛,他可以看到跟我一样场景、一样视角的球赛。

还有一家专门做研究的公司,他们做云端大数据的,他们专门研究人的注意力到底是怎么一回事。你今天去逛街,你的眼睛焦点到底都在哪里。几十万、几百万的人的焦点的数据收集到云端去了就变成大数据,他们就可以出分析报告,卖给所有想要开百货公司的人,告诉他说你要怎么装修、怎么摆放,你的货最有价值的、利润最高的货应该摆在什么位置。

警察值勤也是有刚需的。警察站在高铁站执勤,在机场执勤,他可以眼观四面,耳听八方。他可以透过人脸识别看到那个人是可能是嫌疑犯,那个车牌可能有问题。耳听八方,科大讯飞他们的语音识别软件是可以听得懂很多方言的,所以你让一个警察戴着智能眼睛,他就可以听懂所有的方言了,最重要的是他听得是关健字,枪、武器、爆炸等等,不管你是维吾尔语、蒙古语、西藏语,他都会马上告诉你,这个人你要注意他。现在美国的机场就正在导入这一款智能眼镜。

再比如今天有人挟持了人质,警察要去攻坚,他不知道前面的路到底怎么一回事,房子的入口到底有几个,歹徒到底有几个人,你怎么攻坚?以前的做法是派直升飞机绕两圈,又贵又慢,现在有一种飞行器,上面有摄像头,去飞一圈我从这里就可以看的清清楚楚,然后你从眼镜里可以直接看到飞行器的视角。

AR 有很多成熟的技术,可以做图像叠加。国内比较少人做的是室内导航,但是技术不难,因为你用图像识别就可以做室内导航,重要的是要去建模。在很大的建筑里,像刚刚那个足球场,或者地下停车场,很大的卖场,室内导航都会非常重要。因为里面没有 GPS,所以室内导航一定要靠图像识别。

还有贵宾服务,现在美国日本都在做这件事情。你在某个百货公司一个月刷卡 50 万,人家就发给你贵宾卡。但可能你又去这家百货公司,进去走了半天,没有人知道你,你就想,我是贵宾,你们都不认识,那我一点贵宾的感觉都没有?以后不会了,你进到百货公司,人家摄像头马上就已经 highlight 了,马上他的服务员戴着智能眼镜就迎上前。你是谁,你的生日几号,你在哪一家公司工作,你最喜欢消费一些什么东西,你的嗜好是什么,你到底喝茶还是喜欢喝咖啡,这些问题,服务员都不会再问了,任何一个服务人员都可以把每个贵宾真的当作贵宾。很多这种服务的事情都会通过智能眼镜来做。

还有教育。所有的教育都会变得非常简单有趣,而且都是立体的。比如文字都看不懂的小孩子,你让他戴着智能眼镜扫一下这个图书上的图片,眼镜就可以给他讲故事了,还可以看到三维的画面。

智能眼镜延伸了你的视觉,延伸了你的听觉,可以让你拥有不同的视角看世界,有更多的应用场景可以去挖掘。

智能眼镜的产业发展

智能眼镜是一个产业,一个正在兴起的产业,我们在做的这些事情是要改变人类未来所有的生活。

我想在中国建立一个生态系统,有人做硬件开发,有人做软件开发,有人做应用开发,有人做产品的运营,有人做云端的开发,一起来面对这里面的很多很多的需求,所以我才需要跟中科院去成立智能眼镜产业联盟。

我最近跟上海市南翔智地签了一个协议,弄了一个智能眼镜产业园。在上海,政府也觉得这个好棒,所以他们愿意给我们免费的办公场地,找风投。一个新兴产业,你今天不扶持它,它不可能快速发展的。

InfoQ:以前那些在平板上做行业应用的开发者,他们现在也在做这个吗?

Tibor:他们许多人还没有意识到世界正在改变。很多人手上有技术,但他没意识到这件事情,他们认为智能眼镜就等于谷歌眼镜,他们认为眼镜还是很遥远的事情,现在只专注自己做眼前的事情。他没有意识到智能眼镜已经近在眼前了。所以我需要把智能眼镜相关的所有技术与资源,包括台湾来的,日本来的,香港来的,所有的包括本地的,统统集中到智能眼镜产业基地那边去,大家一起干活,这样才能快。

InfoQ:刚才你说的那些应用案例,他们用了几年的时间做研发和验证?

Tibor:用我的模块,半年就可以出产品。如果再加上我本地合作所做的那个板子,以后说不定三个月就可以出一款产品。因为最困难的事情我都帮你做完了,你自己再弄一个四层板及外观模具并不难。就是要快,你可以理解我们做的这两块就是智能眼镜的公板,外壳、ID 设计、怎么戴起来舒服好看,这个东西难得倒中国人吗?

现在缺什么?中国本地自己开发出来的眼镜有了以后,接下来要大批量去试点,医院、物流、仓库、警察公安要开始去试点,那这就是要中科院出来号召各行各业、大小企业大家一起去试点。

InfoQ:你关注行业应用。那比如有人想通过众筹的方式做消费者,可能有几千个人预购了,他们找你要用你的芯片,你会支持吗?

Tibor:我可以支持他,但他得要有决心要我的方案,我还可以整合资源给他。

但是我必须要坦白说,我个人不认为现在是智能眼镜可以进入到消费的成熟时间,为什么?时机未到,你看谷歌好了,谷歌那个眼镜算做的很炫了,他也想要做消费品,但卖不动,第一它是不是好看,是不是舒服,不是每个人都能接受;第二有隐私的问题;第三它还很贵,上面又没有什么针对消费者的 APP,没有办法帮你在你生活里产生多大的价值。

而行业应用就不一样了。好不好看舒不舒服,员工能说不喜欢带就不干活儿吗?隐私问题在企业里也不存在。而且最重要的是,行业里面你只要解决一个问题,比如你只要解决了翻译,就有好多公司买单了,不需要很多 App,重要的是它可以帮老板省下多少钱,商业逻辑完全不一样。

所以我们先做行业,先让越来越多的人感觉到影响。当行业里面越来越多的 APP 聚集了,它自然而然有一天水到渠成,就会到民间去。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2014-09-25 18:494873

评论

发布
暂无评论
发现更多内容

元宇宙的本质特征是五大融合

CECBC

2022年1月云主机性能评测报告,移动云升至第三

博睿数据

一文让你彻底搞懂Python中__str__和__repr__

宇宙之一粟

Python 2月月更

2022-02微软漏洞通告

火绒安全

微软 网络安全 终端安全 漏洞修复

2022年的元宇宙,你该知晓些什么?

CECBC

Java自定义DNS解析器负载均衡实现

FunTester

负载均衡 性能测试 接口测试 DNS FunTester

欧拉的奇异之旅·风暴来临与欧拉初诞

白洞计划

总结 XSS 与 CSRF 两种跨站攻击

喀拉峻

网络安全

Camtasia音画同步剪辑教程

淋雨

Camtasia 录屏软件

【安全漏洞】浅谈Bypass Waf (基础-实战)

H

网络安全 渗透测试 漏洞

springcloud五大核心组件

编程江湖

我与Android的故事|社区征文

Changing Lin

android 移动开发 新春征文

redis 面试总结

yuexin_tech

redis 面试

阿里云服务器搭建halo博客从0到1

乌龟哥哥

阿里云 2月月更 halo博客

Web Components系列(四) —— 认识 Shadow DOM

编程三昧

前端 组件化 HTML5, CSS3 2月月更

PingCode Wiki 权限设计之ACL

PingCode研发中心

项目管理 开发 acl PingCode 页面权限

浅谈OKR(12/100)

hackstoic

OKR

征文投稿丨使用云服务器ECS快速搭建halo博客

阿里云弹性计算

征文投稿 玩转ECS halo博客

基于RestTemplate的在线武器库

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

向工程腐化开炮 | proguard治理

阿里巴巴终端技术

Java App 客户端开发 proguard 腐化治理

亚信科技AISWare AntDB数据库在运营商核心业务系统的联合实践分享

亚信AntDB数据库

5G AntDB intel 亚信科技

Flutter 重构 QTalk

Qunar技术沙龙

netty系列之:Bootstrap,ServerBootstrap和netty中的实现

程序那些事

Java Netty 程序那些事 2月月更

2 月亚马逊云科技培训与认证课程,精彩不容错过!

亚马逊云科技 (Amazon Web Services)

架构师 培训 认证

PingCode Wiki ——国内最顶级的产研团队知识库产品介绍

PingCode

团队管理 知识库

Linux修改drop_caches内核参数来清理缓存的一些笔记

山河已无恙

Linux 2月月更

元宇宙里办年会,听演讲、看产品、抽大奖一件不落

Meta 小元

数字孪生 元宇宙

从小样本学习出发,奔向星辰大海

百度大脑

虚拟空间引领 数字化转型拉开银行差距

CECBC

5种阿里常用代码检测推荐 | 阿里巴巴DevOps实践指南

阿里云云效

阿里云 云原生 软件开发 研发 DevOps实践指南

声网AI降噪测评系统初探

声网

音视频 RTE 技术详解

智能眼镜产业现状及开发者的新机遇_Linux_sai_InfoQ精选文章