写点什么

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?

  • 2022-11-29
    北京
  • 本文字数:6470 字

    阅读完需:约 21 分钟

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?

智能机器人是科幻作品中经久不衰的元素之一。经过科技行业数十年的不懈努力,今天我们终于看到了智能机器人走进日常生产生活的曙光。在云计算和人工智能技术的帮助下,机器人在不久的将来有望通过高水平的“智慧大脑”,帮助人类完成一系列工作。


InfoQ 极客有约与 OpenI 启智社区联合推出的系列直播栏目最近就邀请到了国内智能机器人领域独角兽企业,达闼机器人副总裁王斌来做分享,探讨基于云计算技术的云端机器人如何获取知识、提升认知能力,实现自我进化相关的话题。


InfoQ 将本期节目的内容编辑整理成文。

什么是云端机器人?


InfoQ:达闼在机器人领域处于国内领先水平,公司创始人黄晓庆老师在 2012 年率先提出了云端智能机器人架构。什么是云端智能机器人,请王老师科普一下。


王斌: 机器人最早的成熟应用是在传统的工业领域,例如很多自动化生产线上有很多机械臂来完成零件的组装、喷漆等工作,叫工业机器人。现在我们的生活中也出现了一些能自主导航避障的机器人,如室内的送货机器人、家庭清洁用的小型机器人。而在传统的工业机器人和自动导航避障机器人基础上进一步发展,就有了我们现在提到的智能机器人。


智能机器人和前两者有很大差别:传统的工业机器人关注的是机械臂相关的运动学和动力学技术,自主导航避障机器人主要是在相对简单封闭的空间完成单一的功能,而智能机器人要在更开放的环境下完成各种任务,是多功能的机器人。智能机器人需要更多人工智能相关的技术,包括更多算力、数据,需要更多 AI 服务的支撑。


算力、大数据和 AI 模型是人工智能的三驾马车。要达到较高的智能水平需要非常强大的智能系统,单纯在传统机器人的技术架构下很难实现,因为它需要非常大的存储空间和计算能力。所以达闼公司的创始人兼 CEO 黄晓庆先生很早就提出来,未来的机器人一定是“云、网、端”融合的机器人。


云是指利用云计算相关技术,构建具有超大算力和数据的机器人大脑;网是通过 5G 相关的技术,将云计算与机器人本体连接起来;端就是机器人本体,也具有一定的计算能力,可以提供本体的感觉、执行能力。这样的云网端构成了机器人的大脑、神经中枢系统、末端感觉器官和执行器官这样的整体,这就是黄晓庆提出来的”云端机器人”架构。


计算机领域的科研专家主导的人工智能技术,和自动化领域专家主导的机器人技术,这两者由于学科历史发展原因,研究方向不太一致。而今天这两方面的专家逐步开始走向融合,但国内缺乏这两方面都非常专业的技术人员。


我们达闼在做的事情就是填补这一空白,把人工智能和机器人充分结合在一起。2015 年我们开始做云端机器人,成立了达闼公司,在 2019 年实现了云端机器人的商用化。今年国家科技部批复,支持达闼建设“云端机器人国家新一代人工智能开放创新平台”来发展云端机器人,这就标志着达闼所提出的云端机器人技术已经得到了相关领域的专家、研究机构、学者的认可。

云端机器人怎样打造智慧大脑?


InfoQ:云端智能机器人的大脑特别重要。您能不能介绍一下这个智慧大脑是怎样获取知识、提升认知的?


王斌: 人类的智慧是我们研究人工智能最好的样本和出发点。在人类的进化过程当中,在人的大脑皮层通过神经元组成的神经网络,经过长年的人类进化训练最终构成了人类的智能。


认知是智慧生命的更高级阶段,人类认知的能力要比其他的低级动物的认知能力更强。认知能力体现在人的语言、行动上,本质则是推理和决策,而推理和决策是通过大量的训练形成的。所以人类在训练中提升自己的认知水平,比如说从刚出生的婴儿到少年、青年、成人,在大脑中是在不断通过神经元组成的神经网络训练各种智能,最后形成了智慧。大脑记忆也是神经网络,记忆流程在大脑中形成了训练好的神经网络。自我意识也是神经网络,大脑通过日积月累,形成各种各样的神经网络之后,就产生了自主意识。


在机器人大脑当中,我们也要构成机器人的神经网络。人工智能从 2006 年开始进入到了新的发展阶段,就是以深度学习为主的神经网络的发展,使人工智能的各种技术应用快速推进。现在人工智能可以下棋、写诗、作画,这些都是神经网络的算法。很多神经网络的能力已经超过了人类的水平。


目前人工智能的发展又迈入到了新的阶段。现在很多人工智能技术可以归结为一种互联网 AI,而下一步的发展目标就是机器人 AI。机器人有像人一样的身体,除了有感知能力之外还有运动能力。我们把机器人智能叫做“具身智能”,具身智能不仅有思维智能,还包括行为智能。思维智能和行为智能相互影响,思维来指导行为,行为也在反哺思维。机器人智能需要一种全新的方法来提高机器人的 AI 能力,为此达闼黄晓庆先生提出了 HARIX 架构平台,能够让机器人的智能像人类一样,从出生到成长,逐步有了各种各样的知识、智能。这样的过程就是在模仿人类来构建未来的智能机器人。


我们的平台叫做 HARIX。HA 是 Human Augmented 的简写,就是人工增强的意思,指我们人类教会机器人逐步提高技能。RI 是 Robotics Intelligence,就是机器人智能神经网络。我们为机器人提供了各种各样的示范教学后,机器人要在监督学习下在各种场景中通过完成任务形成和训练自己的神经网络。X 是指 eXtreme Reality,指与物理世界极致真实的数字孪生世界。我们把这样的极致真实的数字孪生世界称为“机器人元宇宙”。所有的人工示教训练、机器人算法优化训练都可以放在机器人元宇宙中,在虚拟的数字化空间中训练。这个数字化空间是同实际的物理世界实时同步映射的,这样可以大大降低成本、提高速度。


达闼构建的 HARIX 架构就是模拟人类的大脑智能成长的过程来构建的机器人大脑。有很多重要的基本能力在人类看来都非常简单,可机器人却是欠缺的,其中很重要的一点就是人类有很多常识。


常识也是人类构成智能的基础。常识是人在成长过程当中,从一出生就开始感受这个世界,形成的对世界的正确认知。人在成长过程中都有大脑在计算,无论人在做什么事情都希望有低成本的行为来达到自己的目的,这个低成本实际上就是常识。而强化学习也是在成本最优的情况下形成神经网络,云端机器人大脑就是帮助机器人在感知、认知和推理过程中形成智能。


InfoQ:元宇宙和数字孪生这两个概念非常火,那么达闼科技在这些方面正在做怎样的探索呢?


王斌: 元宇宙是机器人理解物理世界的重要平台。我们只有把物理世界数字化,才能让机器人,或者人工智能感知、理解这个世界。元宇宙也是人和机器人沟通的平台。比如人可以远程和机器人互动或者控制,可以通过 VR 设备进入机器人元宇宙中和机器人互动。


另一方面,未来的世界是人机共生的世界,会有大量智能机器人在我们的日常生活当中出现。人机共生是今后人类社会的基本常态。元宇宙不简单是人和人之间在虚拟环境当中交互,实际上它是人机融合的元宇宙。这里当然包括人和人之间的互动,也包括人和机之间的互动,还包括机和机之间的互动。

云端机器人与 5G 技术


InfoQ:云端智能机器人能够成为 5G 的杀手应用吗?


王斌: 5G 技术目前已经得到了广泛的普及和应用,5G 在现有移动通讯技术基础上有大幅提升,提供了低延时、高带宽、大并发等能力。但这些能力在手机等应用场景上,实际上并没有给我们带来更新的体验,那么我们就在考虑给 5G 赋予哪些新的应用场景。


黄晓庆先生就提出来,云端机器人是 5G 的新物种。云端机器人需要大量的算力在云端完成,机器人本体在执行任务的时候要跟云通讯,就需要低延时、高带宽。同时未来的机器人数量可能达到几十亿,一定需要大并发。这样的需求只有 5G、6G 才能够满足。也就是说云端机器人在未来离不开 5G 这样的高速通讯网络,同时这样的高速通讯网络的杀手级应用之一就是未来的智能机器人。


我们现在的智能机器人实际上处于初级阶段,主要用来完成专用的某一项功能,比如说迎宾接待机器人就完成迎宾接待这样的工作。这类工作所需要的算力、数据都是有限的,现有的通讯网络可以满足它的要求。


所以我们现在采用的技术是云、边、端结合的系统,有些算法在云端处理,有些可以在本地完成。我们的云、边、端系统是根据不同的应用场景按照分布式架构来部署,这样就可以最大限度平衡云、网、端之间的资源,来完成相应场景的工作。

人形智能机器人成为行业拐点


InfoQ:黄晓庆老师在今年达闼举行的开发者大会上做出了判断,认为现在整个机器人行业已经走到了从功能到智能的市场爆发拐点上。那么这里面的智能具体体现在哪些方面?


王斌: 这个拐点今年已经开始到来。首先,今年我们看到有很多突破性的技术在解决通用智能的挑战,也就是说机器人,开始拥有了像人类一样聪明的大脑。第二点,机器人本体的灵巧性和运动能力在突飞猛进地发展。我们达闼做出了人形机器人,其他公司也在做类似的产品,所以机器人行业就是从功能走到了智能,马上要迎来市场爆发了。


我们现在做人形机器人一定要按照人类的形态去做,这里边有几点非常重要的因素。第一就是我们人类生活的空间,无论是房间的大小、门的宽窄、桌椅的高低,这些都是为人来设计的。我们的机器人也要像人这样的体型,才能够在人类这个环境中工作。包括机器人手的大小也要和人手相近,也要有五指,这些都是必不可少的。否则人类能够使用的工具,机器人没有这样灵巧的手就使用不了,如何能够跟我们人类共存?第二点就是人有同情心、同理心,看到长相类似同类的机器人会感到更亲切。这两点意味着人形机器人会是未来最有价值的品类。三是,机器人通过模仿人类的行为进行学习,也需要在形体上与人类接近,我们人类可以通过示教的方法来教机器人,就像人类教自己的孩子一样。


但做人形机器人难度很大。我们人有两百多个关节,对应到机器人身上就是驱动装置的执行器,有的也叫关节。不同尺寸的机器人关节既要保证灵活性,也要保证精度。关节是最核心的机器人硬件,达闼的解决方案叫智能柔性执行器(SCA)。智能柔性关节具有高度集成性,包括编码器、伺服驱动器、伺服电机、减速器等核心部件高度集成在一起。现在国内国外两百多家机器人企业、研究机构都在用我们的 SCA 在组装机器人。我们的人形机器人现在有 34 个关节,未来的机器人会有 40 多个关节,能够更灵活地完成各种各样的任务。


关节的数量不是越多越好,因为人类有两百多个关节,机器人肯定用不了这么多。机器人可以先完成一些相对不是特别精细化的工作,它所需要的关节数量就不一定有这么多。这里边还涉及到精度,工业机器人的精度要求非常高,因为它是在标准化的场景当中工作,精度会达到亚毫米级。而我们未来的机器人可能需要达到毫米级,这样的能力就可以满足工作的需要。


InfoQ:人形机器人在感觉和思维方面要接近人类,从技术的角度来看还有哪些比较困难的地方?


王斌: 这也是人工智能行业最大的挑战,涉及的技术非常多。对达闼来说,我们首先要为机器人构建机器人的元宇宙,构建更逼真、覆盖更广、数据更丰富的数字化孪生世界。


第二点,在这个机器人元宇宙当中,有各种各样的机器人数字孪生智能体,智能机器人在这个环境当中可以学习各种知识,可以通过虚实结合提升自己的能力,最后所有这些能力又可以在我们的平台上共享。就像互联网的应用有各种各样的应用生态,机器人也会有机器人的 APP 可以下载。我们这个平台还能管理机器人,和机器人形成安全的交互。


所有这些技术融合在一起非常复杂,不仅需要达闼公司来做这个事情,也需要我们的产业生态一起来做。我们构建的是开放的海睿平台,这个平台可以让应用开发者和 AI 服务商都可以为机器人来赋能,来解决各种各样的机器人场景应用挑战。因为未来的机器人会有非常多的应用场景,我们海睿平台最大的价值就是让所有的开发者都可以快速开发人形机器的场景应用。同时我们构建的机器人本体,包括它的关节、内部的控制结构,都可以让第三方的机器人厂商用来组装各种各样形态的机器人。


我们达闼是在大脑、平台、机器人本体、核心部件、操作系统和整个生态领域都在做工作。有了海睿这样的平台,才能更好地推进智能机器人、人形机器人未来的技术发展,推进各种各样的行业场景应用。


我们的海睿平台一开始主要是 2B,未来肯定是要做到 2C 场景的。我们也提出来了“机器人保姆”的概念,未来我们每个家庭都会有机器人保姆来陪伴。我们相信再过三年,我们的人形保姆机器人一定会走向家庭。到了 2035 年,人形机器人将像汽车一样变得越来越普及,走进千家万户。这是我们对未来的分析和判断,也是我们未来的工作重点。


InfoQ:您觉得智能机器人行业现在还存在哪些挑战,未来 5 到 10 年的发展前景会是什么样子,有哪些技术趋势是大家应该从现在就开始关注的?


王斌: 这里边最主要的问题是,我们需要像智能手机这样成功的产业思路去发展智能机器人。未来的智能机器人如何像智能手机一样形成大型生态产业,这往往比某项技术更加重要。因为任何机器人都需要本体的强大硬件能力,同时又需要很好的平台支撑。这就需要有产业链上的各种各样的角色完成各种各样的工作。硬件要有硬件的一套核心标准体系,软件要有软件的一套以操作系统为核心的开发生态。只有形成这样的产业生态,未来智能机器人行业,才能实现真正快速地发展。


机器人领域也是有一些评价标准的,只不过这个标准还没有形成共识。我们达闼也提出来了五代标准概念,第一代就是工业机器人,主要完成简单重复动作,没有传感器。第二代叫协作机器人,加入了一些传感器。第三代的机器人可以自动行走,运动能力非常强,可以规划路线、避开障碍物。第四代的机器人在某些功能场景下可以有一些职业能力,比如它能够和人类对话,可以结合视觉移动操作物体。第五代就是通用人工智能机器人,要求机器人的大脑就像人类大脑皮层结构一样,通过云计算中心集成算法、数据、算力,可以无限扩展。同时它还具备学习、推理、想象、记忆的能力,这样来提升认知水平。从这个角度来讲,我们的云端智能机器人的云、网、端架构,是未来机器人的终极架构形态。


当然了,机器人可以有不同的应用场景,并不是说所有场景都需要通用人工智能机器人,有的场景就可以用工业机器人解决。未来不同类型的机器人会共存,就像我们生活的这个大自然会有不同智能的生物体一样,形成生态平衡。


InfoQ:现在的人形机器人还会使受众陷入“恐怖谷”效应吗?您和您的团队是怎么解决这方面的问题的?


王斌: 我觉得这有适应的过程。从现在来看,我们还远远没有达到做得完全逼真,真正能够像人的水平。这还是逐步发展的过程。随着我们人类文明的不断进步,人类也会不断接受新鲜事物。比如说新时代的年轻人从小就生活在计算机、互联网场景中,他们对新技术的接受能力就跟我们这一代的接受能力不一样。所以未来当我们走到人机共融的社会形态后,新的一代会更自然地接受智能机器人生活在我们的周围,跟我们形成人机共生的全新社会。

达闼与 OpenI 启智社区


InfoQ:您能不能分享一下您和 OpenI 社区结缘的经历,这个社区有哪些特别吸引您的地方?


王斌:我们和 OpenI 社区在 2020 年就一起启动了 HARIX 面向机器人的交互操作模型库项目。这是在人工智能领域的首个机器人交互操作的开源项目。这个项目一经推出,也受到了很多高校和科研院所的支持。


OpenI 最吸引我们的地方,还是启智社区有很多的激励政策来激励开发者进行开源的贡献。达闼也非常重视开源生态建设。未来的智能机器人产业需要大量的开发者、参与者来进行相关建设。我们要把机器人的智能做成一种服务,OpenI 启智社区可以给我们提供很好的,与开发者交流、互动的场所。


我们同启智社区每年都有线上、线下的活动,邀请行业专家、企业大咖和全球开发者一起来探讨人工智能和机器人相关的主题。现在我们正在和启智社区一起筹建新一代云端机器人产业开放和创新联盟,希望通过这样的联盟建设,让更多科研院所、高校、企业以及开发者能够加入到联盟当中,形成一种协同创新、共建共享的氛围,把云端机器人生态建设好,形成良性发展的循环。

嘉宾介绍


王斌,达闼机器人副总裁。达闼成立于 2015 年,是智能机器人领域的独角兽头部企业,全球领先的云端机器人创造者、制造商和运营商。公司围绕“机器人服务于人、达闼服务机器人”的战略使命和“云端智能,连接未来”的美好愿景,旨在通过持续引领云端机器人前沿技术研究与产业化应用,让云端机器人走进千家万户,帮助人类完成 4D(如枯燥、肮脏、危险、甚至困难的)工作,让人类尽享更美好的生活。

2022-11-29 16:212206
用户头像
刘燕 InfoQ高级技术编辑

发布了 1010 篇内容, 共 373.5 次阅读, 收获喜欢 1768 次。

关注

评论

发布
暂无评论
发现更多内容

Vue虚拟dom是如何被创建的

yyds2026

Vue

Vue模板是怎样编译的

yyds2026

Vue

深入nodejs的event-loop

coder2028

node.js

原生拖拽太拉跨了,纯JS自己手写一个拖拽效果,纵享丝滑

茶无味的一天

CSS html HTML5, CSS3 拖拉拽 原生js

0元上新丨PostgreSQL零基础开发指南+223页学习资料

博文视点Broadview

引擎上新|卡片焕新升级,信息高效呈现

Jianmu

DevOps 持续集成 CI/CD

【1024程序员节专访】聚焦行业前沿,共话IT发展趋势

博睿数据

程序员 可观测性 智能运维 博睿数据 IT行业

文读懂NodeJs知识体系和原理浅析

coder2028

node.js

Redis 知识点全面击破,多图警告

小小怪下士

Java redis 程序员

js对象和原型、原型链的关系

hellocoder2029

JavaScript

京东云开发者|ElasticSearch降本增效常见的方法

京东科技开发者

elasticsearch ES 降本增效 数据压缩 存储计算分离

5 why 分析法,一种用于归纳抽象出解决方案的好方法

SaaS创业之路

JavaScript模板字符串与es6中let的用法

何极光

ES6 let 模板字符串 10月月更

Java:既然有了synchronized,为什么还要提供Lock

华为云开发者联盟

Java 开发 华为云 企业号十月 PK 榜

Workflow,要不要了解一下

华为云开发者联盟

人工智能 华为云 企业号十月 PK 榜

云安全系列2:访问安全和身份管理

HummerCloud

云计算 云安全 iam 身份和访问管理 10月月更

Vue组件是怎样挂载的

yyds2026

Vue

SAP | 子例程

暮春零贰

SAP 10月月更 子例程

webpack模块化的原理

Geek_02d948

webpack

彻底搞懂nodejs事件循环

coder2028

node.js

SAP | 功能模块

暮春零贰

SAP 功能块 10月月更

js进阶手写常见函数

hellocoder2029

JavaScript

js异步编程的三种模式

hellocoder2029

JavaScript

webpack实战,手写loader和plugin

Geek_02d948

webpack

【文本检测与识别白皮书-3.2】第二节:场景文本识别方法

合合技术团队

人工智能 深度学习 文字识别 OCR 文本识别

漏洞评分高达9.8分!Text4Shell 会是下一个 Log4Shell吗?

SEAL软件供应链安全

安全 log4j 漏洞分析 Log4j2 漏洞 软件供应链安全

从 wepy 到 uniapp 变形记

vivo互联网技术

wepy uni-app 前端 编译器

实用的正则表达式知识【建议收藏】

何极光

正则表达式 10月月更 RegExp

云小课|MRS基础原理之Oozie任务调度

华为云开发者联盟

大数据 华为云 企业号十月 PK 榜

线上数据问题排查案例分享-因为 HMS 和底层 orc 文件中某字段的数据精度不一致造成的数据丢失问题

明哥的IT随笔

hadoop hive DataX

Webpack配置实战

Geek_02d948

webpack

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?_AI_刘燕_InfoQ精选文章