【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?

  • 2022-11-29
    北京
  • 本文字数:6470 字

    阅读完需:约 21 分钟

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?

智能机器人是科幻作品中经久不衰的元素之一。经过科技行业数十年的不懈努力,今天我们终于看到了智能机器人走进日常生产生活的曙光。在云计算和人工智能技术的帮助下,机器人在不久的将来有望通过高水平的“智慧大脑”,帮助人类完成一系列工作。


InfoQ 极客有约与 OpenI 启智社区联合推出的系列直播栏目最近就邀请到了国内智能机器人领域独角兽企业,达闼机器人副总裁王斌来做分享,探讨基于云计算技术的云端机器人如何获取知识、提升认知能力,实现自我进化相关的话题。


InfoQ 将本期节目的内容编辑整理成文。

什么是云端机器人?


InfoQ:达闼在机器人领域处于国内领先水平,公司创始人黄晓庆老师在 2012 年率先提出了云端智能机器人架构。什么是云端智能机器人,请王老师科普一下。


王斌: 机器人最早的成熟应用是在传统的工业领域,例如很多自动化生产线上有很多机械臂来完成零件的组装、喷漆等工作,叫工业机器人。现在我们的生活中也出现了一些能自主导航避障的机器人,如室内的送货机器人、家庭清洁用的小型机器人。而在传统的工业机器人和自动导航避障机器人基础上进一步发展,就有了我们现在提到的智能机器人。


智能机器人和前两者有很大差别:传统的工业机器人关注的是机械臂相关的运动学和动力学技术,自主导航避障机器人主要是在相对简单封闭的空间完成单一的功能,而智能机器人要在更开放的环境下完成各种任务,是多功能的机器人。智能机器人需要更多人工智能相关的技术,包括更多算力、数据,需要更多 AI 服务的支撑。


算力、大数据和 AI 模型是人工智能的三驾马车。要达到较高的智能水平需要非常强大的智能系统,单纯在传统机器人的技术架构下很难实现,因为它需要非常大的存储空间和计算能力。所以达闼公司的创始人兼 CEO 黄晓庆先生很早就提出来,未来的机器人一定是“云、网、端”融合的机器人。


云是指利用云计算相关技术,构建具有超大算力和数据的机器人大脑;网是通过 5G 相关的技术,将云计算与机器人本体连接起来;端就是机器人本体,也具有一定的计算能力,可以提供本体的感觉、执行能力。这样的云网端构成了机器人的大脑、神经中枢系统、末端感觉器官和执行器官这样的整体,这就是黄晓庆提出来的”云端机器人”架构。


计算机领域的科研专家主导的人工智能技术,和自动化领域专家主导的机器人技术,这两者由于学科历史发展原因,研究方向不太一致。而今天这两方面的专家逐步开始走向融合,但国内缺乏这两方面都非常专业的技术人员。


我们达闼在做的事情就是填补这一空白,把人工智能和机器人充分结合在一起。2015 年我们开始做云端机器人,成立了达闼公司,在 2019 年实现了云端机器人的商用化。今年国家科技部批复,支持达闼建设“云端机器人国家新一代人工智能开放创新平台”来发展云端机器人,这就标志着达闼所提出的云端机器人技术已经得到了相关领域的专家、研究机构、学者的认可。

云端机器人怎样打造智慧大脑?


InfoQ:云端智能机器人的大脑特别重要。您能不能介绍一下这个智慧大脑是怎样获取知识、提升认知的?


王斌: 人类的智慧是我们研究人工智能最好的样本和出发点。在人类的进化过程当中,在人的大脑皮层通过神经元组成的神经网络,经过长年的人类进化训练最终构成了人类的智能。


认知是智慧生命的更高级阶段,人类认知的能力要比其他的低级动物的认知能力更强。认知能力体现在人的语言、行动上,本质则是推理和决策,而推理和决策是通过大量的训练形成的。所以人类在训练中提升自己的认知水平,比如说从刚出生的婴儿到少年、青年、成人,在大脑中是在不断通过神经元组成的神经网络训练各种智能,最后形成了智慧。大脑记忆也是神经网络,记忆流程在大脑中形成了训练好的神经网络。自我意识也是神经网络,大脑通过日积月累,形成各种各样的神经网络之后,就产生了自主意识。


在机器人大脑当中,我们也要构成机器人的神经网络。人工智能从 2006 年开始进入到了新的发展阶段,就是以深度学习为主的神经网络的发展,使人工智能的各种技术应用快速推进。现在人工智能可以下棋、写诗、作画,这些都是神经网络的算法。很多神经网络的能力已经超过了人类的水平。


目前人工智能的发展又迈入到了新的阶段。现在很多人工智能技术可以归结为一种互联网 AI,而下一步的发展目标就是机器人 AI。机器人有像人一样的身体,除了有感知能力之外还有运动能力。我们把机器人智能叫做“具身智能”,具身智能不仅有思维智能,还包括行为智能。思维智能和行为智能相互影响,思维来指导行为,行为也在反哺思维。机器人智能需要一种全新的方法来提高机器人的 AI 能力,为此达闼黄晓庆先生提出了 HARIX 架构平台,能够让机器人的智能像人类一样,从出生到成长,逐步有了各种各样的知识、智能。这样的过程就是在模仿人类来构建未来的智能机器人。


我们的平台叫做 HARIX。HA 是 Human Augmented 的简写,就是人工增强的意思,指我们人类教会机器人逐步提高技能。RI 是 Robotics Intelligence,就是机器人智能神经网络。我们为机器人提供了各种各样的示范教学后,机器人要在监督学习下在各种场景中通过完成任务形成和训练自己的神经网络。X 是指 eXtreme Reality,指与物理世界极致真实的数字孪生世界。我们把这样的极致真实的数字孪生世界称为“机器人元宇宙”。所有的人工示教训练、机器人算法优化训练都可以放在机器人元宇宙中,在虚拟的数字化空间中训练。这个数字化空间是同实际的物理世界实时同步映射的,这样可以大大降低成本、提高速度。


达闼构建的 HARIX 架构就是模拟人类的大脑智能成长的过程来构建的机器人大脑。有很多重要的基本能力在人类看来都非常简单,可机器人却是欠缺的,其中很重要的一点就是人类有很多常识。


常识也是人类构成智能的基础。常识是人在成长过程当中,从一出生就开始感受这个世界,形成的对世界的正确认知。人在成长过程中都有大脑在计算,无论人在做什么事情都希望有低成本的行为来达到自己的目的,这个低成本实际上就是常识。而强化学习也是在成本最优的情况下形成神经网络,云端机器人大脑就是帮助机器人在感知、认知和推理过程中形成智能。


InfoQ:元宇宙和数字孪生这两个概念非常火,那么达闼科技在这些方面正在做怎样的探索呢?


王斌: 元宇宙是机器人理解物理世界的重要平台。我们只有把物理世界数字化,才能让机器人,或者人工智能感知、理解这个世界。元宇宙也是人和机器人沟通的平台。比如人可以远程和机器人互动或者控制,可以通过 VR 设备进入机器人元宇宙中和机器人互动。


另一方面,未来的世界是人机共生的世界,会有大量智能机器人在我们的日常生活当中出现。人机共生是今后人类社会的基本常态。元宇宙不简单是人和人之间在虚拟环境当中交互,实际上它是人机融合的元宇宙。这里当然包括人和人之间的互动,也包括人和机之间的互动,还包括机和机之间的互动。

云端机器人与 5G 技术


InfoQ:云端智能机器人能够成为 5G 的杀手应用吗?


王斌: 5G 技术目前已经得到了广泛的普及和应用,5G 在现有移动通讯技术基础上有大幅提升,提供了低延时、高带宽、大并发等能力。但这些能力在手机等应用场景上,实际上并没有给我们带来更新的体验,那么我们就在考虑给 5G 赋予哪些新的应用场景。


黄晓庆先生就提出来,云端机器人是 5G 的新物种。云端机器人需要大量的算力在云端完成,机器人本体在执行任务的时候要跟云通讯,就需要低延时、高带宽。同时未来的机器人数量可能达到几十亿,一定需要大并发。这样的需求只有 5G、6G 才能够满足。也就是说云端机器人在未来离不开 5G 这样的高速通讯网络,同时这样的高速通讯网络的杀手级应用之一就是未来的智能机器人。


我们现在的智能机器人实际上处于初级阶段,主要用来完成专用的某一项功能,比如说迎宾接待机器人就完成迎宾接待这样的工作。这类工作所需要的算力、数据都是有限的,现有的通讯网络可以满足它的要求。


所以我们现在采用的技术是云、边、端结合的系统,有些算法在云端处理,有些可以在本地完成。我们的云、边、端系统是根据不同的应用场景按照分布式架构来部署,这样就可以最大限度平衡云、网、端之间的资源,来完成相应场景的工作。

人形智能机器人成为行业拐点


InfoQ:黄晓庆老师在今年达闼举行的开发者大会上做出了判断,认为现在整个机器人行业已经走到了从功能到智能的市场爆发拐点上。那么这里面的智能具体体现在哪些方面?


王斌: 这个拐点今年已经开始到来。首先,今年我们看到有很多突破性的技术在解决通用智能的挑战,也就是说机器人,开始拥有了像人类一样聪明的大脑。第二点,机器人本体的灵巧性和运动能力在突飞猛进地发展。我们达闼做出了人形机器人,其他公司也在做类似的产品,所以机器人行业就是从功能走到了智能,马上要迎来市场爆发了。


我们现在做人形机器人一定要按照人类的形态去做,这里边有几点非常重要的因素。第一就是我们人类生活的空间,无论是房间的大小、门的宽窄、桌椅的高低,这些都是为人来设计的。我们的机器人也要像人这样的体型,才能够在人类这个环境中工作。包括机器人手的大小也要和人手相近,也要有五指,这些都是必不可少的。否则人类能够使用的工具,机器人没有这样灵巧的手就使用不了,如何能够跟我们人类共存?第二点就是人有同情心、同理心,看到长相类似同类的机器人会感到更亲切。这两点意味着人形机器人会是未来最有价值的品类。三是,机器人通过模仿人类的行为进行学习,也需要在形体上与人类接近,我们人类可以通过示教的方法来教机器人,就像人类教自己的孩子一样。


但做人形机器人难度很大。我们人有两百多个关节,对应到机器人身上就是驱动装置的执行器,有的也叫关节。不同尺寸的机器人关节既要保证灵活性,也要保证精度。关节是最核心的机器人硬件,达闼的解决方案叫智能柔性执行器(SCA)。智能柔性关节具有高度集成性,包括编码器、伺服驱动器、伺服电机、减速器等核心部件高度集成在一起。现在国内国外两百多家机器人企业、研究机构都在用我们的 SCA 在组装机器人。我们的人形机器人现在有 34 个关节,未来的机器人会有 40 多个关节,能够更灵活地完成各种各样的任务。


关节的数量不是越多越好,因为人类有两百多个关节,机器人肯定用不了这么多。机器人可以先完成一些相对不是特别精细化的工作,它所需要的关节数量就不一定有这么多。这里边还涉及到精度,工业机器人的精度要求非常高,因为它是在标准化的场景当中工作,精度会达到亚毫米级。而我们未来的机器人可能需要达到毫米级,这样的能力就可以满足工作的需要。


InfoQ:人形机器人在感觉和思维方面要接近人类,从技术的角度来看还有哪些比较困难的地方?


王斌: 这也是人工智能行业最大的挑战,涉及的技术非常多。对达闼来说,我们首先要为机器人构建机器人的元宇宙,构建更逼真、覆盖更广、数据更丰富的数字化孪生世界。


第二点,在这个机器人元宇宙当中,有各种各样的机器人数字孪生智能体,智能机器人在这个环境当中可以学习各种知识,可以通过虚实结合提升自己的能力,最后所有这些能力又可以在我们的平台上共享。就像互联网的应用有各种各样的应用生态,机器人也会有机器人的 APP 可以下载。我们这个平台还能管理机器人,和机器人形成安全的交互。


所有这些技术融合在一起非常复杂,不仅需要达闼公司来做这个事情,也需要我们的产业生态一起来做。我们构建的是开放的海睿平台,这个平台可以让应用开发者和 AI 服务商都可以为机器人来赋能,来解决各种各样的机器人场景应用挑战。因为未来的机器人会有非常多的应用场景,我们海睿平台最大的价值就是让所有的开发者都可以快速开发人形机器的场景应用。同时我们构建的机器人本体,包括它的关节、内部的控制结构,都可以让第三方的机器人厂商用来组装各种各样形态的机器人。


我们达闼是在大脑、平台、机器人本体、核心部件、操作系统和整个生态领域都在做工作。有了海睿这样的平台,才能更好地推进智能机器人、人形机器人未来的技术发展,推进各种各样的行业场景应用。


我们的海睿平台一开始主要是 2B,未来肯定是要做到 2C 场景的。我们也提出来了“机器人保姆”的概念,未来我们每个家庭都会有机器人保姆来陪伴。我们相信再过三年,我们的人形保姆机器人一定会走向家庭。到了 2035 年,人形机器人将像汽车一样变得越来越普及,走进千家万户。这是我们对未来的分析和判断,也是我们未来的工作重点。


InfoQ:您觉得智能机器人行业现在还存在哪些挑战,未来 5 到 10 年的发展前景会是什么样子,有哪些技术趋势是大家应该从现在就开始关注的?


王斌: 这里边最主要的问题是,我们需要像智能手机这样成功的产业思路去发展智能机器人。未来的智能机器人如何像智能手机一样形成大型生态产业,这往往比某项技术更加重要。因为任何机器人都需要本体的强大硬件能力,同时又需要很好的平台支撑。这就需要有产业链上的各种各样的角色完成各种各样的工作。硬件要有硬件的一套核心标准体系,软件要有软件的一套以操作系统为核心的开发生态。只有形成这样的产业生态,未来智能机器人行业,才能实现真正快速地发展。


机器人领域也是有一些评价标准的,只不过这个标准还没有形成共识。我们达闼也提出来了五代标准概念,第一代就是工业机器人,主要完成简单重复动作,没有传感器。第二代叫协作机器人,加入了一些传感器。第三代的机器人可以自动行走,运动能力非常强,可以规划路线、避开障碍物。第四代的机器人在某些功能场景下可以有一些职业能力,比如它能够和人类对话,可以结合视觉移动操作物体。第五代就是通用人工智能机器人,要求机器人的大脑就像人类大脑皮层结构一样,通过云计算中心集成算法、数据、算力,可以无限扩展。同时它还具备学习、推理、想象、记忆的能力,这样来提升认知水平。从这个角度来讲,我们的云端智能机器人的云、网、端架构,是未来机器人的终极架构形态。


当然了,机器人可以有不同的应用场景,并不是说所有场景都需要通用人工智能机器人,有的场景就可以用工业机器人解决。未来不同类型的机器人会共存,就像我们生活的这个大自然会有不同智能的生物体一样,形成生态平衡。


InfoQ:现在的人形机器人还会使受众陷入“恐怖谷”效应吗?您和您的团队是怎么解决这方面的问题的?


王斌: 我觉得这有适应的过程。从现在来看,我们还远远没有达到做得完全逼真,真正能够像人的水平。这还是逐步发展的过程。随着我们人类文明的不断进步,人类也会不断接受新鲜事物。比如说新时代的年轻人从小就生活在计算机、互联网场景中,他们对新技术的接受能力就跟我们这一代的接受能力不一样。所以未来当我们走到人机共融的社会形态后,新的一代会更自然地接受智能机器人生活在我们的周围,跟我们形成人机共生的全新社会。

达闼与 OpenI 启智社区


InfoQ:您能不能分享一下您和 OpenI 社区结缘的经历,这个社区有哪些特别吸引您的地方?


王斌:我们和 OpenI 社区在 2020 年就一起启动了 HARIX 面向机器人的交互操作模型库项目。这是在人工智能领域的首个机器人交互操作的开源项目。这个项目一经推出,也受到了很多高校和科研院所的支持。


OpenI 最吸引我们的地方,还是启智社区有很多的激励政策来激励开发者进行开源的贡献。达闼也非常重视开源生态建设。未来的智能机器人产业需要大量的开发者、参与者来进行相关建设。我们要把机器人的智能做成一种服务,OpenI 启智社区可以给我们提供很好的,与开发者交流、互动的场所。


我们同启智社区每年都有线上、线下的活动,邀请行业专家、企业大咖和全球开发者一起来探讨人工智能和机器人相关的主题。现在我们正在和启智社区一起筹建新一代云端机器人产业开放和创新联盟,希望通过这样的联盟建设,让更多科研院所、高校、企业以及开发者能够加入到联盟当中,形成一种协同创新、共建共享的氛围,把云端机器人生态建设好,形成良性发展的循环。

嘉宾介绍


王斌,达闼机器人副总裁。达闼成立于 2015 年,是智能机器人领域的独角兽头部企业,全球领先的云端机器人创造者、制造商和运营商。公司围绕“机器人服务于人、达闼服务机器人”的战略使命和“云端智能,连接未来”的美好愿景,旨在通过持续引领云端机器人前沿技术研究与产业化应用,让云端机器人走进千家万户,帮助人类完成 4D(如枯燥、肮脏、危险、甚至困难的)工作,让人类尽享更美好的生活。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-11-29 16:212997
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 489.9 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

红河州加速区块链等新技术与实体经济的深度融合

CECBC

数字经济

深圳程序员自谋生路的2020

鸠摩智首席音效师

开源 程序员 在线教育 创业者 深圳

Flink SQL 在字节跳动的优化与实践

Apache Flink

flink

【面试必备】Swift 面试题及其答案

ios swift

常见运维监控系统的技术选型

OpsMind

运维 监控系统

十年磨一剑,腾讯云数据库品牌重磅升级, “企业级分布式数据库TDSQL”来了!

数据君

七大步骤、备战60天,4面拿下字节跳动offer:时间规划+知识点+画脑图+做笔记+看书+看视频+刷题刷题

Java 程序员 面试

懂点EXCEL就行!教你利用Python做数据筛选(上)

智分析

Python Excel 数据清洗

腾讯云数据库品牌升级,大咖解读数据库三大变化

数据君

《程序员修炼之道》- 务实的哲学(1)

石云升

程序员 28天写作

Postgreshub中文资源网介绍

PostgreSQLChina

数据库 postgresql 开源 软件 开源社区

连肝7个晚上,总结了计算机网络的知识点!(共66条)

我是哪吒

程序员 面试 浏览器 计算机网络 HTTP

Vue.js笔试题解决业务中常见问题

我是哪吒

程序员 面试 Vue 大前端

产品思维和产品意识

ALone

LeetCode题解:389. 找不同,ASCII码求和,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

产品经理训练营第 0 期 第二次作业

孙行者

第0期 产品经理训练营

第二周-作业-胡赵凯

hisun胡

产品经理 产品经理训练营

阿里P8亲测能实战落地的SpringCloud开发笔记已开源

996小迁

Java 程序员 架构 面试 SpringCloud

极客时间产品训练营第二周总结

云随心

产品 总结 产品训练营

图解 | 原来这就是TCP

程序员 网络协议 架构师

用APICloud开发iOS App Clip(苹果小程序)详细教程

YonBuilder低代码开发平台

小程序云开发 大前端 移动开发 APP开发

搞定万亿级MySQL海量存储的索引与分表设计实战

Java架构师迁哥

品牌升级后,TBase更名为TDSQL和TDSQL-A,CynosDB更名为TDSQL-C

数据君

别让假“努力”毁掉了你!面试了10家企业软件测试岗位,面试题整理

程序员阿沐

程序员 面试 软件测试 自动化测试 测试工程师

高承实:区块链是一个技术结构组织 而不是技术

CECBC

大数据

应对新冠病毒传播-粤政协委员建议构建公共卫生区块链平台

CECBC

区块链 公共卫生

测试一下

TJJ

目标岗位差异化对比

Geek_6a8931

极客时间产品训练营第二周作业

云随心

产品 第二周作业 产品训练营

从根上理解高性能、高并发(六):通俗易懂,高性能服务器到底是如何实现的

JackJiang

网络编程 高并发 高性能 即时通讯

挑战前端知识点HTTP/ECMAScript

我是哪吒

大前端 HTTP ES6

云端机器人的“智慧大脑”是如何获取知识、提升认知,完成进化的?_AI&大模型_刘燕_InfoQ精选文章