百度计划发布 BROAD 数据集,PaddlePaddle 公布三大功能升级

  • 陈思

2017 年 11 月 17 日

话题:百度AI

2017 年 11 月 16 日,一上午的新品轰炸之后,百度世界大会分论坛于下午两点正式开始。InfoQ 记者前往 AI 技术平台分论坛,从最前方为各位读者带来论坛的实况报道。

百度副总裁、AI 技术平台体系(AIG)总负责人王海峰首先亮相,在演讲中他表示:AI 作为新的生产力,积极为行业赋能,创造新的行业。据了解,百度在实践中已大量应用 AI 技术,同时,百度正在将这些 AI 能力全面开放,与合作伙伴和广大开发者一起,建设 AI 生态。

之后,百度各事业部负责人上台对百度近一段时间在 AI 领域取得的成果进行分享,不仅有全新的语音、视觉技术解决方案,还包括开源的深度学习平台 PaddlePaddle 升级,“BROAD”公开数据集发布计划等。

现场展示了一款智能即时翻译产品,名曰共享 Wifi 翻译机,演示过程中,即时翻译的功能让人印象深刻,也很切合大会“软硬一体”的主题,除了共享 Wifi 翻译机的口语和朗读语流、中英文等一体化建模技术,现场还分享了基于深度学习的情感拼接合成,有融合先进的识别与合成、低成本、低误报和高精度的语音技术。

视觉技术方面,据介绍,百度的视觉技术目前已经可以识别 8 万种物体,可以做到花卉、动物、车型、商品等细粒度图像识别;掌握从视频分类、检索、细粒度识别、比对、结构化分析等全面而完整的视频语义理解技术;实现从 2D 到 3D 的人脸识别。

自然语言处理方面,百度号称拥有最好的中文语言理解与交互、以及内容理解等技术。

知识图谱方面,百度方面介绍已拥有亿级实体、千亿事实,在此基础上能够做到丰富的知识标注和关联。在用户画像方面,百度拥有 10 亿画像,细分标签达到千万量级,可基于画像做出精准的个性化推荐。

王海峰说:“百度目前已经将 80 多项全球领先的 AI 能力和技术解决方案,开放开源给全社会使用。”百度自 7 月宣布开放 60 项核心 AI 技术能力后,迅速吸引了国内外开发者和合作伙伴的关注。目前,百度大脑已开放 80 多项核心 AI 能力,接入百度 AI 开放平台的开发者数量超过 37 万,百度大脑被内外部产品调用的次数达到每天 2188 亿次。

PaddlePaddle 与 BROAD

百度宣布即日起推出目前全球规模最大的“BROAD”百度 AI 公开数据集计划(Baidu Research Open-Access Dataset),包括室外场景理解数据集、视频精彩片段数据集、阅读理解数据集 3 个数据集。这些数据是百度 AI 生态的真实数据,有些是首次发布,有些是截止目前国际上发布的最大的数据集。百度 AI 公开数据集计划将在 2018 年开放更多数据,并推出供在校师生免费使用的 BROAD 云计算平台,共同推进 AI 技术的发展和落地。

此外,日前全球开发热度(用 Github pull request 数量衡量)增速最高的开源深度学习平台 PaddlePaddle 发布了三大新功能。

首先,PaddlePaddle Fluid 提供高级语言中的 while 和 if 等控制流结构提升使用者的开发效率,同时将利用编译优化技术保证计算性能。

其次,PaddlePaddle Cloud 支持使用者在浏览器里开发 AI 应用,在云端调试运行,使开发者不再需要在个人电脑和机群之间切换环境,显著提升工作效率;第三,PaddlePaddle EDL 是全球首个支持弹性作业调度的开源 AI 云解决方案,通过与 Kubernetes 合作实现弹性作业调度充分利用机群计算资源。此外,PaddlePaddle 目前已经支持 Android、iOS、Raspberry Pi 等常见移动平台,未来将支持 PX2/3 等为自动驾驶设计的车载电脑。

此外,本次论坛上,百度副总裁、AI 技术平台体系商业化总负责人杨涛宣布了百度全新的端到端数据智能平台和智慧机场两大行业解决方案,推动 AI 技术的商业化进程。

AI 新时代已经到来。百度人工智能已经在交通、教育、医疗、娱乐等行业结合场景进行多技术综合应用,人工智能作为新的生产力,优势愈发明显。百度最懂 AI,这句话是上午主论坛提出的,这句话能否成为百度对 AI 从一而终的信条,让我们拭目以待。

另附百度副总裁、AI 技术平台体系(AIG)总负责人王海峰演讲全文:

各位来宾、各位朋友,大家下午好!

非常欢迎大家来到百度 AI 技术与平台论坛,今天上午,大家看到了很多激动人心的展示。我很高兴地告诉大家,这些展示的背后都有百度的 AI 技术。今天下午,我们会向大家展示百度 AI 技术,它不仅可以为百度的产品赋能,同时也会为我们的合作伙伴、开发者赋能,让我们整个社会一起共享 AI 的力量。

我们正处于一个 AI 的新时代,前面的暖场视频大家也看到了很多伟大的科学家、工程师和发明家,而他们的名字都和同一个词连接在一起,就是科技。我们都知道,科学技术是第一生产力,从十八世纪的第一次工业革命开始,科学技术就将巨大的自然力和自然科学融入人们的生产中,从而大大提升了生产力,进而改变了社会关系,让我们的生活变得越来越美好;十九世纪的第二次工业革命,将整个人类社会带进电气时代;二十世纪第三次工业革命,又将人类带入了信息时代。而我们是幸运的,能处于第四次非常伟大的科技变革中,而这次的核心驱动力就是人工智能。

相信大家都知道,十九大报告中提到,要推动互联网、大数据、人工智能和实体经济深度融合。今年 7 月国务院发布的《新一代人工智能发展规划》也指出,人工智能成为经济发展的新引擎,人工智能将带来社会建设的新机遇。过去几年,人工智能的投资一直在飞速增长,可以预见,人工智能仍然还会保持高速增长的势头。

所以我们说,人工智能已经成为新的生产力,成为 AI 时代最重要的生产力。它既可以赋能很多传统行业,为每一个行业提升效率,为每一个行业带来新机遇,同时还会创造很多新的产品、新的行业和新的机遇。

说起百度的 AI 实践,百度 AI 已经赋能不同的产品和业务。

比如在百度 FEED 上,通过内容质量识别,每天可以减少上亿低质内容的分发,提升编辑人工效率 60% 以上;在视频分类和比对方面,现在的分类准确率已超过 90%。相信大家使用 FEED 流的时候会有一种感受,有一定概率会出现曾经看过的视频。视频重复出现会让用户有不好的体验,因此,视频去重能力就尤为重要。但视频去重依靠人工实现,是非常耗时耗力的事,而通过视频比对技术,可将人工比对成本大幅降低(降低约 80%)。

还有另外一个例子,是关于智能客服。今天上午的主论坛上多次提到百度知识图谱,它是描绘世界的重要基础技术。知识图谱通常分为两个部分,通用知识图谱和行业知识图谱。屏幕左边展示的是跟电信行业相关的知识图谱,有了这个图谱,再配以屏幕右侧的电信行业客户业务逻辑,可以实现有效的智能客服解决方案,大大降低人工客服的工作量。这个例子就是人工智能和行业的深度融合,能够为行业带来更多价值。

百度传统业务是搜索,搜索业务发展至今也在不断发生新的变革,而背后核心的驱动力就是人工智能。比如最左边的例子,“世界上哪个楼最高”,是一个很简单的问题,现在可以图文并茂地展现答案,就是自然语言处理、知识图谱等技术,通过分析用户需求再在图谱里找到了相应的答案。第二个案例仍然是问答,“萤火虫为什么会发光?”,这个问题很难通过图谱找到一个节点关系从而直接找到确切答案,因为这个问题更像是一整段描述,而获得正确答案需要基于互联网深度问答技术,找到合适的回答,给出一段智能摘要,从而形成完美的回答。另外,无论是阅读、享受餐饮或者任何服务,网上都会形成大量的评论,我们会用情感分析技术将评论进行分类,当再有人问这家饭店的情况时,可以提供评分以及评价,同时配以百度地图,让客户得到相对完美的答案。

金融行业是跟每个人息息相关的行业。金融科技在金融行业里的影响越来越深远,其背后是技术和数据的驱动,帮助我们加强风控,为用户提供更好的服务(开户、取款等),最终形成一套完整的行业解决方案。

这是一款 Wi-Fi 翻译机,每天都有大量的用户享受百度的翻译服务。去年,百度机器翻译获得了国家科学技术进步奖二等奖,也是互联网行业获得的第一个科技进步奖。Wi-Fi 翻译机把 Wi-Fi 和翻译组合在一起,可以为更多用户提供便利,一举两得。朋友们出国时,不仅可以在世界各地享受 Wi-Fi 服务,还可以克服语言障碍,不受语言的限制。

我们认为百度是最懂 AI 的,从百度公司建立之初就跟 AI 有关。众所周知,百度是做搜索引擎起家的,成立之初就需要理解用户的搜索需求。成立近 18 年,自然语言处理技术由始至终都是人工智能非常重要的方向,也就是说,百度始终与 AI 技术相关。七、八年前,百度开始逐渐全面布局人工智能技术,发展至今,我们已经形成了完整的六层布局。最底层是大数据、大计算以及算法;第二层是感知层,是与人类感知能力相关的技术,比如语音、图像、视频、增强现实、虚拟现实等;第三层与认知相关,比如人对语言的理解、对知识的掌握运用以及对人的理解。同时我们还希望 AI 技术可以平台化,使用更便利,这个平台既可以供百度内部使用,也可以为合作伙伴开放,打造 AI 生态,从而使得 AI 技术在百度内外都得到更好地应用。

关于百度大脑,目前,百度图像识别技术可以识别八万种物体,拥有全面的视频语义理解技术,可以实现 3D 人脸识别;知识图谱为了描述大千世界,需要庞大的知识库,现在我们已经有了几亿实体,在这几亿实体之间会产生各种“联接”,每一个“联接”都代表一个事实,目前事实量已经有千亿个,这种“联接”不仅是数量多,同时有理解、归一的能力;我们有非常好的中文自然语言理解和交互能力,全栈式自然语言内容理解能力;我们有 10 亿级画像、千万级标签,能够进行基于画像的个性化推荐。语音方面,上午,大家看到了很多与语音相关的技术,比如渡鸦背后一系列的语音交互技术。现在,我们更强调远场语音识别的高精度、低误报,追求更好、更自然、更接近人类、更逼真的情感丰沛的语音合成。

目前,百度已经开源了超过 80 种 AI 能力,并在此基础上持续开放自己的技术。我们希望结合行业场景,将多种技术综合应用。其实,当一个问题被解决时,往往需要综合不同的技术,比如视频去重,既有视频技术,也可以使用语音技术,用语音和视频技术相结合的方式,可以让视频去重达到更好的效果。

我们相信,百度 AI 是新时代的生产力,这个生产力既会让百度自身的产品变得越来越好,也能满足客户的不同需要。同时希望我们和所有合作伙伴一起,共享百度的 AI 能力。谢谢大家。

百度AI