【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

微软小冰第七代重磅升级!首次推出通用型 AI 框架 Avatar Framework

  • 2019-08-15
  • 本文字数:3192 字

    阅读完需:约 10 分钟

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework

InfoQ 8 月 15 日消息,微软(亚洲)互联网工程院在北京召开了“第七代微软小冰”年度发布会,会上发布了微软小冰历史上最大跨度的一次升级,披露了 Dual AI 战略的新进展、AI Creation 的技术突破,并首次推出了全新的人工智能框架— Avatar Framework。此外,微软还首次公布了小冰近一年来在商业化进展方面的成果。


“第七代小冰拥有更多激动人心和脱胎换骨的能力“,微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋表示,“我们希望小冰能够无处不在,只要有人类的地方,都可以看到小冰、和小冰交流 ”。



微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋


沈向洋认为微软小冰代表了人工智能的发展,最重要的(一个特点)就是,人工智能要不断地迭代与演进。“做人工智能肯定不是只做一个产品就结束了,做人工智能必须要不断地学习、迭代”。


今天的发布会上有一个重磅发布,微软首次发布了 Avatar Framework 第一个工具包版本,这是第七代微软小冰一个很重要的“飞跃”和突破。


沈向洋简单回顾了微软小冰的发展历程,他谈到,从第五代小冰开始有了“框架”的概念,到第六代小冰时,框架初步成熟,而到了今年的第七代,整体框架有了飞跃般的进步。


第一代小冰发布时,恰是人工智能新的浪潮开始的时候,彼时业界在不断在思考,人工智能发展的道路到底是什么样的?是要追求一个单独的爆款应用还是走一条真正的所谓框架的道路,并发展可以无处不在的人工智能呢?


从第一代到第七代,沈向洋用“森林和树木”的关系来形容微软小冰的发展路径,他相信,人工智能不断前进和发展的路上,有这样一个框架非常重要。“尽管小冰只是广阔森林里面的一颗大树而已,但我们必须要做这样一颗大树,因为我们需要有这样一个机会去学习、去验证这个框架的可行性”。


微软(亚洲)互联网工程院副院长,小冰团队总负责人李笛如是形容 Avatar  Framework 的重要意义,“它让是‘一棵小树’的微软小冰真正能够认认真真去做永远 18 岁的少女小冰,而 Avatar  Framework 将用来‘孕育’包括小冰在内的整片‘森林’。

以下为“第七代微软小冰”的升级亮点

部分核心技术升级

第七代微软小冰对核心对话引擎、全双工语音及多模态交互感官等部分核心技术进行了升级。*


其中:


全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达 68%,比上一个版本的转化率提高 21%。



全双工语音交互感官:微软小冰于 2017、2018 年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。


面向未来的多模态交互感官:这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时“边听边说边看”的交互体验,该感官有望成为 5G 时代的全新交互形式。继去年宣布率先开始多模态感官的研发后,今年 2 月,微软日本小冰团队已在日本完成了多模态交互感官公开测试。

Dual AI 战略新进展

微软小冰自去年开始执行 Dual AI 战略计划,现在,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。目前,在全球多个国家,微软小冰单一品牌已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备和 9 亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在 23 轮。


小冰团队产品负责人彭爽表示,Dual AI 是半开放的生态思路,框架的通用性和丰富性使得小冰在产品形态上具有非常大的弹性,一方面小冰可以转换成各种各样适合的形态,接入到智能手机、智能音箱设备、括社交网络、内容和资讯平台等。另一方面,当小冰化身为千万形态的同时,又可以在一定程度上保持相对统一的独特性。



此外,发布会上还宣布了微软小冰与腾讯、小米、今日头条、vivo 和 OPPO 等合作伙伴的共同项目,并拓展上线了多个第三方合作伙伴平台的小冰产品,产品形态涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台等。


其中,在智能手机方面,微软小冰宣布已经上线了 vivo 和 OPPO 的手机系统,至此达成与国产 TOP5 手机生产商(华为、荣耀、vivo、OPPO、小米)共同完成“召唤小冰”的产品形态。在智能音箱设备上,微软小冰已与小米的小爱音箱达成合作;此外,小冰还在不断地探索深度融入主流社交平台网络中,已跟 QQ 深化合作,小冰已进入 3000 万个 QQ 群。目前小冰正在和微信 AI 就对话开放平台、微信 AI 所涉及的智能硬件产品等两个方面展开合作;


在内容和资讯平台上,继第六代小冰与网易、新浪合作后,微软在今天宣布与今日头条达成合作,通过长时间的训练,小冰的认知能力和三观能力在不断深化。



除了在线内容和资讯平台之外,小冰在传统的电视台和广播电台持续担当着内容生产和技术提供者的角色,截止到 2019 年 7 月末,小冰已累计在中国和日本的共 50 家电台和电视台的 69 档节目中提供人工智能内容创造能力。小冰已经上线的日播和周播节目达到 30 档,目前累计参与生产的电视和电台节目总时长达到 6908 小时,其中今年生产的节目时长是去年 2.05 倍。

AI Creation 的技术突破

在 AI Creation 方面,微软希望通过人工智能技术解决高度定制化内容的供需矛盾。目前,在文本、声音与视觉创造方面,微软在核心技术上保持全球领先,并发布了实际线上产品。自小冰工作室成立一年多来,工作室里已累积了越来越多的声音、文本和视觉创造力角色,发布会上还展示了“小冰工作室”拥有的丰富模型,包括跨越多种演唱技巧的多个声音模型、多种绘画模型等。



此外,AI Creation 多条面向量产化的生产线已实现产业化贯通。其中,与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,在这条生产线上,SELECTED、万事利、依文等品牌的产品已上架销售。在音乐方面,微软小冰与联通沃音乐共同推出的音乐生成平台也已上线。

新框架 Avatar Framework 初次发布

微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛表示,今年微软小冰最大的“跨越”就在于首次推出的新框架——Avatar Framework。


据介绍,Avatar Framework 工具包与微软小冰框架同源,可以从零开始轻松构建并训练任何具有完整情感计算能力的 AI beings —人工智能助手、社交对话机器人、人工智能内容创作和 IP 人物角色等。该工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的 3D 人物模型进行实时交互。



在本次发布前,微软已通过 Avatar Framework 框架赋能软银 Pepper 等数十个第三方客户 AI,以及微软小冰自身,目前发布的版本面向全部合作伙伴及客户,面向个人使用者的版本预计将于 2020 年春季发布。微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东还在发布会上宣布了知识图谱方面的新进展,并表示微软已与阅文集团达成针对《全职高手》等 100 部小说主人公 IP 的合作。

微软小冰商业化进展

人工智能创造及商业事业部总经理,小冰团队商业负责人徐元春公布了微软小冰在商业化方面的新进展,他表示,自去年宣布启动了微软小冰的商业化以来,得益于在 ToB 领域的丰富经验及技术产品积累,这一年来微软小冰商业化进展迅速,目前已落地的商业客户覆盖金融、零售、汽车、地产、纺织等十个领域,



具体服务的客户包括万科、万得资讯、万事利、中国联通等。其中一个典型案例是与金融信息服务提供商万得资讯的合作。微软利用 AI  Creation 文本生成技术帮助万得资讯构建端到端的完整 AI 能力,双方合作研发了一款金融电台产品,通过这款产品,可以将上市公司公告摘要等财经信息即时、高质量、24 小时不间断地通过语音输出给机构投资者和个人用户。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-08-15 22:4310379
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 492.9 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

勿以善小而不为,让AI成为温柔的力量

wood

AI 烟火气 温柔

vivo 服务端监控体系建设实践

vivo互联网技术

云原生 监控 可用性 可观测

字节前端必会react面试题

beifeng1996

React

vue组件通信方式有哪些?

bb_xiaxia1998

Vue

2023前端必会手写面试题整理

helloworld1024fd

JavaScript

如何实现一个计算器

Towify

前端二面vue面试题(边面边更)

bb_xiaxia1998

Vue

坚果的2022年终总结

坚果

年终总结 OpenHarmony

面试官:能用JavaScript手写一个bind函数吗

helloworld1024fd

JavaScript

令人头秃的js隐式转换面试题,你能做对吗

loveX001

JavaScript

2022年后疫情时代旅游业发展的新趋势

易观分析

旅游 后疫情时代

字节前端高频手写面试题(持续更新中)

helloworld1024fd

JavaScript

自己手写一个redux

helloworld1024fd

JavaScript

假如面试官问你Babel的原理该怎么回答

loveX001

JavaScript

滴滴前端一面高频vue面试题及答案

bb_xiaxia1998

Vue

vue组件通信6种方式总结(常问知识点)

bb_xiaxia1998

Vue

从源代码构建TensorFlow流程记录

京东科技开发者

tensorflow GitHub 开源 源代码 企业号 1 月 PK 榜

了解下 Rust 的所有权机制

ooooooh灰灰

rust 后端 编译

面试官:说说React-SSR的原理

beifeng1996

React

TorchDynamo初探:Python ByteCode的动态修改

OneFlow

人工智能 深度学习 TorchDynamo

前端高频面试题集锦

loveX001

JavaScript

面试官:你是怎样进行react组件代码复用的

beifeng1996

React

2023年工作上的几个小目标

SAP虾客

系统集成 在家办公 PRA 自动化仓库

带你实现react源码的核心功能

flyzz177

React

从React源码角度看useCallback,useMemo,useContext

flyzz177

React

从React源码来学hooks是不是更香呢

flyzz177

React

osx安装mpd和ncmpcpp

alps2006

macos

Java高手速成│实战:应用数据库和GUI开发产品销售管理软件(1)

TiAmo

JDBC GUI 数据库·

那些高级前端是如何回答面试题的

loveX001

JavaScript

阿里前端二面必会react面试题总结

beifeng1996

React

如何实现购物车一键全选?

Towify

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework_AI&大模型_刘燕_InfoQ精选文章