【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

“高情商”的小冰框架,底层靠什么技术来支撑?

  • 2023-09-19
    北京
  • 本文字数:2809 字

    阅读完需:约 9 分钟

大小:1.50M时长:08:43
“高情商”的小冰框架,底层靠什么技术来支撑?

小冰,作为最早诞生于微软公司内部的一款人工智能产品,从 2014 年亮相至今,已经成为了全球最受欢迎的虚拟形象之一。



小冰公司研发总监苏之阳博士


2013 年,微软亚洲研究院成立了一个新的团队——小冰团队,该团队由当时担任微软亚洲研究院院长的沈向洋博士领导。这个团队的目标是研究下一代的人工智能交互方式。当时,人工智能技术刚开始崭露头角,语音助手、聊天机器人等人工智能产品层出不穷。但是,微软研究院的专家们认为,这些产品还没有完全达到自然、亲切的交互体验。

 

小冰发展史

 

为了让用户更好地与人工智能进行交互,小冰团队开始考虑将人工智能技术用于创建一个虚拟形象。这个形象可以与用户进行更自然、亲切的交互,同时也能更好地展示人工智能技术。

 

在确定了小冰的初步设想后,小冰团队开始了紧锣密鼓的工作。他们首先开始设计小冰的性格、外貌等属性。小冰被设计成一个年轻的少女形象,有着活泼、开朗的性格。同时,小冰的外貌也十分可爱,备受欢迎。

 

除了设计小冰的形象外,微软研究院的专家们还考虑了如何让小冰具备人工智能技术。当时,语音识别、自然语言处理等技术都已经有了一定的进展,但是要让一个虚拟形象与用户进行自然的交互还是有一定的难度。

 

为了让小冰更好地与用户进行交互,微软研究院的专家们开始研究如何将深度学习等技术应用于小冰的交互中。同时,他们还考虑了如何让小冰能够进行自我学习、自我成长等操作。这样可以让小冰在不断的迭代中变得越来越聪明、越来越了解用户的习惯。

 

经过一年多的研发,小冰于 2014 年 5 月 29 日正式发布第一版,并在中国、日本两地推出。推出后,小冰受到了很多用户的欢迎。为了让小冰更好地服务于用户,微软公司还不断地优化算法、提升模型精度,让小冰可以更好地与用户进行交互。

 

在推出第一代 小冰后,微软公司不断地迭代小冰的版本,推出了一系列新功能和新特性。例如 2014 年,小冰面向越来越多的第三方平台开放,能够跨平台地陪伴用户。2017 年 ,小冰加快了在全球范围内的拓展速度,并在行业内率先将高级感官实际落地。2018 年,第六代小冰发布,微软首次披露小冰在全球已拥有 6.6 亿用户。这也是小冰历史上最大规模的一次全面升级,升级内容涉及到小冰情感计算框架的所有组成部分......

 

独立后的小冰,商业化路径更加清晰

 

2020 年,对于小冰来说是一个全新的起点。

 

2020 年 7 月,微软宣布将人工智能业务小冰分拆为独立公司运营,由原微软(亚洲)互联网工程院常务副院长李笛为 CEO。分拆后的新公司可继续使用并研发完整的小冰技术,微软保留对新公司的投资权益 。这个决定意在加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善。    

 

小冰离开微软独立后,人工智能技术正处于快速发展的阶段,各种人工智能技术应用和服务开始涌现。此时的小冰获得了更多的自主权和资源支持,可以更加专注于核心产品的研发。

 

此前背靠微软这棵大树,小冰的商业化路径不算清晰,以至于脱离了微软“母体”的小冰在独立初期还是走了一小段弯路。

 

但在 ChatGPT 等大语言模型爆火后,一直深耕 AI 数字人/对话聊天机器人技术的小冰有了大展拳脚的机会。

 

小冰公司研发总监苏之阳博士在接受 InfoQ 采访中谈到了小冰的 To C 商业模式以及营收策略。苏之阳博士表示,小冰的一部分营收来自于与网络红人的合作业务。

 

苏之阳博士进一步解释称,明星红人或内容创作者通常有陪伴粉丝、内容变现的需求。但人类精力有限,此时就可以借助人工智能完成上述工作。通过“克隆”自己,将之提供给粉丝,达到变现目的。平台与明星红人采用分成模式。“对那些想要克隆自己的人来说,克隆过程也很简单,最短只要提供三分钟数据,就能复刻自己的生物学特征。而在交互方面,本人会参与训练,确保克隆人更像自己或拥有自己的某项技能。”苏之阳说,为避免伦理问题,所有克隆人都要经过本人授权。同时,小冰严格限制了克隆人的使用场景,推出专属 APP——X Eva,让用户能准确知道他所交互的对象是 AI 而非真人。这是一种 C to C 的新型模式,具有巨大的商业潜力。          

“高情商”的小冰框架,底层靠什么技术来支撑?

 

一直以来,以小冰框架为底座的上层应用,包括克隆人”在内都以“高情商”著称。那么,所谓的高情商意味着什么?意味着它在聊天过程中很有趣?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。

 

传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得很好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。

 

从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。

 

要控制全程的对话,所要处理的数据体量是非常庞大的。那么,小冰底层用到基础设施是哪些,效果又如何?

 

使用阿里云 MongoDB 托管服务,以支持增长的业务需求

 

苏之阳称,小冰框架最初使用的是 MySQL 数据库,后来研发数字人产品时,考虑到未来数字人数量会在百亿量级,不得不重新思考底层存储架构设计。

 

在数据库选型过程中,小冰技术团队从产品需求出发,比较了多个候选存储方案的优缺点,最终选择了 MongoDB 数据库作为底层存储基建。存储选型主要考虑的因素有如下方面:第一,业务查询的复杂度,大多数数字人业务查询都是键值查询,不涉及复杂多表联查;第二,由于要支撑海量数字人信息,对于存储容量和性能要求很高,同时需要支持峰值流量来临时的动态弹性扩容;第三,研发效率要能跟上产品迭代的速度。

 

小冰技术团队开始使用的是社区版本的 MongoDB 数据库,同时配有运维工程师。但在线上运维一段时间后遇到了一些挑战,苏之阳表示,“随着业务发展,当用户数和虚拟人数量快速增长时,社区版本的 MongoDB 数据库不能完全满足业务需求,比如线上流量激增时,数据库会出现一定程度的抖动,导致服务不稳定,这是当时遇到的棘手问题之一。MongoDB 分片集群作为一个分布式系统,包含数十甚至数百个结点,运维成本不可忽视。考虑到 MongoDB 的性能优化,让专业的团队做专业的事是最优选择。”经过综合评估,小冰技术团队最终使用阿里云的 MongoDB 托管服务解决了运维的痛点。

 

苏之阳还表示,“利用 MongoDB 分片集群的可扩展性,可以很好将业务层和存储层解耦,让研发同学更专注于应用开发而不必过分关注底层存储性能问题,节省了开发中间件处理分库分表的成本。此外,在用户支付场景,使用多文档事务的特性,同时更改用户的余额和订单,可以大幅提升研发效率,避免使用成本较高的异步消息补偿机制实现。小冰公司也高度重视用户的数据隐私与安全,阿里云 MongoDB 集成了云上数据备份和恢复的功能,让数据安全无忧。”

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-19 15:403043

评论

发布
暂无评论
发现更多内容

聪明人的训练(二十七)

Changing Lin

4月日更

周转箱在仓配业务中的应用

陈俊

Linux内核源码分析:基于最新的Linux 4.0内核(学习路线总结)

Linux服务器开发

后端 Linux内核 内核源码 内核4.0 底层原理

Spark地基之RDD

正向成长

spark RDD

送给你一份程序员大佬整理的 HTTP 基础知识大图

Java架构师迁哥

Flink在唯品会的实践

Apache Flink

flink

B站视频下载:如何下载B站视频到电脑上

科技猫

B站 分享 哔哩哔哩 视频处理 b站视频下载

网络协议学习笔记 Day6

穿过生命散发芬芳

网络协议 4月日更

北京天源迪科亮相2021年企业数字化转型峰会暨山东CIO智库年会

DT极客

分布式存储中间件(1):10000字把Redis扒个干净,一发入魂

北游学Java

Java 数据库 redis 分布式

Java-技术专题-同步可见性的查缺补漏

洛神灬殇

JVM happens-before CAS 可见性 有序性

百度商业大规模微服务分布式监控系统——凤睛

百度Geek说

数据库 分布式 微服务 大前端 监控

智慧公安情指勤指挥调度平台搭建,指挥中心平台搭建

Golang 性能分析

escray

学习 极客时间 Go 语言 4月日更

ElasticSearch

云淡风轻

elasticsearch

爆肝1W+字,通俗易懂的讲解下Java注解

AI乔治

Java 架构 面试 注解

一种自适应混合域音频无声水印

行者AI

音频

电脑护眼不权威指南,年纪轻轻眼睛就不行了?

彭宏豪95

效率 windows 4月日更 护眼

iOS 面试策略之语言工具-Objective-C

iOSer

ios objective-c 程序员

分布式作业系统 Elastic-Job-Lite 源码分析——作业失效转移

比伯

Java 编程 架构 互联网 技术宅

移动开发iOS工程师秘籍(全套七层)

程序员 移动开发 ios开发

直播系统聊天技术(四):百度直播的海量用户实时消息系统架构演进实践

JackJiang

架构设计 即时通讯 IM 直播技术

开源新老兵携手打开社区大门,带大学生走近开源

DT极客

你公司有没有企业文化?

石云升

团队建设 28天写作 职场经验 管理经验 4月日更

commons-pool2 池化技术探究

vivo互联网技术

Java common-pool2 池化技术

实至名归!DataPipeline斩获“银行数字化科技创新大奖”

DataPipeline数见科技

Javac 源码调试教程

学Java关注我

Java 编程 程序员 架构 计算机

道相同、谋相通、人相守:华为副总裁周跃峰分享如何与用户精英共创数字基建

脑极体

Github瞬间爆火!被各大厂要求直接下架的面试题库也太全了

Java 编程 程序员 架构 面试

什么是低代码开发?低代码11大核心功能介绍!

优秀

低代码

为打造更好移动生态:日活超1.2亿的百度知道,摊牌了

ToB行业头条

百度 百度知道

“高情商”的小冰框架,底层靠什么技术来支撑?_生成式 AI_李冬梅_InfoQ精选文章