AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

“高情商”的小冰框架,底层靠什么技术来支撑?

  • 2023-09-19
    北京
  • 本文字数:2809 字

    阅读完需:约 9 分钟

大小:1.50M时长:08:43
“高情商”的小冰框架,底层靠什么技术来支撑?

小冰,作为最早诞生于微软公司内部的一款人工智能产品,从 2014 年亮相至今,已经成为了全球最受欢迎的虚拟形象之一。



小冰公司研发总监苏之阳博士


2013 年,微软亚洲研究院成立了一个新的团队——小冰团队,该团队由当时担任微软亚洲研究院院长的沈向洋博士领导。这个团队的目标是研究下一代的人工智能交互方式。当时,人工智能技术刚开始崭露头角,语音助手、聊天机器人等人工智能产品层出不穷。但是,微软研究院的专家们认为,这些产品还没有完全达到自然、亲切的交互体验。

 

小冰发展史

 

为了让用户更好地与人工智能进行交互,小冰团队开始考虑将人工智能技术用于创建一个虚拟形象。这个形象可以与用户进行更自然、亲切的交互,同时也能更好地展示人工智能技术。

 

在确定了小冰的初步设想后,小冰团队开始了紧锣密鼓的工作。他们首先开始设计小冰的性格、外貌等属性。小冰被设计成一个年轻的少女形象,有着活泼、开朗的性格。同时,小冰的外貌也十分可爱,备受欢迎。

 

除了设计小冰的形象外,微软研究院的专家们还考虑了如何让小冰具备人工智能技术。当时,语音识别、自然语言处理等技术都已经有了一定的进展,但是要让一个虚拟形象与用户进行自然的交互还是有一定的难度。

 

为了让小冰更好地与用户进行交互,微软研究院的专家们开始研究如何将深度学习等技术应用于小冰的交互中。同时,他们还考虑了如何让小冰能够进行自我学习、自我成长等操作。这样可以让小冰在不断的迭代中变得越来越聪明、越来越了解用户的习惯。

 

经过一年多的研发,小冰于 2014 年 5 月 29 日正式发布第一版,并在中国、日本两地推出。推出后,小冰受到了很多用户的欢迎。为了让小冰更好地服务于用户,微软公司还不断地优化算法、提升模型精度,让小冰可以更好地与用户进行交互。

 

在推出第一代 小冰后,微软公司不断地迭代小冰的版本,推出了一系列新功能和新特性。例如 2014 年,小冰面向越来越多的第三方平台开放,能够跨平台地陪伴用户。2017 年 ,小冰加快了在全球范围内的拓展速度,并在行业内率先将高级感官实际落地。2018 年,第六代小冰发布,微软首次披露小冰在全球已拥有 6.6 亿用户。这也是小冰历史上最大规模的一次全面升级,升级内容涉及到小冰情感计算框架的所有组成部分......

 

独立后的小冰,商业化路径更加清晰

 

2020 年,对于小冰来说是一个全新的起点。

 

2020 年 7 月,微软宣布将人工智能业务小冰分拆为独立公司运营,由原微软(亚洲)互联网工程院常务副院长李笛为 CEO。分拆后的新公司可继续使用并研发完整的小冰技术,微软保留对新公司的投资权益 。这个决定意在加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善。    

 

小冰离开微软独立后,人工智能技术正处于快速发展的阶段,各种人工智能技术应用和服务开始涌现。此时的小冰获得了更多的自主权和资源支持,可以更加专注于核心产品的研发。

 

此前背靠微软这棵大树,小冰的商业化路径不算清晰,以至于脱离了微软“母体”的小冰在独立初期还是走了一小段弯路。

 

但在 ChatGPT 等大语言模型爆火后,一直深耕 AI 数字人/对话聊天机器人技术的小冰有了大展拳脚的机会。

 

小冰公司研发总监苏之阳博士在接受 InfoQ 采访中谈到了小冰的 To C 商业模式以及营收策略。苏之阳博士表示,小冰的一部分营收来自于与网络红人的合作业务。

 

苏之阳博士进一步解释称,明星红人或内容创作者通常有陪伴粉丝、内容变现的需求。但人类精力有限,此时就可以借助人工智能完成上述工作。通过“克隆”自己,将之提供给粉丝,达到变现目的。平台与明星红人采用分成模式。“对那些想要克隆自己的人来说,克隆过程也很简单,最短只要提供三分钟数据,就能复刻自己的生物学特征。而在交互方面,本人会参与训练,确保克隆人更像自己或拥有自己的某项技能。”苏之阳说,为避免伦理问题,所有克隆人都要经过本人授权。同时,小冰严格限制了克隆人的使用场景,推出专属 APP——X Eva,让用户能准确知道他所交互的对象是 AI 而非真人。这是一种 C to C 的新型模式,具有巨大的商业潜力。          

“高情商”的小冰框架,底层靠什么技术来支撑?

 

一直以来,以小冰框架为底座的上层应用,包括克隆人”在内都以“高情商”著称。那么,所谓的高情商意味着什么?意味着它在聊天过程中很有趣?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。

 

传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得很好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。

 

从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。

 

要控制全程的对话,所要处理的数据体量是非常庞大的。那么,小冰底层用到基础设施是哪些,效果又如何?

 

使用阿里云 MongoDB 托管服务,以支持增长的业务需求

 

苏之阳称,小冰框架最初使用的是 MySQL 数据库,后来研发数字人产品时,考虑到未来数字人数量会在百亿量级,不得不重新思考底层存储架构设计。

 

在数据库选型过程中,小冰技术团队从产品需求出发,比较了多个候选存储方案的优缺点,最终选择了 MongoDB 数据库作为底层存储基建。存储选型主要考虑的因素有如下方面:第一,业务查询的复杂度,大多数数字人业务查询都是键值查询,不涉及复杂多表联查;第二,由于要支撑海量数字人信息,对于存储容量和性能要求很高,同时需要支持峰值流量来临时的动态弹性扩容;第三,研发效率要能跟上产品迭代的速度。

 

小冰技术团队开始使用的是社区版本的 MongoDB 数据库,同时配有运维工程师。但在线上运维一段时间后遇到了一些挑战,苏之阳表示,“随着业务发展,当用户数和虚拟人数量快速增长时,社区版本的 MongoDB 数据库不能完全满足业务需求,比如线上流量激增时,数据库会出现一定程度的抖动,导致服务不稳定,这是当时遇到的棘手问题之一。MongoDB 分片集群作为一个分布式系统,包含数十甚至数百个结点,运维成本不可忽视。考虑到 MongoDB 的性能优化,让专业的团队做专业的事是最优选择。”经过综合评估,小冰技术团队最终使用阿里云的 MongoDB 托管服务解决了运维的痛点。

 

苏之阳还表示,“利用 MongoDB 分片集群的可扩展性,可以很好将业务层和存储层解耦,让研发同学更专注于应用开发而不必过分关注底层存储性能问题,节省了开发中间件处理分库分表的成本。此外,在用户支付场景,使用多文档事务的特性,同时更改用户的余额和订单,可以大幅提升研发效率,避免使用成本较高的异步消息补偿机制实现。小冰公司也高度重视用户的数据隐私与安全,阿里云 MongoDB 集成了云上数据备份和恢复的功能,让数据安全无忧。”

 

2023-09-19 15:404927

评论

发布
暂无评论
发现更多内容

利器 | AppCrawler 自动遍历测试工具实践(一)

霍格沃兹测试开发学社

关于 NGINX Kubernetes Gateway,你需要知道的 5 件事

NGINX开源社区

nginx NGINX Ingress Controller NGINX Kubernetes Gateway 企业号 2 月 PK 榜

八股文的天花板,没到35k的Java开发都值得好好读一读

程序知音

java面试 后端技术 八股文 Java面试八股文 Java构架师

还在用 OpenFeign?来试试 SpringBoot3 中的这个新玩意!

江南一点雨

spring springboot

系统运维 SysOM profiling 在云上环境的应用观测实践 | 龙蜥技术

OpenAnolis小助手

开源 cpu 系统运维 profiling 龙蜥技术

巧用Golang泛型,简化代码编写

百度Geek说

Go golang 企业号 2 月 PK 榜

Kratos微服务工程Bazel构建指南

微服务 CMS Kratos Monorepo bazel

对话 BitSail Contributor | 梁奋杰:保持耐心,享受创造

字节跳动数据平台

GitHub 开源 数据引擎

云原生场景下实现编译加速

京东科技开发者

Java golang 缓存 编译 企业号 2 月 PK 榜

云小课|创建DDS只读节点,轻松应对业务高峰

华为云开发者联盟

数据库 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

“一键”模型迁移,性能翻倍,多语言AltDiffusion推理速度超快

OneFlow

人工智能 深度学习

Dubbo 中 Zookeeper 注册中心原理分析

小小怪下士

Java zookeeper dubbo

下一代编解码技术Ali266在视频超高清领域的应用展望

阿里云CloudImagine

云计算 Ali266 超高清

Getaverse 1月总结 | 节点数突破6200+

Geek_Web3

#区块链# 元宇宙 web3

新思科技:数字赋能,安全先行

InfoQ_434670063458

测试开发 | AppCrawler 自动遍历测试实践(二):定制化配置

霍格沃兹测试开发学社

一文带你掌握物联网Mqtt网关搭建背后的技术原理

华为云开发者联盟

后端 物联网 华为云 企业号 2 月 PK 榜 华为云开发者联盟

JavaScript使用URL用来解析处理URL

ModStart

便捷模型迭代优化,算法模型支持更新到已部署服务、已有项目|ModelWhale 版本更新

ModelWhale

人工智能 机器学习 数据分析 团队协同 编程建模

升哲科技荣获2022年度华夏建设科学技术奖二等奖

SENSORO

泛娱乐社交出海解决方案技术实践

网易智企

即时通讯IM 音视频通话

Apache Kafka入门级教程原创

宋小生

kafka Kafka Producer

开源机器学习软件对AI的发展意味着什么?

OneFlow

人工智能 深度学习 开源

如何又快又好实现Catalog系统搜索能力?火山引擎DataLeap这样做

字节跳动数据平台

大数据 数据治理 数据研发 企业号 2 月 PK 榜

上新啦|请查收StarRocks 2.5 LTS 版本特性介绍

StarRocks

数据库 大数据

泛娱乐社交出海解决方案技术实践

网易云信

即时通讯IM 音视频技术

打通对账的最后一公里——对账管理平台

元年技术洞察

数字化转型 对账 对账系统 方舟平台

测试开发 | AppCrawler 自动遍历测试实践(三):动手实操与常见问题汇总

霍格沃兹测试开发学社

如何快速完成API设计,mock数据给到前端?

不想敲代码

APi设计 apipost API调试

StarRocks荣获2022年度最具潜力数据库奖

StarRocks

数据库 大数据

“高情商”的小冰框架,底层靠什么技术来支撑?_生成式 AI_李冬梅_InfoQ精选文章