2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

“高情商”的小冰框架,底层靠什么技术来支撑?

  • 2023-09-19
    北京
  • 本文字数:2809 字

    阅读完需:约 9 分钟

大小:1.50M时长:08:43
“高情商”的小冰框架,底层靠什么技术来支撑?

小冰,作为最早诞生于微软公司内部的一款人工智能产品,从 2014 年亮相至今,已经成为了全球最受欢迎的虚拟形象之一。



小冰公司研发总监苏之阳博士


2013 年,微软亚洲研究院成立了一个新的团队——小冰团队,该团队由当时担任微软亚洲研究院院长的沈向洋博士领导。这个团队的目标是研究下一代的人工智能交互方式。当时,人工智能技术刚开始崭露头角,语音助手、聊天机器人等人工智能产品层出不穷。但是,微软研究院的专家们认为,这些产品还没有完全达到自然、亲切的交互体验。

 

小冰发展史

 

为了让用户更好地与人工智能进行交互,小冰团队开始考虑将人工智能技术用于创建一个虚拟形象。这个形象可以与用户进行更自然、亲切的交互,同时也能更好地展示人工智能技术。

 

在确定了小冰的初步设想后,小冰团队开始了紧锣密鼓的工作。他们首先开始设计小冰的性格、外貌等属性。小冰被设计成一个年轻的少女形象,有着活泼、开朗的性格。同时,小冰的外貌也十分可爱,备受欢迎。

 

除了设计小冰的形象外,微软研究院的专家们还考虑了如何让小冰具备人工智能技术。当时,语音识别、自然语言处理等技术都已经有了一定的进展,但是要让一个虚拟形象与用户进行自然的交互还是有一定的难度。

 

为了让小冰更好地与用户进行交互,微软研究院的专家们开始研究如何将深度学习等技术应用于小冰的交互中。同时,他们还考虑了如何让小冰能够进行自我学习、自我成长等操作。这样可以让小冰在不断的迭代中变得越来越聪明、越来越了解用户的习惯。

 

经过一年多的研发,小冰于 2014 年 5 月 29 日正式发布第一版,并在中国、日本两地推出。推出后,小冰受到了很多用户的欢迎。为了让小冰更好地服务于用户,微软公司还不断地优化算法、提升模型精度,让小冰可以更好地与用户进行交互。

 

在推出第一代 小冰后,微软公司不断地迭代小冰的版本,推出了一系列新功能和新特性。例如 2014 年,小冰面向越来越多的第三方平台开放,能够跨平台地陪伴用户。2017 年 ,小冰加快了在全球范围内的拓展速度,并在行业内率先将高级感官实际落地。2018 年,第六代小冰发布,微软首次披露小冰在全球已拥有 6.6 亿用户。这也是小冰历史上最大规模的一次全面升级,升级内容涉及到小冰情感计算框架的所有组成部分......

 

独立后的小冰,商业化路径更加清晰

 

2020 年,对于小冰来说是一个全新的起点。

 

2020 年 7 月,微软宣布将人工智能业务小冰分拆为独立公司运营,由原微软(亚洲)互联网工程院常务副院长李笛为 CEO。分拆后的新公司可继续使用并研发完整的小冰技术,微软保留对新公司的投资权益 。这个决定意在加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善。    

 

小冰离开微软独立后,人工智能技术正处于快速发展的阶段,各种人工智能技术应用和服务开始涌现。此时的小冰获得了更多的自主权和资源支持,可以更加专注于核心产品的研发。

 

此前背靠微软这棵大树,小冰的商业化路径不算清晰,以至于脱离了微软“母体”的小冰在独立初期还是走了一小段弯路。

 

但在 ChatGPT 等大语言模型爆火后,一直深耕 AI 数字人/对话聊天机器人技术的小冰有了大展拳脚的机会。

 

小冰公司研发总监苏之阳博士在接受 InfoQ 采访中谈到了小冰的 To C 商业模式以及营收策略。苏之阳博士表示,小冰的一部分营收来自于与网络红人的合作业务。

 

苏之阳博士进一步解释称,明星红人或内容创作者通常有陪伴粉丝、内容变现的需求。但人类精力有限,此时就可以借助人工智能完成上述工作。通过“克隆”自己,将之提供给粉丝,达到变现目的。平台与明星红人采用分成模式。“对那些想要克隆自己的人来说,克隆过程也很简单,最短只要提供三分钟数据,就能复刻自己的生物学特征。而在交互方面,本人会参与训练,确保克隆人更像自己或拥有自己的某项技能。”苏之阳说,为避免伦理问题,所有克隆人都要经过本人授权。同时,小冰严格限制了克隆人的使用场景,推出专属 APP——X Eva,让用户能准确知道他所交互的对象是 AI 而非真人。这是一种 C to C 的新型模式,具有巨大的商业潜力。          

“高情商”的小冰框架,底层靠什么技术来支撑?

 

一直以来,以小冰框架为底座的上层应用,包括克隆人”在内都以“高情商”著称。那么,所谓的高情商意味着什么?意味着它在聊天过程中很有趣?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。

 

传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得很好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。

 

从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。

 

要控制全程的对话,所要处理的数据体量是非常庞大的。那么,小冰底层用到基础设施是哪些,效果又如何?

 

使用阿里云 MongoDB 托管服务,以支持增长的业务需求

 

苏之阳称,小冰框架最初使用的是 MySQL 数据库,后来研发数字人产品时,考虑到未来数字人数量会在百亿量级,不得不重新思考底层存储架构设计。

 

在数据库选型过程中,小冰技术团队从产品需求出发,比较了多个候选存储方案的优缺点,最终选择了 MongoDB 数据库作为底层存储基建。存储选型主要考虑的因素有如下方面:第一,业务查询的复杂度,大多数数字人业务查询都是键值查询,不涉及复杂多表联查;第二,由于要支撑海量数字人信息,对于存储容量和性能要求很高,同时需要支持峰值流量来临时的动态弹性扩容;第三,研发效率要能跟上产品迭代的速度。

 

小冰技术团队开始使用的是社区版本的 MongoDB 数据库,同时配有运维工程师。但在线上运维一段时间后遇到了一些挑战,苏之阳表示,“随着业务发展,当用户数和虚拟人数量快速增长时,社区版本的 MongoDB 数据库不能完全满足业务需求,比如线上流量激增时,数据库会出现一定程度的抖动,导致服务不稳定,这是当时遇到的棘手问题之一。MongoDB 分片集群作为一个分布式系统,包含数十甚至数百个结点,运维成本不可忽视。考虑到 MongoDB 的性能优化,让专业的团队做专业的事是最优选择。”经过综合评估,小冰技术团队最终使用阿里云的 MongoDB 托管服务解决了运维的痛点。

 

苏之阳还表示,“利用 MongoDB 分片集群的可扩展性,可以很好将业务层和存储层解耦,让研发同学更专注于应用开发而不必过分关注底层存储性能问题,节省了开发中间件处理分库分表的成本。此外,在用户支付场景,使用多文档事务的特性,同时更改用户的余额和订单,可以大幅提升研发效率,避免使用成本较高的异步消息补偿机制实现。小冰公司也高度重视用户的数据隐私与安全,阿里云 MongoDB 集成了云上数据备份和恢复的功能,让数据安全无忧。”

 

2023-09-19 15:405219

评论

发布
暂无评论
发现更多内容

从“打标签”到“算行为”:抖音推荐系统的进化逻辑(附打分算法深度解析)

掘金安东尼

怎么选择最好用的境外舆情监测软件?

沃观Wovision

舆情监测 舆情监测系统 海外舆情监测 舆情监测软件

C++ 函数:重载、覆盖、隐藏

岭南过客

c++ C++ 函数

Apache SeaTunnel 9 月动态:多模块修复 + 新功能上线,社区贡献成果亮眼

白鲸开源

大数据 开源 数据同步 数据集成 Apache SeaTunnel

2026全球舆情趋势报告:洞察跨区域议题与商业风险图谱

沃观Wovision

舆情监测 海外舆情监控 舆情监测网站 全球舆情监测 全球舆情监控

如何通过海外舆情分析判断新市场的文化与政策?

沃观Wovision

企业出海 舆情监测 海外舆情监控 海外舆情 海外舆情监测

区块链 Web3 项目的开发费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

去中心化金融(简称 DeFi)系统的开发流程

北京木奇移动技术有限公司

区块链开发 defi开发 软件外包公司

电商仓库批量出货推荐用哪款RFID隧道机?

斯科信息

RFID隧道机 CK-TP2A

芜湖,千兆网络下载速率只有10MB秒,过的什么苦日子

BugShare

macos 网络 网盘 网速

从“目录电价”到“直供价格”:绿电直连电价机制全景图

西格电力

新能源产业 电力交易 电价预测 电力系统 绿电直连

文书生成Agent+案卷评查Agent+归纳分析Agent,推动烟草行业向更高效、更精准的方向演进

中烟创新

华为鸿蒙开发:掌握应用包名、图标、版本及权限配置

最新动态

Abaqus购买指南:除了软件费用还有其他成本吗?达索授权代理商思茂信息

思茂信息

abaqus abaqus有限元仿真 达索系统 达索代理商

SD-WAN如何帮助企业降低网络运维成本?

光联世纪

出海企业要做好境外舆情监测应注意哪些问题?

沃观Wovision

舆情监测 海外舆情监测 境外舆情监测 境外舆情监控

全球舆情的AI赋能:智能监控平台如何实现风险预测

沃观Wovision

舆情监控 舆情监测 海外舆情监控 全球舆情监测 全球舆情监控

一文读懂海外舆情:概念、价值与企业必修课

沃观Wovision

出海企业 海外舆情监控 海外舆情 海外舆情监测 出海舆情

大数据-138 ClickHouse MergeTree 实战详解|分区裁剪 × 稀疏主键索引 × marks 标记 × 压缩

武子康

大数据 flink 分布式 Clickhouse MergeTree

HarmonyOS NEXT智能车载应用开发实战

最新动态

(三)从分层架构到数据湖仓架构系列:数据仓库分层之贴源层和数据仓库层设计

白鲸开源

数据库 大数据 数据仓库 数据湖 白鲸开源

如何做好境外舆情监测?五大策略解密

沃观Wovision

舆情监测 海外舆情监测 境外舆情监测 境外舆情监控 境外舆情

数据采集故障频发,中控技术靠SeaTunnel实现日均TB级核心数据同步任务0出错

白鲸开源

AI 技术分享 数据同步 Apache SeaTunnel 中控技术

PalmPay 携手阿里云 RocketMQ,共建非洲普惠金融“高速通道”

阿里巴巴云原生

阿里云 Serverless RocketMQ 云原生

直播|均降 40% 的 GPU 成本,大规模 Agent 部署和运维的捷径是什么?

阿里巴巴云原生

阿里云 Serverless 云原生 agent

HarmonyOS NEXT 椭圆曲线密码学应用:ECC 与 SM2 深入剖析

最新动态

区块链DID 系统的开发流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 DID开发

Apache DolphinScheduler 9 月进展:工作流/任务执行等问题修复,性能再升级

白鲸开源

大数据 开源 开源社区 技术分享 Apache DolphinScheduler

支持私有化本地部署|域名证书管理系统白皮书

37丫37

DevOps 运维自动化 自动化运维 域名系统 证书管理

监测到预测:下一代舆情监测软件的演进趋势与核心技术

沃观Wovision

舆情监控 舆情监测 舆情监测系统 海外舆情监测 舆情监测软件

“高情商”的小冰框架,底层靠什么技术来支撑?_生成式 AI_李冬梅_InfoQ精选文章