写点什么

百川智能发布角色大模型,零代码复刻角色

  • 2024-01-09
    北京
  • 本文字数:2054 字

    阅读完需:约 7 分钟

大小:1017.61K时长:05:47
百川智能发布角色大模型,零代码复刻角色

2024 年 1 月 9 日,百川智能发布角色大模型 Baichuan-NPC,深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动。

 

此外,对于游戏领域 AI 角色开发成本高、周期长、自由度差、API 不稳定等诸多不足, 百川智能推出了“角色创建平台+搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。

 

相关链接:https://npc.baichuan-ai.com

 

中文领域“最强”角色大模型

 

大模型拓展了传媒、游戏、影视等诸多领域数字角色的想象空间。其中游戏行业作为科技创新的“试验田”,受到的影响尤其明显。大模型强大的生成能力、流畅的自然交互方式,将改变游戏的开发流程,重构游戏体验早已成为业内共识。但如何将大模型这个新技术融入成熟的游戏研发流程,依旧挑战重重。其中目前最大的问题是,当下的大模型在角色扮演上依旧“不够拟人”,这会直接破坏用户与角色的互动感受,使游戏丧失沉浸感。

 

模型在角色扮演中是否足够“拟人”,主要由模型的基础能力和角色扮演一致性两个方面来决定。

 

对于角色扮演而言,模型的基础能力既包括模型的通用智能水准,还包含角色知识、对话能力、情节演绎以及逻辑推理四个专项能力。而强化这些能力的最佳方式是在预训练阶段通过高质量数据集进行针对性训练。

 

百川智能收集了海量行业网站、高质量书籍、优质剧本数据,对 Baichuan-NPC 进行了超过 3T Tokens 的领域知识预训练。此外,Baichuan-NPC 还创新性地使用多方法模型合成数据进行预训练阶段的领域知识增强,针对性地缓解了 Reversal Curse 问题,大幅度提升 Token 利用效率。

 

角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行,即业界所说的 OOC 问题(角色言行偏离原有设定,如:古代人物谈论现代事物)。

 

针对这一问题,百川智能首创将思维链对齐技术引入到角色模型对齐中。使用带有思维链的数据构造方式和带有思维链对齐的强化对齐方法,双管齐下让模型的思考过程和思考之后的行动表现更接近人类,大幅提升了角色一致性,显著增强模型的基础对话能力和角色演绎能力。

 

Baichuan-NPC 通过强化模型基础能力,使用思维链对齐技术赋予角色模型类人的思考能力,使模型能够敏锐地捕捉上下文对话语义,生成更加符合人物性格地对话和行动,让角色效果栩栩如生。

 

在 CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演 Agent 评估标准)评测中,Baichuan-NPC 在对话能力、角色一致性、扮演吸引力等方面大幅领先,是目前中文领域最强角色模型。

 

零代码复刻角色

 

将大模型的角色构建能力应用于具体场景,除了模型要具备强大的基础能力,简洁高效的开发流程同样至关重要。

 

当前行业内的角色构建主要通过 API 调用实现。在实际创作中,需要产品、运营、技术等多个部门共同协作、反复调试,开发流程门槛高、周期长、效率低,最终的角色效果还难以保障。

 

对此,百川智能在 Baichuan-NPC 基础上推出了由“角色创建平台+搜索增强知识库”组成的开发套件,通过标准化模板、自定义选项、所见即得的调优界面及搜索增强知识库,为用户提供了一个高度自由且无需编写代码的低成本解决方案。

 


百川智能角色创建平台官网

 

为提高角色定制自由度,百川智能自研了强多轮对齐和搜索增强知识库两项特色技术。强多轮对齐技术通过精心设计 System Prompt 中的角色设定字段,强化了角色创建平台 System Prompt 在对话 Session 中的特殊地位,保证了角色言行响应系统指令定制的敏感性和鲁棒性。简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定进行相应的“演绎”。

 


不同性格孙悟空的不同演绎

 

AI 角色知识储备量是决定能否自由定制角色的另一个重要因素。如果 AI 角色缺乏与其身份相符的知识,即使角色“演绎”的再努力,也会让人感觉“不真实”。

 

百川智能将搜索技术与角色知识能力深度融合,基于最新研发的 SOTA 模型 BCTE(Baichuan-Text-Embedding),针对角色扮演场景优化了建库和召回算法,为角色和知识库提供了灵活的“多对多”关联方式。用户只需上传角色所需的知识文档并自定义回复方式,就能显著降低角色产生幻觉的可能性,极大地丰富了角色“内涵”。

 

创建好角色只是完成了角色定制的第一步,想要真正落到真实场景,还需要微调优化让其达到最佳效果。百川角色创建平台将微调选项和角色对话效果实时整合,实现了调优过程的“所调即所见”。



角色调试与生成效果实时同步

 

此外,平台还提供了一键复制功能。完成角色调试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,极大降低了开发门槛,有效缩减了企业定制角色的时间和人员成本。

 


角色调试完成即可一键复制角色代码

 

目前,百川智能已经与众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展 AIGC 创作的应用场景。

 

2024-01-09 18:249272

评论

发布
暂无评论
发现更多内容

保姆级SpringBoot+Vue图片上传到阿里云OSS教程

沉默王二

Spring Boot

阿里巴巴云原生大数据运维平台 SREWorks 正式开源

阿里云大数据AI技术

大数据 自动化运维 大规模网络运维

限量独家!濒危动物数字藏品免费发放!

百度开发者中心

百度希壤元宇宙平台上线首个汽车数字展厅,领克探索汽车营销新方式

百度开发者中心

Docker Build时的安全问题

火线安全

Docker 云原生 云安全 docker build

中台和多云管理是伪问题?运维要集体下岗了吗?

火线安全

DevOps 云原生 云安全

以太坊的扩容革命:ETH2.0

不登山的小鲁

以太坊 扩容 Ethereum eth eth2.0

2022年最热门的招聘技术技能是什么,您绝对想不到

禅道项目管理

项目管理 开发技能

跑马灯带你深入浅出TextView的源码世界

vivo互联网技术

android 源码分析 TextView

春分耕种时,AI“现身”田间地头

百度开发者中心

开学季 | 飞桨AI Studio课程学习,小白也可以成为一名优秀的算法工程师!

百度开发者中心

Rust 用于移动开发的几种方式

非凸科技

Java c++ Python rust 量化

内存之旅——如何提升CMA利用率?

OpenHarmony开发者

内存 OpenHarmony

电路模型和电路定律 (Ⅲ)

謓泽

3月月更

信通院推出数字化赋能者新标准天翼云获评数字化转型赋能服务集体

天翼云开发者社区

一文来了解关于分布式锁的那些事儿

Linux服务器开发

redis 分布式 分布式锁 Linux服务器开发 Linux后台开发

天翼云成为首个加入openGauss社区的运营商云

天翼云开发者社区

DevOps落地思考

火线安全

DevOps 云原生 云安全 DevOps认证

融云互联网通信安全揭秘之链路安全

融云 RongCloud

网络安全

两会“数字经济”高频出位,博睿数据为企业数字转型提供有力引擎

博睿数据

多场景推进 服务网格在联通的落地实践(下)

百度开发者中心

VuePress 博客之 SEO 优化(六)站长工具

冴羽

Vue 前端 vuepress SEO 博客搭建

译文《Java并发编程之volatile》

潘大壮

并发编程 volatile 后端 Java EE

如何理解基础服务和通用服务

Im胡子

基础服务 通用服务 基础服务边界

Gartner发布中国IaaS PaaS市场服务报告,天翼云强势入选

天翼云开发者社区

企业在线产品宣传册应该如何设计?

小炮

产品宣传手册

公有云市场百舸争流!天翼云稳居第一梯队,进入领导者象限

天翼云开发者社区

QoS 设计:车联网平台消息传输质量保障|车联网平台搭建从入门到精通 04

EMQ映云科技

物联网 IoT mqtt coap emq

融云直播 SDK 升级,让直播「PK」起来

融云 RongCloud

直播 IM 场景化

雄安新区设立四周年,看天翼云以数字底座托起未来之城

天翼云开发者社区

长连接网关技术专题(七):小米小爱单机120万长连接接入层的架构演进

JackJiang

网络编程 websocket 即时通讯 网关 长连接

百川智能发布角色大模型,零代码复刻角色_企业动态_褚杏娟_InfoQ精选文章