写点什么

百川智能发布角色大模型,零代码复刻角色

  • 2024-01-09
    北京
  • 本文字数:2054 字

    阅读完需:约 7 分钟

大小:1017.61K时长:05:47
百川智能发布角色大模型,零代码复刻角色

2024 年 1 月 9 日,百川智能发布角色大模型 Baichuan-NPC,深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动。

 

此外,对于游戏领域 AI 角色开发成本高、周期长、自由度差、API 不稳定等诸多不足, 百川智能推出了“角色创建平台+搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。

 

相关链接:https://npc.baichuan-ai.com

 

中文领域“最强”角色大模型

 

大模型拓展了传媒、游戏、影视等诸多领域数字角色的想象空间。其中游戏行业作为科技创新的“试验田”,受到的影响尤其明显。大模型强大的生成能力、流畅的自然交互方式,将改变游戏的开发流程,重构游戏体验早已成为业内共识。但如何将大模型这个新技术融入成熟的游戏研发流程,依旧挑战重重。其中目前最大的问题是,当下的大模型在角色扮演上依旧“不够拟人”,这会直接破坏用户与角色的互动感受,使游戏丧失沉浸感。

 

模型在角色扮演中是否足够“拟人”,主要由模型的基础能力和角色扮演一致性两个方面来决定。

 

对于角色扮演而言,模型的基础能力既包括模型的通用智能水准,还包含角色知识、对话能力、情节演绎以及逻辑推理四个专项能力。而强化这些能力的最佳方式是在预训练阶段通过高质量数据集进行针对性训练。

 

百川智能收集了海量行业网站、高质量书籍、优质剧本数据,对 Baichuan-NPC 进行了超过 3T Tokens 的领域知识预训练。此外,Baichuan-NPC 还创新性地使用多方法模型合成数据进行预训练阶段的领域知识增强,针对性地缓解了 Reversal Curse 问题,大幅度提升 Token 利用效率。

 

角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行,即业界所说的 OOC 问题(角色言行偏离原有设定,如:古代人物谈论现代事物)。

 

针对这一问题,百川智能首创将思维链对齐技术引入到角色模型对齐中。使用带有思维链的数据构造方式和带有思维链对齐的强化对齐方法,双管齐下让模型的思考过程和思考之后的行动表现更接近人类,大幅提升了角色一致性,显著增强模型的基础对话能力和角色演绎能力。

 

Baichuan-NPC 通过强化模型基础能力,使用思维链对齐技术赋予角色模型类人的思考能力,使模型能够敏锐地捕捉上下文对话语义,生成更加符合人物性格地对话和行动,让角色效果栩栩如生。

 

在 CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演 Agent 评估标准)评测中,Baichuan-NPC 在对话能力、角色一致性、扮演吸引力等方面大幅领先,是目前中文领域最强角色模型。

 

零代码复刻角色

 

将大模型的角色构建能力应用于具体场景,除了模型要具备强大的基础能力,简洁高效的开发流程同样至关重要。

 

当前行业内的角色构建主要通过 API 调用实现。在实际创作中,需要产品、运营、技术等多个部门共同协作、反复调试,开发流程门槛高、周期长、效率低,最终的角色效果还难以保障。

 

对此,百川智能在 Baichuan-NPC 基础上推出了由“角色创建平台+搜索增强知识库”组成的开发套件,通过标准化模板、自定义选项、所见即得的调优界面及搜索增强知识库,为用户提供了一个高度自由且无需编写代码的低成本解决方案。

 


百川智能角色创建平台官网

 

为提高角色定制自由度,百川智能自研了强多轮对齐和搜索增强知识库两项特色技术。强多轮对齐技术通过精心设计 System Prompt 中的角色设定字段,强化了角色创建平台 System Prompt 在对话 Session 中的特殊地位,保证了角色言行响应系统指令定制的敏感性和鲁棒性。简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定进行相应的“演绎”。

 


不同性格孙悟空的不同演绎

 

AI 角色知识储备量是决定能否自由定制角色的另一个重要因素。如果 AI 角色缺乏与其身份相符的知识,即使角色“演绎”的再努力,也会让人感觉“不真实”。

 

百川智能将搜索技术与角色知识能力深度融合,基于最新研发的 SOTA 模型 BCTE(Baichuan-Text-Embedding),针对角色扮演场景优化了建库和召回算法,为角色和知识库提供了灵活的“多对多”关联方式。用户只需上传角色所需的知识文档并自定义回复方式,就能显著降低角色产生幻觉的可能性,极大地丰富了角色“内涵”。

 

创建好角色只是完成了角色定制的第一步,想要真正落到真实场景,还需要微调优化让其达到最佳效果。百川角色创建平台将微调选项和角色对话效果实时整合,实现了调优过程的“所调即所见”。



角色调试与生成效果实时同步

 

此外,平台还提供了一键复制功能。完成角色调试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,极大降低了开发门槛,有效缩减了企业定制角色的时间和人员成本。

 


角色调试完成即可一键复制角色代码

 

目前,百川智能已经与众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展 AIGC 创作的应用场景。

 

2024-01-09 18:249716

评论

发布
暂无评论
发现更多内容

农产品区块链溯源平台,区块链溯源方案

13530558032

智慧组工党务解决方案,智慧党建系统

13530558032

面试腾讯T3,过关斩将直通3面,终斩获offer流下了激动的泪水(腾讯面经总结分享)

Java架构之路

Java 程序员 架构 面试 编程语言

云算力系统开发|云算力APP软件开发

系统开发

深入理解 Web 协议(三):HTTP 2

vivo互联网技术

Web HTTP HTTP2.0

OAtuth2.0 知多少

oauth2.0 dotnet

量化炒币机器人软件系统开发|量化炒币机器人app开发

系统开发

Protobuf源码解读之编解码

batman

protubuf zigzag varint

2021最新总结:阿里/京东/饿了么/拼多多/爱奇艺面经分享(堪称Offer收割机)

比伯

Java 编程 架构 面试 计算机

最值得期待的Python进阶宝典《Effective Python》第2版中文版来咯!

华章IT

Python 代码整洁 Python编程 EffectivePython Python进阶

量化机器人APP开发|量化机器人软件系统开发

系统开发

助力文化荟萃,区块链或可打造“新”春晚?

CECBC

区块链 春晚

读懂框架设计的灵魂—Java反射机制

Java 编程 架构

60K*17薪的面试题是什么样的,需要具备什么技术?首发“Java面试考点大全”

Java架构之路

Java 程序员 架构 面试 编程语言

第二次书摘的微信视频号直播复盘

小匚

用户体验

区块链电子合同应用平台,区块链存证系统

13530558032

LeetCode题解:322. 零钱兑换,动态规划,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

开源微服务运行时 Dapr 发布 1.0 版本

阿里巴巴云原生

开源 容器 微服务 开发者 云原生

2021 iOS底层提升计划

iOS底层

架构设计篇之微服务实战笔记(四)

小诚信驿站

架构师 刘晓成 小诚信驿站 28天写作 架构师成长笔记

为了面试阿里巴巴、腾讯、字节跳动、京东、华为等大厂,我收集了8家大厂高频Java面试真题集锦(含答案)

Java架构之路

Java 程序员 架构 面试 编程语言

读书笔记-MySQL索引

yunCrush

话题讨论 | 你”节后综合症“了吗?

程序员架构进阶

话题讨论 28天写作 2月春节不断更 话题王者 节后焦虑

jenkins Android 自动构建-扫码下载

三爻

快速搭建本土「Clubhouse」

anyRTC开发者

ios android WebRTC RTC 语音通话

产品训练营第五周作业

产品经理训练营

区块链技术的价值传递

CECBC

区块链

Linux Jenkins 自动打包vue部署到远程window服务器

三爻

Vue jenkins Win

菜单展示的递归与非递归形式实现 (go语言版)

松小鼠

数据结构和算法

Your small business questions, answered

小韩

做一个很出色的程序员

四猿外

Java 程序员 面试 架构师 职场成长

百川智能发布角色大模型,零代码复刻角色_企业动态_褚杏娟_InfoQ精选文章