【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

企业大脑背后的“双系统”:中关村科金以“大模型 + 知识库”打造技术应用新范式

  • 2023-11-23
    北京
  • 本文字数:3859 字

    阅读完需:约 13 分钟

大小:987.65K时长:05:37
企业大脑背后的“双系统”:中关村科金以“大模型+知识库”打造技术应用新范式

在这个日新月异的时代,我们无时无刻不在见证着 AI 和大模型技术的飞速发展。它们如同一座座高塔,引领着人类社会向着未来前进。这些技术的重要性在于为人类的生活和工作带来了前所未有的变革和进步,让世界更加智能化、高效化。

 

11 月 23 日,由中关村科金与中国信通院人工智能创新中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的 2023 大模型产业前沿论坛正式启幕。

 

作为一家对话式 AI 技术解决方案提供商,中关村科金利用其多年的人工智能技术积累和行业经验,为各行业提供了智能化、高效化的解决方案,帮助客户提升效率、降低成本、提高用户体验。


在本场发布会上,中关村科金发布了国内首个企业知识大模型、AgentGraph 应用开发平台,以及“超级员工”助手系列 AIGC 应用,为企业提供开箱即用、系统无缝衔接、成本可负担的专属领域大模型服务。

企业知识大模型:让每个企业都拥有自己专属的大模型


“让每个企业都拥有自己专属的大模型”是中关村科金在大模型领域践行的产品和技术理念。


与市场上其他领域大模型不同的是,中关村科金的企业知识大模型不仅具备了领域大模型的基本能力,还拥有一个知识密度较高的领域知识库。

 

“领域大模型+领域 知识库”这一路线,核心是为了利用大模型的理解能力,将散落在企业内外部各类数据源中的事实知识和流程知识提取出来,然后再利用大模型的生成能力输出长文本或多轮对话。


之所以要把大模型的直觉系统和领域知识库相结合,是因为此前市场上的前几代产品没有知识库的支持都会有一些缺陷。例如,第一代文档管理产品仅限于简单地给文档打标签,对于文档中的具体内容并不理解。尽管第二代的知识图谱能够提供比文档管理产品更加准确的信息,但其对于知识的覆盖范围较低,因此在实际应用中效果不佳。大模型兴起后,信息查询的覆盖度和准确率才得到了大幅提升。


增加了领域知识库的大模型让企业知识大模型同时拥有类似人类左脑的直觉系统和类似右脑的可存储长尾碎片化知识的知识系统。


有了知识库的加持,知识密集型企业可以应用大模型技术构建智能知识中台,高效打造全媒体销服一体化应用,提升企业知识管理和利用效能,拓展认知深度和支持复杂决策。


在人工智能领域,知识图谱和预训练语言模型是两个重要的基础技术。算法团队出身的中关村科金技术团队有着多年知识图谱方面的技术经验,并且也一直深耕预训练模型的研发,积累了丰富的模型微调经验,使其能够应用于各种场景,包括知识问答、营销、金融等场景。


最近两年,大语言模型呈现出规模体量大、复杂度高的趋势,训练一款大模型需要更多的数据、计算资源和优化技术来支持,这就把很多企业困在了这场“AI 竞赛”的大门之外。

 

微调大模型需要积累大量的对话数据和经验,通过对任务的分解、掺混和优化,可以提高模型的效率和性能,而这些正是中关村科金技术团队的优势所在。

 

因此,将这项能够降低大模型微调门槛的技术普惠出去成为中关村科金的当务之急,这也是为什么中关村科金选择在这样的时间点上发布这一技术路径的原因。


作为国内首个企业知识大模型,其主要具备以下优势:

 

  • 准确度高:模型能力获中国信通院权威机构认证,具备全面的语义、语音、视觉等基础能力,在 5 个能力域、46 个能力项评测中准确度达 95%+,已达到当前国产大模型最高能力级别,全面升级企业营销服务价值,提升员工工作体验;

  • 数据丰富:预置 2000 亿 token 预训练数据,2000 万条指令数据;

  • 安全可控:通过数据清洗、隐私脱敏、合规加训、提示控制、质检过滤等多种技术手段实现模型安全可控;

  • 成本可负担:灵活适配 10+大模型,指令数据可持续积累,实现单周迭代、单卡推理,为企业提供开箱即用的智能工具,加深业务与技术的耦合,提升生产力并降低成本;


据中关村科金技术副总裁张杰介绍,企业知识大模型现已经可以完全覆盖企业营销服务场景。耗费 10 万卡天算力,整理出原子任务间的协同增益关系图,从而高效微调,避免灾难性遗忘,极大缩短了微调一款通用大模型的时间并且降低了算力成本。

 

依托多年的技术积累,中关村科金走通了一条“领域大模型+领域知识库”的底层技术之路。在企业知识大模型基础上,顺势生长出了 AgentGraph 应用开发平台。、

AgentGraph 应用开发平台:零代码、3 分钟搭好一款应用


AgentGraph 是一款基于中关村科金企业知识大模型的一站式、全链路的 AI Native 应用开发平台。AgentGraph 提供多项核心开发能力,包括开放的大模型调用、可视化任务流程编排、AI 及系统工具组件、数据处理及存储、低代码应用构建,为企业专属大模型应用提供快捷、高效、安全的解决方案。

 

以大语言模型为底座的应用开发平台近两年来备受追捧,多家国际科技巨头和科研机构都在该领域加大了研发和投入。OpenAI、谷歌、Meta 等公司都结合自家大模型产品构建了较为完善的应用平台生态体系。


与他们不同的是,中关村科金这款 AgentGraph 平台底座是面向 AI 原生应用的零代码开发平台。据张杰介绍,AgentGraph 平台场景(Vertical Agent)里封装了 200 多个场景 KnowHow,犹如为大模型装上了专属、定制化的 Agent OS“操作系统”,为企业打造下一站 AI Native 入口。

 

AgentGraph 应用开发平台也具备了多项开箱即用的功能,例如开发者通过拖拉拽可实现的零代码流程编排画布,最快 3 分钟完成一款应用搭建,极大降低了企业内部应用创新成本;此外,AgentGraph 平台还具备组件和应用的运行管理能力,开发者能够在 AgentGraph 平台上贡献自己的 AI Native 应用,避免重复造轮子。

 

更重要的是,从设计之初,AgentGraph 应用开发平台就将开放、易用奉为圭臬。它不仅能支持 10+开源大模型调用、兼容 Lang Chain 等开源框架,还允许 API 直接接入,并且支持包括常见文档、网页、办公工具在内的多源数据。


张杰称,未来公司将计划开源 AgentGraph 应用开发平台开源,让内部能力组件可以帮助更多企业低成本、快速地开发出新的大模型应用。

 

“开源应用开发平台的意义在于提供了一种自由、灵活和创新的方式来开发应用程序。在开源平台上,开发者可以自由地修改和定制软件,满足自己的需求,同时也可以学习和借鉴其他开发者的经验和技巧,提高自己的技术水平。此外,开源应用开发平台还可以促进开发者之间的合作和交流,构建完整的技术生态链,推动整个技术领域的发展和创新。”

“超级员工”助手系列 AIGC 应用:打通数智化升级“最后一公里”


事实上,以大模型为底座的 AI Native 应用的发展历程并不长,但其在短短几年内已经取得了令人瞩目的成就。目前,AI Native 应用已经在自然语言处理、图像识别、语音识别等领域都取得了重大进展,为人们的生活和工作带来了诸多便利。

 

中关村科金基于国内首个企业知识大模型打造了“超级员工”助手系列 AIGC 应用,包括 ChatPilot 知识助手、培训助手、合规助手、服务助手、营销助手、写作助手、数据助手等,为企业提供开箱即用、系统无缝衔接、成本可负担的 AI 创新应用。

 

“超级员工”助手系列 AIGC 应用具备阅读(信息抽取)、倾听(语言理解)、撰写(文本生成)、规划(思维链)等关键技能,在营销文案生成、客服问答、座席助手等场景下发挥了巨大价值。

 

目前,中关村科金打造的“超级员工”助手系列 AIGC 应用已在各个场景落地。其中,在智能客服场景下表现尤为亮眼。

 

张杰举例说,“与传统的智能客服相比,大模型进一步降低了开发和运维成本。以前,各种场景都需要算法工程师标注数据以训练特定任务的模型,因此开发成本较高。现在,企业知识大模型本身的领域专业性已经足够好,不再需要很多算法工程师标数据,可以直接拿过来用,有时稍微标几条数据就够了,大大降低了客服成本。

 

当下,企业数智化转型已进入深水区。“超级员工”助手系列 AIGC 应用打通了企业知识应用的“最后一公里”,大幅提高了生产效率、降低了企业运营成本,提升了员工体验,这些优势可以帮助企业在激烈的市场竞争中获得更大的优势和更多的收益。

 

ChatPilot 知识助手:集成四大能力,打造知识应用新范式

 

作为“超级员工”助手系列 AIGC 应用之一,ChatPilot 知识助手也是中关村科金推出的首款大模型应用。得益于领域大模型、多模态文档解析、知识搜索等核心技术,ChatPilot 知识助手能够以句为单位理解用户提问,轻松识别各种文档非结构化信息。

 

随着近些年大模型的高速发展,对话数据成为企业愈发重视的数据资源。无论在现阶段还是未来,无论是企业与外部客户沟通,还是企业内部员工的培训和协作,对话一直都是最主要、最自然的交互形式。在营销服务、投研投顾、企业运营、科研教学等场景下会产生很多对话数据,这些对话数据充满价值,因为它们能够最直观地体现个体或企业的诉求。这些场景也是 ChatPilot 知识助手应用最为广泛的场景。

 

在这些场景中,通过智能化阅读、整理、归纳与 AI 的交互内容,ChatPilot 知识助手可以完成四大核心任务:

 

  • 知识问答:理解用户问题,即时提供答案,支持答案溯源;

  • 抽取 QA:基于文档生成一键生成核心内容 QA;

  • 全文总结:1 分钟可完成 100 页文档关键信息的提取,准确率超 90%,快速生成高质量文档摘要;

  • 搜索增强:猜测用户意图,智能推荐内容;

 

在操作上,ChatPilot 知识助手可做到开箱即用,与企业业务系统无缝集成,充分赋能各个业务条线,避免重复建设。借助领域知识库和数据加密、隔离等技术,ChatPilot 知识助手能在保障企业数据安全的基础上,确保输出的内容准确、可控、可用。

 

作为专注于对话式 AI 技术解决方案提供商,随着企业知识大模型的发布,中关村科金成为了“领域大模型+领域知识库”这条路上的先行者。未来,如何发挥自身优势,在领域内积累更多专业数据,沉淀更多领域知识,并将这些数据和知识集成到大模型上,将成为中关村科金最稳固的技术护城河。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-23 17:316607

评论

发布
暂无评论
发现更多内容

30个类手写Spring核心原理之AOP代码织入(5)

Tom弹架构

Java spring 源码

Linux之rm命令

入门小站

Linux

在线JSON转flow工具

入门小站

工具

存储空间降为原来的1/7,TDengine在中移物联网轨迹数据存储中的应用

TDengine

数据库 tdengine 时序数据库

前端架构师的 git 功力,你有几成火候?

杨成功

git 架构师 GitFlow git 规范 签约计划第二季

大数据开发之数仓工具Hive(一)

@零度

大数据 hive 数仓工具

iOS 开发者福音:iOS 项目也能支持 MQTT 5.0 啦!

EMQ映云科技

ios mqtt emq tvos osx

我也想说说日志,但是我不想说漏洞。

why技术

观测云高分通过等保三级认证,信息安全体系建设领先行业

观测云

深入浅出 Java 中枚举的实现原理

恒生LIGHT云社区

Java 编程语言 枚举

Linux一学就会之LVM管理和SSM存储管理器使用

学神来啦

Linux centos 运维 lvm linux云计算

前端开发之cypress的自动化实践

@零度

前端 Cypress

基于JSX的全新BDD工具 - Crius

RingCentral铃盛

CSS之选择器(六)::before和::after

Augus

CSS 12月日更

源码超度:String、StringBuffer、StringBuilder

无心水

StringBuilder StringBuffer String字符串

华为云消息队列服务荣获首个双擎可信云稳定性最高级认证

华为云开发者联盟

开源 安全 消息队列 可信云 DMS Kafka版

拥抱开源,共建生态!观测云 DataFlux-Func 代码全部开源

观测云

Android C++系列:Linux Socket编程(二)网络套接字函数

轻口味

28天写作 Android; 12月日更

【SpringCloud技术专题】「Gateway网关系列」(1)微服务网关服务的Gateway组件的原理介绍分析

洛神灬殇

Spring Cloud api 网关 SpringCloud Gateway API Gateway 12月日更

解析WeNet云端推理部署代码

华为云开发者联盟

gRPC 语音 PyTorch ASR WeNet

卧槽!Spring中竟然有12种定义Bean的方法?

北游学Java

Java、 SP【ring

【软件开发】直播带货App如何开发

青山一叶秋

「可观测产品首发」观测云免费版正式上线!开箱即用,观测无限

观测云

13. 《重学 JAVA》-- 抽象类和接口

杨鹏Geek

Java 25 周年 28天写作 12月日更

纯 Git 实现前端 CI/CD

杨成功

架构 前端 CI/CD 签约计划第二季

云智慧智能运维算法技术黑板报 | 内容合集

云智慧AIOps社区

机器学习 大数据 智能运维 算法实践 技术专题合集

30个类手写Spring核心原理之MVC映射功能(4)

Tom弹架构

Java spring 源码

云原生时代,领域驱动设计思想(DDD)如何落地?

华为云开发者联盟

软件架构 架构设计 建模 领域驱动设计思想 领域模型

百度搜索中“鱼龙混杂”的加盟信息,如何靠AI 解决?

百度Geek说

架构 AI 后端 百度搜索

使用 scipy.fft 进行Fourier Transform:Python 信号处理

华为云开发者联盟

Python 音频 信号处理 傅立叶变换 Fourier transform

斗罗大陆真3D手游实力上线,带你感受魂兽猎杀的超燃时刻

华为云开发者联盟

数据库 华为云数据库 rds for mysql 3D手游 PITR

企业大脑背后的“双系统”:中关村科金以“大模型+知识库”打造技术应用新范式_生成式 AI_李冬梅_InfoQ精选文章