写点什么

MaaS 赛道再添选手,京东推出言犀大模型:把大模型做实,把供应链做透

  • 2023-07-13
    北京
  • 本文字数:2398 字

    阅读完需:约 8 分钟

MaaS赛道再添选手,京东推出言犀大模型:把大模型做实,把供应链做透

7 月 13 日,2023 京东全球科技探索者大会暨京东云峰会在北京举行,全面推出京东言犀大模型、言犀 AI 开发计算平台、升级支撑大模型落地行业的产品及解决方案,服务千行百业拥抱产业智能。


源于产业、服务产业。言犀大模型融合了 70%的通用数据与 30%京东数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于面向知识密集型、任务型产业场景,解决真实产业问题。


“从产业端切入大模型,如同从北坡攀爬珠峰,有更波澜壮阔的风景,有巨大的探索价值。”京东集团 CEO 许冉首次对外展示了京东的技术追求:成本、效率、体验、可信、普惠、突破。她表示,京东的技术发展史,就是一部供应链技术的发展史、技术驱动的发展史、产业降本增效的发展史。大模型的出现,为京东帮助产业实现价值倍增,增添了新的可能性。


大模型依托供应链深入产业


京东集团技术委员会主席、京东云事业部总裁曹鹏在会议上发表了题为《突破供应链价值 跨越产业智能》的演讲。他表示,对于京东而言,大模型不是目标,而是工具,目的在于真正创造出产业价值。因此,秉承着把人工智能技术与实体产业结合起来的理念,京东要做产业大模型而不是通用大模型。基于京东深耕多模态研发经验,集合京东零售、物流、健康等丰富产业场景,曹鹏宣布京东正式发布产业大模型“言犀”,内置 70%标准语料和 30%独有产业数据。



“单一的模型是没有办法直接用起来的”,曹鹏表示,京东为“言犀”大模型准备了相应的配套开发工具——言犀 AI 开发计算平台,内置京东在开发大模型时积累的能力,预计 8 月会正式上线发布。他表示,言犀 AI 开发计算平台可以用“创建目标”“上传数据”“创建管道”“模型训练”“部署和发布”五步将通用大模型转化为专业的产业大模型。在平台中,除了京东自己的“言犀”大模型以外,还内置了其他开源大模型框架。


京东的经营理念是“成本”“效率”“体验”,而“言犀”大模型的应用不仅可以帮助用户提升体验,还可以帮助京东在零售、物流、健康、金融等领域降低成本、提升效率。此外,“做好大模型还需要有基础技术支持”。曹鹏表示,为了更好地应用“言犀”大模型,京东还对技术基座产品做了优化,为大模型设计了极致性能数字基础设施如京东云云舰 3.0、京东云云海 2.0 以及京东云京刚 3.0。


“我们的技术理念源于产业,也服务于产业。”曹鹏如是总结。“孤举者难起,众行者易趋”,整个产业智能时代的到来,不是光靠京东一家企业,而是靠无数行业中的同仁一起不断努力。


言犀大模型的技术优势


数智供应链训练产业大模型,大模型依托供应链深入产业。


优势一:尖端技术突破

  • 7 年深耕多模态模型研发:自 2017 年,京东云就布局人机交互、多模态智能等 AI 前瞻技术,在多模态领域的 26 项国际赛事中夺魁,并在 2023 年斩获中国人工智能最高奖吴文俊奖个人、团体两项殊荣。

  • 首创将领域知识注入大模型:基于领域知识注入的模型 K-PLUG,采用推理低延时策略,推理速度提升 6.2 倍,模型部署成本降低 90%。


优势二:产业原生数据

  • 30%数智供应链原生数据:数智供应链长链路、复杂协同的原生数据,更适合产业大模型训练,沉淀 30%原生数据,每年数百亿优质动态交互数据回流。围绕这些场景训练的大模型更适合产业应用。


优势三:新型算力加持

  • 超大规模计算集群“天琴α”:2021 年,京东落地重庆全国首个基于 SuperPOD 架构的超大规模计算集群——天琴α,算力总规模达到 135TFLOPS(每秒浮点运算次数),推理提速 6.2 倍,推理成本节省 90%。


构建大模型“训练营”和“弹药库” 打通技术落地每一步


京东探索研究院院长何晓冬在会议上介绍,言犀大模型支持语言、语音、视觉、多模态等,70%通用域数据,结合 30%的行业数据,实现基座模型+垂直领域模型的精调,可服务于零售、金融、教育、政务等领域。他还透露,计划在 2024 年上半年全面开放大模型能力,向产业输出定制化模型。此外,京东也在探索从语言大模型走向多模态数字人交互,而具身智能也将是京东探索研究院未来重点探索方向。



何晓东列举了大模型的应用方向:已写 30 亿字营销文案,上万个直播脚本;数智人,应用于电商直播;艺术创作等。他认为,未来通往 AGI 的终局,多模态智能是必经之路。如果想打造一个像人一样聪明的 AGI,就需要向人学习,通过多模态方式来进行知识获取、知识融合,这是让机器走向 AGI 的必经之路;未来人与机器交互时,必然是通过语言、视觉、语音进行沟通的,所以机器也必须能够理解相应的信息,否则机器就无法服务人类。


大模型在京东的实践


言犀大模型以“三步走”深入产业,2023 年 7 月,产业原生,推出大模型;2023 年下半年,内部实践,产品融合,锤炼迭代;2024 年上半年,服务产业,全面开放,大模型能力向外部严肃商业场景开放。


数智供应链,服务超千万商品 SKU、5000 万工业品 SKU 、800 多万家活跃企业客户(其中世界 500 强企业超 90%、全国专精特新中小企业近 70%)、全国 2000 多条产业带。这个链路更长、场景更复杂、数据更丰富的京东内部场景,是大模型绝佳的“训练场”。


  • 言犀 AI 开发计算平台:实现大模型下的模型即服务,高效、低成本构建 AI 产品。

  • AIGC 商品内容营销平台:每套图成本降低 90%,制作周期从 7 天缩短到半天。

  • 多模态数字人:5 分钟采集生成高仿真数字人,入驻 4000+品牌直播间。

  • AI 增长营销平台:操作效率提升 40 倍,活动生产效率提高上百倍。

  • 健康助手及辅助诊疗:涵盖超千种疾病专业性服务,20 种评价标准保障医疗安全。

  • 京东物流超脑:自动生成全局最优供应链解决方案。


在 MaaS(Model as a Service,模型即服务)赛道越来越激烈的环境下,各大厂都聚焦在大模型的研发和应用场景探索,我们希望看到的是真的能实现业务增长,效率提升的现象,对各个细分行业有实际的价值。


【活动推荐】


在 7 月 21-22 日深圳举办的 ArchSummit 全球架构师峰会上,我们也邀请了国内的企业,例如出门问问、科大讯飞、腾讯、顺丰科技、趣丸科技等企业来演讲,分享各自企业在大模型上的进展,欢迎你来交流。期待与你线下交流!咨询购票请联系 18514549229(微信同手机号)


2023-07-13 18:025008

评论

发布
暂无评论
发现更多内容

NCCL源码解析②:Bootstrap网络连接的建立

OneFlow

人工智能 深度学习

【分布式技术专题】「单点登录技术架构」一文带领你好好认识以下Saml协议的运作机制和流程模式

码界西柚

分布式 SAML SSO 单点登录

Redis一主二从环境搭建

京茶吉鹿

nosql redis

四川农信:与先进科技融合,更好服务广大用户|客户之声

OceanBase 数据库

数据库 oceanbase

iOS SKAN 4.0 时代的广告追踪优化:掌握隐私友好的营销策略

37手游iOS技术运营团队

SKAdNetwork SKAN IDFA ATT App Tracking Trans

成立数科公司之余,央国企推进数智化转型还需要底座支撑

用友BIP

如何高效清洗数据?试试这款神器

博文视点Broadview

火了!阿里资深架构师总结的春招Java岗核心笔记,GitHub标星20k

Java你猿哥

Java ssm 面经 Java工程师 java核心知识

AI日课@20230409:对话式用户界面

无人之路

ChatGPT

“成本刺客”防不胜防,如何应用亚马逊云科技驾驭云成本

Lily

MySQL自增ID用完了怎么办?4种解决方案!

Java你猿哥

Java MySQL sql 后端 ssm

“程序员”即将失业 | 社区征文

六月的雨在InfoQ

程序员 ChatGPT GPT-4 三周年征文

技术同学如何做好向上管理

老张

职场新人 向上管理

这份Java面试八股文让329人成功进入大厂,堪称2023最强

Java你猿哥

Java 面试 面经 春招 Java八股文

AI时代要用俄罗斯套娃思考模式

FN0

AIGC

五面阿里巴巴拿offer后定级P6:分享Java面经及答案总结

Java你猿哥

Java 面试 面经 春招 Java八股文

一文吃透Arthas常用命令!

程序员大彬

Java JVM

流程图哪个软件好用?10款好用的流程图软件推荐:boardmix、Visio、Miro…

彭宏豪95

效率工具 职场 工具 流程图 在线白板

前端工程化实战:React 的模块化开发、性能优化和组件化实践

兴科Sinco

性能优化 前端工程化 React Native 前端模块化 组件化开发

DevOps infra | 互联网、软件公司基础设施建设(基建)哪家强?

laofo

DevOps 研发效能 持续交付 infra 平台工程

Java概述与基础知识

timerring

Java

Kubernetes 本地持久化存储方案 OpenEBS LocalPV 落地实践上——使用篇

江湖十年

k8s 后端 #Kubernetes# Go 语言

包装了三年工作经验的我,被同事发现居然连这些Maven的操作都不懂

Java你猿哥

maven ssm 架构师 Java工程师

浏览器缓存清理:Cookie for Mac6.9.0激活版

真大的脸盆

Mac Mac 软件 缓存清理 清理缓存 缓存处理工具

ChatGPT会在三年内终结编程吗?| 社区征文

芯动大师

程序员 ChatGPT 三周年征文

潮起风来,政企DICT “跃升”之乘风破浪篇

鲸品堂

DT IT 企业号 4 月 PK 榜 ct

为了减少延迟和卡顿,我对 MySQL 查询做了这些优化处理...

Java你猿哥

MySQL sql ssm MySQL优化 优化SQL

华为运动健康服务Health Kit 6.10.0版本新增功能速览!

HarmonyOS SDK

HMS Core

JetCache 缓存开源组件设计精要

阿里技术

缓存 JetCache

Spring 之依赖注入底层原理

Java你猿哥

spring ssm 架构师 Java工程师 spring ioc

线上问题排查异闻录

小小怪下士

Java 程序员 后端 堆内存管理

MaaS赛道再添选手,京东推出言犀大模型:把大模型做实,把供应链做透_业务架构_Xue Liang_InfoQ精选文章