写点什么

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语 2.0,支持 200K 超长上下文

  • 2024-01-18
    北京
  • 本文字数:1019 字

    阅读完需:约 3 分钟

大小:356.42K时长:02:01
国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文

1 月 17 日,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书生·浦语 2.0(InternLM2)。

 

InternLM2 是在 2.6 万亿 token 的高质量语料上训练得到的。沿袭第一代书生·浦语(InternLM)设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,

 

沿袭第一代书生·浦语(InternLM)的设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,分别是:

 

  • Internlm2-base: 高质量和具有很强可塑性的模型基座,是模型进行深度领域适配的高质量起点;

  • Internlm2: 在 internlm2-base 基础上,在多个能力方向进行了强化,在评测中成绩优异,同时保持了很好的通用语言能力;

  • Internlm2-sft:在 Base 基础上,进行有监督的人类对齐训练;

  • Internlm2-chat:在 internlm2-sft 基础上,经过 RLHF,面向对话交互进行了优化,具有很好的指令遵循、共情聊天和调用工具等的能力。


InternLM2 的基础模型具备以下的技术特点:

 

  • 有效支持 20 万 tokens 的超长上下文:能够一次性接受并处理约 30 万汉字(约五六百页的文档)的输入内容。

  • 综合性能全面提升:各能力维度相比上一代模型全面进步,在推理、数学、代码等方面的能力提升显著。

 

值得一提的是,书生·浦语 2.0 版本将继续开源,提供免费商用授权。

 

Github 地址:

https://github.com/InternLM/InternLM

 

模型相关链接:

目前,书⽣·浦语 2.0(InternLM2)系列模型现已在魔搭 ModelScope 社区开源,包括:

 

书生·浦语 2-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-7b/summary

书生·浦语 2-对话-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b/summary

书生·浦语 2-基座-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-7b/summary

书生·浦语 2-对话-7B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b-sft/summary

书生·浦语 2-基座-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-20b/summary

书生·浦语 2-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-20b/summary

书生·浦语 2-对话-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b/summary

书生·浦语 2-对话-20B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b-sft/summary

2024-01-18 17:587786
用户头像
李冬梅 加V:busulishang4668

发布了 1209 篇内容, 共 834.3 次阅读, 收获喜欢 1314 次。

关注

评论

发布
暂无评论
发现更多内容

过程控制 通讯维护经验总结(5)

万里无云万里天

工业 工厂运维 过程控制

如何提高 SaaS 产品的成功率?

hepingfly【gzh:和平本记】

AI智能体与多模态算法系统:您的“全能数字员工”已上线

上海拔俗

10 月热搜精选

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库

StarRocks 4.0:FlatJSON,让 JSON 查询像列存一样高效

StarRocks

json sql 数据查询 StarRocks 4.0 FlatJSON

储能项目如何落地?— 西格电力从规划到运营的全流程实战指南

西格电力

高性能存储 新能源 智慧储能电站 储能 新能源产业

qData 数据中台开源版 v1.0.7 发布:新增 SQL Server 支持,快速部署支持达梦与 MySQL 主库切换!

千桐科技

大数据 开源 数据中台 数据治理 qData

智能车间管理系统:数字化驱动的车间全流程管控生态

深圳亥时科技

职场中的顶级能力—服务意识

老李说技术

职场 职场发展

Java程序员该如何快速上手LLM应用开发呢?

六边形架构

LLM应用开发 Java应用开发 Java大模型

AI Compass前沿速览:Cursor 2.0、Firefly Image5、Agent HQ 、LongCat-Video、Kimi-k2 Thinking

汀丶人工智能

大数据-146 Apache Kudu Docker 快速部署:3 Master/5 TServer 实战与踩坑速查

武子康

大数据 flink spark 分布式 Apache Kudu

工业设计 自控设计经验总结(17)

万里无云万里天

设计师 工业 工厂运维

天润融通AI Agent实战营北京站圆满收官,引爆企业AI生产力!

天润融通

Advantech iView SQL注入漏洞分析:认证绕过与数据泄露

qife122

网络安全 SQL注入

AI替代人工:车企如何用天润融通ZENAVA重塑试驾邀约流程

天润融通

等级保护建设方案,等保解决方案

金陵老街

等级保护

AI辅助规划编制与智能管理系统:为您的业务装上“导航”与“自动驾驶”

上海拔俗

AWS CloudFront 可观测最佳实践

观测云

aws cloudfront

过程控制 硬件维护经验总结(8)

万里无云万里天

工业 工厂运维 过程控制

Vibe Coding - 免费使用gpt-5、grok-code-fast-1进行氛围编程

小工匠

vibe coding Claude Code

听歌母带音质,追剧AI搜片,鸿蒙双11为你的娱乐生活升个级

最新动态

《Learn Python Programming(4th)》读后感

codists

Python

AI智能体-路由模式

Hernon AI

#LangChain AI 智能体 AI开发框架 AI设计方法论 AI开发方法论

C#/.NET/.NET Core优秀项目和框架2025年10月简报

追逐时光者

.net

浅析iGIX多语列的实现

inBuilder低代码平台

jpa 国际化 spring data 多语言支持 iGIX

Data engineering at Meta

数新网络官方账号

meta

西格电力企业级储能技术线路图制定方法与实践指南

西格电力

高性能存储 智慧储能电站 储能 新能源产业 可再生能源发电

传帮带 人才梯队建设经验总结(16)

万里无云万里天

人才培养 工业 工厂运维

AI客服越智能,客户越崩溃?看天润融通怎么说

天润融通

在CEIC 2025:生态之力,推动全球消费电子产业的风向之变

脑极体

AI

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文_生成式 AI_李冬梅_InfoQ精选文章