写点什么

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语 2.0,支持 200K 超长上下文

  • 2024-01-18
    北京
  • 本文字数:1019 字

    阅读完需:约 3 分钟

大小:356.42K时长:02:01
国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文

1 月 17 日,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书生·浦语 2.0(InternLM2)。

 

InternLM2 是在 2.6 万亿 token 的高质量语料上训练得到的。沿袭第一代书生·浦语(InternLM)设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,

 

沿袭第一代书生·浦语(InternLM)的设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,分别是:

 

  • Internlm2-base: 高质量和具有很强可塑性的模型基座,是模型进行深度领域适配的高质量起点;

  • Internlm2: 在 internlm2-base 基础上,在多个能力方向进行了强化,在评测中成绩优异,同时保持了很好的通用语言能力;

  • Internlm2-sft:在 Base 基础上,进行有监督的人类对齐训练;

  • Internlm2-chat:在 internlm2-sft 基础上,经过 RLHF,面向对话交互进行了优化,具有很好的指令遵循、共情聊天和调用工具等的能力。


InternLM2 的基础模型具备以下的技术特点:

 

  • 有效支持 20 万 tokens 的超长上下文:能够一次性接受并处理约 30 万汉字(约五六百页的文档)的输入内容。

  • 综合性能全面提升:各能力维度相比上一代模型全面进步,在推理、数学、代码等方面的能力提升显著。

 

值得一提的是,书生·浦语 2.0 版本将继续开源,提供免费商用授权。

 

Github 地址:

https://github.com/InternLM/InternLM

 

模型相关链接:

目前,书⽣·浦语 2.0(InternLM2)系列模型现已在魔搭 ModelScope 社区开源,包括:

 

书生·浦语 2-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-7b/summary

书生·浦语 2-对话-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b/summary

书生·浦语 2-基座-7B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-7b/summary

书生·浦语 2-对话-7B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-7b-sft/summary

书生·浦语 2-基座-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-base-20b/summary

书生·浦语 2-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-20b/summary

书生·浦语 2-对话-20B:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b/summary

书生·浦语 2-对话-20B-SFT:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2-chat-20b-sft/summary

2024-01-18 17:587867
用户头像
李冬梅 加V:busulishang4668

发布了 1237 篇内容, 共 853.0 次阅读, 收获喜欢 1323 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试学习笔记丨软件测试流程体系

测试人

软件测试

数字疗法与心理健康应用的普及

心大陆多智能体

人工智能 AI 心理健康 数字心理

国企干部选拔合规| 数智化工具赋能国企优化干部选拔机制

用友BIP

ITSM流程落地经验之问题管理

嘉为蓝鲸

ITSM 事件管理 问题管理

TDengine 签约极氪汽车,建设新一代车联网云端基础平台

TDengine

数据库 tdengine 时序数据库

涛思数据荣获北京市新技术新产品(服务)证书

TDengine

数据库 tdengine 时序数据库

养猪大户必备!教你用ModelBox开发一个AI数猪应用

华为云开发者联盟

人工智能 华为云 华为云ModelArts 华为云开发者联盟 企业号2024年6月PK榜

嘉为蓝鲸监控中心:助力大型金融企业实现各类监控场景全覆盖

嘉为蓝鲸

监控 可观测

斩获 CVPR NTIRE 冠亚军,小红书如何提升短视频与直播体验质量?

小红书技术REDtech

人工智能 算法 计算机视觉 音视频 CVPR

RN状态管理MobX使用

凌宇之蓝

React Native

🔥httpsok-v1.13.0支持nginx证书部署管理

物有本末

SSL证书 SSL域名 免费SSL证书 (SSL)/TLS

httpsok-v1.13.0支持七牛云证书自动部署

物有本末

七牛云存储 SSL证书 七牛云 免费SSL证书

LeetCode题解:2042. 检查句子中的数字是否递增,直接遍历,JavaScript,详细注释

Lee Chen

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

明哥的IT随笔

Koupleless 内核系列 | 一台机器内 Koupleless 模块数量的极限在哪里?

SOFAStack

开源 云原生 开发 架构治理 软件应用架构

毫秒级响应!清科优能应用 TDengine 建设虚拟电厂运营管理平台

TDengine

数据库 涛思数据 tdengine 时序数据库

【ASeeker】Android 源码捞针,服务接口扫描神器

iofomo

android 源码 Framework

LeetCode题解:62. 不同路径,动态规划(空间O(n)),JavaScript,详细注释

Lee Chen

AI+供应链丨一图读懂用友BIP供应链智能场景

用友BIP

TON: 引领区块链革命,有望成为下一个十亿级用户公链巨头

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

京东工业平台商品详情数据接口(vipmro.item_get)

tbapi

京东 京东工业品数据采集 京东工业平台数据采集 京东工业品商品详情数据

国产开源大模型阵营又添新成员!商汤科技发布新一代大语言模型书生·浦语2.0,支持200K超长上下文_生成式 AI_李冬梅_InfoQ精选文章