写点什么

用 9B 参数做推理?任度双脑深度思考大模型 T1 发布,创始人:和大厂 PK 的底气来自“根原创”

  • 2025-03-26
    北京
  • 本文字数:2431 字

    阅读完需:约 8 分钟

大小:1.22M时长:07:07
用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”

近日,传神语联重磅发布了任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。

 

在大模型层出不穷的今天,传神语联为什么还执着于推出大模型?底气来自哪里?发布当天,传神语联创始人何恩培、传神语联研究院院长何征宇通过一场深度对话带来了上述问题的答案。

 

“根原创”的底气

Q:在当前市面上已有众多如 DeepSeek、千问、豆包等大模型的情况下,为什么你们还要入局?

 

何恩培:我们并非刚刚入局。早在 GPT 火起来之前,我们已经在法律、语言服务等领域研究和应用大模型技术。去年 5 月份,OpenAI 的 Sam Altman 提到在 GPT5、GPT6 中将数据和推理做分离,这一点还是刺激了我,因为我们已经实现了技术,我觉得还应该更自信一点站出来。因为我们主要 TOB,没有做过什么公开发布,于是我们在 2024 年 11 月正式发布了任度双脑大模型。最新的深度思考版本 T1 早在 2 月就出来了,只是在传神 A 纪元一周年向大家公开发布,进一步巩固我们在大模型领域的技术优势。

 

Q:那数推分离技术,就是你们敢于和大厂 PK 的底气吗?

何恩培:准确的说我们的底气来自根原创,这是我们过去、现在以及未来所有创新的基石和底气。我们从底层算法框架到模型架构,完全自主研发,且通过了中国信通院 0 开源依赖的验证,做到了完全独立自主。当然更重要的是“根原创”技术还做到了“更先进”,我们一次次走在大模型时代的前列,验证了我们的技术先进性,这才是真正的底气。

 

当然,数推分离是我们的大模型的架构设计。基于数推分离架构,任度大模型-T1 实现了“双脑”联合推理,以仅 9B 的小参数规模实现了大智能,性能可媲美参数量为其几十倍,甚至一两百倍的大模型。同时,基于此架构,我们的大模型成长出了实时学习、长效记忆能力,可以实现数据不离场(私域)、无需专业技术人员情况下与企业数据深度融合,并可以持续实时学习客户新数据。

 

深度思考的突破

Q:看来,任度大模型-T1 确实有自己的独特能力,那体现在哪些方面呢?

何征宇:任度大模型-T1 在继承任度双脑大模型实时学习、长效记忆、高性参比等核心能力的基础上,实现了在深度思考、高效能等多维度上的新突破,解决了当前 AI 如何具备真正的结构化思考能力、如何降低模型部署能耗和成本、如何确保数据安全与可控等诸多行业问题,是企业数字化转型的理想选择。

 

总结来说,任度大模型-T1 依托自研的 zANN 神经网络架构,做到像人类一样深度理解并处理信息,实现复杂逻辑推理和抽象思考。

 

结构化思考:推理更透明、更高效。任度大模型-T1 能够将复杂问题分解为多个逻辑清晰的步骤,并逐步分析和解决。其思考过程更加透明和可解释,不再是难以理解的“流水账”形式。例如,在解决数学问题时,任度大模型-T1 会从问题分析、已知信息提取、列方程组到最终求解,每一步都清晰可见。不仅让用户更容易理解模型的推理过程,还显著提升了问题解决的效率和准确性。

 

图:任度双脑-T1-9B 与 600B+开源大模型的结构化思考能力对比

 

智能判断:简单问题直接解决,复杂问题深度思考。任度大模型-T1 能够自动识别问题的复杂度。对于简单问题,直接给出答案,避免了不必要的深度思考过程。例如,当被问及“hello”是什么意思时,任度大模型-T1 会直接给出答案,而不会启动复杂的深度思考流程。相比之下,不少大模型即使面对简单问题,仍然会进行复杂的思考过程,效率低、能耗高。

 

图:任度双脑-T1-9B 智能判断演示图

 

图形化展示:直观清晰,易于理解。任度大模型-T1 在输出结果时,采用了图形化展示的方式,让复杂的信息更加直观和易于理解。例如,当被要求分析水分子和二氧化碳分子的关系时,任度大模型-T1 会直接以图示的方式呈现,不仅让用户一目了然,还显著提升了信息的传达效率,而不少大模型只能以代码或文字形式进行描述。

 

图:任度双脑-T1-9B 与 600B+ 开源大模型结构化图形展示对比

 

多场景应用落地

Q:行业应用是检验大模型能力的试验田,任度大模型-T1 现在的应用落地情况如何?

何恩培:基于深厚的数据应用能力,任度大模型-T1 在航天航空、生物医药、金融、法律等多个领域,已经形成了典型案例,展现了强大的数据处理和分析能力。

 

Q:那具体来聊一下,比如,现在医学科研的比较火热的方向当中, AI For Science 是十分典型的,任度大模型-T1 有没有案例可以分享下?

何恩培:AI For Science 是我们重点且擅长的领域,比如我们与全球顶尖的干细胞科学家合作,构建干细胞综合研究大模型,进行干细胞综合研究,并开发面向健康伴侣的端侧小模型——“为能”,将干细胞生物治疗和人工智能有机结合,实现发现-诊断-分析研究-治疗方案全健康链的大模型赋能。

 

Q:听说你们也接入了 DeepSeek?你们是怎么考虑的?

何征宇:准确的说不是“接入”Deepseek,而是推出了首义任度双脑一体机,深度融合了任度双脑 9B 大模型、DeepSeek-R1 671B 大模型的能力,帮助企业形成知识沉淀-分析-决策的闭环。我们是从多个角度考虑的。对用户来说,他们有选择使用哪个大模型的自由度。但同时,用户也需要保障自身数据的安全可控。因此,我们推出了双模型一体机,这样一来,敏感数据层使用任度大模型,应用层则可以选择 DeepSeek 或其他大模型,确保数据安全和业务灵活性。

 

Q:你们对未来的展望是什么?

何恩培:在业务定位上,传神有根原创的深度学习框架和模型架构,这非常利于我们向两个方向发展,一个是为科学研究赋能,也就是正在流行的方向 AI For Science,一个是向端侧发展,实现从万物互联到“万脑互联”,让人工智能赋能服务我们生活每个角落。从产业生态上我们正在联合一些原创公司发起原创联盟,向合作伙伴开放技术,共同构建国产原创的 AI 研究和应用生态,通过自主研发和根原创技术,摆脱对国外技术的依赖,确保核心技术的自主可控,为国家构建一个安全、可靠的 AI 生态体系。

 

任度双脑深度思考大模型-T1 的发布,不仅是对参数竞赛时代的终结宣言,更是开启 AI"质效革命"新纪元的里程碑。我们坚信,任度双脑深度思考大模型-T1 将进一步展现出差异化竞争优势,以超强的性能,卓越的深度思考能力,成为企业数字化转型的新质生产力。

2025-03-26 11:434130

评论 1 条评论

发布
用户头像
听名字就能看出来有点意思
2025-03-28 12:02 · 北京
回复
没有更多了

架构师训练营第三周作业和小记

tuuezzy

架构师 极客大学架构师训练营

[架构师训练营] Week01 -学习总结

谭方敏

架构师是怎样炼成的-3-2-设计模式

闷骚程序员

Zookeeper通信协议详解

tunsuy

zookeeper TCP/IP 通信协议

让你眼前一亮的 10 大 TS 项目

阿宝哥

Java typescript 开源 大前端 Web

第三周总结

晨光

第三周手写单例模式(饿汉模式)

吴建中

极客大学架构师训练营

极客大学架构师训练营 框架开发 第三次作业

John(易筋)

极客时间 设计模式 极客大学 极客大学架构师训练营 框架开发

一个汉字占几个字节你真的记住了吗?

Java旅途

Zookeeper的数据剖析

tunsuy

zookeeper 日志分析 事务 快照 数据恢复

架构师训练营第四周

Melo

Oracle SQL调优系列之看懂执行计划explain

Nicky.Ma

sql

第三周作业

晨光

架构师训练营 第三周 学习总结

RZC

Zookeeper集群模式启动

tunsuy

zookeeper 源码分析 socket 分布式集群

第三周-设计模式-学习总结

吴建中

极客大学架构师训练营

【非原创】微服务设计

Axe

太赞了!一份适合程序员的精选面试题清单。

JackTian

GitHub 开源 编程 程序员 面试

极客大学架构师训练营 系统架构 第7课 听课总结

John(易筋)

极客时间 系统架构 高并发 极客大学 极客大学架构师训练营

windows使用docker运行mysql等工具(二)安装运行mysql

Java旅途

MySQL Docker

面向对象设计模式课程小结

梅子黄时雨

极客大学架构师训练营

良心推荐 | LeetCode(力扣),算法、数据结构的学习良伴

YoungZY

算法

组合设计模式编码&手写单例模式

吴建中

极客大学架构师训练营

产品失败了,产品经理要不要承担责任?

涛哥 数字产品和业务架构

产品经理

组合模式应用

yupi

windows使用docker运行mysql等工具(一)windows安装docker

Java旅途

MySQL Docker

rodert单排学习redis进阶【白银一】

JavaPub

Java nosql redis

手写单例模式

yupi

区块链改变数字营销与广告市场

CECBC

区块链技术 广告业 精准投放 去中介 公开透明

架构师训练营 第三周 命题作业

RZC

极客大学架构师训练营 框架开发 模式与重构 JUnit、Spring、Hive核心源码解析 第6课

John(易筋)

spring 极客时间 极客大学 极客大学架构师训练营 JUnit

用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”_AI&大模型_华卫_InfoQ精选文章