2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

用 9B 参数做推理?任度双脑深度思考大模型 T1 发布,创始人:和大厂 PK 的底气来自“根原创”

  • 2025-03-26
    北京
  • 本文字数:2431 字

    阅读完需:约 8 分钟

大小:1.22M时长:07:07
用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”

近日,传神语联重磅发布了任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。

 

在大模型层出不穷的今天,传神语联为什么还执着于推出大模型?底气来自哪里?发布当天,传神语联创始人何恩培、传神语联研究院院长何征宇通过一场深度对话带来了上述问题的答案。

 

“根原创”的底气

Q:在当前市面上已有众多如 DeepSeek、千问、豆包等大模型的情况下,为什么你们还要入局?

 

何恩培:我们并非刚刚入局。早在 GPT 火起来之前,我们已经在法律、语言服务等领域研究和应用大模型技术。去年 5 月份,OpenAI 的 Sam Altman 提到在 GPT5、GPT6 中将数据和推理做分离,这一点还是刺激了我,因为我们已经实现了技术,我觉得还应该更自信一点站出来。因为我们主要 TOB,没有做过什么公开发布,于是我们在 2024 年 11 月正式发布了任度双脑大模型。最新的深度思考版本 T1 早在 2 月就出来了,只是在传神 A 纪元一周年向大家公开发布,进一步巩固我们在大模型领域的技术优势。

 

Q:那数推分离技术,就是你们敢于和大厂 PK 的底气吗?

何恩培:准确的说我们的底气来自根原创,这是我们过去、现在以及未来所有创新的基石和底气。我们从底层算法框架到模型架构,完全自主研发,且通过了中国信通院 0 开源依赖的验证,做到了完全独立自主。当然更重要的是“根原创”技术还做到了“更先进”,我们一次次走在大模型时代的前列,验证了我们的技术先进性,这才是真正的底气。

 

当然,数推分离是我们的大模型的架构设计。基于数推分离架构,任度大模型-T1 实现了“双脑”联合推理,以仅 9B 的小参数规模实现了大智能,性能可媲美参数量为其几十倍,甚至一两百倍的大模型。同时,基于此架构,我们的大模型成长出了实时学习、长效记忆能力,可以实现数据不离场(私域)、无需专业技术人员情况下与企业数据深度融合,并可以持续实时学习客户新数据。

 

深度思考的突破

Q:看来,任度大模型-T1 确实有自己的独特能力,那体现在哪些方面呢?

何征宇:任度大模型-T1 在继承任度双脑大模型实时学习、长效记忆、高性参比等核心能力的基础上,实现了在深度思考、高效能等多维度上的新突破,解决了当前 AI 如何具备真正的结构化思考能力、如何降低模型部署能耗和成本、如何确保数据安全与可控等诸多行业问题,是企业数字化转型的理想选择。

 

总结来说,任度大模型-T1 依托自研的 zANN 神经网络架构,做到像人类一样深度理解并处理信息,实现复杂逻辑推理和抽象思考。

 

结构化思考:推理更透明、更高效。任度大模型-T1 能够将复杂问题分解为多个逻辑清晰的步骤,并逐步分析和解决。其思考过程更加透明和可解释,不再是难以理解的“流水账”形式。例如,在解决数学问题时,任度大模型-T1 会从问题分析、已知信息提取、列方程组到最终求解,每一步都清晰可见。不仅让用户更容易理解模型的推理过程,还显著提升了问题解决的效率和准确性。

 

图:任度双脑-T1-9B 与 600B+开源大模型的结构化思考能力对比

 

智能判断:简单问题直接解决,复杂问题深度思考。任度大模型-T1 能够自动识别问题的复杂度。对于简单问题,直接给出答案,避免了不必要的深度思考过程。例如,当被问及“hello”是什么意思时,任度大模型-T1 会直接给出答案,而不会启动复杂的深度思考流程。相比之下,不少大模型即使面对简单问题,仍然会进行复杂的思考过程,效率低、能耗高。

 

图:任度双脑-T1-9B 智能判断演示图

 

图形化展示:直观清晰,易于理解。任度大模型-T1 在输出结果时,采用了图形化展示的方式,让复杂的信息更加直观和易于理解。例如,当被要求分析水分子和二氧化碳分子的关系时,任度大模型-T1 会直接以图示的方式呈现,不仅让用户一目了然,还显著提升了信息的传达效率,而不少大模型只能以代码或文字形式进行描述。

 

图:任度双脑-T1-9B 与 600B+ 开源大模型结构化图形展示对比

 

多场景应用落地

Q:行业应用是检验大模型能力的试验田,任度大模型-T1 现在的应用落地情况如何?

何恩培:基于深厚的数据应用能力,任度大模型-T1 在航天航空、生物医药、金融、法律等多个领域,已经形成了典型案例,展现了强大的数据处理和分析能力。

 

Q:那具体来聊一下,比如,现在医学科研的比较火热的方向当中, AI For Science 是十分典型的,任度大模型-T1 有没有案例可以分享下?

何恩培:AI For Science 是我们重点且擅长的领域,比如我们与全球顶尖的干细胞科学家合作,构建干细胞综合研究大模型,进行干细胞综合研究,并开发面向健康伴侣的端侧小模型——“为能”,将干细胞生物治疗和人工智能有机结合,实现发现-诊断-分析研究-治疗方案全健康链的大模型赋能。

 

Q:听说你们也接入了 DeepSeek?你们是怎么考虑的?

何征宇:准确的说不是“接入”Deepseek,而是推出了首义任度双脑一体机,深度融合了任度双脑 9B 大模型、DeepSeek-R1 671B 大模型的能力,帮助企业形成知识沉淀-分析-决策的闭环。我们是从多个角度考虑的。对用户来说,他们有选择使用哪个大模型的自由度。但同时,用户也需要保障自身数据的安全可控。因此,我们推出了双模型一体机,这样一来,敏感数据层使用任度大模型,应用层则可以选择 DeepSeek 或其他大模型,确保数据安全和业务灵活性。

 

Q:你们对未来的展望是什么?

何恩培:在业务定位上,传神有根原创的深度学习框架和模型架构,这非常利于我们向两个方向发展,一个是为科学研究赋能,也就是正在流行的方向 AI For Science,一个是向端侧发展,实现从万物互联到“万脑互联”,让人工智能赋能服务我们生活每个角落。从产业生态上我们正在联合一些原创公司发起原创联盟,向合作伙伴开放技术,共同构建国产原创的 AI 研究和应用生态,通过自主研发和根原创技术,摆脱对国外技术的依赖,确保核心技术的自主可控,为国家构建一个安全、可靠的 AI 生态体系。

 

任度双脑深度思考大模型-T1 的发布,不仅是对参数竞赛时代的终结宣言,更是开启 AI"质效革命"新纪元的里程碑。我们坚信,任度双脑深度思考大模型-T1 将进一步展现出差异化竞争优势,以超强的性能,卓越的深度思考能力,成为企业数字化转型的新质生产力。

2025-03-26 11:434300

评论 1 条评论

发布
用户头像
听名字就能看出来有点意思
2025-03-28 12:02 · 北京
回复
没有更多了

【Java知识点详解 7】装箱和拆箱

Java 程序员 后端

区块链食品溯源平台,给食品定制数字“身份证”

电微13828808271

【MyBatis系列4】一对一,一对多,多对多查询及延迟加载(N+1问题)分析

Java 程序员 后端

【Spring 工厂】工厂设计模式、第一个Spring程序细节分析、整合日志框架

Java 程序员 后端

【SpringBoot搭建个人博客】- 后台登录(四)

Java 程序员 后端

过等保选择云堡垒机还是硬件堡垒机比较好?

行云管家

网络安全 云服务 堡垒机 等级保护

【Java设计模式系列】装饰器模式(Decorator Pattern)

Java 程序员 后端

【Java面经】阿里三面被挂!幸获内推,历经5轮终于拿到口碑offer(1)

Java 程序员 后端

【MyBatis系列2】最全MyBatis核心配置文件总结,可以作为工具先收藏了

Java 程序员 后端

【Spring Boot 8】Okhttp实现GitHub第三方登录

Java 程序员 后端

【备战秋招冲击大厂】Java面试题系列—Java集合

Java 程序员 后端

【Java设计模式实战系列】好的单例模式是怎样的?

Java 程序员 后端

【Java面试题总结 4】Java Web、网络、设计模式综合篇

Java 程序员 后端

万文讲解实时数仓架构演进

大数据技术指南

11月日更

【Spring 工厂】注入详解 — Set注入(JDK内置类型

Java 程序员 后端

大数据中必须要掌握的 Flink SQL 详细剖析

五分钟学大数据

flink 11月日更

技术干货 | Flutter在线编程实践总结

有道技术团队

flutter 大前端 #技术干货#

【备战秋招冲击大厂】Java面试题系列—数据库

Java 程序员 后端

【Redis面试题】Redis的字符串是怎么实现的?

Java 程序员 后端

【springcloud】eureka服务治理入门

Java 程序员 后端

【增强】(注解)SSM之配置多数据源

Java 程序员 后端

质量基础设施一站式综合服务平台,NQI一站式服务线上平台

电微13828808271

【Redis缓存】- Redis数据结构、基本命令操作、持久化

Java 程序员 后端

公有云是什么意思?其存在的意义是什么?

行云管家

云计算 公有云 私有云 混合云

【Java面经】阿里三面被挂!幸获内推,历经5轮终于拿到口碑offer

Java 程序员 后端

墨天轮国产数据库沙龙 | 张晓庆:GoldenDB分布式数据库的自动安装与备份恢复

墨天轮

数据库 技术沙龙

【Redis系列2】Redis字符串对象之SDS(简单动态字符串)实现原理分析

Java 程序员 后端

【springcloud合集】02:微服务架构理论基础

Java 程序员 后端

【Java面试题】常见Java面试知识点总结

Java 程序员 后端

【Spring Cloud 12】分布式架构下的高可用设计与可伸缩设计

Java 程序员 后端

用APaaS平台落地高校闲置资产调剂业务

明道云

用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”_AI&大模型_华卫_InfoQ精选文章