50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

用 9B 参数做推理?任度双脑深度思考大模型 T1 发布,创始人:和大厂 PK 的底气来自“根原创”

  • 2025-03-26
    北京
  • 本文字数:2431 字

    阅读完需:约 8 分钟

大小:1.22M时长:07:07
用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”

近日,传神语联重磅发布了任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。

 

在大模型层出不穷的今天,传神语联为什么还执着于推出大模型?底气来自哪里?发布当天,传神语联创始人何恩培、传神语联研究院院长何征宇通过一场深度对话带来了上述问题的答案。

 

“根原创”的底气

Q:在当前市面上已有众多如 DeepSeek、千问、豆包等大模型的情况下,为什么你们还要入局?

 

何恩培:我们并非刚刚入局。早在 GPT 火起来之前,我们已经在法律、语言服务等领域研究和应用大模型技术。去年 5 月份,OpenAI 的 Sam Altman 提到在 GPT5、GPT6 中将数据和推理做分离,这一点还是刺激了我,因为我们已经实现了技术,我觉得还应该更自信一点站出来。因为我们主要 TOB,没有做过什么公开发布,于是我们在 2024 年 11 月正式发布了任度双脑大模型。最新的深度思考版本 T1 早在 2 月就出来了,只是在传神 A 纪元一周年向大家公开发布,进一步巩固我们在大模型领域的技术优势。

 

Q:那数推分离技术,就是你们敢于和大厂 PK 的底气吗?

何恩培:准确的说我们的底气来自根原创,这是我们过去、现在以及未来所有创新的基石和底气。我们从底层算法框架到模型架构,完全自主研发,且通过了中国信通院 0 开源依赖的验证,做到了完全独立自主。当然更重要的是“根原创”技术还做到了“更先进”,我们一次次走在大模型时代的前列,验证了我们的技术先进性,这才是真正的底气。

 

当然,数推分离是我们的大模型的架构设计。基于数推分离架构,任度大模型-T1 实现了“双脑”联合推理,以仅 9B 的小参数规模实现了大智能,性能可媲美参数量为其几十倍,甚至一两百倍的大模型。同时,基于此架构,我们的大模型成长出了实时学习、长效记忆能力,可以实现数据不离场(私域)、无需专业技术人员情况下与企业数据深度融合,并可以持续实时学习客户新数据。

 

深度思考的突破

Q:看来,任度大模型-T1 确实有自己的独特能力,那体现在哪些方面呢?

何征宇:任度大模型-T1 在继承任度双脑大模型实时学习、长效记忆、高性参比等核心能力的基础上,实现了在深度思考、高效能等多维度上的新突破,解决了当前 AI 如何具备真正的结构化思考能力、如何降低模型部署能耗和成本、如何确保数据安全与可控等诸多行业问题,是企业数字化转型的理想选择。

 

总结来说,任度大模型-T1 依托自研的 zANN 神经网络架构,做到像人类一样深度理解并处理信息,实现复杂逻辑推理和抽象思考。

 

结构化思考:推理更透明、更高效。任度大模型-T1 能够将复杂问题分解为多个逻辑清晰的步骤,并逐步分析和解决。其思考过程更加透明和可解释,不再是难以理解的“流水账”形式。例如,在解决数学问题时,任度大模型-T1 会从问题分析、已知信息提取、列方程组到最终求解,每一步都清晰可见。不仅让用户更容易理解模型的推理过程,还显著提升了问题解决的效率和准确性。

 

图:任度双脑-T1-9B 与 600B+开源大模型的结构化思考能力对比

 

智能判断:简单问题直接解决,复杂问题深度思考。任度大模型-T1 能够自动识别问题的复杂度。对于简单问题,直接给出答案,避免了不必要的深度思考过程。例如,当被问及“hello”是什么意思时,任度大模型-T1 会直接给出答案,而不会启动复杂的深度思考流程。相比之下,不少大模型即使面对简单问题,仍然会进行复杂的思考过程,效率低、能耗高。

 

图:任度双脑-T1-9B 智能判断演示图

 

图形化展示:直观清晰,易于理解。任度大模型-T1 在输出结果时,采用了图形化展示的方式,让复杂的信息更加直观和易于理解。例如,当被要求分析水分子和二氧化碳分子的关系时,任度大模型-T1 会直接以图示的方式呈现,不仅让用户一目了然,还显著提升了信息的传达效率,而不少大模型只能以代码或文字形式进行描述。

 

图:任度双脑-T1-9B 与 600B+ 开源大模型结构化图形展示对比

 

多场景应用落地

Q:行业应用是检验大模型能力的试验田,任度大模型-T1 现在的应用落地情况如何?

何恩培:基于深厚的数据应用能力,任度大模型-T1 在航天航空、生物医药、金融、法律等多个领域,已经形成了典型案例,展现了强大的数据处理和分析能力。

 

Q:那具体来聊一下,比如,现在医学科研的比较火热的方向当中, AI For Science 是十分典型的,任度大模型-T1 有没有案例可以分享下?

何恩培:AI For Science 是我们重点且擅长的领域,比如我们与全球顶尖的干细胞科学家合作,构建干细胞综合研究大模型,进行干细胞综合研究,并开发面向健康伴侣的端侧小模型——“为能”,将干细胞生物治疗和人工智能有机结合,实现发现-诊断-分析研究-治疗方案全健康链的大模型赋能。

 

Q:听说你们也接入了 DeepSeek?你们是怎么考虑的?

何征宇:准确的说不是“接入”Deepseek,而是推出了首义任度双脑一体机,深度融合了任度双脑 9B 大模型、DeepSeek-R1 671B 大模型的能力,帮助企业形成知识沉淀-分析-决策的闭环。我们是从多个角度考虑的。对用户来说,他们有选择使用哪个大模型的自由度。但同时,用户也需要保障自身数据的安全可控。因此,我们推出了双模型一体机,这样一来,敏感数据层使用任度大模型,应用层则可以选择 DeepSeek 或其他大模型,确保数据安全和业务灵活性。

 

Q:你们对未来的展望是什么?

何恩培:在业务定位上,传神有根原创的深度学习框架和模型架构,这非常利于我们向两个方向发展,一个是为科学研究赋能,也就是正在流行的方向 AI For Science,一个是向端侧发展,实现从万物互联到“万脑互联”,让人工智能赋能服务我们生活每个角落。从产业生态上我们正在联合一些原创公司发起原创联盟,向合作伙伴开放技术,共同构建国产原创的 AI 研究和应用生态,通过自主研发和根原创技术,摆脱对国外技术的依赖,确保核心技术的自主可控,为国家构建一个安全、可靠的 AI 生态体系。

 

任度双脑深度思考大模型-T1 的发布,不仅是对参数竞赛时代的终结宣言,更是开启 AI"质效革命"新纪元的里程碑。我们坚信,任度双脑深度思考大模型-T1 将进一步展现出差异化竞争优势,以超强的性能,卓越的深度思考能力,成为企业数字化转型的新质生产力。

2025-03-26 11:434208

评论 1 条评论

发布
用户头像
听名字就能看出来有点意思
2025-03-28 12:02 · 北京
回复
没有更多了

政务公告数据的应用与八爪鱼的实践

八爪鱼采集器︱RPA机器人

爬虫 采集

行业融媒体平台建设与八爪鱼

八爪鱼采集器︱RPA机器人

爬虫 采集

采用众包方法进行红队测试 (Red Teaming)

澳鹏Appen

red team 大模型幻觉

如何在鸿蒙 NEXT 中使用 @Builder 装饰器优化 UI 组件的复用?

威哥爱编程

huawei HarmonyOS ArkTS HarmonyOS框架 HarmonyOS NEXT

YouTube 上线「用相机拍摄」标签为真实视频「验明正身」;美国被曝考虑限制向中东国家出口 AI 芯片丨 RTE 开发者日报

声网

KWDB 正式捐赠给开放原子开源基金会

KaiwuDB

Java程序员真的还有未来吗?如何备战2025春招Java面试?并狂拿大厂offer?(java高级岗)

程序员高级码农

Java 面试 架构师 Java’ 面试‘ Java 面试题

分布式电商项目:天猫 Java 亿级高并发架构设计笔记

程序员高级码农

数据库 高并发 电商 分布式, 消息列队

全面洞察商业情报,助力企业破解增长难题

八爪鱼采集器︱RPA机器人

爬虫 采集

八爪鱼采集在国央企产业大脑的应用:以智慧水务大脑为例

八爪鱼采集器︱RPA机器人

爬虫 采集

智算筑基,九章云极DataCanvas公司闪耀2024年服贸会

九章云极DataCanvas

原型设计软件:Axure RP 9(Win&Mac)中文版

你的猪会飞吗

Axure RP 9汉化 Axure RP 9破解版 Axure RP 9授权

第三届OpenHarmony技术大会硬件生态分论坛圆满举办

科技热闻

掌握行业全球新闻,实现产业研究/内容聚合分发/情报采集

八爪鱼采集器︱RPA机器人

爬虫 采集

见证 RTE 的新篇章丨 RTE 年度场景 Showcase 暨第四届 RTE 创新大赛开幕

声网

GitLab 安全漏洞CVE-2024-9164、CVE-2024-8970 等的修复方案

极狐GitLab

gitlab 安全漏洞 CVE CVE 漏洞

KWDB 开源社区走进天津大学

KaiwuDB

AI 赋能大模型:从 ChatGPT 到国产大模型的角逐与发展契机

GPU算力

HPC 算力 高性能计算 LLM 大语言模型

盘点15款国内外社交聆听工具

八爪鱼采集器︱RPA机器人

爬虫 采集

人工智能机器人

天津汇柏科技有限公司

AI 人工智能

部署SD-WAN时会遇到什么问题及应对策略

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商 SDWAN SD-WAN国际专线

九章云极DataCanvas公司荣获2024年服贸会“科技创新服务示范案例”

九章云极DataCanvas

采集医药行业数据,赋能企业创新与决策

八爪鱼采集器︱RPA机器人

爬虫 采集

产品负责人对干系人说‘不’的6条准则

ShineScrum

鸿蒙 NEXT 如何使用 @Styles 装饰器来优化我的组件代码?

威哥爱编程

华为 HarmonyOS ArkTS HarmonyOS框架 HarmonyOS NEXT

大模型后训练时代,“呼唤”普惠算力服务新范式

九章云极DataCanvas

采集新闻数据,助力产业研究/内容聚合分发/行业研究/舆情监控

八爪鱼采集器︱RPA机器人

爬虫 采集

精彩回顾 | KaiwuDB 携手信通院举办能源行业数据库研讨沙龙

KaiwuDB

KaiwuDB 亮相第二十四届中国国际工业博览会

KaiwuDB

用9B参数做推理?任度双脑深度思考大模型T1发布,创始人:和大厂PK的底气来自“根原创”_AI&大模型_华卫_InfoQ精选文章