2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

  • 2025-01-15
    北京
  • 本文字数:2309 字

    阅读完需:约 8 分钟

大小:1.17M时长:06:49
科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗

1 月 15 日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火 X1。据讯飞测试,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

 

同时,讯飞星火 4.0 Turbo 底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于 5 秒。

 

首个基于全国产算力的推理大模型

 

讯飞星火一直走全国产化路线。科大讯飞与华为合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火 X1。 

 

发布演示中,讯飞星火 X1 不仅准确给出了高考题、AIME 竞赛题以及高中奥赛题题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

 

讯飞星火 X1 展现出了深度推理模型的三大典型特征:化繁为简,运用长思维链分步骤解析能力,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

 

 

根据介绍,目前讯飞星火 X1 率先在教育等真实场景中实现了应用落地。去年 1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。星火 X1 现已经部署上述试点区域。随着讯飞星火 X1 相关技术的深度融入,科大讯飞 AI 学习机也将持续升级。

 

医疗领域,讯飞星火 X1 的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火 X1 的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

 

讯飞星火 4.0 Turbo 底座能力再升级,变得更懂行业

 

此次发布会,讯飞星火 4.0 Turbo 底座能力实现了全新升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。


 

据介绍,此次基于讯飞星火 X1 的高质量合成数据,讯飞星火 4.0 Turbo 的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

 

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。为此,讯飞星火 4.0 Turbo 图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试显示,讯飞星火 4.0 Turbo 的图文识别能力显著领先国内外顶尖竞品。

 

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了 10 倍以上。对于一份 500 页的项目文件,从扫描、识别到解析的全过程,仅需 2 分钟即可全部完成。 

 

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了 40%,句子级溯源效果更是超越了 GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

 

考虑到不少用户在写报告、做调研这类工作时,往往需要花费大量时间搜集信息、整理资料,基于图文、长文本能力的提升和行业应用能力的积累,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

 

 

首发星火语音同传大模型

 

发布会上,科大讯飞带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

 

“现在大模型能力的发展,结合讯飞在智能语音技术上的独特算法积累,可以做端到端的语音同传。”据了解,该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

 

 

根据讯飞的技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅 5 秒的同传时延,达到人类专家译员的水平。

 

另外,除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。 

 

发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在 2025 年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。

 

2025-01-15 18:169840

评论

发布
暂无评论

数字货币交易所自动刷量机器人介绍|开发交易所去中心化量化机器人

量化系统19942438797

遗留系统演进

Kubernetes 微服务 etcd 架构设计原则 演进式架构

Ubuntu Server 20.04 搭建Nacos集群

玏佾

nacos 部署 搭建

如何高效工作,享受品质生活?看看少数派的经验总结吧

博文视点Broadview

10年IT老兵亲述SpringCloud开发从入门到实战文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

阿里资深专家分享程序员三门课:技术精进架构修炼、管理探秘文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

6年Java经验,4面阿里定级P7,多亏阿里13万字+脑图+源码面试笔记

Java~~~

Java spring 架构 面试 高并发

数字货币交易所自动刷量机器人介绍|开发交易所去中心化量化机器人

Geek_23f0c3

市值管理机器人系统开发 自动刷量机器人 炒币机器人

【架构实战营】--第一次作业

Geek_d18264

架构实战营

牛掰!阿里大佬刷了四年LeetCode才总结出来的数据结构和算法手册

Java~~~

Java 架构 面试 算法 数据结构与算法

拍乐云Pano 两周年啦!砥砺前行,踏浪潮头,做全行业的实时音视频专家

拍乐云Pano

WebRTC RTC

开发者实践丨盲水印插件:用户端的实时视频溯源保护

声网

开发者实践 RTE大赛

云小课 | 区块链关键技术之一:共识算法

华为云开发者联盟

区块链 区块链技术 共识机制 共识算法

三个月学完阿里数位架构师总结的281页架构宝典PDF终入蚂蚁

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

一起来养猪APP开发

游戏开发_软件开发

小程序云开发 游戏开发 2D APP开发 3D

IT运维审计系统是什么?有推荐的吗?

行云管家

云计算 堡垒机 IT运维 数据审计 运维审计

开源demo | 快速搭建在线自习室场景

anyRTC开发者

音视频 在线教育 视频直播 在线自习室

游戏“外挂”?—— AI生成游戏最强攻略

华为云开发者联盟

AI 游戏 华为云

SQL 是产品经理必会技能

蒋川

数据库 sql 产品 后端

阿里资深专家整理的Redis5设计与源码分析宝典终于横空出世

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

springboot整合activiti自带在线流程编辑器,整个程序源码,请假审批

金陵老街

大前端 工作流 ERP Activiti spring-boot 2.5.4

java布道者耗尽20年的功力整理完结java实战第2版文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

什么样的架构师修炼之道文档,能帮助大家修炼成为出色的架构师?

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

谈谈Go的固定时长定时器和周期性时长定时器

Regan Yue

协程 Go 语言 8月日更

LeetCode刷题14-简单-最长公共前缀

ベ布小禅

8月日更

面对不同的业务场景,选择零码还是低码?

华为云开发者联盟

开发者 低代码 零代码 AppCube 业务场景

合约量化系统开发(炒币合约/机器人炒币App)

获客I3O6O643Z97

智能合约 量化机器人 合约量化

制作第三方库时,我们的资源到底在哪?

fuyoufang

ios swift 8月日更

MySQL基于GTID复制实现的工作原理

Java MySQL 数据库 面试 后端

48W字?GitHub上下载量破百万的阿里:图解Java、网络、算法笔记

Java~~~

Java 架构 面试 算法 JVM

如何用3分钟搭建一个属于自己的网站?

百度开发者中心

最佳实践 开发者 方法论

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗_AI&大模型_褚杏娟_InfoQ精选文章