写点什么

科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

  • 2025-01-15
    北京
  • 本文字数:2309 字

    阅读完需:约 8 分钟

大小:1.17M时长:06:49
科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗

1 月 15 日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火 X1。据讯飞测试,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

 

同时,讯飞星火 4.0 Turbo 底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于 5 秒。

 

首个基于全国产算力的推理大模型

 

讯飞星火一直走全国产化路线。科大讯飞与华为合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火 X1。 

 

发布演示中,讯飞星火 X1 不仅准确给出了高考题、AIME 竞赛题以及高中奥赛题题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

 

讯飞星火 X1 展现出了深度推理模型的三大典型特征:化繁为简,运用长思维链分步骤解析能力,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

 

 

根据介绍,目前讯飞星火 X1 率先在教育等真实场景中实现了应用落地。去年 1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。星火 X1 现已经部署上述试点区域。随着讯飞星火 X1 相关技术的深度融入,科大讯飞 AI 学习机也将持续升级。

 

医疗领域,讯飞星火 X1 的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火 X1 的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

 

讯飞星火 4.0 Turbo 底座能力再升级,变得更懂行业

 

此次发布会,讯飞星火 4.0 Turbo 底座能力实现了全新升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。


 

据介绍,此次基于讯飞星火 X1 的高质量合成数据,讯飞星火 4.0 Turbo 的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

 

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。为此,讯飞星火 4.0 Turbo 图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试显示,讯飞星火 4.0 Turbo 的图文识别能力显著领先国内外顶尖竞品。

 

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了 10 倍以上。对于一份 500 页的项目文件,从扫描、识别到解析的全过程,仅需 2 分钟即可全部完成。 

 

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了 40%,句子级溯源效果更是超越了 GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

 

考虑到不少用户在写报告、做调研这类工作时,往往需要花费大量时间搜集信息、整理资料,基于图文、长文本能力的提升和行业应用能力的积累,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

 

 

首发星火语音同传大模型

 

发布会上,科大讯飞带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

 

“现在大模型能力的发展,结合讯飞在智能语音技术上的独特算法积累,可以做端到端的语音同传。”据了解,该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

 

 

根据讯飞的技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅 5 秒的同传时延,达到人类专家译员的水平。

 

另外,除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。 

 

发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在 2025 年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。

 

2025-01-15 18:169965

评论

发布
暂无评论

华为云耀云服务器L实例:小程序开发者的智选

平平无奇爱好科技

灵活弹性、成本优化:深度解析华为云耀云服务器L实例在企业数字化转型中的全面优势

轶天下事

游戏开发不再难:华为这款服务器为小程序与PC游戏提供强大支持

轶天下事

探索华为云耀云服务器L实例:助力中小企业高效迈入数字化时

平平无奇爱好科技

27 | 递归树:如何借助树来求解递归算法的时间复杂度

鲁米

华为云耀云服务器L实例:赋能中小企业数字化转型

平平无奇爱好科技

华为云耀云服务器L实例:创业先锋的得力利器

YG科技

华为云耀云服务器L实例:以最少的复杂度实现最高效的小程序开发

YG科技

WorkPlus高效助力企业沟通的专业级即时通讯软件

BeeWorks

华为云耀云服务器L实例:助力初创企业数字化腾飞

YG科技

华为云耀云服务器L实例:专家为您解读的中小企业云计算新选择

YG科技

华为云耀云服务器L实例:中小企业在云计算时代的强力伙伴

YG科技

MySQL 数据库操作指南:LIMIT,OFFSET 和 JOIN 的使用

小万哥

Python 程序员 软件 后端 开发

企业级即时通讯系统的领跑者,WorkPlus引领沟通协作创新潮流

BeeWorks

飞跃时代的翅膀,华为云这款服务器可助力企业数字化升级的强大能力

轶天下事

华为云耀云服务器L实例:中小企业数字化升级的最佳选择

YG科技

2023总结 - 后端开发如何利用 AI 快速完成工作

聚散又离合的鸟群

AI 后端开发 #技术人的2023总结

WorkPlus平台级定制,支持企业个性化需求定制

BeeWorks

一种在数据量比较大、字段变化频繁场景下的大数据架构设计方案

编程攻略

大数据 架构设计

数字时代智选,华为云耀云服务器L实例:数据分析背后的智能小程序开发解决方案

轶天下事

华为云耀云服务器L实例:让小程序开发更简单,上线更迅速,性能更稳定

平平无奇爱好科技

华为云耀云服务器L实例:小程序时代的得力伙伴

平平无奇爱好科技

29 | 堆的应用:如何快速获取到Top 10最热门的搜索关键词

鲁米

WorkPlus即时通讯,让沟通零障碍!企业协作更高效

BeeWorks

华为云耀云服务器L实例:跨境电商数字化转型的智选之道

平平无奇爱好科技

28 | 堆和堆排序:为什么说堆排序没有快速排序快

鲁米

【Go实现】实践GoF的23种设计模式:适配器模式

元闰子

Go 设计模式 适配器模式

【精彩回顾】恒拓高科亮相第十一届深圳军博会

BeeWorks

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗_AI&大模型_褚杏娟_InfoQ精选文章