写点什么

科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

  • 2025-01-15
    北京
  • 本文字数:2309 字

    阅读完需:约 8 分钟

大小:1.17M时长:06:49
科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗

1 月 15 日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火 X1。据讯飞测试,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

 

同时,讯飞星火 4.0 Turbo 底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于 5 秒。

 

首个基于全国产算力的推理大模型

 

讯飞星火一直走全国产化路线。科大讯飞与华为合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火 X1。 

 

发布演示中,讯飞星火 X1 不仅准确给出了高考题、AIME 竞赛题以及高中奥赛题题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

 

讯飞星火 X1 展现出了深度推理模型的三大典型特征:化繁为简,运用长思维链分步骤解析能力,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

 

 

根据介绍,目前讯飞星火 X1 率先在教育等真实场景中实现了应用落地。去年 1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。星火 X1 现已经部署上述试点区域。随着讯飞星火 X1 相关技术的深度融入,科大讯飞 AI 学习机也将持续升级。

 

医疗领域,讯飞星火 X1 的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火 X1 的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

 

讯飞星火 4.0 Turbo 底座能力再升级,变得更懂行业

 

此次发布会,讯飞星火 4.0 Turbo 底座能力实现了全新升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。


 

据介绍,此次基于讯飞星火 X1 的高质量合成数据,讯飞星火 4.0 Turbo 的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

 

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。为此,讯飞星火 4.0 Turbo 图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试显示,讯飞星火 4.0 Turbo 的图文识别能力显著领先国内外顶尖竞品。

 

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了 10 倍以上。对于一份 500 页的项目文件,从扫描、识别到解析的全过程,仅需 2 分钟即可全部完成。 

 

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了 40%,句子级溯源效果更是超越了 GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

 

考虑到不少用户在写报告、做调研这类工作时,往往需要花费大量时间搜集信息、整理资料,基于图文、长文本能力的提升和行业应用能力的积累,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

 

 

首发星火语音同传大模型

 

发布会上,科大讯飞带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

 

“现在大模型能力的发展,结合讯飞在智能语音技术上的独特算法积累,可以做端到端的语音同传。”据了解,该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

 

 

根据讯飞的技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅 5 秒的同传时延,达到人类专家译员的水平。

 

另外,除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。 

 

发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在 2025 年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。

 

2025-01-15 18:169414

评论

发布
暂无评论

18 | 散列表(上):Word文档中的单词拼写检查功能是如何实现的

鲁米

医院检验科LIS系统源码,oracle数据库、报告管理、质控管理

源码星辰

工业数据存储的“四道难关”,国产数据库如何应势破局?

用友BIP

万界星空科技MES系统中的生产管理流程

万界星空科技

生产管理系统 mes 制造业生产管理系统 云mes 万界星空科技mes

为什么要对数据库优化

小魏写代码

推荐5款很牛的Paas平台编译构建工具

伤感汤姆布利柏

文心一言 VS 讯飞星火 VS chatgpt (152)-- 算法导论12.2 8题

福大大架构师每日一题

福大大架构师每日一题

中山大学数学学院 x 赛博威 | 共同成立人工智能算法产学研合作基地

赛博威科技

人工智能 赛博威 中山大学 人工智能算法

领先实践之鑫阳钢铁∣短流程钢铁企业废钢智能判级的行业标杆

用友BIP

废钢智能判级

Linus:我休假的时候也会带着电脑,否则会感觉很无聊

极狐GitLab

Linux 开源 AI DevOps gitlab

Mac电脑多平台数据同步推荐:SyncMate最新激活版

mac大玩家j

同步工具 Mac软件推荐 同步软件

详细了解大数据离在线混部架构模型

易程

大数据 Kubernetes 云原生大数据 离在线混部 大数据离在线混部

实战干货!基于ERNIE Bot SDK的数字诗人聊天开发教程

飞桨PaddlePaddle

人工智能 数字人 技术干货 文心一言

3D LED广告牌市场潜力待挖掘

Dylan

视频 图片 文字 LED LED显示屏

在线教育小程序如何一键生成App

Onegun

在线教育 小程序转app

Future3 Campus访谈丨资本是如何看待AI+Web3的?

Footprint Analytics

AI web3

ACPM高效C++组件管理让音视频终端SDK性能更好、稳定性更高

阿里云CloudImagine

云计算 视频云

使用 Kubernetes 为 CI/CD 流水线打造高效可靠的临时环境

SEAL安全

Kubernetes CI/CD 临时环境

通过线上巡检,保障生产环境质量

老张

软件测试 质量保障

五金家具行业MES解决方案

万界星空科技

mes 制造业生产管理系统 万界星空科技mes 家居设计工具 家具生产管理系统

语言模型:GPT与HuggingFace的应用

华为云开发者联盟

人工智能 华为云 GPT 华为云开发者联盟

CurveFS 助力网易云商,解决语音识别训练数据增长需求

OpenCurve

云计算 开源 文件存储 分布式文件存储 海量数据

为什么6层板最好设计2个接地层?

华秋电子

Amazon S3 Glacier 将检索大量存档数据时的还原吞吐量提升高达 10 倍

亚马逊云科技 (Amazon Web Services)

S3 API 云存储服务 Amazon S3 Glacier

强强联合!航天科技AIRIOT助力航天电工打造智慧工厂

AIRIOT

IOT Platform 智慧工厂

文心ERNIE Bot SDK+LangChain:基于文档、网页的个性化问答系统

飞桨PaddlePaddle

人工智能 开发者 开发工具

Mac电脑强大的文件夹快速访问工具:Default Folder X 最新激活

胖墩儿不胖y

Mac软件 文件访问工具 文件夹管理软件

探秘 Spring Boot Async:解析原理与实践详解

Apifox

性能优化 Spring Boot 后端 多线程 Async

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗_AI&大模型_褚杏娟_InfoQ精选文章