写点什么

讯飞星火 4.0 Turbo、超拟人数字人等 11 个首发,科大讯飞如何深入大模型国产化“无人区”

  • 2024-10-25
    北京
  • 本文字数:3852 字

    阅读完需:约 13 分钟

大小:1.98M时长:11:31
讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”

10 月 24 日,第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布最新的讯飞星火 4.0 Turbo:七大核心能力全面超过 GPT-4 Turbo,数学和代码能力超越 GPT-4o,国内外中英文 14 项主流测试集中讯飞星火 4.0 Turbo 实现 9 项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。

 

科大讯飞还首发了 10 项基于讯飞星火底座能力的硬核产品与创新应用:定义多模 AIUI 标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板 2.0、AI 作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人 VIAS 以及科大讯飞多语种 AI 翻译透明屏。

 大模型能力如何?

 

讯飞星火 4.0 Turbo,提效 50%

 

根据介绍,讯飞星火大模型 4.0 Turbo 在数学能力、代码能力上超过了 GPT-4o。由艾伦人工智能研究所、OpenAI 等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的 14 项主流测试集中,讯飞星火 4.0-Turbo 在其中 9 项测试集中实现超越,效率相对提升 50%。



刘庆峰特别提到了“硬碰硬”的数学能力和代码能力。

 

根据实用数学任务构建测试集 CAppliedMath-1.0,讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务中均超过 GPT-4o 水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。

 

而根据代码生成 HumanEval 测试集上的效果对比,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上和 GPT-4o 的差距微弱,在 C++能力上超过 GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的 iFLYCode-Eval-2.0 代码实用场景测试集,讯飞星火 4.0 Turbo 在代码生成、代码检错、单元测试等任务上都超过了 GPT-4o。同时,讯飞推出了星火代码 7B 版本,满足代码生成、代码补全等极速响应型任务,效果业界最优。

 

首发语音视觉虚拟人交互“三合一”

 

发布会上,科大讯飞重新定义万物智联时代的多模 AIUI 交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。

 

超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

 

多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看图说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽 ”,和刘聪畅聊不同角度的所见。

 

刘聪还演示了更实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能对画面中产品的品牌、功能等信息进行“秒回”,超拟人数字人已成为“跨语言”购物的好帮手。

 

“讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持 1300+种人设打造。目前,超拟人数字人能力正式开通内测。

 

 

首发星火多语言大模型、汽车端侧星火大模型

 

在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。在多语言能力上,首次实现全国地级市方言全覆盖,含全国 288 个地市、202 种方言,讯飞输入法 14.0 即将支持 202 种方言免切换自由说。

 

在多语种能力上,科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等 8 个语种。根据实用任务场景构建测试集 MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了 GPT-4o。

 

刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”

 

多模态多语言能力升级,将全面赋能汽车产业。科大讯飞还首发了汽车端侧星火大模型,相比云端大模型,端侧 1.3B 大模型效果损失≤1%,端侧首响 40ms,端云融合交互低至 1.3s。据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。



首个国产万卡算力集群“飞星二号”平台上线

 

刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力。”

 

为此,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。去年 10 月 24 日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰介绍一年以来攻克了很多‘疑难杂症’,解决了 500 多次以上的基础软硬件问题和模型适配问题。

 

此外,科大讯飞表示,讯飞星火大模型开发者规模达到了 78.1 万。科大讯飞还将牵头成立 AI 基金,用 5 亿创业基金推动开发者创业加速前沿技术产业化进程,并与地方政府联合为 AI 创业团队提供产业落地支撑。

大模型应用如何?

 

“用人工智能技术解决社会刚需”,此次 1024 科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。

 

在教育行业,科大讯飞首次发布基于“问题链”的高中数学智能教师系统。据悉,此次发布的高中数学智能教师系统,中国教科院牵头、北京、上海、重庆、深圳、合肥、成都、大连、广州、哈尔滨等 12 个区域 50 多位数学教研员、400 多位优秀教师与讯飞星火大模型人机共创的智慧成果。它可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习,帮助学生实现知识、到能力、再到素养的综合培养。

 

搭载了高中数学智能教师系统的星火智慧黑板 2.0 也将于 10 月 25 日在第 84 届教育装备展上正式发布。另外,讯飞 AI 学习机中首发 AI 作业过滤器。

 

在医疗行业,讯飞星火医疗大模型 2.0 发布,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大医疗核心场景能力重大升级。另外,基于讯飞星火医学影像大模型打造的智能医学影像助手也正式发布,在智能质控环节,可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。



会上,讯飞医疗还联合安徽省卫生健康委员会、认知智能全国重点实验室,共同发布全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球最顶尖的影像 AI 科研团队,共同推进医学影像大模型的发展。

 

在司法领域,星火法律大模型赋能庭审笔录制作、裁判文书编写、法条类案检索等司法场景,和星火通用大模型相比,效率提升从 61.7%提升到 87.9%。

 

在政务服务场景,政务大模型持续迭代,全面覆盖 4500 多种标准化事项和 60 多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短 80%,登记效率提升 5 倍。此外,发布会上首发了搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”。

 

“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。截至 2024 年 10 月,科大讯飞已与各头部企业共建 20 多个行业大模型,覆盖 300+应用场景,所覆盖行业和场景数都是第一。

 

为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖 300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。

AI for Science 成为科技发展新引擎

 

今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了 AI 领域的科学家。刘庆峰表示,AI for Science 带来科研范式的根本变革,正在成为科技发展的新引擎。

 

刘庆峰介绍,星火科研助手自去年底发布以来,已在中科院下属 116 个院所使用。北京邮电大学 EZCoding 雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,目前已在全国 332 所院校开通使用,学生主动提问率增加 1 倍,教师辅导工作减少 80%。

 

刘庆峰提到,人工智能赋能科研工作的三个台阶:依托科研文献助手和代码助手提升基础工作效率,基于深度神经网络对科学任务进行精准建模,以及借助认知大模型学习领域知识并辅助设计科研实验方案。

 

据悉,科大讯飞已在大模型+科研领域做了许多探索,如联合中国科学技术大学刘海燕教授团队,成功设计了 48 个自然界不存在的全新蛋白质;联合中科院动物研究所李鑫团队,研究单细胞基因表达课题;联合中科院等离子体物理研究所李建刚院士团队,研究托卡马克等离子体控制。此外,科大讯飞还联合中国科技大学研发“化学大模型”,联合中科院大连化学物理研究所研发“化工大模型”。

 

“AI for Science 决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命”,刘庆峰说道。


2024-10-25 11:238949

评论

发布
暂无评论
发现更多内容

创新、开放、尊重,华为给出了知识产权保护的示范答卷

Alter

等保一体机的定义及核心价值说明

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

YashanDB的高可用性设计与故障恢复机制详解

数据库砖家

链游钱包开发冷钱包开发热钱包开发web3開發多链钱包NFT 钱包跨链钱包开发

西安链酷科技

CMDB实例回收站:让数据管理游刃有余

智象科技

CMDB #运维 一体化运维平台 一站式运维

2025年企业级海外社交媒体分析系统选型指南

沃观Wovision

舆情监测 舆情监测系统 海外舆情监测 社交媒体监测

海量算力,一键配置!咕泡AI云实验室全面升级!

咕泡科技

咕泡ai 咕泡科技 实战平台

携手伊克罗德,国内知名会计师事务所借助Dify实现审计业务全链路升级

伊克罗德信息科技

10 分钟搞定全栈无人机系统

俞凡

低空经济

从“事后抢险”到“事前防控”:江西水投用 TDengine 重塑防汛模式

TDengine

联邦机构未完全修补思科设备漏洞,CISA发出紧急警告

qife122

网络安全 思科设备

海外社交媒体分析工具终极评测:2025年TOP 10平台功能与价格全解析

沃观Wovision

社交媒体 社媒监测 出海舆情 社媒分析

哈尔滨等保方案构建要点

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

洞察竞争格局:利用海外社媒分析平台构建海外社交媒体竞争情报体系

沃观Wovision

社交媒体监控 海外社交媒体监控 社交媒体监测 社媒分析

BeeWorks:更懂工作的企业级安全通讯平台

BeeWorks

即时通讯 IM 私有化部署

在技术无人区栽花:华为十大发明的慢哲学

脑极体

AI

本地模型 + 云端模型的 Hybrid Inference 架构设计:下一代智能系统的底层范式

掘金安东尼

哈尔滨密码测评办理要点说明

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

Go语言AI智能体开发套件(ADK) - 构建复杂AI代理的开源框架

qife122

AI Google 智能体

Principle for mac 交互设计神器

做梦万元户

阿尔特携手 Amazon AgentCore ,打造懂你的AI,智能搜索成本降低34%

亚马逊云科技 (Amazon Web Services)

人工智能

一站式等保安全产品类别及功能说明

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

YashanDB的缓存机制深入剖析及实用优化技巧

数据库砖家

别再卷传统后端了!

王中阳Go

AI agent

QuitAll for mac 快速退出应用

做梦万元户

这十款出海人必备的海外社交媒体分析工具,建议收藏!

沃观Wovision

社交媒体 海外社交媒体监控 社交媒体监测 社媒分析

钱包开发加密钱包社交钱包Web3钱包去中心化钱包

西安链酷科技

还在为搭建FAQ系统发愁?这10个问题帮你彻底搞懂知识库选型

百川云开发者

小红书笔记详情API秘籍!轻松获取笔记数据

Datafox(数据狐)

小红书笔记详情接口 小红书API 小红书数据采集

YashanDB的国际化与本地化实施策略

数据库砖家

YashanDB的缓存机制解析及性能优化技巧

数据库砖家

讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”_AI&大模型_褚杏娟_InfoQ精选文章