2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

成本最高降 90%!百度发布端到端语音语言大模型,已在文小言上线

  • 2025-04-01
    北京
  • 本文字数:729 字

    阅读完需:约 2 分钟

大小:383.32K时长:02:10
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线

3 月 31 日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。



文小言最核心的三个场景依然是:搜、创、聊,支持这三个核心场景下有各种模型和技术。相比产品本身形象的升级,最重要的有两件事情:开放和应用,即能够兼容各种优秀先进模型、把各种先进模型能力用

 

文小言除了视觉变化,内核已经从单引擎大模型驱动,变成由多模型引擎驱动。更新后的文小言支持“多模型融合调度”,通过整合百度自研的文心 X1、文心 4.5 等顶尖模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。

 

百度自研大模型不但能“看”,更能“说”和“听”,背后就是其端到端语音大模型。新的端到端语音模型体验比原来会很大的提升,比如能够识别儿童的含糊发音,理解能力更符合儿童的习惯。

 

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

 

用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

 

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。



2025-04-01 16:256625

评论

发布
暂无评论

AI时代,数字化转型:企业生存与发展的必答题

天津汇柏科技有限公司

人工智能 AI 数字化转型

2024年我读过的10本技术书籍(Java、架构、SRE运维)

京东科技开发者

🚀《Go语言在高并发场景下的实战:从面试题看大厂架构设计》

王中阳Go

golang 微服务 性能优化 面试题 分布式锁

Eudic欧路词典 for Mac(英语词典翻译查询工具)v4.8.2激活版

小玖_苹果Mac软件

iStatistica for mac(专业系统监控工具)v7.0.1激活版

小玖_苹果Mac软件

淘宝商品评论API接口(淘宝 API 系列)

tbapi

淘宝商品评论接口 淘宝API 淘宝评论接口 淘宝商品评论数据采集

Dropover Pro for mac(增强型拖拽操作工具)v5.0中文版

小玖_苹果Mac软件

TinyEngine v2.2版本发布:支持页面嵌套路由,提升多层级路由管理能力&开发分支调整

OpenTiny社区

开源 前端 低代码 OpenTiny TinyEngine

淘宝商品详情API接口(淘宝API系列)

tbapi

淘宝API接口 淘宝商品详情接口

秒开率从18%到64%,我们对小程序模拟器做了什么?

快手技术

Binary Ninja for Mac(功能强大且操作简便的逆向编译工具)激活版

小玖_苹果Mac软件

2025全球人形机器人赛道最新、最全解读!

机器人头条

科技 大模型 人形机器人 具身智能

XMind Pro for mac (XMind思维导图)v25.04中文beta版

小玖_苹果Mac软件

黑龙江等保测评政策法规、技术标准、测评流程

黑龙江陆陆信息测评部

等保测评 哈尔滨 黑龙江

直播APP的测试

北京木奇移动技术有限公司

APP开发 直播app APP外包公司

如何让DeepSeek的回答从“还行”变成“绝了”?——提示词构建的终极指南

京东科技开发者

隐形的守护者(风控技术篇)-时序流异常检测(Self-Isolation-Stream)

京东科技开发者

数据大屏开发用AI效率翻倍!华为云Astro大屏应用盘古助手,这波操作太震撼了!

YG科技

在线CAD插件通过上下文对象MxPluginContext修改UI界面

WEB CAD SDK

网页CAD 在线CAD CAD SDK

Alfred 5 for Mac(苹果效率提升工具)v5.6.0 (2290)免激活版

小玖_苹果Mac软件

数字先锋 | 央企智能化发展新篇!天翼云助力铁建云链快速部署上线DeepSeek智能助手

天翼云开发者社区

gpu 云服务 DeepSeek 智能化升级

天线与热——多物理场耦合仿真实例【CST软件分析】

思茂信息

cst cst使用教程 CST软件

震撼发布!CodeArts 解锁全新技能,鸿蒙应用与元服务开发轻松拿捏

YG科技

探讨组合加密算法在IM中的应用

JackJiang

网络编程 即时通讯 IM

荣誉|奇点云斩获STIF双项大奖

奇点云

荣誉

成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线_AI&大模型_褚杏娟_InfoQ精选文章