大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

成本最高降 90%!百度发布端到端语音语言大模型,已在文小言上线

  • 2025-04-01
    北京
  • 本文字数:729 字

    阅读完需:约 2 分钟

大小:383.32K时长:02:10
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线

3 月 31 日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。



文小言最核心的三个场景依然是:搜、创、聊,支持这三个核心场景下有各种模型和技术。相比产品本身形象的升级,最重要的有两件事情:开放和应用,即能够兼容各种优秀先进模型、把各种先进模型能力用

 

文小言除了视觉变化,内核已经从单引擎大模型驱动,变成由多模型引擎驱动。更新后的文小言支持“多模型融合调度”,通过整合百度自研的文心 X1、文心 4.5 等顶尖模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。

 

百度自研大模型不但能“看”,更能“说”和“听”,背后就是其端到端语音大模型。新的端到端语音模型体验比原来会很大的提升,比如能够识别儿童的含糊发音,理解能力更符合儿童的习惯。

 

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

 

用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

 

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。



2025-04-01 16:256201

评论

发布
暂无评论

云图说丨叮咚,您有一份短信通关攻略待查收

华为云开发者联盟

短信 签名 消息 签名模板 MSGSMS

java高级用法之:JNA中的Function

程序那些事

Java Netty 程序那些事 4月月更

thinkphp5框架新建页面相关规范详解

CRMEB

“东数西算”超级工程利好云计算,多云管理背后却暗藏汹涌!

行云管家

云计算 多云 东数西算 云管

免费下载|KubeMeet 城市站实录合辑,N 场容器开源分享打包看

阿里巴巴云原生

一文读懂 TsFile

Apache IoTDB

Prime Video 如何使用机器学习来确保视频质量

亚马逊云科技 (Amazon Web Services)

计算机视觉 Amazon Prime Video WACV

STM32+华为云IoTDA,带你设计一个属于自己的动态密码锁

华为云开发者联盟

stm32 iotda 华为云IoT 密码锁 Qt框架

聚焦供应链布局,新能源汽车企业重塑产业核心竞争能力

数商云

数字化转型 供应链 新能源汽车

教你用ab命令进行并发与压力测试

华为云开发者联盟

并发 压力测试 ab测试 ab命令 请求次数

【Zeekr_Tech】汽车软件RTOS-之AUTOSAR OS多核控制简介

Zeekr_Tech

Linux 软件架构

知识管理的目的及意义——提高社会资源的配置效率

小炮

知识管理

jackson学习之十(终篇):springboot整合(配置类)

程序员欣宸

Java web 4月月更

WeTest平台产品&技术合作伙伴招募

WeTest

Tiger DAO VC:将你的风险投资变成DAO组织协同

小哈区块

“双碳”下的建筑业:未来10年必须重视这5大方向

BeeWorks

来也科技收购Mindsay背后:新旧势力交锋智能自动化备受关注

王吉伟频道

RPA 收购 机器人流程自动化 来也科技 Mindsay

YonMaster开发者认证线上赋能培训班定档4月18日

YonBuilder低代码开发平台

使用 Sanic 框架进行 Python Web 开发

宇宙之一粟

Python 4月月更 sanic

Redis是怎样通讯的?

ooooooh灰灰

redis 后端 协议 4月月更

MSE 微服务治理发布企业版,助力企业构建完整微服务治理体系

阿里巴巴云原生

IoTDB 服务绍兴安瑞思90%业务,助其提升百倍查询速度

Apache IoTDB

从容器化到资源池化,数栈云原生技术实践探索之路

袋鼠云数栈

大数据 flink 云原生 k8s

TASKCTL ETL作业类型的插件与维护管理

敏捷调度TASKCTL

kettle 元数据 ETL 自动化运维 调度任务

macOS系统病毒常见的两种传播途径

火绒安全

macos 终端安全 勒索病毒 蠕虫

计算机存储层次简析

懒时小窝

计算机基础

2022年提高远程工作效率的三大实用技巧汇总

行云管家

远程办公 居家办公 办公软件

科创人·富士康CDO史喆:To B产品切忌臃肿,数字化不分对错只求更好

科创人

好的测试数据管理,到底要怎么做?

禅道项目管理

测试 数据 数据管理

hyengine - 面向移动端的高性能通用编译/解释引擎

阿里巴巴终端技术

编译 移动端 引擎

5. 堪比JMeter的.Net压测工具 - Crank 实战篇 - 接口以及场景压测

MASA技术团队

C# .net 微软 测试 压测

成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线_AI&大模型_褚杏娟_InfoQ精选文章