写点什么

成本最高降 90%!百度发布端到端语音语言大模型,已在文小言上线

  • 2025-04-01
    北京
  • 本文字数:729 字

    阅读完需:约 2 分钟

大小:383.32K时长:02:10
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线

3 月 31 日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。



文小言最核心的三个场景依然是:搜、创、聊,支持这三个核心场景下有各种模型和技术。相比产品本身形象的升级,最重要的有两件事情:开放和应用,即能够兼容各种优秀先进模型、把各种先进模型能力用

 

文小言除了视觉变化,内核已经从单引擎大模型驱动,变成由多模型引擎驱动。更新后的文小言支持“多模型融合调度”,通过整合百度自研的文心 X1、文心 4.5 等顶尖模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。

 

百度自研大模型不但能“看”,更能“说”和“听”,背后就是其端到端语音大模型。新的端到端语音模型体验比原来会很大的提升,比如能够识别儿童的含糊发音,理解能力更符合儿童的习惯。

 

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

 

用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

 

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。



2025-04-01 16:256058

评论

发布
暂无评论

【愚公系列】2022年11月 微信小程序-页面配置

愚公搬代码

11月月更

API渗透测试的基本流程及关键点

阿泽🧸

11月月更 API渗透测试

正则表达式学习笔记(一)

lxmoe

正则表达式 学习笔记 11月月更

拿下大厂?这几道jvm面试题必须要懂

钟奕礼

Java 程序员 java面试 java编程

2022-11-18:给定一个数组arr,表示连续n天的股价,数组下标表示第几天 指标X:任意两天的股价之和 - 此两天间隔的天数 比如 第3天,价格是10 第9天,价格是30 那么第3天和第9天的指

福大大架构师每日一题

算法 rust 福大大

Spring 5(六)新功能

浅辄

Spring5 JUnit 11月月更

10道不得不会的 Java容器 面试题

JavaPub

Java 面试 后端

[力扣] 剑指 Offer 第四天 - 数组中重复的数字

陈明勇

Go 数据结构与算法 力扣 11月月更

三面头条 + 四面阿里 + 五面腾讯拿 offer 分享面经总结

程序知音

java面试 大厂面试 java架构 后端技术 Java面试八股文

K8S环境的Jenkin性能问题处理

程序员欣宸

Kubernetes jenkins 11月月更

云原生系列 【轻松入门容器基础操作】

叶秋学长

云原生 沙箱实验 11月月更 操作手册

【LeetCode】无重复字符的最长子串题解

Albert

算法 LeetCode 11月月更

Java | IO流文件专属流

陌上

Java 编程 11月月更

Java | IO流数据流和标准输出流

陌上

Java 编程 11月月更

Meta开源新工具啊,Git地位危险了?

Jackpop

用户特征分析的方法

穿过生命散发芬芳

11月月更 用户特征分析

极客时间运维进阶训练营第四周作业

9527

2022年最新版68道Redis面试题,20000字干货,赶紧收藏起来备用!

钟奕礼

Java 程序员 java程序员 java面试 java编程

一款超好用的开源密码管理器!

Jackpop

复杂时序逻辑电路

芯动大师

Verilog 11月月更 时序逻辑

算法题学习---判断一个链表是否为回文结构

桑榆

算法题 11月月更

美团技术官手写的精品SpringBoot笔记,涵盖99%知识点,强到离谱

小小怪下士

Java spring 程序员 springboot

昇腾AI创新大赛燃情上演,大咖齐聚共话人工智能发展新篇章

极客天地

正则表达式学习笔记(二)

lxmoe

正则表达式 学习笔记 11月月更

Java | IO流缓冲流和转换流

陌上

Java 编程 11月月更

3年Java研发,突击30天,从14K变成了30K

程序知音

Java java面试 大厂面试 java架构 后端技术

这一次,带你深入浅出Go语言切片和数组

闫同学

Go 11月月更

【LeetCode】找到最高海拔Java题解

Albert

算法 LeetCode 11月月更

10道不得不会的 SpringBoot 面试题

JavaPub

Java 后端 springboot

码农必备?清华大学开源了一款写代码神器!

Jackpop

计算机网络:VLAN基本概念与原理

timerring

计算机网络 VLAN 11月月更

成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线_AI&大模型_褚杏娟_InfoQ精选文章