AICon 深圳站 Keynote 嘉宾官宣!共探AI价值转化的实践路径 了解详情
写点什么

成本最高降 90%!百度发布端到端语音语言大模型,已在文小言上线

  • 2025-04-01
    北京
  • 本文字数:729 字

    阅读完需:约 2 分钟

大小:383.32K时长:02:10
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线

3 月 31 日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。



文小言最核心的三个场景依然是:搜、创、聊,支持这三个核心场景下有各种模型和技术。相比产品本身形象的升级,最重要的有两件事情:开放和应用,即能够兼容各种优秀先进模型、把各种先进模型能力用

 

文小言除了视觉变化,内核已经从单引擎大模型驱动,变成由多模型引擎驱动。更新后的文小言支持“多模型融合调度”,通过整合百度自研的文心 X1、文心 4.5 等顶尖模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。

 

百度自研大模型不但能“看”,更能“说”和“听”,背后就是其端到端语音大模型。新的端到端语音模型体验比原来会很大的提升,比如能够识别儿童的含糊发音,理解能力更符合儿童的习惯。

 

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

 

用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

 

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。



2025-04-01 16:256256

评论

发布
暂无评论

中昊芯英董事长兼CEO杨龚轶凡入选“2025 年度浙江省青年科技型企业家”榜单

科技热闻

智慧政协系统(源码+文档+讲解+演示)

深圳亥时科技

Compressor for Mac(视频转码编辑工具)

Geek贝

CADintosh X for Mac 技术图形、工程图纸、流程图等

Rose

融云 AI 机器人上线,独家直连 AI 平台,加速落地创新探索

融云 RongCloud

NocoBase 本周更新汇总:支持扫码填充数据

NocoBase

开源 低代码 零代码 无代码 版本更新

企业太小没钱做等保2.0怎么办?

等保测评

AppGallery Connect(AGC)使用指南

小赵学鸿蒙

商务 AppGallery Connect 鸿蒙开发​​工具

mac鼠标键盘记录工具Mouse and Keyboard Recorder

Rose

mac虚拟光驱工具 Daemon Tools 中文激活版

Rose

中昊芯英荣获中国证券报首届“科创金牛奖”

科技热闻

DevEco Studio 安装与使用全流程

小赵学鸿蒙

商务 DevEco Studio 鸿蒙开发工具

哪些行业必须做等保

等保测评

me2025媒体编码Media Encoder 2025系统要求及安装包下载-mac/win

Rose

DevEco Studio 模块使用全指南

小赵学鸿蒙

商务 DevEco Studio 鸿蒙开发工具

AppGallery Connect(AGC)平台介绍

小赵学鸿蒙

商务 AppGallery Connect 鸿蒙开发​​工具

光伏、光伏能源、光伏设备制造业AI智能MES系统解决方案

万界星空科技

mes 制造业工厂 光伏能源行业 光伏MES 智能化MES

Movist Pro mac高清视频播放器,不会卡顿或滞后

Rose

Mac天气预报组件 Weather Widget Live 随时了解天气!

Rose

AI赋能专卖人员画像与队伍评价,助力烟草行业人才队伍建设​

中烟创新

Mac 3D影视特效渲染SideFX Houdini 安装包含注册机及激活补丁

Rose

Turbo Boost Switcher Pro for mac(cpu温度监测工具)

Geek贝

科学智能赋能空间科学研究(4):中国空间站空间科学实验的未来展望

ModelWhale

科学智能 AI4S 空间科学

京东图片搜索接口抓取指南,搜索相似商品

tbapi

京东图片搜索接口 京东拍立淘接口 京东图片搜索API 京东图片API 京东商品搜索接口

DevEco Studio 工程管理全指南

小赵学鸿蒙

商务 DevEco Studio 鸿蒙开发工具

AppGallery Connect(AGC)总体流程

小赵学鸿蒙

商务 AppGallery Connect 鸿蒙开发​​工具

Spring Boot 启动优化实践

vivo互联网技术

Java 性能优化 后端 spring-boot SpringBoot启动流程

如何使用第三方库中的picker_utils (API12) PickerUtil类

小赵学鸿蒙

数码相机 三方 SDK

视频转换编辑压缩和下载工具VideoProc Converter AI 中文版-mac/win

Rose

京东店铺所有商品接口,搜索整店商品

tbapi

京东数据接口 京东店铺所有商品接口 京东店铺商品采集 京东店铺数据采集

Mac吉他贝斯效果器 Native Instruments Guitar Rig 7 Pro新功能详解

Rose

成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线_AI&大模型_褚杏娟_InfoQ精选文章