在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

百度搜索 10 年来最大改版,支持超千字长文本输入和 MCP 调用

  • 2025-07-03
    北京
  • 本文字数:1983 字

    阅读完需:约 7 分钟

大小:1013.28K时长:05:45
百度搜索10年来最大改版,支持超千字长文本输入和MCP调用

7 月 2 日,百度搜索宣布进行十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新,主要包括:

 

  • 百度搜索框升级为“智能框”,支持超千字的文本输入,拍照、语音、视频等能力也全面加强,支持直接调取 AI 写作、AI 作图等工具。

  • “百看”功能升级,不仅支持图文、音视频混合输出内容,还接入智能体、真人服务等能力。

  • AI 助手加入视频通话,提升多模态输入、富媒体输出、一站式工作台及深度搜索能力。智能创作能力升级,一句话即可生成三分钟创意视频,支持分镜编辑,自定义画面内容。

  • 百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。


发生了哪些变化?


最直接的变化是经典的百度搜索框变大,成为“智能框”:原本只支持几十个字的搜索框,现在能放得下超千字的长文本,还可以上传文件,直接集成了 AI 写作、AI 画图等功能。


据悉,智能框的理解能力也大大提升。不论是旅游路线规划、方案撰写等创作类需求,还是“有一部外国电影讲的是一个黑人照顾一个残疾人,残疾人是一个富豪,电影名是什么,谁拍的”这种模糊需求,都能找到答案。


此外,图片、视频、音频等多模态输入能力的增强。比如 AI 相机不仅能帮用户识图、解题、翻译等,还能完成更个性化的服务。比如随手拍一张风景图,它可以充当导游为用户讲解;家里的电器出现故障不知道怎么描述,拍一张即可排查检修;体检报告看不懂,拍一张就能分析解读。升级后的方言搜索能力也让习惯用方言的用户更轻松地获取答案。



搜索结果页也发生了重大变化,以前是给链接,现在可以直接给出答案。百度搜索全新升级了“百看”功能,不仅能图文、音视频并茂地直接输出结构化内容,还会陆续接入智能体、真人等服务,把信息以最适配的形态送到用户面前。

 

比如,用户提问“最近有什么适合送礼的数码产品”,以前搜索会给出一堆链接,而现在不仅会把信息分门别类整理好,甚至还能搜索页直接下单。


接入全球首个中文音视频一体化生成模型 MuseSteamer

 

百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。

 

MuseSteamer 也是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC 视频 “先画面后配音”的割裂流程。

 

据介绍,MuseSteamer 在权威榜单 VBench I2V 中以 89.38%总分登顶全球第一,支持一张图生成 10 秒 1080P 电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。

 

MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线创作平台「绘想」开启限时免费公测,其余版本将于 8 月陆续开放。平台同步启动「跨次元捏合」AI 视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。

 

AI 助手升级


AI 助手此次也迎来重大能力升级。

 

首先是加入视频通话,并增强语音、图片和文件等多模态输入的能力;其次是丰富了多媒体输出能力,全面支持图片、视频、笔记等内容的混合排版,同时可根据用户的习惯和偏好智能调整输出结果;再者是一站式工作台能力实现「智能创作、实时编辑、异步交付、一键存储」的一体化能力;此外还强化了深度搜索(Deep Search)能力,能够模拟人类处理信息「感知-规划-执行-生成」的全流程,通过思维链多级推理,结合大模型多阶段自主反思能力,为用户提供更全面更多维的答案。

 

此外,百度搜索全新升级智能创作能力,一句话就能生成三分钟创意视频,视频生成后,支持分镜编辑,自定义画面内容,提供「从灵感捕捉、内容生成到全平台发布」一站式服务,大大降低了创作门槛,用户无需辗转多个平台,也无需拍摄剪辑,即可一键制作爆款视频。目前这一能力主要支持 PC 端,可以通过搜索「AI 视频」、「百度智能创作」等关键词体验。


接入 1.8 万+MCP


在今年 4 月的 Create2025 百度 AI 开发者大会上,百度创始人李彦宏正式发布了百度搜索开放平台,提供了 AI 时代的生态解决方案。目前百度搜索开放平台已收录 1.8 万+优质 MCP,其中有很多已经直接可被百度搜索调用,实实在在提升了用户的搜索体验。

 

比如近期爆火的拉布布,用户只需要通过拍照搜索,就能直接调用“千岛 MCP server”,不止查得到物品信息, 还可以直接找到购买链接,一键下单。如果用户想知道“哪些债券基金的费率比较低”,百度搜索就会调用“盈米 MCP”,利用其专业可信、实时准确的金融数据,提供形成系统、可信的建议。

 

除了面向 AI 搜索的 MCP server 外,百度搜索还接入了大量拥有闭环解决方案的 AI 应用,有些优质应用已获得了千万级的免费流量。比如用户想装修,只需要描述自己的想法,就能在搜索页直接调用生境科技的 AI 应用,生成 3D 装修全景方案。


百度方面表示,此次十年来最大改版,是百度搜索顺应行业形势做出的主动变革和积极探索。从通用化到个性化,从工具化到内容化,从信息获取到任务完成,百度搜索正在努力拓宽搜索的能力边界。


2025-07-03 11:107699

评论

发布
暂无评论

IDEA 接入 DeepSeek,太酷了!

不在线第一只蜗牛

IDEA DeepSeek

如何对测试同学进行能力定级

老张

团队管理 职场成长 工作规划

巧用通义灵码,提升前端研发效率

阿里巴巴云原生

阿里云 云原生 通义灵码

Flink CDC YAML:面向数据集成的 API 设计

Apache Flink

大数据 flink 实时计算 API

零基础构建开源项目OpenIM桌面应用和pc web- Electron篇

Geek_1ef48b

Byteman 使用指南(四)

FunTester

中国移动智慧屏市场报告出炉,小度闺蜜机销量稳居全年度TOP1

科技大数据

DeepSeek破圈,AI商业化临界点是如何被打开的?

脑极体

AI

免费体验100度算力包,极速部署不蒸馏满血版DeepSeek-R1!

九章云极DataCanvas

deeoseek

新注册的域名无法访问,是怎么回事?

防火墙后吃泡面

巧用通义灵码,提升前端研发效率

阿里云云效

阿里云 云原生 通义灵码

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

RTE开发者社区

仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型

火山引擎边缘云

边缘计算 网关 火山引擎 #大模型 边缘智能

5分钟入门微信小游戏开发(三)

扬_帆_起_航

小游戏开发

小派科技完成C1+轮融资,营收三年连续翻倍增长

极客天地

语音社交app源码,语音聊天交友 社交app 婚恋交友专业开发 交友互动小程序源码_交友小程序源码,小程序交友源码

DUOKE七七

深度洞察:低代码在企业数字化赋能进程中的策略与应用

不在线第一只蜗牛

人工智能 低代码 数字化 数智化

地平线 3D 目标检测 Bevformer 参考算法 V2.0

地平线开发者

自动驾驶; 算法工具链 地平线征程6

百度搜索10年来最大改版,支持超千字长文本输入和MCP调用_AI&大模型_褚杏娟_InfoQ精选文章