2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

百度搜索 10 年来最大改版,支持超千字长文本输入和 MCP 调用

  • 2025-07-03
    北京
  • 本文字数:1983 字

    阅读完需:约 7 分钟

大小:1013.28K时长:05:45
百度搜索10年来最大改版,支持超千字长文本输入和MCP调用

7 月 2 日,百度搜索宣布进行十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新,主要包括:

 

  • 百度搜索框升级为“智能框”,支持超千字的文本输入,拍照、语音、视频等能力也全面加强,支持直接调取 AI 写作、AI 作图等工具。

  • “百看”功能升级,不仅支持图文、音视频混合输出内容,还接入智能体、真人服务等能力。

  • AI 助手加入视频通话,提升多模态输入、富媒体输出、一站式工作台及深度搜索能力。智能创作能力升级,一句话即可生成三分钟创意视频,支持分镜编辑,自定义画面内容。

  • 百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。


发生了哪些变化?


最直接的变化是经典的百度搜索框变大,成为“智能框”:原本只支持几十个字的搜索框,现在能放得下超千字的长文本,还可以上传文件,直接集成了 AI 写作、AI 画图等功能。


据悉,智能框的理解能力也大大提升。不论是旅游路线规划、方案撰写等创作类需求,还是“有一部外国电影讲的是一个黑人照顾一个残疾人,残疾人是一个富豪,电影名是什么,谁拍的”这种模糊需求,都能找到答案。


此外,图片、视频、音频等多模态输入能力的增强。比如 AI 相机不仅能帮用户识图、解题、翻译等,还能完成更个性化的服务。比如随手拍一张风景图,它可以充当导游为用户讲解;家里的电器出现故障不知道怎么描述,拍一张即可排查检修;体检报告看不懂,拍一张就能分析解读。升级后的方言搜索能力也让习惯用方言的用户更轻松地获取答案。



搜索结果页也发生了重大变化,以前是给链接,现在可以直接给出答案。百度搜索全新升级了“百看”功能,不仅能图文、音视频并茂地直接输出结构化内容,还会陆续接入智能体、真人等服务,把信息以最适配的形态送到用户面前。

 

比如,用户提问“最近有什么适合送礼的数码产品”,以前搜索会给出一堆链接,而现在不仅会把信息分门别类整理好,甚至还能搜索页直接下单。


接入全球首个中文音视频一体化生成模型 MuseSteamer

 

百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。

 

MuseSteamer 也是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC 视频 “先画面后配音”的割裂流程。

 

据介绍,MuseSteamer 在权威榜单 VBench I2V 中以 89.38%总分登顶全球第一,支持一张图生成 10 秒 1080P 电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。

 

MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线创作平台「绘想」开启限时免费公测,其余版本将于 8 月陆续开放。平台同步启动「跨次元捏合」AI 视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。

 

AI 助手升级


AI 助手此次也迎来重大能力升级。

 

首先是加入视频通话,并增强语音、图片和文件等多模态输入的能力;其次是丰富了多媒体输出能力,全面支持图片、视频、笔记等内容的混合排版,同时可根据用户的习惯和偏好智能调整输出结果;再者是一站式工作台能力实现「智能创作、实时编辑、异步交付、一键存储」的一体化能力;此外还强化了深度搜索(Deep Search)能力,能够模拟人类处理信息「感知-规划-执行-生成」的全流程,通过思维链多级推理,结合大模型多阶段自主反思能力,为用户提供更全面更多维的答案。

 

此外,百度搜索全新升级智能创作能力,一句话就能生成三分钟创意视频,视频生成后,支持分镜编辑,自定义画面内容,提供「从灵感捕捉、内容生成到全平台发布」一站式服务,大大降低了创作门槛,用户无需辗转多个平台,也无需拍摄剪辑,即可一键制作爆款视频。目前这一能力主要支持 PC 端,可以通过搜索「AI 视频」、「百度智能创作」等关键词体验。


接入 1.8 万+MCP


在今年 4 月的 Create2025 百度 AI 开发者大会上,百度创始人李彦宏正式发布了百度搜索开放平台,提供了 AI 时代的生态解决方案。目前百度搜索开放平台已收录 1.8 万+优质 MCP,其中有很多已经直接可被百度搜索调用,实实在在提升了用户的搜索体验。

 

比如近期爆火的拉布布,用户只需要通过拍照搜索,就能直接调用“千岛 MCP server”,不止查得到物品信息, 还可以直接找到购买链接,一键下单。如果用户想知道“哪些债券基金的费率比较低”,百度搜索就会调用“盈米 MCP”,利用其专业可信、实时准确的金融数据,提供形成系统、可信的建议。

 

除了面向 AI 搜索的 MCP server 外,百度搜索还接入了大量拥有闭环解决方案的 AI 应用,有些优质应用已获得了千万级的免费流量。比如用户想装修,只需要描述自己的想法,就能在搜索页直接调用生境科技的 AI 应用,生成 3D 装修全景方案。


百度方面表示,此次十年来最大改版,是百度搜索顺应行业形势做出的主动变革和积极探索。从通用化到个性化,从工具化到内容化,从信息获取到任务完成,百度搜索正在努力拓宽搜索的能力边界。


2025-07-03 11:107549

评论

发布
暂无评论

AI 友好的云开发 MySQL SDK 它来了!微信小程序能直连关系型数据库了

蛋先生DX

微信小程序 云开发 AI‘’ mysql'

华为开发者空间,基于仓颉与DeepSeek的MCP智能膳食助手

华为云开发者联盟

MaaS DeepSeek v3 华为开发者空间

想了解ABAQUS,有没有比较好的SMULIA代理商公司推荐?

思茂信息

abaqus软件 达索 SMULIA代理商 思茂信息

信息化系统数据安全建设方案

金陵老街

数据安全 医疗安全

基于华为开发者空间,实现RFM分析与CLTV预测的电商客户细分与营销策略优化

华为云开发者联盟

RFM模型 华为开发者空间 CLTV

2026年境外舆情监测网站选型白皮书:功能、厂商与案例

沃观Wovision

舆情监测 沃观Wovision 海外舆情监测 境外舆情监测 舆情监测网站

如何有效开展境外的舆情监控工作?

沃观Wovision

舆情监控 海外舆情监控 沃观Wovision 境外舆情监测 舆情监控网站

BeeWorks企业即时通讯好用吗,马上简单了解一下!

BeeWorks

即时通讯 IM 私有化部署

大数据-136 - ClickHouse 集群 表引擎详解 选型实战:TinyLog/Log/StripeLog/Memory/Merge

武子康

大数据 flink spark 分布式 Clickhouse

读懂5G新通话:可能是AI落地千行万业的首个全民级场景

Alter

AI 5G

黑龙江龙江网络安全:等保测评的核心作用与覆盖范畴

等保测评

MIAOYUN | 每周AI新鲜事儿(10.17-10.24)

MIAOYUN

AI 机器人 AIGC AI大语言模型 多模态模型

领域驱动设计(DDD)中聚合根的最主要职责真的是维护一致性吗?

canonical

领域驱动设计 DDD 领域模型 可逆计算 Nop平台

基于华为开发者空间-云开发环境,Vanna+MaaS实现自然语言与数据库对话

华为云开发者联盟

MaaS 华为开发者空间 云开发环境 Vanna Text-to-SQL

AI风险评估系统:技术架构、行业落地与风控效能革新

上海拔俗

双碳目标下,MyEMS 为何成为制造企业的 “刚需工具”?

开源能源管理系统

开源 能源管理系统

【FAQ】HarmonyOS SDK 闭源开放能力 — AppGallery Kit

HarmonyOS SDK

HarmonyOS SDK应用服务

区块链 Web3 项目的开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

基于华为开发者空间云主机部署Typora高效内容创作,实现图片自动上传

华为云开发者联盟

Typora PicGo 华为开发者空间 云主机环境 对象存储服务 (OBS)

基于华为开发者空间云主机的软件安全栈溢出攻击实践

华为云开发者联盟

云主机 华为开发者空间

内网视频会议与外网视频会议的区别是什么?

BeeWorks

即时通讯 IM 视频会议 局域网

不止节能:MyEMS 为企业带来的成本控制、合规风控与数字化转型价值

开源能源管理系统

开源 开源能源管理系统

软件外包公司选择指南 - 郑州寻路科技专业建议

寻路科技

软件开发公司

领域驱动设计(DDD)领域对象一定要讲究充血模型吗?

canonical

领域驱动设计 DDD 聚合根 可逆计算

打破 “封闭垄断”:MyEMS 开源生态如何有效控制企业能源管理成本

开源能源管理系统

开源 能源管理系统

为什么说境外舆情监测是全球化企业的必要投资?

沃观Wovision

舆情监测 沃观Wovision 海外舆情监测 境外舆情监测 舆情监测软件

提示词工程-复杂项目-VB Coding

Jxin

AI 软件工程 提示词工程 氛围编程

WebGL 数字孪生系统的外包开发

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

选对黑龙江等保测评公司:从合规准入到服务质量的全维度指南

等保测评

百度搜索10年来最大改版,支持超千字长文本输入和MCP调用_AI&大模型_褚杏娟_InfoQ精选文章