写点什么

百度搜索 10 年来最大改版,支持超千字长文本输入和 MCP 调用

  • 2025-07-03
    北京
  • 本文字数:1983 字

    阅读完需:约 7 分钟

大小:1013.28K时长:05:45
百度搜索10年来最大改版,支持超千字长文本输入和MCP调用

7 月 2 日,百度搜索宣布进行十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新,主要包括:

 

  • 百度搜索框升级为“智能框”,支持超千字的文本输入,拍照、语音、视频等能力也全面加强,支持直接调取 AI 写作、AI 作图等工具。

  • “百看”功能升级,不仅支持图文、音视频混合输出内容,还接入智能体、真人服务等能力。

  • AI 助手加入视频通话,提升多模态输入、富媒体输出、一站式工作台及深度搜索能力。智能创作能力升级,一句话即可生成三分钟创意视频,支持分镜编辑,自定义画面内容。

  • 百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。


发生了哪些变化?


最直接的变化是经典的百度搜索框变大,成为“智能框”:原本只支持几十个字的搜索框,现在能放得下超千字的长文本,还可以上传文件,直接集成了 AI 写作、AI 画图等功能。


据悉,智能框的理解能力也大大提升。不论是旅游路线规划、方案撰写等创作类需求,还是“有一部外国电影讲的是一个黑人照顾一个残疾人,残疾人是一个富豪,电影名是什么,谁拍的”这种模糊需求,都能找到答案。


此外,图片、视频、音频等多模态输入能力的增强。比如 AI 相机不仅能帮用户识图、解题、翻译等,还能完成更个性化的服务。比如随手拍一张风景图,它可以充当导游为用户讲解;家里的电器出现故障不知道怎么描述,拍一张即可排查检修;体检报告看不懂,拍一张就能分析解读。升级后的方言搜索能力也让习惯用方言的用户更轻松地获取答案。



搜索结果页也发生了重大变化,以前是给链接,现在可以直接给出答案。百度搜索全新升级了“百看”功能,不仅能图文、音视频并茂地直接输出结构化内容,还会陆续接入智能体、真人等服务,把信息以最适配的形态送到用户面前。

 

比如,用户提问“最近有什么适合送礼的数码产品”,以前搜索会给出一堆链接,而现在不仅会把信息分门别类整理好,甚至还能搜索页直接下单。


接入全球首个中文音视频一体化生成模型 MuseSteamer

 

百度搜索还接入了商业研发团队自研的视频生成模型 MuseSteamer。

 

MuseSteamer 也是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC 视频 “先画面后配音”的割裂流程。

 

据介绍,MuseSteamer 在权威榜单 VBench I2V 中以 89.38%总分登顶全球第一,支持一张图生成 10 秒 1080P 电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。

 

MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线创作平台「绘想」开启限时免费公测,其余版本将于 8 月陆续开放。平台同步启动「跨次元捏合」AI 视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。

 

AI 助手升级


AI 助手此次也迎来重大能力升级。

 

首先是加入视频通话,并增强语音、图片和文件等多模态输入的能力;其次是丰富了多媒体输出能力,全面支持图片、视频、笔记等内容的混合排版,同时可根据用户的习惯和偏好智能调整输出结果;再者是一站式工作台能力实现「智能创作、实时编辑、异步交付、一键存储」的一体化能力;此外还强化了深度搜索(Deep Search)能力,能够模拟人类处理信息「感知-规划-执行-生成」的全流程,通过思维链多级推理,结合大模型多阶段自主反思能力,为用户提供更全面更多维的答案。

 

此外,百度搜索全新升级智能创作能力,一句话就能生成三分钟创意视频,视频生成后,支持分镜编辑,自定义画面内容,提供「从灵感捕捉、内容生成到全平台发布」一站式服务,大大降低了创作门槛,用户无需辗转多个平台,也无需拍摄剪辑,即可一键制作爆款视频。目前这一能力主要支持 PC 端,可以通过搜索「AI 视频」、「百度智能创作」等关键词体验。


接入 1.8 万+MCP


在今年 4 月的 Create2025 百度 AI 开发者大会上,百度创始人李彦宏正式发布了百度搜索开放平台,提供了 AI 时代的生态解决方案。目前百度搜索开放平台已收录 1.8 万+优质 MCP,其中有很多已经直接可被百度搜索调用,实实在在提升了用户的搜索体验。

 

比如近期爆火的拉布布,用户只需要通过拍照搜索,就能直接调用“千岛 MCP server”,不止查得到物品信息, 还可以直接找到购买链接,一键下单。如果用户想知道“哪些债券基金的费率比较低”,百度搜索就会调用“盈米 MCP”,利用其专业可信、实时准确的金融数据,提供形成系统、可信的建议。

 

除了面向 AI 搜索的 MCP server 外,百度搜索还接入了大量拥有闭环解决方案的 AI 应用,有些优质应用已获得了千万级的免费流量。比如用户想装修,只需要描述自己的想法,就能在搜索页直接调用生境科技的 AI 应用,生成 3D 装修全景方案。


百度方面表示,此次十年来最大改版,是百度搜索顺应行业形势做出的主动变革和积极探索。从通用化到个性化,从工具化到内容化,从信息获取到任务完成,百度搜索正在努力拓宽搜索的能力边界。


2025-07-03 11:107464

评论

发布
暂无评论

记录自有意义

彭宏豪95

人生 写作 感悟 记录

Java新技术:文字块

X.F

Java 编程语言

Boyer-Moore 算法

Kenn

算法 数组 Boyer-Moore

Dubbo 概述

会飞的猪

找工作不得不知道的事

熊斌

认知提升 求职

游戏夜读 | 2020周记(4.3-4.10)

game1night

20 大类,100+ 网络副业兼职平台汇总推荐

一尘观世界

程序员 自由职业 副业 赚钱

Java并发编程系列——锁顺序

孙苏勇

Java Java并发 并发编程 多线程

Redis学习笔记(概述)

编程随想曲

redis

动画设计的十个原则

养牛致富带头人

设计 动画

职场“35岁现象”:焦虑 or 出路?是时候说出真相了!

狂师

职场 成长 软件测试 测试 软件开发

JAVA中Base64加密与解密

Howe

Java base64 加密解密

Spring中的测试类~简洁方便

程序员的时光

spring

Kafka系列第4篇:消息发送时,网络“偷偷”帮忙做的那点事儿

z小赵

kafka 推荐 实时计算

iOS Release 版本开启调试功能

liu_liu

ios release 调试

从Integer开始阅读JDK源码

指尖流逝

Java jdk源码

如何梳理画出牛逼的、高大上的架构图?

狂师

程序员 企业架构 开发者 软件测试 软件开发

为什么每个软件人都要懂点系统架构?

刘华Kenneth

架构 DevOps 高可用 敏捷 高并发

Nacos 1.1.4 与微服务的实践经验记录

itfinally

Java 微服务 nacos

动态规划问题的思路和技巧

Kenn

算法 动态规划

为AndroidApk添加系统级签名

Howe

Java android

Spring Cloud概述

会飞的猪

KubeFATE: 用云原生技术赋能联邦学习(二)

亨利笔记

Kubernetes 云原生 k8s FATE KUBEFATE

认识数据产品经理(一 数据产品经理的细分)

马踏飞机747

大数据 数据中台 数据分析 产品经理

我愿沉迷于学习,无法自拔(三)

孙瑜

深度思考 程序员 感悟

聊聊测试工程师的价值

软件测试 质量 测试工程师产出 测试的价值

制作Unknown Pleasures效果图的3种方法

张云金_GISer

设计 T恤 GIS 地图

程序员陪娃漫画系列——上学路上

孙苏勇

程序员 生活 陪伴 漫画

缓存的五种设计模式

Rayjun

缓存

聊聊数据库原理和索引结构:1000万条数据优化后为什么能提升1500倍

牧码哥

MySQL 数据库 数据结构 性能优化 索引结构

技术人员加薪二三事

南方

管理 职场 技术管理 加薪 劈空掌

百度搜索10年来最大改版,支持超千字长文本输入和MCP调用_AI&大模型_褚杏娟_InfoQ精选文章