【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

百度转型 AI,Web 大有可为

  • 2017-07-10
  • 本文字数:3094 字

    阅读完需:约 10 分钟

搜索是 AI 最早的原型,也是 AI 最典型的应用。百度着力向 AI 转型,搜索仍是最重要的应用。Web 有天然的开放性、需求满足路径短的特性,所以 Web 技术在 AI 时代将会有更大应用空间,百度仍然会不遗余力为 web 生态提供基础设施的建设。在 2017 百度 AI 开发者大会 Web 生态分论坛上,百度就展示了其在 Web 生态技术上的探索和实践,包括 Web 设计、HTTPS 安全、MIP 加速、Web APP、AR 增强现实等。本文从技术的角度对现场内容作了简单的汇总,感兴趣的读者可以下载讲师 PPT 深入阅览。

百度搜索生态总监谢天做了开场致辞,谢天表示,百度搜索是用户通往 Web Site 的桥梁,而在 Open Web 的过程中,站点面临了四大挑战:安全、速度体验、体验增强与用户留存。百度在深耕搜索技术的同时,也心系 Web 繁荣,针对当今 Web 技术面临的痛点,研发发展了 HTTPS 安全、MIP 加速、百度 AR 增强现实等系列技术,与开发者共同将 Web 生态的挑战转化成这个时代的机遇。

Web 安全技术——HTTPS(演讲 PPT

百度资深研发工程师张伟伟以及吕明分别从 Web 网页的安全隐患和百度 HTTPS 解决方案做了分享。张伟伟表示,在移动互联网时代,网站跳转白页、广告插播、调至跳转、隐私泄露等网络安全隐患的背后都隐藏着相同的问题——网络劫持。下图为一个典型的劫持场景,劫持者通常处于网络链路中间环节,在百度服务器之前将用户请求劫持到自己的服务器上,再将伪造的响应通过互联网反馈给用户,由此达到欺瞒用户的目的。

为了解决这个问题,百度启用了 HTTPS 超文本传输协议,HTTPS 设置 APS 保护,身份验证、数据加密、完整性校验等多种保密措施能够很好的防止中间劫持行为发生。

采用 HTTPS 技术可以大幅度增强网络安全性,有收益的同时必然存在一定的成本,速度慢 & 访问体验差,服务 CPU 资源资源消耗大以及网站改造成本高都是 HTTPS 改造需要解决的问题。针对 HTTPS 改造过程中面临的问题,百度是如何改进的呢?

  • 1)访问速度。据统计,采用 HTTPS 协议替代 HTTP,网络访问需要增加 1 到 7 个 RTT,大大降低了访问速度,百度通过对网站访问过程的分析,采用常规优化和定制优化两种策略消除网络延迟、减少 CPU 运算、节省流量。
  • 2)安全和可用性。提高安全性往往可能在某些场景中损害用户可用,保证用户可用的条件下,又回用户损失安全,如何平衡安全和可用性,百度从两大方向着手,一是安全等级,二是证书可用性。百度为不同类型的服务提供了同步安全等级,并且根据客户端特性,选择不同的证书提供服务。
  • 3)业务改造。针对复杂 Web 站点和简单 Web 站点,张伟伟现场分别给出了不同的建议,Web 站点设计域名数量多、第三方资源以及接入集群部署等问题,推荐自主改造;简单 Web 站点可使用百度云加速一键开通,百度云加速提供完整的 HTTPS 和匀加速解决方案,能够帮助站点快速完成域名接入、服务配置和 HTTPS 开通流程。

最后吕明在百度对各站点升级 HTTPS 的支持做了简单介绍,现场打消了开发者对于站点升级改造后能否被百度收录的忧虑,他解释,百度搜索除了全面支持 HTTPS 网页抓取和收录有待之外,同时开通绿色认证通道帮助网友快速切换 HTTPS 入口。

速度——MIP 的架构与原理解析(演讲PPT

百度前端工程师沈洲、产品设计师冯旭、高级研发工程师吴鹏分享了Web 极致体验背后的加速器——MIP 的架构与原理。百度MIP 项目启动于15 年12 月份,16 年4 月MIP 测试版发布、16 年8 月官网上线、9 月工具集发布、17 年3 月百度MIP 组件平台正式上线,纵观百度MIP 发展的整体路线,百度对MIP 上投入的时间虽然不长,却也有条不紊,沈洲表示:百度MIP 还会持续完成技术的更新于迭代,帮助用户达到最佳的网络体验环境。

沈洲首先分析了MIP 的加速流程,MIP 加速主要包括MIP 规范、代码运行环境以及CDN 缓存系统三大部分,HTML 根据MIP 规范进行改造,经过MIP 校验,在MIP 运行环境运行保证整个页面在进行无阻塞的加载,同时保证MIP 规范能够完整的执行,最后通过CDN 缓存,进入极速浏览模式。MIP 加速流程如下:

在MIP 优化流程当中,百度利用多种手段提升网络的访问速度,沈洲现场通过对代码优化、生命周期优化以及CDN 缓存优化三点举例加以说明。

1)网络优化。如下图所示,在图片代码之前添加“// prefetch-dns && preconnect”代码,这行代码能够帮助实现两个功能,一是 DNS 预取、二是 HTTP 与连接建立,通过这行代码的简单优化,能够使移动网络提升 100mS-200mS。

2)生命周期优化。现如今用户浏览的页面经常会加载大量的图片、视频或者音频媒体资源,这些资源通常加载时间长、流量消耗大。为了解决和优化因大文件导致的速度延时问题,百度 MIP 对于每个元素生命周期均做了一定优化,如控制图片加载顺序,优先加载可视区域的图片,对于非可视区域内的图片延迟加载等。
3)CDN 缓存系统。百度 MIP 页面被 CDN 缓存,用户可直接访问 CDN 页面。去年,百度的 MIP CDN 响应时间在 200mS 左右,随着近一年的优化,响应时间已经提升至 100 毫秒左右。

与此同时,百度为开发者提供了较为完整的规范和使用工具。吴鹏在现场一一作了介绍,本文在此不做详述,感兴趣的开发者下载 PPT 了解详情。

用户留存——Web APP 的探索与实践(演讲PPT

如果说移动Web 是引导用户关注的指南针,那么Web APP 就是用户留存的最佳入口。百度高级技术经理王俊杰、资深前端工程师彭星、百度浏览器内核技术负责人尹立就百度在Web APP 上的探索与实践进行深入分享。

什么样的Web APP 符合“优质用户体验”?

Web APP 无需安装也无需下载的特性受到众多用户喜爱,但即使被人们广泛使用的应用工具诸如网页版微信、钉钉等,也存在入口不便、输入缓慢、离线不可用、交互卡顿等各种问题。谈到 Web APP 现状,王俊杰乐观的表示,目前 Web APP 的各类问题都有实际落地的解决方案。

王俊杰对 Web APP 的用户体验提出了三个标准:1)Reliable 可靠的,可信赖的。现在的 Web APP 基本上是离线完全不可用,但在将来,即便未连接网络,Web APP 至少保证一些不需要网络的功能交互窗口离线可用;2)fast 快速。好的体验速度是第一要素,Web APP 不仅可以从服务器上去下载资源加载,而且还要考虑本地缓存问题;3)Engaging 有粘性。用户可以通过在桌面创建图标、显示消息通知等方式更快速、方便进入 Web APP。

百度浏览器内核在 Web App 体验上的优化实践

不止于搜索页面,百度在浏览器的内核优化方面也做了不少努力和尝试,尹立现场展示了百度浏览器在内核优化方面所做的实践,包括渲染优化和流畅度优化。

  • 渲染优化。包括首屏展现提速、智能云加速、首屏 JS API 支持、DomFirstPaint 以及 DomFirstScreenPaint 五大类型。
  • 流畅度优化。手机流畅度分为两块,一是左右滑动流畅度,实现页面的切换;二是纵向滑动流畅度,实现某些功能的触发。百度采用优先响应显示区域加载页面,降低不在可视区的元素响应等级的方式,提升页面的流畅度。

体验增强——AR 与 Web 技术的融合(演讲PPT

AR 是未来的发展趋势之一,Web AR 也已经不是一个虚无缥缈的概念。百度从很早以前就开始关注 AR 并将 AR 和百度技术进行融合,做到真正的增强用户体验如百度地图 16 年增加的 AR 导航模式。当 AR+Web 技术,会碰撞出怎样的火花?百度主任架构师王宇亮现场分享了百度在 AR 领域做的工作和突破。

王宇亮现场透露到,百度搜索已经着手开始对 AR 进行全面的支持,AR 内容将像图片、视频一样成为搜索的第一“公民”。即百度搜索将对优质、有体验度的 AR 内容进行优先索引排序,用以提升用户体验。同时,百度计划今年在 AR 的内容、交互和展现形式上开放统一标准和预处理工具等,其目的是希望在年底实现网站对 AR 内容的简单调取和引用。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-07-10 00:187505
用户头像

发布了 24 篇内容, 共 99348 次阅读, 收获喜欢 2 次。

关注

评论

发布
暂无评论
发现更多内容

霸气!这份清华学霸整理的Java线程池笔记,2小时从入门到入坟

飞飞JAva

Java

消息队列详细设计架构文档

Hesher

架构 MQ Architecture 消息队列 架构实战营

MySQL索引原理浅析

逸少

MySQL 索引结构 索引

架构实战训练营 - 模块三课后作业

Johnny

架构实战营

ARTS - week 8 补打卡

steve_lee

架构实战营 模块三:学习总结

👈

架构实战营

一文看懂 Go 的数据类型

Rayjun

Go 语言

【LeetCode】制作 m 束花所需的最少天数Java题解

Albert

算法 LeetCode 5月日更

架构实战营-模块3-作业

笑春风

假如只剩下canvas标签

执鸢者

大前端 canvas

自研集群 + MySQL 存储详细架构文档

@oo?金樱子

挖矿探索一:狗狗币-mac普通电脑

程序员架构进阶

比特币 区块链 28天写作 5月日更

架构实战营 - 模块三作业

凯迪

服务器又被挖矿了,怎么防?

运维研习社

挖矿 5月日更 Linux安全

作业三架构设计文档

大肚皮狒狒

第三课作业

杰语

模块3作业 3

杨彬

#架构实战营

Dubbo 泛化引用

青年IT男

dubbo

架构训练营模块3作业《消息队列架构设计文档》-江哲

江哲

自研集群+MySQL架构设计文档模板

9527

架构实战营

架构实战营 - 模块三总结

凯迪

架构实战营

架构实战营 模块三课后作业

iProcess

架构实战营

前端百题斩[001]——typeof和instanceof

执鸢者

面试 大前端

初识Golang之err概述

Kylin

Go 语言 5月日更

架构实战营模块三作业

冷大大

作业 架构实战营 模块三

架构师实战营 模块三作业(基于自研集群 + MySQL 存储的消息队列系统架构设计文档)

好吃不贵

业务架构

GreenPlum的CURD

数据社

greenplum 5月日更

消息中间件详细架构设计文档

白发青年

架构实战营

模块三作业 - 消息队列系统架构设计文档

青鸟飞鱼

架构实战营

架构训练营——模块2作业

圆心角

applet跨域访问安全性问题(java.security.AccessControlException:access denied)

xcbeyond

跨域 5月日更 疑难杂症

百度转型AI,Web大有可为_百度_江柳_InfoQ精选文章