2021腾讯数字生态大会直播预约通道开启!技术内容大爆发,开发者必看! 了解详情
写点什么

伯克利提出 AdaSearch:一种用于自适应搜索的逐步消除方法

2018 年 12 月 12 日

伯克利提出AdaSearch:一种用于自适应搜索的逐步消除方法

在机器学习领域的诸多任务当中,我们通常希望能够立足预先给定的固定数据集找出问题的答案。然而,在某些应用场景下我们并没有先验数据可供参考; 相反,我们必须自行收集数据以回答那些自己感兴趣的问题。举例来说,这种情况在环境污染物监测以及人口普查类调查中就比较常见。自行收集数据的方式,使得我们能够将注意力集中在相关度最高的信息来源身上。然而,确定哪些信息来源能够生成有用的指标同样不是件易事。此外,当物理代理(例如机器人、卫星、人类等)进行数据收集时,我们必须首先规划需要测量的指标,以便缩短代理活动时长并降低相关成本。我们将这个抽象问题,称为自适应传感


我们引入了一种新的方法以体现自适应感知问题,其中的机器人必须遍历所处环境以识别值得关注的位置或对象。自适应传感涵盖机器人技术当中众多已经得到充分研究的问题,包括快速识别意外污染泄漏与放射源,以及在搜索与救援任务当中寻找人类目标等。在这类场景当中,设计一条能够尽快返回正确解决方案的传感轨迹往往直接决定着任务的成败。


在这里,我们以放射源搜寻(简称 RSS)问题为例,其中无人机必须在所处环境中发现 K 个最为严重的发射性源头,而 K 为用户定义的参数。放射源搜寻属于自适应传感问题中一类特别有趣的例子,这主要是因为其中往往存在大量异质化明显的背景干扰,此外我们还很难找到适合统计置信区间且拥有良好表征的传感模型。



在这里我们引入了 AdaSearch,一套用于常规自适应传感问题的逐步消除框架,这里将在放射源搜寻场景下进行演示。AdaSearch 能够持续且明确地提供环境中每点放射率的置信区间。利用这些置信区间,算法将以迭代方式识别可能作为主要放射源的一组候选点,同时排除掉其它的点。


以体现搜索作为多重假设检验场景

从传统角度来讲,机器人社区一直将体现搜索(embodied search)目标设想为连续运动规划问题。其中,机器人必须在环境探索与有效轨迹选择之间做出有效平衡。这一基本思路意味着原有算法会将轨迹优化与探索结合至单一目标当中,从而利用滚动优化控制进行优化(参见Hoffman与 Tomlin、Bai等人、以及Marchant与 Ramos 的各自相关论文)。但我们的想法与此不同:我们希望建立起一种替代性方法,通过假设检验将问题表述为一种可排序的最佳行动识别。


在可排序的假设检验当中,我们的目标是通过迭代方式收集数据,从而针对多个单独问题得出结论。我们为代理提供一组 N 个测量行动,其中每种行动都根据不同的固定分布产生观察结果。


代理的目标是学习这些 N 个观测分布的一些预先指定的性质。举例来说,在“A/B 测试”这一统计问题当中,测量行动对应于向新客户展示产品 A 或产品 B,同时记录他们对于相关产品的评估意见。在这里,N=2,因为其中只涉及两种行动——向客户展示产品 A,以及向客户展示产品 B。其中需要关注的属性,在于哪款产品得到的平均反馈更好(如下图所示,B 的反馈更好)。随着收集到客户的偏爱情况,我们将能够获得产品样本平均反馈以及与之相关的置信区间,这一区间由每款产品的置信区间下限(简称 LCB)与置信区间上限(简称 UCB)予以描述。随着收集到的测量值不断增加,我们对于每款产品的反馈预估将更为自信,换言之我们能够进一步确定两款产品的真实排名。从结果来看,只要达成下述条件,则产品 B 的反馈要好于产品 A:如果产品 B 的置信下限高于产品 A 的置信上限,即可基本断定产品 B 的平均反馈情况有很大机率高于产品 A。



在环境感测场景下,每种行为都对应着一组来自给定位置与方向的传感器读数。通常来讲,代理希望了解哪项单一度量行为能够带来最大的平均观察信号值,或者说一组 K 项行为能够带来更高的总体平均观察值。为了实现这一目标,代理可能会利用以往观察到的结果按排序选择行为,从而尽可能采取具有最大平均观察值的行为以实现潜在的行动收益。


乍看起来,最佳行为排序识别这种方法似乎过于抽象了,很难在具体的移动传感代理当中发挥作用。但事实上,代理可以选择任意度量行为序列,而无需考虑潜在成本,例如与变更行为相关的活动时间。与此同时,最佳行动排序识别机制自身的抽象性质正是其最强大的力量所在。通过以精确的统计语言制定具体的搜寻问题,我们得以制定出与每项感测行为相关的可操作观察置信区间,同时在确定需要关注的目标观察点之前整理出所需采取的所有行为集合。


我们提出的具体搜寻方法正是 AdaSearch,其利用来自最佳行为排序识别与全局轨迹规划的启发式置信区间,从而分步渐近地实现复杂度最优度量,同时有效分摊活动成本。


放射源搜寻

为使阐述更加具体,我们将以单一放射源搜寻问题为场景解读 AdaSearch 的工作原理。我们将环境建模为一套平面网络,如下图所示。其中只存在一个高强度放射性源(下图中红点位置)。然而,定位该位置非常困难,因为传感器的测量功能会被背景辐射(即粉红点位置)所干扰。我们通过在网格上方部署配有辐射传感器的四旋翼飞行器来获取传感测量值。这一案例的目标,在于设计出一系列轨迹以确保机载传感器能够获得正确的测量值,从而使我们能够尽快将放射源位置与背景放射位置区分开来。



AdaSearch

我们的 AdaSearch 算法将全局覆盖规划方法与基于假设检验的自适应传感规则相结合,旨在定义出最优轨迹。在第一次进行网格探索时,我们会对整体环境进行均匀采样。



在经过第一轮探索与测量结果观察之后,我们可以略去其中一部分区域。如果某个点的置信区间上限低于其周边任何点的平均观察值置信区间下限,则将该点排除——这意味着其不太可能是我们需要搜寻的放射来源。



在下一轮搜寻中,AdaSearch 将专注于对作为潜在放射源位置的剩余点(即绿色方块)进行更细致地采样。



整个过程将不断继续,每轮的候选放射源数量也将持续减少,直到最终只剩下一个点。AdaSearch 会返回此点(即放大的红点),这就是搜寻工作最终给出的放射源答案。


由于整个统计公式清晰可信,因此我们基本可以肯定在已知的传感模型下,AdaSearch 有很高机率能够返回正确的放射源位置。我们在算法的整个执行过程当中设立固定的各单独区域周边置信界限宽度(以标准差方式),从而确保该概率具有一定程度的置信度。此外,AdaSearch 还提供特定于具体环境的运行时保证,更多详情请参考我们的论文。(https://arxiv.org/abs/1809.10611)。


实验基准

对于常规自适应搜寻问题,目前最流行的解决方案当数信息最大化(Bourgault等人提出)。信息最大化方法的基本思路在于根据信息理论标准在高机率位置收集测量值,并遵循滚动优化规划以进行轨迹规划。下面,我们将把 AdaSearch 与同样针对放射源搜寻场景定制的信息最大化方案 InfoMax 进行比较。


遗憾的是,对于规模较大的搜索区域,这种方法的实时计算存在诸多局限,例如只能给出规划范围与轨迹参数化的近似结果。这些近似结果可能导致算法贪婪性过高,且浪费太多时间以追踪无法解决问题的错误线索。


为了消除统计置信区间与全局规划启发(这一组合直接对打 InfoMax 中的信息指标与滚动优化规划)间的歧义,我们选择一种简单的全局规划方法 NaiveSearch 作为辅助基准。该方法会均匀地对网格进行采样,且保证在每个网格单元处花费相同的采样时间。


实验结果

我们建立起全部三种算法,并立足一套以 4 米为基本网格单位的 64 x 64 环境下利用仿真四旋翼无人机加模拟辐射传感器读数对其进行了测试,希望了解三者在十种随机实例排布下的具体效能。


在我们的实验中,我们观察到 AdaSearch 在计算完成速度总体上快于 NaiveSearch 以及 InfoMax。随着我们不断增加背景辐射的最高水平,AdaSearch 相较于 NaiveSearch 的运行时间比较优势亦持续提升,这与论文中提出的理论界限相符。



AdaSearch 相较于 NaiveSearch 的效能提升表明,自适应性方法确实比非自适应方法更具优势。同样令人惊讶甚至出乎意料的是,即使是 NaiveSearch,在处理此类问题时也往往能够带来优于 InfoMax 的表现。这意味着 InfoMax 中采用的滚动优化控制方法存在局部贪婪性,并因此损害了其实际效能。相比之下,AdaSearch 则优雅地将自适应策略与全局覆盖保证加以结合。


AdaSearch 更具通用性

在放射源搜寻案例中大获得成功的无人机载 AdaSearch 演示,不禁令我们想到这种新型算法还能够在哪些更为常规/通用的问题中带来良好表现?事实证明,这种核心算法拥有相当广泛的适用范围,甚至适用于多种非机器人体现型传感问题。


举例来说,我们可以考虑在某一地区分布的 100 家医疗诊所中为 10 家规划试点计划的问题。我们可能需要立足诊所的具体位置进行调查,从而评估哪里才是某种特定罕见疾病发病率最高的区域或者各地区的具体发病率水平。这是一项具体型感测问题,因为诊断工作由医师亲自进行。很明显,人力调查员的数量有限,而且同一组调查员的工作时间需求以及在各诊所之间的往来成本都属于客观存在的物理限制。


调查工作的调度人员可以利用 AdaSearch 的指导意见整理各诊所位置在计算该疾病新病例时的具体用时,外加由此前往其它诊所的距离,从而权衡往来行程时长以确保调查人员能够在单位时间之内收集到更多相关数据。


一般来讲,当我们认为测量过程中的干扰因素足以保证算法在数据收集过程中完成多轮区域探索时,AdaSearch 即可带来良好的预期表现。无论是搜寻放射源头还是调查罕见疾病的发病率,我们都可以将其建模为泊松分布随机变量,其中的方差会随平均值变化而变化。AdaSearch 能够轻松适应不同的噪声模型(例如高斯模型),从而对接存在此类模型的多种不同应用场景。只要我们能够计算或者框定出适当的置信区间边界,AdaSearch 就能够保证有效遍历该区域以找到需要关注的目标点。


如果您希望了解关于 AdaSearch 的更多细节信息,可通过以下链接获取论文全文: https://arxiv.org/abs/1809.10611


查看原文链接:


https://bair.berkeley.edu/blog/2018/11/14/adasearch/


会议推荐:

12 月 20-21,AICon全球人工智能与机器学习技术大会将于北京盛大开幕,学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例年终总结,与国内外一线技术大咖面对面交流,不见不散。



2018 年 12 月 12 日 12:00756

评论 1 条评论

发布
暂无评论
发现更多内容

展览工厂2020南京国际人工智能产品展览会

InfoQ_caf7dbb9aa8a

java安全编码指南之:堆污染Heap pollution

程序那些事

Java java安全编码 java安全编码指南 堆污染

架构师训练营1期 - 第一周 - 食堂就餐卡系统设计

三板斧

极客大学架构师训练营

zabbix 4.x一键部署脚本

edd

Servlet 知识点

陈靓-哲露

快讯2020第十三届南京国际大数据产业博览会

InfoQ_caf7dbb9aa8a

架构师训练营1期第1周:架构方法 - 作业

piercebn

极客大学架构师训练营

mysql union子句排序问题

LSJ

开发 SQL语法

实战中学习浏览器工作原理 — HTML 解析与 CSS 计算

三钻

CSS 前端 浏览器

Spring 5 中文解析数据存储篇-事务同步和声明式事物管理

青年IT男

Spring5

架构师训练营技术知识点

devfan

架构建模学习总结

林杭戴

极客大学架构师训练营

一代巨星的陨落!

小齐本齐

程序员 程序人生 职场

2020南京国际工业互联网及工业通讯展览会

InfoQ_caf7dbb9aa8a

架构师训练营大作业

路易斯李李李

StringBuilder 比 String 快?空嘴白牙的,证据呢!

小傅哥

面试 小傅哥 string StringBuilder StringBuffer

【API进阶之路】做OCR文字识别,谁说必须要有AI工程师?

华为云开发者社区

API 文字识别 OCR

成为技术领导者-读书笔记

edd

一次年轻代GC长暂停问题的解决与思考

AI乔治

Java 架构 JVM 优化 GC调优

架构师培训大作业二——知识思维导图

chanson

快讯2020第十三届南京国际智慧工地装备展览会

InfoQ_caf7dbb9aa8a

Golang领域模型-依赖倒置

奔奔奔跑

Go 架构 微服务 领域驱动设计 DDD

架构知识总结

飞雪

优选2020第十三届南京国际智慧停车展览会

InfoQ_caf7dbb9aa8a

亚洲2020第十三届南京国际智慧新零售暨无人售货展览会

InfoQ_caf7dbb9aa8a

英特尔揭示智能边缘重大机遇,助推产业智能变革

新闻科技资讯

架构师训练营第一周学习总结

尹斌

极客大学架构师训练营

听说你想进腾讯总部?这项黑科技你值得拥有!

腾讯云音视频

音视频

食堂就餐卡系统设计

熊桂平

系统设计 极客大学架构师训练营 UML

Vitalik Buterin: 协作的好坏两面

安比实验室SECBIT

区块链 博弈论 协作

大作业 二

Jaye

英特尔On技术创新峰会

英特尔On技术创新峰会

伯克利提出AdaSearch:一种用于自适应搜索的逐步消除方法-InfoQ