谷歌通过概念向量来影响图像搜索-InfoQ

抖音技术能力大揭密！钜惠大礼、深度体验，尽在火山引擎增长沙龙，就等你来！立即报名>> 了解详情 



 写点什么

登录/注册

谷歌通过概念向量来影响图像搜索

谷歌最近公布了“与你相像的医疗图像”（Similar Medical Images Like Yours，SMILY）工具的研究工作进展，这个工具使用概念向量来增强医疗图像的搜索。这项研究工作使用 embedding 技术进行基于图像的搜索，用户可以通过概念交互细化来影响搜索。

谷歌先后发表了两篇论文。第一篇论文“组织病理学的相似图像搜索：SMILY”（Similar Image Search for Histopathology: SMILY）关注的是深层神经网络架构，主要用于创建搜索相似图像所需的 embedding。第二篇论文“在医疗决策过程中处理不完美算法的工具”（Human-Centered Tools for Coping with Imperfect Algorithms During Medical Decision-Making）集中在人类交互方面，以便提升在第一篇论文中提及的工具的使用。用户可以调整图像中的概念数量，而这反过来通过增强 embedding 中的位置来影响相似图像的选择。

用于创建 embedding 的深度神经网络是一种叫作深度排名网络的架构。该网络由三个并行的神经网络组成，分别接收三个独立的输入。第一个神经网络获取被搜索的图像，第二个神经网络获取与第一个同类的图像，第三个神经网络获取不同类别的图像。这三个网络都会创建 embedding，并经过训练，用以缩短同类图像与不同类图像之间的距离。这个神经网络架构可以为 300×300 像素的图像生成 128 维的 embedding。谷歌表示：

我们使用大约 5 亿张 18000 不同类别的“自然图像”（例如狗、猫、树、人造物体等）来训练我们的网络，因此它学会了通过计算和比较输入图像的 embedding 来区分相似和不同的图像。

在第一篇论文“组织病理学的相似图像搜索：SMILY”中，谷歌展示了用户选择图像片段，为图像片段创建 embedding，然后使用 K 近似算法从 embedding 空间检索相似的图像。但他们发现，用户在搜索相似图像时无法传达搜索意图，限制了工具的参与度。因此，第二篇论文继续进行深入研究，以改进交互搜索。

在第二篇论文“在医疗决策过程中处理不完美算法的工具”中，谷歌引入了一个称为“按概念进行细化”的特性，以此来改进这个工具。这个特性使用 embedding 维度中的方向来表示概念。选取一组图像样本，并对具有概念或相反概念的图像进行标记，确定方向，然后使用线性分类器在 embedding 空间中识别平面。然后进一步计算出平面的正交向量，也就是概念的方向。然后，用户通过影响概念的流行程度对搜索进行补偿，这样会影响所选图像生成的 embedding，进而影响相似图像的 K 近似选择。

原文链接：

Google Research Into Concept Vectors for Image Search

评论

发布

暂无评论

2021突击金三银四必备：BAT1000Java面试真题合集！

Java 编程架构面试计算机

程序员成长第十四篇：做好时间管理（二）

时间管理程序员成长 28天写作 2月春节不断更

第五周作业

紧急寻人，还缺75万！区块链产业为何“一才难求”？

CECBC区块链专委会

区块链人才

你知道 HTTP 是如何使用 TCP 连接的吗？今天我就来告诉你

程序员改bug

Java 架构 HTTP

Nginx入门的基本使用和配置详解

数据库架构运维

2021最全iOS面试题及底层视频分享专栏

ios 面试音视频 iOS底层 iOS逆向

2021最新华为面经分享：Java高分面试指南（25分类1000题50w字解析）

Java 编程架构面试计算机

安卓开发环境！一份字节跳动面试官给你的Android技术面试指南，终获offer

欢喜学安卓

android 程序员面试移动开发

GitHub上连夜被下架！阿里巴巴2021版JDK源码笔记（2月第三版）

Java架构追梦

Java 阿里巴巴 jdk源码金三银四跳槽面试

最新“美团+字节+腾讯”三面面经，你能撑到哪一面？

Java架构之路

Java 程序员架构面试编程语言

Newbe.Claptrap 框架入门，第一步 —— 开发环境准备

Docker 云计算分布式微服务 .net core

普本毕业，阿里五面成功斩下offer，名校出身的我究竟输在哪？

Java架构之路

Java 程序员架构面试编程语言

Newbe.Claptrap 框架入门，第二步 —— 创建项目

Docker 云计算分布式微服务 .net core

Enterprise Tech30(2021)

推荐程序员平时使用最多的绘图软件！！！

秦怀杂货店

软件流程图绘图

涨薪50%，从小厂逆袭快手 - 附面经

日记 2021年2月27日(周六)

2月春节不断更

基于matlab的控制系统与仿真6-PID控制模型

matlab 2月春节不断更

神操：凭借“阿里Java脑图”，成功斩获腾讯、蚂蚁、B站、字节、滴滴等5个Offer

Java架构师迁哥

诊所数字化：实施私域，诊所店员的赋能路径

数字化医疗私域运营七日更 28天写作

《华为技术认证HCNA网络技术实验指南》参考配置Ⅰ

华为网络交换机

牛批！Github一夜爆火，阿里JDK源码小册2021全新开源！

程序员小毕

Java 源码 jdk 面试并发

架构设计篇之微服务实战笔记（八）

小诚信驿站

架构刘晓成小诚信驿站 28天写作

刷了一个月leetcode算法，成功收下阿里巴巴、网易等大厂的offer

程序员改bug

三年Java开发，年底跳槽挂了阿里和字节，却收获美团offer，分享大厂面试心得

Java架构之路

Java 程序员架构面试编程语言

2021年金三银四Java面试突击大全，吃透这套Java真题合集，突破BAT面试官这道“防线”

Java 架构面试

金融数字化转型浪潮呼啸而来大数据区块链落地场景全面开花

CECBC区块链专委会

公链，区块链的未来和归宿

CECBC区块链专委会

成为阿里P7移动架构师到底有多难？带你快速通过字节跳动面试，讲的明明白白！

欢喜学安卓

android 程序员面试移动开发

第五周第一课笔记

Study Go: From Zero to Hero

Study Go: From Zero to Hero