写点什么

谷歌详细描述了 Allo 的图形推荐处理算法

  • 2016-11-15
  • 本文字数:965 字

    阅读完需:约 3 分钟

谷歌的 Expander 团队详细描述了一种常数运行时的算法,用于支持 Allo 应用程序中的推荐图像回复功能。谷歌描述说,他们使用未标记的节点彼此之间的相似性来推断它们可能属于同一类,或者有相同的属性,在这个案例中,就是指那些输入的图像、文本或者其它包含了异构图形的数据。有监督的学习方法一直都以代价过大而著称,尤其是当这种图形算法需要处理并学习百万级或十亿级别的图形时。半监督式学习方法与之相比,则大大减少了所需要的训练数据集的大小。

各种大小各种形状,包括图形那样的异构的、多模型的数据,包括文本、图像和视频输入,或者这些数据的各种各样的“数据表现”,比如图像象素和聊天等,都可能在 Allo 中用于图像回复。数据可能是从原始数据中抽取出来的关系型或结构化的数据,也可能是非结构化的、稀疏或密集型表示。

谷歌提到了示例图表的多种属性,但也提到这种方法并不能扩展到百万级,或有时候十亿级的图形处理。在图表中预测任意节点是“红”还是“蓝”的示例中,谷歌提到:

数据节点之间的关系都是通过边来表示,并且通过每条边的宽度来表示连接的强度……边的强度是通过嵌入矩阵的相似性计算的——低相似性的边就直接被忽略了……灰色表示没有标签的数据,而有颜色的节点就表示有标签的数据。数据节点之间的关系都是通过边来表示,以及通过每条边的宽度来表示连接的强度。注意具体的图形结构和颜色的选择要根据具体的任务来,这种方法并不适用于大型图形。

谷歌提供的一个与平常生活更贴近的例子是从存储在相似性图形中的若干个已打标签的单词中辨别幽默词。

常数运行时算法是由分布式的相邻节点算法中派生而来的,目的是在大型图形上应用半监督式学习算法进行计算,发现单词的感情类别,从而算出某个词是否是幽默词。谷歌提到了系统的复杂度空间和内存要求,但没有提任务的复杂度、预测标签的数量,以及做算法设计决定时的可能输出空间因子的大小。目前谷歌没有提供示例代码、数据集及它们的属性。

“在实践中,我们会使用在图形结构上定义的复杂优化功能,这包含了更多的对半监督式图像学习的信息和约束,因此也导致了复杂的非凸性问题。然而,真正的挑战在于将这种算法有效地扩展到更大的系统之上,包含几十亿个图形节点、几十亿条边以及几十亿种不同的标签类型等。”

查看英文原文 Google Details Allo Recommendation Graph Processing Algorithm

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-11-15 18:001327
用户头像

发布了 152 篇内容, 共 68.0 次阅读, 收获喜欢 63 次。

关注

评论

发布
暂无评论
发现更多内容

扩招1W人,字节跳动内部公开12月份Java岗71道面试题

比伯

Java 编程 架构 面试 程序人生

JavaScript中,if判断未生效的一些特殊情况

Geek_de9857

js 1 if 0 不生效

架构师 3 期 3 班 -week4- 作业

zbest

作业 week4

阿里华为等大厂如何处理数值精度/舍入/溢出问题

Java架构师迁哥

OpenKruise v0.7.0 版本发布:新增周期任务分发控制器

阿里巴巴云原生

阿里云 容器 开发者 运维 云原生

程序员因重复记录日志撑爆ELK被辞退!

Java架构师迁哥

去 DeepMind 面试是怎样一种体验?

故胤道长

人工智能 面试 谷歌Google 硅谷 移动开发

第九周学习总结

Griffenliu

从面试角度分析LinkedList源码

Java旅途

Java List 集合 linkedlist

90分钟10个手写案例,从源码底层给你讲解7种线程池创建方式

996小迁

Java 源码 架构 资料 笔记

滴滴DoKit阶段性成果汇报之一机多控

工具 滴滴开源 DoKit

15年华为云视频架构师采访实录:揭秘未来音视频行业的科技趋势!

华为云开发者联盟

直播 视频 华为云

原创 | 使用JPA实现DDD持久化-O/R映射元数据-关联属性映射

编程道与术

Java hibernate 编程 mybatis jpa

第九周作业

Griffenliu

Mysql中,1=1和 1=1=1 和 -1=-1 和 -1=-1=-1 和 5=5 和 5=5=5 有什么区别

Geek_de9857

MySQL sql 返回值 1=1=1 -1=1=1

原创 | 使用JPA实现DDD持久化-O/R映射元数据-值属性映射

编程道与术

Java hibernate 编程 mybatis jpa

自从看了百度强推的“Spring源码笔记”我从渣渣成功逆袭成为钢铁侠!

比伯

Java 架构 程序人生 计算机 spring源码

佛萨奇Forsage系统开发,智能合约dapp技术

薇電13242772558

智能合约 dapp

eCharts -- 如何修改柱状图中相关数据的顺序?如何在鼠标悬浮时增加百分比信息?如何为柱状图设置分组?

Geek_de9857

柱状图 eCharts 修改数据顺序 百分比提示信息 设置分组

读《全球创新投资:经济大变局中的财富新机遇》

邓瑞恒Ryan

创业 读书笔记 企业 企业管理 产业竞争

原创 | 使用JPA实现DDD持久化-O/R映射元数据-值和关联的比较+继承映射

编程道与术

Java hibernate 编程 mybatis jpa

女朋友突然问我DNS是个啥....

乱敲代码

计算机网络 DNS DNS服务器

架构师训练营第 13 周学习总结

netspecial

极客大学架构师训练营

Hive中,同时存在map、array、struct这三种格式,应如何在建表语句中指定分隔符?

Geek_de9857

hive struct map array 分隔符

flink 使用curl,通过RESTful api,上传和删除jar包

Geek_de9857

flink RESTful curl 上传jar 删除jar

【涂鸦物联网足迹】用煲仔饭来说明IaaS/PaaS/SaaS的区别

IoT云工坊

云计算 IaaS PaaS SaaS 云平台

一文详解激活函数

书豪

阿里云容器服务入选云原生边缘「领导力企业TOP3」,推动「原生云边」基础设施标准建立

阿里巴巴云原生

阿里云 容器 开发者 云原生 边缘计算

几款Java开发者必备常用的工具,准点下班不在话下

华为云开发者联盟

Java 工具 开发

等保数据备份和恢复关键点,这些你该知道!

华为云开发者联盟

数据 容灾 恢复

LeetCode题解:127. 单词接龙,双向BFS,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

谷歌详细描述了Allo的图形推荐处理算法_AI&大模型_Dylan Raithel_InfoQ精选文章