写点什么

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

Sergio De Simone

  • 2024-10-11
    北京
  • 本文字数:1210 字

    阅读完需:约 4 分钟

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

谷歌介绍了一种将 Transformer 模型应用于音乐推荐的创新方法。目前,这一技术正在 YouTube 上进行试验性部署,目标是开发出一种能够理解用户在听音乐时的行为模式的推荐系统,通过分析用户的实时互动数据更好地理解用户偏好。


推荐系统通过分析用户的行为——如播放音乐、跳过曲目或对某首歌曲表示喜爱——来捕捉用户偏好,并据此推荐用户可能感兴趣的内容。


谷歌研究团队指出,音乐推荐系统在用户所处环境发生变化时常常表现不佳,例如从在家里听音乐变成在健身房听音乐。这种场景转换可能伴随着用户偏好从舒缓音乐转到更具活力的音乐。研究人员强调,尝试将这些上下文变化考虑在内,导致推荐系统要完成的任务变得更加困难,因为它们需要理解用户在当前上下文中的行为。


他们认为,Transformer 架构在这方面可能会有所用处,因为它特别适合理解输入数据序列,正如自然语言处理(NLP)和大语言模型(LLM)所证实的。谷歌研究团队相信,Transformer 架构有望展现出与理解基于用户上下文的语言相同的能力,从而深入洞察用户的行为序列。


自注意力层能够捕捉句子中单词之间的关系,这表明它们可能具备解析用户行为联系的潜力。在 Transformer 模型中,注意力层通过学习输入 Token 之间的权重分配,类似于分析句子中单词的关系,从而实现对用户行为序列的理解。


谷歌研究团队的目标是将 Transformer 架构从生成式模型转变为理解基于当前上下文的用户行为序列。这种理解随后与个性化排名模型相结合,生成精准的推荐。为了解释用户行为在不同上下文中可能具有的不同含义,研究人员以在健身房听音乐的用户为例,指出他们可能更偏好节奏感强的音乐。而在家中,这类音乐可能会被跳过。因此,在健身房时,推荐系统应降低对这种行为的关注权重。换句话说,推荐系统需要在考虑用户特定上下文与整体用户音乐收听记录之间合理分配注意力权重。


我们仍然会利用他们之前听过的音乐记录,并推荐与他们常听的音乐相似的曲目。实际上,我们正在探索哪些历史记录对于当前音乐排序任务是有价值的,以及哪些不是。


作为对谷歌推荐系统工作原理的简要总结,基于 Transformer 的系统遵循推荐系统的典型流程,分为三个主要阶段:首先从资料库检索项目,然后根据用户行为对项目进行排序,最后通过筛选减少展示给用户的选项。在对项目进行排名时,系统将 Transformer 技术与现有的排名模型相结合。每首歌曲都关联一个叫作“曲目嵌入”的向量,该向量同时用于 Transformer 和排名模型。与用户行为和曲目元数据相关的信号被映射到等长的向量,使得它们能够像曲目嵌入一样处理。例如,当向 Transformer 提供输入时,用户行为嵌入和音乐曲目嵌入会被相加,形成一个 Token。最终,Transformer 的输出与排名模型的输出通过多层神经网络进行融合。


谷歌研究人员的初步实验结果表明,推荐系统的性能得到了提升,具体表现为用户跳过率的降低和音乐播放时间的增加。


查看英文原文:

https://www.infoq.com/news/2024/09/transofrmer-based-recommender/

2024-10-11 08:089884

评论

发布
暂无评论
发现更多内容

AI在线生成组织架构图!办公效率原地起飞!

职场工具箱

AI 办公软件 AIGC 绘图软件 组织架构图

别让工具拖后腿!2025年Top5 AI代码工具,让Java开发效率翻倍

飞算JavaAI开发助手

YashanDB知识库|BeetISQL 批量插入时报 autoAssignKey 异常?可能是 rowid 惹的祸

数据库砖家

数据库·

YashanDB知识库|集成 Druid 连接池时日志报 “token IDENTIFIER start”?问题虽小但有来头!

数据库砖家

数据库·

阶跃星辰发布端到端语音接口 Realtime API,理解情绪、随时打断;Dia TTS:生成语音可带笑声、咳嗽声、清嗓子丨日报

RTE开发者社区

让 LLM 来评判 | 基础概念

量贩潮汐·WholesaleTide

LLM

从代码小白到 Java 高手:AI 工具如何压缩你的学习曲线?

飞算JavaAI开发助手

YashanDB知识库|Quartz调度写布尔值报错?问题关键在于 true/false 与 0/1 的差异

数据库砖家

数据库·

分析型数据库与事务型数据库?核心差异与选型指南

镜舟科技

OLAP 分析型数据库 OLTP 事务型数据库 数据存储结构

我们收到了数百份AI“生存提案”|72小时AI生存挑战招募中

RTE开发者社区

BOE(京东方)LTPO技术赋能vivo x200 Ultra 超低功耗解锁专业级影像新体验

爱极客侠

【参会有礼】4.26 广州 | 国产开源 AI 数据库技术交流

Apache IoTDB

TiDB 社区第四届专栏征文大赛联合墨天轮火热开启,TiDB 业务场景实战、运维开发攻略两大赛道,BOSE 降噪耳机、大疆手持云台、投影仪、运动手环、礼品卡等重磅礼品等你来拿!

TiDB 社区干货传送门

数据库 运维 分布式数据库 征文大赛 TiDB

YashanDB 知识库|如何远程连接 YashanDB 数据库?最全工具和方式合集!

数据库砖家

数据库·

YashanDB知识库|一个 SQL 多个执行计划?绑定参数背后的优化器逻辑别忽略

数据库砖家

数据库·

Arthas monitor(方法执行监控)

刘大猫

Java 监控 Monitor Arthas 方法执行监控

YashanDB|设置了归档日志上限,为什么磁盘还是被打爆了?

数据库砖家

数据库·

海外加速专线:解锁跨国视频会议,助您畅享畅聊体验

宽炜网络

海外网络专线

飞算 JavaAI 实战:从零搭建电商系统,代码一键生成!

飞算JavaAI开发助手

站在“场景化保险”拐点的致保科技,按下了增长“加速键”

Alter

YashanDB知识库|别名和变量同名就报错?这个“重名陷阱”得避开!

数据库砖家

数据库·

iVX:图形化编程语言 + IDE,而非传统 “代码平台”

代码制造者

无代码平台

YashanDB知识库|服务端编码是 GBK,为什么升级失败了?这其实是个字符集对齐问题

数据库砖家

数据库·

炸裂!推荐一款开源项目集成 Dify 到钉钉

柯杰

钉钉 dify

YashanDB知识库|用 yasldr 导入 LOB 字段,有几种方式?lls 和 lobfile 怎么选?

数据库砖家

数据库·

电信SD-WAN线路的有那些优势

宽炜网络

电信sd-wan

飞算 JavaAI 与 Spring Boot:如何实现微服务开发效率翻倍?

飞算JavaAI开发助手

智源数据新基建系列Workshop | 从大模型到具身智能

智源研究院

YashanDB知识库|JDBC 和 OCI 驱动需要设置字符集吗?其实你可能多虑了!

数据库砖家

数据库·

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐_架构/框架_InfoQ精选文章