写点什么

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

Sergio De Simone

  • 2024-10-11
    北京
  • 本文字数:1210 字

    阅读完需:约 4 分钟

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

谷歌介绍了一种将 Transformer 模型应用于音乐推荐的创新方法。目前,这一技术正在 YouTube 上进行试验性部署,目标是开发出一种能够理解用户在听音乐时的行为模式的推荐系统,通过分析用户的实时互动数据更好地理解用户偏好。


推荐系统通过分析用户的行为——如播放音乐、跳过曲目或对某首歌曲表示喜爱——来捕捉用户偏好,并据此推荐用户可能感兴趣的内容。


谷歌研究团队指出,音乐推荐系统在用户所处环境发生变化时常常表现不佳,例如从在家里听音乐变成在健身房听音乐。这种场景转换可能伴随着用户偏好从舒缓音乐转到更具活力的音乐。研究人员强调,尝试将这些上下文变化考虑在内,导致推荐系统要完成的任务变得更加困难,因为它们需要理解用户在当前上下文中的行为。


他们认为,Transformer 架构在这方面可能会有所用处,因为它特别适合理解输入数据序列,正如自然语言处理(NLP)和大语言模型(LLM)所证实的。谷歌研究团队相信,Transformer 架构有望展现出与理解基于用户上下文的语言相同的能力,从而深入洞察用户的行为序列。


自注意力层能够捕捉句子中单词之间的关系,这表明它们可能具备解析用户行为联系的潜力。在 Transformer 模型中,注意力层通过学习输入 Token 之间的权重分配,类似于分析句子中单词的关系,从而实现对用户行为序列的理解。


谷歌研究团队的目标是将 Transformer 架构从生成式模型转变为理解基于当前上下文的用户行为序列。这种理解随后与个性化排名模型相结合,生成精准的推荐。为了解释用户行为在不同上下文中可能具有的不同含义,研究人员以在健身房听音乐的用户为例,指出他们可能更偏好节奏感强的音乐。而在家中,这类音乐可能会被跳过。因此,在健身房时,推荐系统应降低对这种行为的关注权重。换句话说,推荐系统需要在考虑用户特定上下文与整体用户音乐收听记录之间合理分配注意力权重。


我们仍然会利用他们之前听过的音乐记录,并推荐与他们常听的音乐相似的曲目。实际上,我们正在探索哪些历史记录对于当前音乐排序任务是有价值的,以及哪些不是。


作为对谷歌推荐系统工作原理的简要总结,基于 Transformer 的系统遵循推荐系统的典型流程,分为三个主要阶段:首先从资料库检索项目,然后根据用户行为对项目进行排序,最后通过筛选减少展示给用户的选项。在对项目进行排名时,系统将 Transformer 技术与现有的排名模型相结合。每首歌曲都关联一个叫作“曲目嵌入”的向量,该向量同时用于 Transformer 和排名模型。与用户行为和曲目元数据相关的信号被映射到等长的向量,使得它们能够像曲目嵌入一样处理。例如,当向 Transformer 提供输入时,用户行为嵌入和音乐曲目嵌入会被相加,形成一个 Token。最终,Transformer 的输出与排名模型的输出通过多层神经网络进行融合。


谷歌研究人员的初步实验结果表明,推荐系统的性能得到了提升,具体表现为用户跳过率的降低和音乐播放时间的增加。


查看英文原文:

https://www.infoq.com/news/2024/09/transofrmer-based-recommender/

2024-10-11 08:089317

评论

发布
暂无评论
发现更多内容

FCPX插件-动态视频运动模糊视觉特效 mMotion Blur 支持Intel和Apple M芯片

南屿

fcpx动态视频 运动模糊视觉特效 fcpx插件下载 fcpx特效

30款绚彩天空背景特效PS渐变-Photoshop天空渐变

南屿

ps渐变 天空背景特效 Photoshop素材

实用fcpx插件:Photo Montage(轻松制作照片动画)

南屿

fcpx fcpx插件

如何利用 APM 追踪完整的类函数调用

心有千千结

APM Datadog OpenTelemetry 系统可观测性 DDTrace

PS磨皮滤镜降噪插件Imagenomic Professional 支持ps2024 兼容M1

南屿

磨皮插件 ps滤镜下载 Imagenomic Imagenomic Professional

外贸自建站推广为何首选谷歌广告?谷歌广告的优势在哪?

九凌网络

eBPF运行时安全

统信软件

安全 ebpf 运行时

软件测试/测试开发/全日制/测试管理丨多设备管理平台 STF

测试人

软件测试

电子签章接口调用,以契约锁为例

Geek_2a38d5

电子签章 契约锁

微店获得微店商品详情 API(micro.item_get)在电商中的发展

技术冰糖葫芦

API

ScaleUp插件使用方法 附ScaleUp for Mac破解版资源

南屿

高级视频增强工具 ScaleUp插件下载 ScaleUp mac破解版 AE/PR插件

photoshop色轮插件Coolorus怎么安装 附Coolorus 许可证

南屿

Coolorus mac版 PS调色插件 Coolorus许可证 Coolorus安装教程

软件测试/测试开发/全日制/测试管理丨iOS 自动化相关工具

测试人

软件测试

云联接:揭开SD-WAN神秘面纱,颠覆你对网络的认知!

博文视点Broadview

App加固:不同类型和费用对比

NFTScan | 01.08~01.14 NFT 市场热点汇总

NFT Research

NFT NFT\ NFTScan

AE蓝宝石插件BorisFX Sapphire 2024 for Mac破解版 及新功能介绍

南屿

Sketch Measure for Mac中文破解版 sketch标注插件下载

南屿

Sketch Measure mac中文版 sketch标注插件

Lightroom预设资源-高级食物lr预设 附lr预设导入教程

南屿

高级食物lr预设 Lightroom预设下载 lr预设怎么导入

软件测试/测试开发/全日制/测试管理丨Android WebView 技术原理

测试人

软件测试

SD-WAN服务简介及挑选服务商指南

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

荣耀开发者大会2023 · 一张图读懂设计分论坛

荣耀开发者服务平台

AI 设计 开发者大会 honor

堡垒机和数据库防水坝的区别一二

行云管家

数据库 网络安全 堡垒机 数据库防水坝

ps一键磨皮插件Delicious Retouch 5怎么安装 支持M芯片

南屿

磨皮插件 Photoshop 插件

软件测试/测试开发/全日制/测试管理丨CSS Selector

测试人

软件测试

Authing 入选中国信通院《 2023 高质量数字化转型产品及服务全景图》

Authing

中国信通院 信通院 Authing

5分钟带您了解DRS录制回放

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟

软件测试/测试开发/全日制/测试管理丨兼容性测试

测试人

软件测试

LED透明显示屏前景发展怎么样?

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 市场 #研发

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐_架构/框架_InfoQ精选文章