写点什么

下笔如有神:这是一个基于营销行业的 AI 技术实践

  • 2020-08-04
  • 本文字数:3759 字

    阅读完需:约 12 分钟

下笔如有神:这是一个基于营销行业的 AI 技术实践

“读书破万卷,下笔如有神”,当机器书读万卷的时候,能否做到下笔有神呢?


我们正在经历一个节奏越来越快的时代,互联网上的信息来也匆匆去也匆匆,各行各业涉及到高频内容生产和处理工作的都希望内容生产的速度快、质量高、数量多。而随着人工智能技术的发展,让机器辅助人类更高效地处理信息,以及让机器自动生成信息都已经成为可能。


让机器“下笔如有神”,涉及到的就是自然语言处理(NLP)技术了,其实依据 NLP 让机器帮助人工写作的技术早已不是新鲜事,前两年人工智能最火热的时候,关于 “AI 写新闻稿,记者要失业”、“AI 写剧本,编剧要下岗”等新闻甚嚣尘上,对于 AI 导致文字工作者失业的讨论也是学术界、产业界喜欢探讨的话题。


对于这种技术能力,在市场上我们常听到的称呼则是「智能写作」。互联网巨头们多有押注「智能写作」,本篇文章会带你了解京东在智能写作上的探索,更多解析在电商场景中智能写作发挥的作用。


在电商产品页面,通过点击商品标题、商品详情,到最终的下单行为,图文的感染力是左右用户的实在原因,而且随着电商平台体量增大,必然会面临需要更快更优质的内容以实现电商转化率地提升。


那么京东「智能写作」涉及到哪些关键性技术,其在京东有哪些应用,又发挥了什么作用呢?带着这些问题,InfoQ 采访到了京东智联云平台产品经理,自然语言处理与智慧内容营销产品负责人朱林仓。

智能写作在哪些场景下占优势?

什么场景适合让机器代替人工?重复性的劳动。在写作这件事上,把一些能找到规律的、大批量、短时间内需产出的内容让机器输出,本身对于商业来说,具有成本优势和效率优势。


从成本角度讲,一个系统一个人操作就能生产出 10 倍于人工的营销文案,这样的场景中技术是一定占优势的,而且当前的技术能力已经达到了替代部分人工的经济可行性和技术可行性。


从效率角度讲,机器能够通过数据分析,通过更精细的数据挖掘维度和非结构化营销内容的数据化与结构化,有效提升营销转化率,进而提升单位流量成本下的 GMV 收益。


所以智能写作在电商场景中的应用是非常占优势的。同时也解决了品牌方、消费者和内容生产方三方的难题:品牌方所投放内容转化订单金额提升困难、消费者面对导购内容与商品不一致的平台使得选择成本增高,体验变差、内容生产方人工成本居高不下,资料搜集时间长,内容审核修订,素材产出效率低。


目前,京东的「智能写作」更多应用在自身平台——京东 APP 上:京东【发现好货】频道、京小智智能客服、京东搭配购、社交电商京粉、人机交互写作等。


京东 APP【发现好货】频道
京东 APP【发现好货】频道,很多商品的营销文案都由「智能写作」来生成

智能写作能够针对不同群体采用不同营销策略,以及不同风格的营销文案,从而提高营销转化率。具体是如何实现的呢?京东 AI 研究院提出了基于商品要素的多模态摘要模型,论文发表在 AAAI2020 上,可基于商品要素进行可控的文案生成。


这也得益于京东原创的商品元素体系,首先根据用户的行为(浏览、点击、加购、下单、评论、分享等)识别用户感兴趣的商品要素——根据这些要素指定模型要生成的文案必须包含的商品要素——利用京东提出的基于商品要素可控的文案生成相应文案。


在京东 APP,通过 AI 创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性。同时,AI 生成内容在曝光点击率、进商品详情转化率等方面,其实都表现出了优于人工创作营销的内容。


另外,在其他的互联网场景中,智能写作也在大放异彩。比如:店铺装修运营、广告创意创作等场景下,将重复工作由 AI 技术完成,创意工作由 AI 构建数据支持和洞察支持,人机协同创作更高效的创意营销内容。还有直播场景下,AI 可以辅助主播创作黄金话术、实时洞察消费者情绪变化与直播间的消费者需求分布等。

京东「智能写作」的关键性技术

京东「智能写作」依靠的关键技术就是多模态异构数据自动摘要技术。


通过输入多模态(图片 + 文本)、异构(结构化商品知识图片和非结构化纯文本)数据,挖掘卖点和商品要素,模型包括多模态的编码器和解码器、预训练语言模型提高文本合规性、句间流畅度模型提高文本逻辑性、标点纠错模型改正标点错误,最终输出商品的营销短文。



在这里,通过解读京东 AI 研究院入选 AAAI 2020 的两篇论文,大家对智能写作涉及到的模型将能有更好的了解。论文标题为:《Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products》、《Keywords-Guided Abstractive Sentence Summarization》 ,分别介绍了基于商品要素地多模态摘要模型和基于关键词指导的生成式句子摘要方法。

基于关键词指导的生成式句子摘要模型介绍

自动文本摘要是 NLP 领域中的一个传统任务,提出于 20 世纪 50 年代,其目标就是基于给定的文本,生成一段包含其中最重要信息的简化文本。常用的自动文本摘要方法包括抽取式自动文摘(Extractive Summarization) 和生成式自动文摘(Abstractive Summarization)。抽取式自动文摘通过提取给定文本中已存在的关键词、短语或句子组成摘要;生成式自动文摘则是通过对给定文本建立抽象的语意表示,利用自然语言生成技术,生成摘要。


京东提出的方法则是融合了抽取式自动文摘和生成式自动文摘,在 Gigaword 句子摘要数据集上与对比模型相比,也取得了更好的性能。


如何让句子“由长变短”呢?京东提出的想法是:输入文本中的关键词可以为自动文摘系统提供重要的指导信息。这一过程就是:首先将输入文本和参考摘要之间重叠的词(停用词除外)作为 Ground-Truth 关键词,通过多任务学习的方式,共享同一个编码器对输入文本进行编码,训练关键词提取模型和摘要生成模型,其中关键词提取模型是基于编码器隐层状态的序列标注模型,摘要生成模型是基于关键词指导的端到端模型。


关键词提取模型和摘要生成模型均训练收敛后,利用训练好的关键词提取模型对训练集中的文本抽取关键词,利用抽取到的关键词对摘要生成模型进行微调。测试时,利用关键词提取模型对测试集中的文本抽取关键词,最终利用抽取到的关键词和原始测试集文本生成摘要。


这其中的重点动作可总结为以下几点:


  • 通过采用多任务学习框架来提取关键词和生成摘要;

  • 通过基于关键字的选择性编码策略,在编码过程中获取重要的信息;

  • 通过双重注意力机制,动态地融合了原始输入句子和关键词的信息;

  • 通过双重复制机制,将原始输入句子和关键词中的单词复制到输出摘要中。

  • 在标准句子摘要数据集上,京东验证了关键词对句子摘要任务的有效性。

基于商品要素的多模态摘要模型介绍

商品摘要任务的挑战性在于:一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响。因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能。因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。


京东 AI 研究院提出的这一电商商品的多模态摘要模型,将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要。有效地整合了商品的视觉和文本信息。



这里对于文本信息的整合很好理解,那么这一模型是怎么理解图像信息的呢?


京东 AI 研究院提出的这一模型基于指针 - 生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码。



这使得京东的智能写作可以更层次化地理解商品图像。第一,通过 R-CNN 挖掘有价值的局部特征,例如冰箱的面板、手机的屏幕,将其融入到文本解码的每一步中,使模型针对商品有卖点的局部进行描述;第二,通过 ResNet 挖掘商品全局特征,该特征和文本全局特征一起,对编码器和解码器初始状态进行赋值,从而从更多的角度丰富商品的特征,提高商品的可区分度,生成更加多样化的文案。

智能写作给京东零售带来的诸多受益

自 2019 年 2 月底,在【发现好物】的频道内实践智能写作功能,它帮助了京东零售生成多种风格文案,包括属性类描述、体验类描述、官方单品描述、搭配商品描述、社交体等,涵盖京东 2700 余个三级类目。文案人工审核率超过 99%,曝光点击率高出达人写作 40%,累计引单金额超过一亿。


而且在今年京东 618,【发现好货】的 AI 内容导购,AI 内容是人工创作内容曝光点击率的 1.4 倍。另外在京小智智能客服,智能生成了数百万营销文案,每天相当于超过 500 个文案编辑人员的工作量。


在 NLP 基础技术研究上,京东未来将强化电商领域语言模型,强化 NLP 应用技术研究,在商品理解和营销内容理解方面更加深入营销场景。


后续,京东「智能写作」还将覆盖更多题材的内容营销导购频道,将商品营销内容理解能力、卖点挖掘与卖点包装能力,更多的赋能商家店铺装修、广告文案创意等场景。同时在这项能力的迭代上,提供千人千面的个性化文案,短文、长文、直播话术等多题材智能创作、营销内容智能诊断。


关于采访嘉宾


朱林仓,京东智联云平台产品经理,自然语言处理与智慧内容营销产品负责人,主导商品营销智能创意产品规划设计,《特种机器人》作者。擅长将电商营销管理与人工智能技术深度融合,专注主观感性业务的数据化、结构化与智能化的产品设计。


2020-08-04 10:003651

评论

发布
暂无评论
发现更多内容

如何使用GaussDB(DWS)的本地临时表进行数据处理

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 本地临时表

DHorse v1.4.2 发布,基于 k8s 的发布平台

tiandizhiguai

图文详解!带你认识 ancert:硬件兼容性标准实现工具!| 龙蜥技术

OpenAnolis小助手

开源 操作系统 龙蜥社区 Ancert 硬件兼容性

财政部办公厅发布公立医院内控建设征求意见函 信息化成为内控建设重要抓手

用友BIP

数智医疗

用友Fast by BIP助力公交企业降本增效,数智运营!

用友BIP

AI原生应用速通指南

百度Geek说

App 百度文库 AIGC 企业号10月PK榜

Bonree ONE 秋季产品发布会上新功能提前剧透!

博睿数据

可观测性 智能运维

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队

京东科技开发者

人工智能 gpu 企业号10月PK榜

消灭指标二义性!提效30%的指标管理如何炼成?

奇点云

奇点云 数据云操作系统 指标标签

解析设计模式与设计原则:构建可维护性和可扩展性代码的重要性

华为云开发者联盟

开发 华为云 华为云开发者联盟

李彦宏,AI原生应用的秋收时刻

脑极体

AI

塑造未来经济的游戏规则改变者:去中心化金融交易所的发展

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

如何将电脑上的“小电影”隐藏为一张图片?这波操作绝了!!

冰河

程序员 图片 视频创作 知识分享 小视频

Vulkan 同步

江湖修行

android OpenGL ES 渲染 移动端开发 vulkan

浅谈东数西算战略中,发挥算网大脑作用的4个关键点

鲸品堂

东数西算 算力网络 企业号10月PK榜

太强了!三种方案优化 2000w 数据大表!

互联网工科生

数据库

设计模式之策略模式:让你的代码灵活应对不同的算法 | 京东云技术团队

京东科技开发者

算法 设计模式 策略模式 企业号10月PK榜

浅谈分布式事务及解决方案 | 京东物流技术团队

京东科技开发者

数据库 分布式 分布式事务 事务 企业号10月PK榜

叮!你有一份1024程序员节的通关秘籍待查收!

飞桨PaddlePaddle

1024程序员节

水务行业管理与服务数智化升级,用友Fast by BIP在行!

用友BIP

Fast by BIP 水务行业

Opencv入门篇:简介与基本使用 | 京东物流技术团队

京东科技开发者

Python OpenCV 计算机视觉 企业号10月PK榜

sip中继的内容介绍

cts喜友科技

SIP sip中继

驱动数字化转型,Doris Summit Asia 2023 智慧金融与政企论坛精彩预告!

SelectDB

数据库 大数据 数据分析 实时数仓 apache doris

火山引擎ByteHouse:双十一即将到来,如何用数据分析提升电商平台销售转化?

字节跳动数据平台

大数据 数据仓库 云原生 电商

博睿数据获评2023中国智能运维领域“最具商业合作价值企业”

博睿数据

可观测平台 智能运维AIOps

TDengine 资深研发整理:基于 SpringBoot 多语言实现 API 返回消息国际化

TDengine

时序数据库 ​TDengine

AI大模型下一步怎么走?百度携AI原生应用抢先作答

陈橘又青

文心一言

对话在行人 | 微乘科技:升级数智底座,从管控向“管理+服务”转变

用友BIP

2023全球商业创新大会 对话在行人

记一次MySQL5初始化被kill的问题排查 | 京东云技术团队

京东科技开发者

MySQL 数据库 企业号10月PK榜

下笔如有神:这是一个基于营销行业的 AI 技术实践_AI&大模型_王利莹_InfoQ精选文章