写点什么

Ocado 客户服务中运用了 TensorFlow 和 Google 云平台

  • 2016-10-26
  • 本文字数:1174 字

    阅读完需:约 4 分钟

通过建立与 Google 及 Google 云平台( GCP )的合作伙伴关系, Ocado Techonology 公司发布了一种新的方法,用在对Ocado 的50 多万用户及来自这些用户的海量电子邮件请求的处理中。该方法使用了 TensorFlow 及宿主于 GCP 上的 TensorFlow Python API,重点在于解决电子邮件的自动分类问题。

Ocado 认为对于电子邮件分类问题,非常适合于使用工业规模的机器学习和自动化,更具体的说就是自然语言处理(NLP)。很多的企业支持中心为让工作一致和可靠,采用了依靠工作人员手工处理电子邮件队列的工作流程。在企业的业务迅速成长时,或是整体客户支持量所需的支持人员日益增长时。这种方法并不能很好地扩展,这会导致邮件响应的延迟,客户不满意度也随之增加。

Ocado 的做法是将所有的电子邮件汇集到同一处,然后通过分析邮件内容为邮件打标签,例如标记为客户投诉的则需要立刻反馈,标记为一般性反馈的则具有稍低的优先级可稍迟反馈。此外,邮件标签还包括:重发货请求、退款请求、支付问题或网站问题、新商品查询等。

Ocado 想要在分配标签类别时,尽可能地减少需用户及支持人员手工输入的域和标签的数量。因为这种手工输入不仅容易产生偏差并生成噪声数据,而且也占用了支持人员的宝贵时间,这些时间是本可用于根据客户请求的优先度服务于客户的。

Ocado 科技的高级软件工程师 Marcin Druzkowski 今年八月在 Datasciencefest 大会上的演讲上,给出了Ocado 训练神经网络所用的各种模型的一些细节。其中的方法包括:使用词袋逻辑回归、使用嵌入(embedding)的卷积神经网络( CNN )、使用嵌入的长短期记忆模型( LSTM )。

Druzkowski 指出深度学习并非一定要使用 GPU,考虑到 CPU 芯片的相对低成本、云计算的可扩展性和并行计算模型训练,没有必要再采用特定的 GPU 写入和训练模型。他也指出通过以软件工程为中心的数据科学方法,他们的 TensorFlow 图以数据矩阵和图定义的方式部署,这不同于数据科学软件所使用的一般方法,那些方法已被证明在部署和易于集成到生产环节的实现上存在着挑战。Druzkowski 在演讲中提到的特性还包括:可移植性和依赖性管理、代码质量、测试覆盖度、版本管理和持续集成。

围绕着测试模型,还出现了其它的一些新挑战。这些测试模式需给出随机性、可接受结果值范围和良好模型性能的组成目标。此外,挑战也存在于如何在后台数据集发生改变时,重新训练和测试模型。在确定一个模型是否有价值时,需额外考虑的变量是数据集改变的比例和速度。当前测试的运行使用了 pyTest 和 TensorFlow,但是 Ocado 拒绝了提供示例代码的请求。

查看英文原文: Ocado Uses TensorFlow and Google Cloud Platform for Novel Customer Service Approach


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-10-26 19:001846
用户头像

发布了 227 篇内容, 共 86.4 次阅读, 收获喜欢 28 次。

关注

评论

发布
暂无评论
发现更多内容

向量数据库这杯“啤酒”与“泡沫”

脑极体

AI 向量数据库

Java零基础适合看的5本书!

java易二三

Java 编程 教学 新手入门

saas平台定义以及优点、特点简单介绍

行云管家

SaaS 平台

直播平台源码开发提高直播质量的关键:视频编码和解码技术

山东布谷科技

软件开发 直播 视频编解码 源码搭建 直播平台源码

面试还不懂Redis与MySQL数据一致性,看这篇就够了

程序员小毕

Java 数据库 程序员 面试 架构师

使用Cloud Studio&Flutter完成全平台博客网站的搭建

坚果

flutter Cloud Studio

前端服务化和小程序容器技术的应用

没有用户名丶

助力企业出海!TDengine Cloud 正式入驻 AWS Marketplace

爱倒腾的程序员

时序数据库

新功能 – Cloud WAN:托管 WAN 服务

亚马逊云科技 (Amazon Web Services)

Amazon VPC

openGauss内核分析(十):数据库索引的创建过程

daydayup

基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数

汀丶人工智能

数据挖掘 机器学习 数据分析

C++实现哈希桶

芯动大师

Java 命令行参数解析方式探索(三):Picocli

冰心的小屋

Java 命令行 console Parameter Picocli

Docker学习路线13:部署容器

小万哥

Java c++ Python Go Docker

AIRIOT可视化组态引擎如何应用于物联业务场景中

AIRIOT

Dify.AI:46,558 行代码,完全开源

Dify

开源 AI LLMOps

线程池中多余的线程是如何回收的?

java易二三

Java 编程 程序员 面试 计算机

零代码,使用 Dify 两分钟接入企业微信 AI 机器人

Dify

开源 AI LLMOps

快速玩转 Llama2!阿里云机器学习 PAI 推出最佳实践(三)——快速部署 WebUI

阿里云大数据AI技术

人工智能

2023-07-27:最长可整合子数组的长度, 数组中的数字排序之后,相邻两数的差值是1, 这种数组就叫可整合数组。 给定一个数组,求最长可整合子数组的长度。

福大大架构师每日一题

福大大架构师每日一题

719作业

天天向上

Java break语句详解!

java易二三

Java 编程 计算机 break 循环

搜索业务广告、Youtube超预期,云计算收入增长Google没败给微软

B Impact

看头部银行保险企业如何释放数智生产力|数智新金融论坛精彩回顾

Kyligence

数智化 Kyligence Copilot

716作业

天天向上

从零构建医疗领域知识图谱的KBQA问答系统

汀丶人工智能

人工智能 知识图谱 智能问答

火山引擎DataLeap的Data Catalog系统公有云实践 (下)

字节跳动数据平台

数据库 数据中台 数据治理 数据安全 企业号 7 月 PK 榜

Ocado客户服务中运用了TensorFlow和Google云平台_AI&大模型_Dylan Raithel_InfoQ精选文章