写点什么

Ocado 客户服务中运用了 TensorFlow 和 Google 云平台

  • 2016-10-26
  • 本文字数:1174 字

    阅读完需:约 4 分钟

通过建立与 Google 及 Google 云平台( GCP )的合作伙伴关系, Ocado Techonology 公司发布了一种新的方法,用在对Ocado 的50 多万用户及来自这些用户的海量电子邮件请求的处理中。该方法使用了 TensorFlow 及宿主于 GCP 上的 TensorFlow Python API,重点在于解决电子邮件的自动分类问题。

Ocado 认为对于电子邮件分类问题,非常适合于使用工业规模的机器学习和自动化,更具体的说就是自然语言处理(NLP)。很多的企业支持中心为让工作一致和可靠,采用了依靠工作人员手工处理电子邮件队列的工作流程。在企业的业务迅速成长时,或是整体客户支持量所需的支持人员日益增长时。这种方法并不能很好地扩展,这会导致邮件响应的延迟,客户不满意度也随之增加。

Ocado 的做法是将所有的电子邮件汇集到同一处,然后通过分析邮件内容为邮件打标签,例如标记为客户投诉的则需要立刻反馈,标记为一般性反馈的则具有稍低的优先级可稍迟反馈。此外,邮件标签还包括:重发货请求、退款请求、支付问题或网站问题、新商品查询等。

Ocado 想要在分配标签类别时,尽可能地减少需用户及支持人员手工输入的域和标签的数量。因为这种手工输入不仅容易产生偏差并生成噪声数据,而且也占用了支持人员的宝贵时间,这些时间是本可用于根据客户请求的优先度服务于客户的。

Ocado 科技的高级软件工程师 Marcin Druzkowski 今年八月在 Datasciencefest 大会上的演讲上,给出了Ocado 训练神经网络所用的各种模型的一些细节。其中的方法包括:使用词袋逻辑回归、使用嵌入(embedding)的卷积神经网络( CNN )、使用嵌入的长短期记忆模型( LSTM )。

Druzkowski 指出深度学习并非一定要使用 GPU,考虑到 CPU 芯片的相对低成本、云计算的可扩展性和并行计算模型训练,没有必要再采用特定的 GPU 写入和训练模型。他也指出通过以软件工程为中心的数据科学方法,他们的 TensorFlow 图以数据矩阵和图定义的方式部署,这不同于数据科学软件所使用的一般方法,那些方法已被证明在部署和易于集成到生产环节的实现上存在着挑战。Druzkowski 在演讲中提到的特性还包括:可移植性和依赖性管理、代码质量、测试覆盖度、版本管理和持续集成。

围绕着测试模型,还出现了其它的一些新挑战。这些测试模式需给出随机性、可接受结果值范围和良好模型性能的组成目标。此外,挑战也存在于如何在后台数据集发生改变时,重新训练和测试模型。在确定一个模型是否有价值时,需额外考虑的变量是数据集改变的比例和速度。当前测试的运行使用了 pyTest 和 TensorFlow,但是 Ocado 拒绝了提供示例代码的请求。

查看英文原文: Ocado Uses TensorFlow and Google Cloud Platform for Novel Customer Service Approach


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-10-26 19:001347
用户头像

发布了 227 篇内容, 共 74.6 次阅读, 收获喜欢 28 次。

关注

评论

发布
暂无评论
发现更多内容

Android 应用层开发 Drawable 的一些叨叨絮,跨平台移动开发答案

android 程序员 移动开发

通过Rainbond的团队管理去管理已有的组织架构

北京好雨科技有限公司

最佳实践 多租户 开源软件 rainbond

用户案例|告别传统金融消息架构:Apache Pulsar 在平安证券的实践

Apache Pulsar

Apache Pulsar

并发编程之深入理解CAS

飞鸟

CAS 并发’ 11月日更 比较与交换

如何使用注解优雅的记录操作日志 | 萌新写开源 01

Zhendong

Java GitHub

RecyclerView使用GridLayoutManager为什么无法均匀分布?

Changing Lin

11月日更

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

阿里巴巴中间件

阿里云 微服务 云原生 中间件 Eureka

软件测试面试屡屡失败,面试官总是说逻辑思维混乱,怎么办?

六十七点五

学习方法 面试 软件测试 自动化测试 测试工程师

Android 开发市场是盛是衰?你应该知晓,android音视频开发面试题

android 程序员 移动开发

客户端稳定性异常检测:函数接口“扫雷”实践

阿里巴巴终端技术

函数式接口 稳定性测试 异常检测 客户端 APP稳定性

JWT、JWS与JWE

喵叔

11月日更

全面升级 —— Apache RocketMQ 5.0 SDK 的新面貌

阿里巴巴中间件

云计算 阿里云 RocketMQ 云原生 中间件

Android 常见的数据存储方式,腾讯T2大佬手把手教你

android 程序员 移动开发

Python代码阅读(第54篇):斐波那契数列

Felix

Python 编程 斐波那契 阅读代码 Python初学者

资产管理系统是管钱的吗?不完全对

低代码小观

企业管理 资产配置 资产管理 管理系统 企业资产

龙蜥操作系统将捐赠开放原子开源基金会

OpenAnolis小助手

Linux centos 开源社区 开放原子开源基金会

模块二作业

ks

300M的文件,9秒钟下载完成,这款软件真的太离谱!

懒得勤快

如何给企业制定碳排放额度?

石云升

学习笔记 碳中和 11月日更 碳交易

程序员:我熟悉多线程!面试官:都不敢写精通,还敢要26K?

Java 编程 程序员 面试 多线程

Linux踩过的坑

正向成长

Linux

高风险IP究竟来自哪里?IP定位带你反欺诈

郑州埃文科技

茜纱窗下夜读书(2021年11月)

美月

#读书

【应用分享】百度超级链助力CFCA建设基于区块链的电子数据存证系统

百度开发者中心

百度 超级链

如何用 Flutter开发一个直播应用

声网

flutter 人工智能

AliRTC 开启视频互动 “零计算” 时代

阿里云视频云

阿里云 音视频 RTC 视频云

又碰到一个奇葩的BUG

艾小仙

Android 应用层开发 Drawable 的一些叨叨絮(1),androidstudio中文社区

android 程序员 移动开发

WordPress站点快速集成腾讯数字身份管控平台CIAM,免开发实现登录认证

腾讯安全

优酷小程序优化实战

阿里巴巴终端技术

小程序 ios android 客户端 包大小

golang源码学习--context

en

Context

Ocado客户服务中运用了TensorFlow和Google云平台_AI&大模型_Dylan Raithel_InfoQ精选文章