深度学习在 Gilt 上的应用

  • Alex Giamas
  • 尚剑

2017 年 2 月 22 日

话题:大数据语言 & 开发AI

深度学习起源神经网络,是机器学习的一个快速发展的子领域。最近的一些算法的进步和 GPU 并行计算的使用,使得基于深度学习的算法可以在围棋和其他的一些实际应用里取得很好的成绩。

时尚产业是深度学习的目标领域之一。闪购网站Gilt就一直在使用深度学习来进行产品推荐和服装的属性分类。裙子样式是通过 Facebook 的Torch库来自动地识别其适用场合、裙子轮廓、领口和袖子类型的。Torch 使用由ImageNet数据集训练得到的模型来利用每张图片已经具有的标签,并通过 Gilt 选定的具体特征来增强它们。该系统使用基于 EBS 和P2实例的亚马逊云基础架构,每个服务器最多可提供 16 个 GPU。为了测试分类质量,该系统使用F1 分数作为评价指标,它同时兼顾了分类模型的准确率和召回率。Gilt 也测试了 SaaS 等替代品,但它们在准确度和提供的标签方面都不能令人满意。

另一方面,针对裙子相似性的产品推荐是基于TiefVision来实现的,它是一种基于深度学习的图像相似性搜索引擎。TiefVision也是基于 ImageNet 数据的分类,它在神经网络的最后几层用一个特定的网络来代替,这种技术也叫迁移学习。第一步是使用 Yann LeCunn 的OverFeat方法在图像中对裙子进行定位。定位之后,该算法使用一个Siamese 网络Hinge 损失函数来进行训练。

随着英特尔开源面向 Apache Spark 的分布式深度学习库BigDL,亚马逊推广MXNet 作为 AWS 的深度学习框架,并且将深度学习用于其他用例中的异常检测,现在看起来不仅软件正在“吞噬”这个世界,而且深度学习正在成为机器学习的主流,渐渐取代传统机器学习的地位。

查看英文原文:Deep Learning at Gilt


感谢冬雨对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

大数据语言 & 开发AI