阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

TensorFlow 技术发展与落地实践

  • 2019-03-13
  • 本文字数:2982 字

    阅读完需:约 10 分钟

TensorFlow技术发展与落地实践

本次分享的主要内容包括以下四个方面:首先是深度学习简介;其次是 TensorFlow 简介;然后讲解了深度学习在服装设计方向的机会与挑战;最后重点介绍深度学习的落地实践。


一、 深度学习简介

1.1 深度学习的发展

阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人, 从 AlphaGo 开始, 人工智能正式走入了大众的视野, 在 10 月 18 日,AlphaGo 的父亲 DeepMind 团队推出了 AlphaGo Zero,从 0 训练用了 40 天时间,以 100:0 击败了当今的世界围棋第一 AlphaGo,AlphaZero 在去年底通过自我对弈,就完爆上一代围棋冠军程序 AlphaGo,且没有采用任何的人类经验作训练数据,不管是 AlphaGo 还是 AlphaGo 他们的原理都是深度学习。


1.2 深度学习的动机

计算机语言一般都是按照固定流程完成任务,但是有一些任务,比如下五子棋、无人驾驶,人脸识别等,很难把他们的流程描述出来。这个时候就需要用到人工智能的方式来实现这些流程不确定的工作。


1.3 深度学习的原理

深度学习是指训练神经网络,把样本 x 输入神经网络,每一个特征都与所有的神经元相互联系,通过习得一个函数,映射到输出 y。



神经网络的结构包含输入层、隐藏层、输出层三部分,以判断零件是否合格为例,一个神经网络可以是输入层输入零件的长度和零件的质量,把参数权重 w、偏置 b 和输入 x 做 wx+b 运算,再通过激活函数激活得到神经元的值传到输出层,如果输出大于 0 则零件是合格,否则不合格。


输入层(Input layer),众多神经元接受大量非线形输入 x。输入的 x 称为输入向量。


输出层(Output layer),x 在神经元链接中传输、分析,形成输出结果。输出的 x 称为输出向量。


隐藏层(Hidden layer),简称“隐层”,是输入层和输出层之间众多神经元和链接组成的各个层面。

1.4 深度学习的案例

神经网络在自然语言上的应用:


情感分类:理解情感的语义,先把文字抽象成特征向量,把特征向量输入到神经网络,经过一系列的运算得到正负值,正代表着好评,负代表着差评。



神经网络在图像上的应用:手写数字识别、目标检测


输入图片得到像素矩阵,然后把像素矩阵输入到神经网络,进行目标检测,目标识别,识别出图片中的人、狗和椅子,手写数字也是同理。



目前 google 也在使用深度学习的方式来做推荐:


1.5 深度学习的趋势

可以看出从 2012 开始,深度学习的热度持续增高,一直到 2017 年都处于持续增长状态。2015 年国内开始兴起人工智能,到 2018 年,经过这三年的发展,人工智能的技术已经得到很好的发展,在各种细分的领域得到很好的应用。


二、TensorFlow 简介

2.1 TensorFlow 的前身

TensorFlow 是一个实现深度学习的框架,两者相辅相成,互为基础,他的前身是 DistBelief,DistBelief 只支持 CPU,原因是 google 内部的 CPU 资源非常丰富,可以通过并行的方式,实现高速度。


2.2 TensorFlow 介绍

DistBelief 后来发展为了 TensorFlow,TensorFlow 不依赖 Google 内部系统和架构,能够支持 GPU。

2.3 TensorFlow 早期版本变化

TensorFlow 不断的再创新,增加新功能,迭代速度是非常快的。



从 2015 年以后,TensorFlow 的流行度远超其他深度学习框架。



四款常用的深度学习框架比较:早期的时候图像的框架多用 caffe,但是 TensorFlow 的学习资料会更多一些,所以刚入门的新手推荐用 TensorFlow。


三、深度学习在服装设计方向的机会与挑战

3.1 深度学习落地行业

随着深度学习的发展,深度学习已经和很多行业结合起来,比如 AI+金融,AI+医疗等,但是在服装设计行业还很少,就目前来说,AI+服装行业还是一片蓝海。


3.2 服装设计行业存在的难题

国内的时尚一直以来都是紧跟欧美时尚,国内的服装设计师通过不断的寻找欧美的时尚素材,然后进行二次创造,但是创作的过程存在两个问题,一是时尚素材过于散,查找困难,二是设计师难以理解淘宝上的相关服装数据,没办法利用这些数据服务于设计,这也是知衣科技想要解决的问题,知衣科技是一家 AI 电商解决方案提供商,利用图像识别、个性化推荐等人工智能技术为电商行业提供人工智能解决方案,辅助设计师完成服装设计。



下图是淘宝的数据工具:


3.3 服装设计问题

1)多源:如果有上千个品牌方,就有上千个官网,还有很多的时尚网站,如何去收集这些信息其实是一个难点。


2)异构:设计师需要参考的既有图像类的非结构化数据,也有文字这样的半结构化数据,还有交易结构化数据,如何将这些数据有机的串联起来存在挑战。


3)海量:在互联网上有上百亿的服装信息,上亿的商品交易信息。


如何去处理这些图片、文字、交易信息,去帮助设计师去选款是知衣科技要解决的问题。


四、深度学习的落地实践

4.1 标签问题和解决办法

深度学习的识别和分类都是比较成熟的技术,但是如何把这些技术应用到服装行业确是一个新的问题。目前时尚图片的标注数据准确率低,因为时尚是一个专业性的东西,并不是每一个人都能理解时尚,所以很难标注,知衣科技的标注是由服装学院的设计师们帮忙标注的, 标注的准确率很高。


在服装识别中,我们把服装分为了五大类:上衣、下衣、包、鞋子、连衣裙, 再对五大类做细分,总共有 150 多种标签,设计师需要的是更细的划分,比如前几年流行的一字肩,这种细节需要从大量的数据中去发现。



目前标签存在的两大问题,一是标签的稀疏性,有的标签会比较少,比如双面呢大衣,二是设计细节难打标签,比如袖口的拉链,口袋的开口方向等,会有漏打漏标的情况,所以整体的标签要治理出来是非常困难的,我们开发了一套专门针对服装标签的打标系统,在部分标签体系上能实现 93%到 95%的识别率,设计院校的学生的识别率在 85%-90%,在这个专业领域上已经比别人强了。


4.2 基于 Faster R-CNN Model 的目标检测

整体的网络构造分两层,第一层是 Faster R-CNN 识别服装的过程,第二层是把识别到的服装经过一些风格的过滤器, 输出到不同的 FeatureMap 里,有些是形态的,有些是风格的,然后根据不同的风格进行聚类,再针对这些问题去做回归。



对图片进行多个维度的识别,包括人脸识别,包括以图搜图,搜图目的不同,他们背后的算法、逻辑和训练方式也是不一样的,比如淘宝的找同款或找相似,而我们要解决的是设计师选错款的问题,理解设计师想找到什么图片,这个问题我们抽象成了两个场景,一是全图搜索,看重的是整体的搭配,二是品类相似,是找单品相似款式。


作者介绍

郑泽宇知衣科技联合创始人兼 CEO。国内第一本 TensorFlow 读物《TensorFlow:实战 Google 深度学习框架》作者,该书销量稳居京东人工智能榜前 3。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从 2013 年加入 Google,作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(Knowledge Graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。 2013 年 5 月获得美国 Carnegie Mellon University 大学语言技术研究所硕士学位。期间在国际会议上发表数篇学术论文,并被评为 Siebel Scholar。此项荣誉每年仅授予 105 位全球顶级研究生。2011 年毕业于北京大学信息科学与技术学院,荣获北大优秀毕业生称号及信息科学与技术学院十佳毕业论文。郑泽宇在机器学习、人工智能领域有多年研究经验,并在 SIGIR、ACL、ICDM、ICWSM 等顶级国际会议上发表多篇学术论文。


本文来自郑泽宇在 DataFun 社区的演讲,由 DataFun 编辑整理。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-03-13 08:003754

评论

发布
暂无评论
发现更多内容

对号入座,快看看你的应用系统用了哪些高并发技术?

京东科技开发者

参与 PenPad Season 2 获得勋章,还有海量 Scroll 生态稀缺权益

威廉META

nft外包开发团队流程和注意事项

西安链酷科技

Amazon Bedrock 实践系列 | Claude 3 深度探秘

亚马逊云科技 (Amazon Web Services)

生成式AI

和鲸协办2024GAIIC算法挑战赛,基于ModelWhale平台实现模型自动评审,加速结果出分

ModelWhale

人工智能 大数据 全球人工智能技术创新大赛

明天!龙蜥邀您参加第二届 eBPF 开发者大会,探索 eBPF 技术的无限可能

OpenAnolis小助手

开发者 ebpf 龙蜥社区 龙蜥操作系统

出海企业如何从海外云手机中受益?

Ogcloud

企业出海 云手机 海外云手机 云手机海外版 电商云手机

APP上架流程解析

区块链公链搭建终极流程 公链搭建技术团队

西安链酷科技

公链开发

今天你对齐了吗,浅析中后台表单的设计艺术

inBuilder低代码平台

并发编程-ExecutorCompletionService解析

京东科技开发者

从零开始到将应用程序成功发布到应用商店

雪奈椰子

保护C#代码的艺术:深入浅出代码混淆技术

一文读懂Partisia Blockchain,被严重低估的隐私区块链生态

西柚子

【PolarDB-X从入门到精通】课程随堂互动获奖公告

阿里云数据库开源

数据库 阿里云 分布式数据库 教程分享 PolarDB-X

一文读懂传统服务器与云服务器的区别

Finovy Cloud

参与 PenPad Season 2 获得勋章,还有海量 Scroll 生态稀缺权益

西柚子

nft数字藏品交易平台系统开发

西安链酷科技

nft市场开发

dapp开发流程以及应用

西安链酷科技

DAPP智能合约交易系统开发

实现“代码可视化”需要了解的前置知识-编译器前端

京东科技开发者

Performance analysis of IPQ9554 chip motherboard with QCN6274 5G & 6G card

wifi6-yiyi

5G 6G ipq9554 qcn6274

SD-WAN企业网络部署模式及适用企业类型

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

聚道云助力企业实现高效合同管理新方案!

聚道云软件连接器

案例分享

Golang 并发安全Map容器实践

俞凡

golang

Golang 状态机设计模式

俞凡

golang 最佳实践 设计模式

古城煤矿:手机扫一扫,设备“码上”见

草料二维码

二维码 草料二维码 干货分享

监控系统泛滥:CTO 面临的隐形成本危机

观测云

监控

云手机可以用来进行Temu电商测评吗?

Ogcloud

云手机 海外云手机 云手机海外版 电商云手机 跨境云手机

意难平!面试小米,一步之遥...

王磊

Java 面试题

交易所钱包系统开发

西安链酷科技

区块链钱包开发 数字钱包开发

重磅揭秘:边缘计算平台技术优势为何突出?

3DCAT实时渲染

边缘计算平台

TensorFlow技术发展与落地实践_框架_DataFunTalk_InfoQ精选文章