写点什么

轻松上手 UAI-Train,拍拍贷人脸识别算法优化效率提升 85.7%

  • 2019-11-11
  • 本文字数:1788 字

    阅读完需:约 6 分钟

轻松上手UAI-Train,拍拍贷人脸识别算法优化效率提升85.7%

“UAI-Train 平台可以让我们方便地在短时内使用大量的 GPU 资源,用较低的成本训练海量的数据集,提高算法模型迭代优化的效率。”

— 拍拍贷算法研究员 朱运

UAI-Train 是什么

UAI-Train 是面向 AI 训练任务的大规模分布式计算平台,基于 P40、V100 等 GPU 云主机集群,通过分布式扩展,最高可实现 192TFlops 的单精度计算能力。提供一站式训练任务托管服务,可自动化解决计算节点调度、训练环境准备、数据上传下载以及任务容灾等问题,并支持按需收费、成本可控,无需担心资源浪费。在视频图像识别、自然语言处理、语音处理等领域均已有诸多实践。

拍拍贷接入 UAI-Train 的效果

通过使用分布式 GPU 训练平台,700W 人脸数据的模型训练所需时长可从原先的一周缩短至一天,整体算法优化效率提升 85.7%,相应的迭代频率也提高数倍,为更深层次的模型结构试验提供了可能。同时 UAI-Train 平台备有大量 GPU 资源,拍拍贷的算法工程师可以同时探索多种算法模型结构,极大缩短初期算法结构探索的时间。最重要的是 UAI-Train 平台具备按需收费的特性,拍拍贷人脸识别算法的 GPU 资源成本可由原先的上万元/月,下降至数千元/月,GPU 资源的有效利用率也达到了 100%。



表:UAI-Train 与购买 GPU 资源的特性对比

关于拍拍贷

拍拍贷是一家行业领先的金融科技公司,同时也是一家非常注重技术驱动、强调自主研发的高科技公司。一直以来非常重视 AI 技术的探索和应用,涉及到计算机视觉、语音分析和建模、自然语言处理、复杂网络分析等针对特定非结构化数据的领域,并将迁移学习、主动学习、强化学习、多任务学习、在线学习、非监督半监督等各种机器学习算法应用至多种业务场景。尤其是人脸识别、OCR、不良中介识别和欺诈团伙挖掘、智能对话机器人、社交文本挖掘等项目,在实际的业务实践中取得了不俗的效果,极大地提升了风险反欺诈水平和运营效率。

人脸识别

人脸识别是拍拍贷 AI 技术的一个重要研究方向,它通过算法识别人的脸部特征,从而可以做到实时地从图片或者视频流中检测和追踪特定的人。


目前拍拍贷自研人脸识别算法,在 700W 规模多年龄段、多姿态、多表情、多环境的人脸图片上进行训练。通过尝试不同的网络结构,包含 Inception-v3、优化后的 resnet 等,以及多种损失函数,例如 triplet_loss、sphere、cosine、arc_loss 等来优化人脸识别算法,从而提升 1:1 人脸认证、1:N 人脸搜索、N:N 人脸交叉比对、人脸聚类等场景的识别精度,并将此类技术应用于拍拍贷的风险监控、反欺诈等业务,并发挥了重要作用。



图:人脸识别业务场景

面临的问题

算法人员在优化人脸识别算法的过程中发现使用单台 GPU 机器迭代一次算法需要一周左右的时间,效率过低影响研发进度,但是采购更多的 GPU 机器来探索不同算法会导致资源成本线性增长;此外由于算法调优工作涉及诸多研究内容,例如算法效果分析、新算法调研、开发等,实际的资源使用率不高。

接触 UAI-Train

在一次线下技术交流活动中,拍拍贷技术人员了解到 UCloud 提供一种面向人工智能算法训练的 UAI-Train 平台,并支持 GPU 资源的按需租售服务,同时该平台上还可执行多机多卡的分布式训练任务。


为了提升模型训练的效率,充分高效地利用更多的新数据来进一步提高其准确率,拍拍贷抉择后选择尝试 UAI-Train 平台。UCloud AI 团队在 GitHub 上发布了适配 UAI-Train 平台的 Insightface 开发案例,用于协助拍拍贷的算法工程师很方便地将单机的人脸识别算法转化成支持分布式训练的人脸识别算法,并成功在 UAI-Train 平台上进行算法的快速优化。


Insightface 是 GitHub 上一个基于 MXNet 框架的开源人脸识别项目。UCloud 基于 insightface 开发了一整套能支持分布式训练的人脸识别训练和在线推理的案例代码,并发布在GitHub上,其中包括基于 MXNet 框架的代码及开发案例。拍拍贷的工程师基于该案例,结合自身人脸识别算法的实现和数据,一周时间内就完成了开发和调试,并顺利在 UAI-Train 平台上逐步展开人脸识别算法的训练迭代工作。



图:人脸识别算法接入过程


在多次算法优化迭代尝试后,拍拍贷通过利用高维向量表征人脸,余弦距离表达相似度,最终在开源测试集准确率表现为:lfw 99.8%, cfp_fp 97%, agedb_30 98.2% ,实际业务应用中的准确率高达 99%以上,进一步提升了风险监管、反欺诈等业务的效率。


本文转载自公众号 UCloud 技术(ID:ucloud_tech)。


原文链接:


https://mp.weixin.qq.com/s/I1Ts8R4_vHCTB6kOWNo3yQ


2019-11-11 10:39982

评论

发布
暂无评论
发现更多内容

干货必收藏!墨天轮最受DBA欢迎的250份学习文档合集

墨天轮

MySQL 数据库 oracle postgresql

JAVA应用生产问题排查步骤

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

微服务的灾难:拆的很爽,但服务太小...

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

Go语言学习查缺补漏ing Day6

Regan Yue

Go 语言 11月日更

Redis为什么需要强一致?技术揭秘秒杀活动如何限流

华为云开发者联盟

redis 开源 华为云 强一致 MySQL组件

趣谈哈希表优化:从规避 Hash 冲突到利⽤ Hash 冲突

热爱java的分享家

Java 架构 编程语言 经验分享 哈希表

用户增速与体验质量并存,博睿数据携阿里云发布双十一电商网站用户体验报告

博睿数据

为何每次用完ThreadLocal都要调用remove()?

热爱java的分享家

Java 程序人生 编程语言 经验分享

彻底搞懂访问者模式的静态、动态和伪动态分派

Tom弹架构

Java 架构 设计模式

Micro Focus Fortify 最新能力发布,应用安全进入“一切皆代码”新时代

CSS布局(四)之文本布局

Augus

CSS 11月日更

外卖跑腿系统专业开发外卖跑腿app源码开发

风行无疆

行业分析| 为什么uni-app在音视频领域这么火?

anyRTC开发者

uni-app 音视频 移动开发 语音通话 视频通话

带你了解AKG正反向算子注册+关联流程

华为云开发者联盟

算子 AKG 正向算子 反向算子 算子注册

“低代码”是什么?低代码平台如何助力企业实现数字化转型?

优秀

低代码

又一次漏洞复现与分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

你的web知识有所欠缺。

喀拉峻

Web 安全

24 K8S之Service资源及其模型

穿过生命散发芬芳

k8s 11月日更

The Data Way Vol.6|我不是开发者,但我依然向往开源

SphereEx

开源 开发者 播客 ShardingSphere SphereEx

Aeron是如何实现的?—— Ipc Publication

BUG侦探

Aeron Ipc Publication

DAS易用性设计

赫杰辉

微帧Film Grain编码技术,致敬电影胶片颗粒的独特魅力

微帧Visionular

视频编解码

会声会影编辑面板常用功能介绍

懒得勤快

掌握Java的内存模型,你就是解决并发问题最靓的仔

华为云开发者联盟

Java 内存模型 线程 并发 工作内存

优秀!阿里甩出GC面试小册,仅7天Github获赞96.9K

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

艾媒报告:百度输入法AI功能领跑行业 用户满意度第一

百度开发者中心

百度 AI

Alibaba最新神作!耗时182天肝出来1015页分布式全栈手册太香了

热爱java的分享家

Java 面试 分布式 编程语言 经验分享

论文解读丨无参数的注意力模块SimAm

华为云开发者联盟

卷积神经网络 视觉 注意力模块 SimAm 神经元

工具 | 一条 SQL 实现 PostgreSQL 数据找回

RadonDB

数据库 postgresql RadonDB

分区丢失导致文件丢失?巧用EasyreCovery找回!

淋雨

数据恢复

帧彩视界之Pseudo HDR:为普通SDR设备用户提供HDR体验

微帧Visionular

视频编码 HDR

轻松上手UAI-Train,拍拍贷人脸识别算法优化效率提升85.7%_文化 & 方法_UCloud技术_InfoQ精选文章