2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

轻松上手 UAI-Train,拍拍贷人脸识别算法优化效率提升 85.7%

  • 2019-11-11
  • 本文字数:1788 字

    阅读完需:约 6 分钟

轻松上手UAI-Train,拍拍贷人脸识别算法优化效率提升85.7%

“UAI-Train 平台可以让我们方便地在短时内使用大量的 GPU 资源,用较低的成本训练海量的数据集,提高算法模型迭代优化的效率。”

— 拍拍贷算法研究员 朱运

UAI-Train 是什么

UAI-Train 是面向 AI 训练任务的大规模分布式计算平台,基于 P40、V100 等 GPU 云主机集群,通过分布式扩展,最高可实现 192TFlops 的单精度计算能力。提供一站式训练任务托管服务,可自动化解决计算节点调度、训练环境准备、数据上传下载以及任务容灾等问题,并支持按需收费、成本可控,无需担心资源浪费。在视频图像识别、自然语言处理、语音处理等领域均已有诸多实践。

拍拍贷接入 UAI-Train 的效果

通过使用分布式 GPU 训练平台,700W 人脸数据的模型训练所需时长可从原先的一周缩短至一天,整体算法优化效率提升 85.7%,相应的迭代频率也提高数倍,为更深层次的模型结构试验提供了可能。同时 UAI-Train 平台备有大量 GPU 资源,拍拍贷的算法工程师可以同时探索多种算法模型结构,极大缩短初期算法结构探索的时间。最重要的是 UAI-Train 平台具备按需收费的特性,拍拍贷人脸识别算法的 GPU 资源成本可由原先的上万元/月,下降至数千元/月,GPU 资源的有效利用率也达到了 100%。



表:UAI-Train 与购买 GPU 资源的特性对比

关于拍拍贷

拍拍贷是一家行业领先的金融科技公司,同时也是一家非常注重技术驱动、强调自主研发的高科技公司。一直以来非常重视 AI 技术的探索和应用,涉及到计算机视觉、语音分析和建模、自然语言处理、复杂网络分析等针对特定非结构化数据的领域,并将迁移学习、主动学习、强化学习、多任务学习、在线学习、非监督半监督等各种机器学习算法应用至多种业务场景。尤其是人脸识别、OCR、不良中介识别和欺诈团伙挖掘、智能对话机器人、社交文本挖掘等项目,在实际的业务实践中取得了不俗的效果,极大地提升了风险反欺诈水平和运营效率。

人脸识别

人脸识别是拍拍贷 AI 技术的一个重要研究方向,它通过算法识别人的脸部特征,从而可以做到实时地从图片或者视频流中检测和追踪特定的人。


目前拍拍贷自研人脸识别算法,在 700W 规模多年龄段、多姿态、多表情、多环境的人脸图片上进行训练。通过尝试不同的网络结构,包含 Inception-v3、优化后的 resnet 等,以及多种损失函数,例如 triplet_loss、sphere、cosine、arc_loss 等来优化人脸识别算法,从而提升 1:1 人脸认证、1:N 人脸搜索、N:N 人脸交叉比对、人脸聚类等场景的识别精度,并将此类技术应用于拍拍贷的风险监控、反欺诈等业务,并发挥了重要作用。



图:人脸识别业务场景

面临的问题

算法人员在优化人脸识别算法的过程中发现使用单台 GPU 机器迭代一次算法需要一周左右的时间,效率过低影响研发进度,但是采购更多的 GPU 机器来探索不同算法会导致资源成本线性增长;此外由于算法调优工作涉及诸多研究内容,例如算法效果分析、新算法调研、开发等,实际的资源使用率不高。

接触 UAI-Train

在一次线下技术交流活动中,拍拍贷技术人员了解到 UCloud 提供一种面向人工智能算法训练的 UAI-Train 平台,并支持 GPU 资源的按需租售服务,同时该平台上还可执行多机多卡的分布式训练任务。


为了提升模型训练的效率,充分高效地利用更多的新数据来进一步提高其准确率,拍拍贷抉择后选择尝试 UAI-Train 平台。UCloud AI 团队在 GitHub 上发布了适配 UAI-Train 平台的 Insightface 开发案例,用于协助拍拍贷的算法工程师很方便地将单机的人脸识别算法转化成支持分布式训练的人脸识别算法,并成功在 UAI-Train 平台上进行算法的快速优化。


Insightface 是 GitHub 上一个基于 MXNet 框架的开源人脸识别项目。UCloud 基于 insightface 开发了一整套能支持分布式训练的人脸识别训练和在线推理的案例代码,并发布在GitHub上,其中包括基于 MXNet 框架的代码及开发案例。拍拍贷的工程师基于该案例,结合自身人脸识别算法的实现和数据,一周时间内就完成了开发和调试,并顺利在 UAI-Train 平台上逐步展开人脸识别算法的训练迭代工作。



图:人脸识别算法接入过程


在多次算法优化迭代尝试后,拍拍贷通过利用高维向量表征人脸,余弦距离表达相似度,最终在开源测试集准确率表现为:lfw 99.8%, cfp_fp 97%, agedb_30 98.2% ,实际业务应用中的准确率高达 99%以上,进一步提升了风险监管、反欺诈等业务的效率。


本文转载自公众号 UCloud 技术(ID:ucloud_tech)。


原文链接:


https://mp.weixin.qq.com/s/I1Ts8R4_vHCTB6kOWNo3yQ


2019-11-11 10:391114

评论

发布
暂无评论
发现更多内容

mkv格式怎么在mac电脑播放,mac上5款必备的视频播放器

Rose

视频播放器 MKV 苹果mac软件

从头到尾学习一个完整 SLAM 项目

博文视点Broadview

超越想象,博睿数据3D数字展厅上线

博睿数据

可观测性 智能运维 博睿数据 3D展厅

影响LED显示屏清晰度的三大要素

Dylan

广告 LED显示屏 体育

从 3 个层级出发,做好 DevSecOps“安全左移”经济账

极狐GitLab

DevOps DevSecOps 代码安全 极狐GitLab 安全左移

扩散模型的通用指导手册

Zilliz

第三方私有云管理平台选择哪家好?理由有哪些?

行云管家

云计算 私有云 云管平台 云管理

系统架构设计:进程缓存和缓存服务,如何抉择?

Java 架构设计 缓存服务 进程缓存

阿里云助力元戎启行 加速自动驾驶应用落地

云布道师

自动驾驶 阿里云 弹性计算

Selenium自动化测试

测吧(北京)科技有限公司

测试

经过阿里四面而形成的10万字java面试题及答案文档到底有多牛?

Java你猿哥

Java 阿里巴巴 后端 面经 八股文

App Store 2022年度app推荐: MacFamilyTree 10 最好的家族谱软件

Rose

MacFamilyTree 家族谱软件 苹果软件精选

如何改变Mac观看Netflix奈飞时的字幕样式?

Rose

Mac软件 奈飞客户端 网飞字幕

太强了!阿里架构师把自己会的都总结到了这份1737页实战开发手册中

Java

一个由public关键字引发的bug

小小怪下士

Java 程序员 后端

NutUI-React 京东移动端组件库 2月份上新!欢迎使用!

京东科技开发者

前端 React 组件库 开源组件 企业号 3 月 PK 榜

浅析synchronized底层实现与锁升级过程

Java JVM synchronized

活动报名 | 博睿数据高阶行业沙龙保险专场启动报名!

博睿数据

智能运维 博睿数据 保险行业

Star History 月度开源精选|2023 年 2 月

Bytebase

GitHub 开源项目 OpenKruise

基于Pub/Sub模式的阿里云IoT同步调用详解——设备管理运维类

阿里云AIoT

物联网 API

真香!腾讯T4梳理的Java核心宝典(框架+原理+笔记+导图)

Java 程序员

Mac电脑照片编辑修图软件精选

Rose

修图 抠图 图片编辑 苹果mac软件 macOS系统

对话 Fork 创始人:帮云服务厂商精准获客,我们是如何做到的?

万事ONES

云计算 研发管理 研发管理工具

数据库开发工具界的ChatGPT来了

NineData

数据库 sql AI ChatGPT NineData

行云管家堡垒机六大功能详细介绍看这里!

行云管家

互联网 网络安全 堡垒机

好用的油猴Safari浏览器插件:Tampermonkey 中文版

真大的脸盆

Mac 油猴 油猴插件 脚本管理 脚本插件

高效稳定的通用增量 Checkpoint 详解之二:性能分析评估

Apache Flink

大数据 flink 实时计算

面试官:还有比Redis更骚的分布式锁的实现方式吗?

Java Spring Boot 分布式锁 etcd

联邦学习开源框架FATE架构

京东科技开发者

人工智能 机器学习 联邦学习 FATE 企业号 3 月 PK 榜

难以置信!四面斩获字节offer,全靠这份“算法最优解”宝典

Java 数据结构 面试 算法 LeetCode

【低代码实践】京东科技活动平台:魔笛介绍

京东科技开发者

低代码 企业号 3 月 PK 榜 活动平台

轻松上手UAI-Train,拍拍贷人脸识别算法优化效率提升85.7%_文化 & 方法_UCloud技术_InfoQ精选文章