写点什么

“深度赋智”论文被人工智能顶刊 IEEE TPAMI 接收

  • 2021 年 4 月 22 日
  • 本文字数:2072 字

    阅读完需:约 7 分钟

“深度赋智”论文被人工智能顶刊IEEE TPAMI接收

“深度赋智”首推以知识驱动的全自动机器学习架构,应用于 2020 四月结束的国际自动机器学习领域的顶级赛事 NeurIPS-AutoDL 竞赛,并以压倒性优势获得世界冠军,相关论文于近日被人工智能顶刊 IEEE TPAMI 接收。“深度赋智”已将该成果应用于天机自动机器学习平台,致力于让每家企业都具有开箱即用的 AI 能力。


近日,“深度赋智”与厦门大学纪荣嵘教授联合团队的研究成果“Evolving Fully Automated Machine Learning via Life-Long Knowledge Anchors”(基于知识锚点进化的全自动机器学习)被 IEEE TPAMI 录用。TPAMI 全称 Transactions on Pattern Analysis and Machine Intelligence,是人工智能,机器视觉,模式识别等多个领域的顶尖国际期刊,对原创性有很高要求,侧重于发表能引领广泛兴趣的突破性前沿研究,并以严苛的审稿过程著称,收录论文数量十分有限(当前影响因子 17.861,在中国计算机学会认定的人工智能领域四个 A 类期刊中排名第一)。

困局


深度学习让机器可以从大量的数据中学习经验并加以应用,已经在图像分类,序列标注等多个任务上取得了惊人的成果。但是,这一过程需要大量的人工干预,比如特征提取,模型选择,参数调节等,既费时又费力。


所以专家们自然而然想到了引入自动化让机器自己“学习如何学习”。然而机器学习的自动化离不开几个关键难题:我们该教授什么知识和配备什么工具?在哪一部分实现自动化?自动化训练如何保证稳定的效果?如何在最短时间内找到又简单又高效的方案?


论文指出,当前的自动机器学习多是在整个流程中的某个或某几个独立分段实现自动化,这种“半自动”让搜索自然受限于“次优”并导致最终结果的偏差。而且搜索空间往往“精心设计”,与自动学习的初衷相违背,实际落地时也易出现过拟合的情况。自动机器学习需要对整个网络结构更高层、更进一步的理解。

破局——论文提出的基于终身知识锚点的进化算法


作者创新性地提出了一种新型的全自动机器学习框架,首次打破了现有自动机器学习中各搜索空间的独立设计,并使用数据集知识锚点加进化算法来加速搜索,解决了在超大空间搜索最优方案的设计难题。



图 1 全自动机器学习框架


承袭现有的终身学习与元学习思想,该框架中的知识锚点使用了全新的元特征和概率抽样方法,极大减少了人工,缓解了搜索过程中的过拟合。该框架实现了全流程自动化,极大降低了机器学习应用门槛,用户只需根据提示进行“傻瓜式”操作,自助服务,时间成本低,即使不懂算法和代码,也不是问题。

从实验结果可以发现,该框架在图像/音频/视频/文本/表格五种模态的典型数据集上的效果都远超当前 SOTA 方案,以下图的图像任务实验为例:


表 1 提出的框架(左)和 AutoCV2 第一(右)的对比


消融实验也证明了知识锚点方法的有效性:


图 2 “各搜索方法+ 知识锚点”与原搜索方法的效果对比

使用该框架,“深度赋智”于 2020 年 4 月获得国际自动机器学习领域的顶级赛事 NeurIPS-AutoDL 系列竞赛总决赛世界冠军,在图像/音频/视频/文本/表格不同场景的十个数据集上稳定获得八项第一和均分第一,证明了该框架在不同场景的普适性。


图 3 竞赛得分情况


价值——降低 AI 应用门槛,助力企业走上智能化快车道


根据目前消息,“深度赋智”已将该成果应用于其自研的天机自动机器学习平台,支持图像/音频/视频/文本/表格模态的任务和多个复杂 AI 场景,并计划向自动学习中引入更多数据集知识,提升搜索效率。


图 4 搜索空间设计示意


天机自动机器学习平台是“深度赋智”产业智能化的前沿创新技术应用之一,已为零售/鞋服、工业、交易平台、金融等行业的多个头部客户提供了相应服务。


在天机自动机器学习平台的帮助下,无需花费高额的成本打造工程师团队,有效避免 AI 应用成本高、周期长、效果难以保障等问题,降低时间成本和机会成本,助力企业走上智能化快车道,提升综合竞争力。


在使用体验上,用户无需深入掌握数据知识,就能建立高质量的人工智能模型;无需深入学习编程知识,就能建立整套生产级人工智能应用,即使算法小白也能玩转 AI,实现事半功倍的效果。平台从数据、模型、部署等多个方面进行了打磨,内含近百模块组件,涉及内容理解,计算机视觉,音频分析和数据预测等多领域国内顶尖方案,通过自动机器学习技术进行组件的衔接与调优,将复杂方案定制的成本降低到 1%,克服了传统 AI 产品的落地周期长、效果迭代久、投入产出比低的瓶颈,为用户实现了超过 60%的人力成本节约和显著的净利率提升。


图 5 全自动 AI 中台=AI 中台+Full-AutoML


2021 年 1 月,工信部印发《工业互联网创新发展行动计划(2021-2023 年)》指出,要进一步完善新型基础设施、彰显融合应用成效、提升技术创新能力、健全产业发展生态和增强安全保障能力。智能化制造和个性化定制等新模式新业态的广泛普及是融合应用成效的关键,智能化成为“新三年”的核心工作目标。


人工智能行业即将迎来政策红利大年,充满新的产业图景、新的机遇和挑战 。在未来一段时间,“深度赋智”将会充分发挥自己丰富的算法资源、深度的技术合作支持、不断完善的生态资源等优势,不断完善 MetaAI 技术,持续建设全自动机器学习平台,与更多开发者、服务商一起面向终端客户推出更多的 AI 解决方案。

2021 年 4 月 22 日 15:451259

评论

发布
暂无评论
发现更多内容

synchronized 到底该不该用

古时的风筝

Java synchronized

《垃圾回收的算法与实现》.pdf

田维常

垃圾回收

Glide.with(view)挂在了谁的生命周期上

mengxn

生命周期 Glide Activity Fragment

一瞬间让我秒变“快男”!腾讯内部强推Java性能优化手册,快了不止一点点。

Java架构追梦

Java 架构 jdk 面试 性能优化

开个交易所需要多少费用?数字货币交易所搭建

13530558032

前嗅教你大数据——什么是代理IP?

前嗅大数据

爬虫 数据采集 静态IP 代理IP 动态IP

区块链,音乐,流媒体和版税

CECBC

区块链 艺术

区块链在债券市场如何应用

CECBC

区块链 债券

太赞了!腾讯T3-3架构师整理了5000页的Java学习手册免费开放下载

Java架构之路

Java 程序员 架构 面试 编程语言

胡继晔:中国应建区块链行业准入制度

CECBC

区块链 金融 数字经济

【活动回顾】WebRTC服务端工程实践和优化探索

ZEGO即构

WebRTC 服务端工程

DàYé的CTO姗姗学步路

曲水流觞TechRill

管理 CTO

云原生2.0时代下,DevOps实践如何才能更加高效敏捷?

华为云开发者联盟

云计算 数字化 华为云

小学妹问我:如何利用可视化工具排查问题?

田维常

可视化

SpringBoot:整合Swagger3.0与RESTful接口整合返回值(2020最新最易懂)

比伯

Java 编程 架构 面试 计算机

一次 Java 进程 OOM 的排查分析(glibc 篇)

996小迁

Java 编程 架构 面试 计算机

【涂鸦物联网足迹】涂鸦云平台消息服务—顺带Pulsar简单介绍

IoT云工坊

人工智能 物联网 云服务 Apache Pulsar 云平台

收藏!数据建模最全知识体系解读

华为云开发者联盟

数据仓库 数据 数据建模

SQL数据库:窗口函数

正向成长

窗口函数

年轻人不讲武德不仅白piao接口测试知识还白piao接口测试工具会员

测试人生路

接口测试

区块链数字货币钱包源码价格,区块链多币种钱包

13530558032

#不吐不快# 三观很正的Boss,你遇到过么?

架构精进之路

职场成长 奇葩的经历 不吐不快

圆通快递回应内鬼泄露用户信息:严打数据倒卖灰色产业

石头IT视角

Nginx-技术专题-技术介绍

浩宇天尚

#不吐不快# CV千千条,修改最重要。代码不规范,伙伴两行泪!

程序员小航

奇葩的经历 不吐不快

科普干货|漫谈鸿蒙LiteOS-M与HUAWEI LiteOS内核的几大不同

华为云开发者联盟

华为 鸿蒙 IoT

高性能利器!华为云MRS ClickHouse重磅推出!

华为云开发者联盟

数据库 Clickhouse MRS

什么是低代码(Low-Code)?

移动研发平台EMAS

工具 研发效能 低代码 开发 代码

IoT企业物联网平台,从设备端到云端业务系统全链路开发实战

不吃米饭

阿里云 最佳实践 物联网 IoT

Jira停售Server版政策客观解读——如何最小化风险?

PingCode

项目管理 研发管理 Jira Atlassian

分布式事务太繁琐?官方推荐Atomikos,5分钟帮你搞定

互联网应用架构

分布式事务 springboot

“深度赋智”论文被人工智能顶刊IEEE TPAMI接收_AI_深度赋智_InfoQ精选文章