写点什么

解码 AI 开源的技术应用与未来趋势

  • 2022-05-05
  • 本文字数:3673 字

    阅读完需:约 12 分钟

解码 AI 开源的技术应用与未来趋势

深度学习框架向下接壤底层芯片,向上承接软件应用,是推动人工智能应用大规模落地的关键力量,也在人工智能技术体系中占据了重要地位。在国家“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。

 

2022 年 4 月 11 日的《极客有约》邀请到了华为昇腾开源生态总监、OpenI 启智社区技术委员会委员黄之鹏老师,以深度学习框架为切入点,探讨人工智能领域的技术应用与突破这一主题。黄老师目前担任华为昇腾开源生态总监,负责昇思 MindSpore 开源社区的建设,同时担任 OpenI 社区、LFAI 基金会、私密计算论坛等开源组织的技术委员会的委员职务,是 Kubernetes Policy 工作组以及 CNCF 基金会安全兴趣组中 Policy 团队负责人、OpenStack Cyborg 项目创始人,并带领团队参与 ONNX、Kubeflow、Akraino 等开源社区。本期访谈中,黄老师分享了国产深度学习框架的相关信息,并对人工智能开源社区的发展与未来方向做了评论。

从通信技术到人工智能基础开源事业


对于很多 IT 从业者来说,人工智能是一个充满挑战的未知领域,向这一领域探索的过程往往令人生畏。黄老师本人是研究通信技术出身,但在最初接触人工智能技术后他意识到,很多人工智能的基础算法和理论与通信技术涉及的算法在数学上是非常相似的。例如通信行业常用的滤波器算法就与人工智能研究中的常用算法相近。正是由于这个契机,黄老师开始了他的人工智能研究事业。

 

黄老师的工作主要集中在人工智能的上游开源社区上,整体偏向于人工智能领域的基础软件层面。在探索人工智能技术的过程中,他为希望了解这一行业的小伙伴们推荐《GEB》和《我是个怪圈》这两本著作(作者均为侯世达),希望这两本书能够帮助大家了解这个行业。

 

在从事人工智能开源事业的这些年间,黄老师也见证了很多值得纪念的时刻,收获了许多有价值的经历。让他感触最深的就是开源社区有很多可爱的小伙伴,在河南水灾、上海疫情等期间站出来贡献自己的知识和能力,展现出了社区有爱、有担当的开源文化。与追求明确目标的商业行为不同,开源的灵魂在于行动本身。开源的道路上充满着不确定性,但只要从业者发自内心地做对一件又一件事情,那么开源成果就会水到渠成。面对不确定的未来,从业者更多会依赖感性、直观的判断,遵从自己内心的指引来走出一条前景广阔的道路。

 

刚刚接触开源社区时,另一件事情也让黄老师记忆犹新。很多国人对美国人有着生性懒惰的刻板印象,但黄老师却发现国外的开源从业者在实际工作中像华人一样非常努力。他们为了更好地与来自全球的同事与合作伙伴协作,尽量克服时差的影响,每天都会晚睡早起,尽快答复来自中、印、日等国家开发者的提问。这种忘我的协作精神是开源社区非常普遍的,也是有志于开源事业的技术人需要学习和坚持的。

 

对于刚刚接触开源领域的开发者来说,正确选择自己的第一个入门项目是非常重要的,对此黄老师也给出了自己的建议。黄老师认为,新人应该选择自己最熟悉的、最擅长的领域来挑选入门项目,然后研究相关的论文、跟随项目进展,逐渐融入项目的开发工作,就可以自然而然地迈过这一门槛。

 

除此之外,新入行的开发者要锻炼自己阅读论文的能力,具备人工智能学习必备的一些数学技能,为自己的入门打好知识基础。找好工具也是很重要的,黄老师推荐了昇思 MindSpore 社区的 TinyMS 高阶 API 套件,该套件位于昇思 MindSpore 框架上,提供了六七个接口,让初入行的开发者也能很简单地写出一个神经网络,做到快速入门。

 

最后,黄老师也建议新人尽快参与到人工智能的开源社区,与社区中的专家、小白多多交流,这样就能尽快熟悉人工智能技术,让自身的能力得到快速提升。

深度学习领域的技术应用与突破


在国家“十四五”规划中,“深度学习框架”被列入到“新一代人工智能”领域,成为国家重点支持的前沿创新技术。那么要选择一个得心应手的深度学习框架需要从哪几方面去衡量?目前主流的开源深度学习框架有哪些?针对这两个问题,黄老师给出了自己的答案。

 

今天的深度学习框架已经经过了三代发展,最新一代的代表能力就是人工智能与科学计算。优秀的深度学习框架必备的技能就是很好地支撑人工智能与科学计算的结合应用。与此同时,新一代框架应该能够支持泛化能力很强的大规模基础模型。最后,高水平的深度学习框架还要具备全场景的应用能力,从云端大规模训练到智能边缘、嵌入式场景都能一站式提供解决方案。值得一提的是,昇思 MindSpore 深度学习框架就是具备以上三方面的能力,拥有顶级生产能力的深度学习框架代表之一,也是国产深度学习框架中的佼佼者,在全球的影响力都在日益增长。

 

很多人认为,开源事业是帮助国产深度学习框架等技术实现跨越式发展,缩小与国际先进水平差距的一种捷径,对此黄老师有着不同的看法。黄老师认为,前沿技术的发展根本仍在于技术创新,在于技术人员踏踏实实的研究和实践。开源是帮助创新的最佳方式,但并不是实现跨越式发展的捷径。开源最重要的是不确定性,用开源的方式帮助核心技术去发展生态时,带来的最大好处就是不确定性。我们不知道通过开源的方式能吸引来什么样背景的专家加入,不知道他们会提出哪些非常好的建议。

 

昇思 MindSpore 的发展故事就是国产开源项目的典型成功案例。昇思 MindSpore 发展两年来,每一个版本都在不断添加新内容,尽量从完全原创的角度实现一个个特性,从 0 到 1 缓慢而坚定地构建框架的技术基础。与其他开源深度学习框架相比,昇思 MindSpore 最核心的不同点就是后者优化的对象是华为自主研发的昇腾 AI 硬件平台。昇思 MindSpore 支持主流 CPU、GPU,对昇腾有深度优化,所以在昇腾平台上跑同类任务有着最优的表现。昇思 MindSpore 还是一个非常通用的全场景框架,可以在各个领域都有很好的应用能力,这也是它的核心优势之一。

开源项目的治理经验


截至目前,昇思 MindSpore 框架的用户下载量已突破 140 万, 服务 5000 多家企业, 码云和 Github 上的总 Stars 数已达 1.7 万+,社区贡献者有 4000 多名。从项目启动到今天这样繁荣活跃的生态过程中,黄老师也积累了很多开源项目的治理经验。

 

首先,开源社区的治理可以分为三个纬度。最重要的纬度是开放性。昇思 MindSpoer 社区诞生时,是企业推动开源框架中第一个采用开放模式的。昇思 MindSpore 社区有一套公开章程,对整个社区的结构都有无微不至的规范,社区所有的机构都是按照这个章程运作。社区技术委员会组建的第一天起就是全球性的,14 名代表来自中国、欧洲、美国,这是一个开放治理的社区,很多事情都会通过投票解决,并有很多机制来收集大家的意见。

 

第二个纬度叫多样性。昇思 MindSpore 有很多手段来保障社区的多样性,首先是 MindSpore Study Group(MSG),通过它将不同城市、企业、高校的开发者组织起来,参与到平等的社区中进行各种活动。其次,社区会组织很多专题活动,做得最有特色的是 WomenTag,专注于科技从业女性这一主题。这一活动的宗旨在于帮助科技行业女性从业者通过作坊的形式分享职场与生活中遇到的问题,交流各种经验。

 

最后一个维度叫可信性。企业需要对开源软件具备充分的信任才会去使用,昇思 MindSpore 会与很多标准组织、产业组织合作推动开源社区的信任标准建设,帮助社区在企业界建立信任度。这三个纬度构成了昇思 MindSpoer 社区整体构建、社区治理的主要框架。

OpenI 启智社区介绍


昇思 MindSpore 和 OpenI 启智社区的合作是非常紧密的。黄老师参与启智社区的时间比昇思 MindSpore 都更久一些,因此对启智社区也有很深的了解。

 

启智社区是国内第一个是专注于人工智能的开源社区,成立之初就设计了非常完备的社区章程。启智社区非常重视开源和知识产权的结合,探索出了很多符合国情的开源知识产权管理方法,很好地帮助了更多科研院校和企业放心地应用开源、贡献开源。

 

启智社区的另一大特点是项目种类极多,对人工智能各个领域感兴趣的从业者都可以在启智社区中找到自己非常喜欢、非常感兴趣的项目。启智社区还会组织很多项目宣讲会,还会举办启智集结号活动。在集结号活动中,很多高校的学生可以在放假时集中到一起,完成组织者设计的一些任务,了解人工智能开源领域的前沿进展。类似的活动还能帮助国内很多关注开源事业的老师熟悉开源项目的运作机制,让他们能够更好地发起开源项目、锻炼自己的组织能力。

开源社区的年轻化趋势


参与启智社区集结号活动的主要是高校学生,昇思 MindSpore 社区的布道师、开发者也有很多都是在校本科生、研究生,博士生。针对这一现象,黄老师认为年轻人更愿意讲述自己的故事,更愿意分享、协作,有更多朝气与活力。另外,人工智能现在还属于朝阳产业,越来越多的高校会开设人工智能专业,越来越多的年轻人正在踏入人工智能行业。这是一个很好的现象。

 

但年轻化趋势也带来一个挑战,就是商业人群很难严肃地看待人工智能的开源事业。他们会有偏见,认为这只是花钱带小孩子搞活动。但实际上专业开源社区建设是非常严肃的工作,日常活动非常枯燥。它与生产线上做产品没有任何区别,社区的每一个服务都是一个精心打造的产品,也需要交付、迭代、不断复盘。所以黄老师希望大家能消除这种偏见,意识到这是年轻人做的一件专业、严肃的事情。

 

2022-05-05 10:352400

评论

发布
暂无评论
发现更多内容

SAS击球实验室向青少年展示数据与分析的价值

E科讯

服务管理与通信,基础原理分析

Java 架构 微服务 nacos Feign

【LeetCode】爱吃香蕉的珂珂Java题解

Albert

LeetCode 6月月更

Linux驱动开发_倒车影像项目介绍

DS小龙哥

6月月更

【Python技能树共建】正则表达式

梦想橡皮擦

6月月更

JavaScript原型链继承与盗用构造函数继承

大熊G

JavaScript 前端 6月月更

C#/VB.NET 在Word中设置纯色/渐变/图片背景

在下毛毛雨

C# .net word文档 背景设置

使用 JavaScript 开发AR(增强现实)移动应用的预备知识和环境搭建

汪子熙

JavaScript AR SAP 增强现实 6月月更

SpringBoot官方支持任务调度框架,轻量级用起来也挺香!

沉默王二

Java springboot

GIT 常见问题

甜甜的白桃

git 版本管理 6月月更

数字货币持币生息质押理财dapp系统开发

开发微hkkf5566

这本书押中了2022北京高考作文题!

博文视点Broadview

Web Service进阶(七)浅谈SOAP Webservice和RESTful Webservice

No Silver Bullet

6月月更 SOAP Webservice RESTful Webservice

系统运维 SIG 直播: libbpf 编译平台 LCC——eBPF从入门到享受 | 第 20 期

OpenAnolis小助手

Linux 运维 内核 ebpf LCC

什么是加密?有哪些加密类型和加密算法?逆天原创神作,值得一读!

wljslmz

加密 密码学 加密算法 网络技术 6月月更

优酷端侧弹幕穿人技术实战之:PixelAI移动端实时人像分割

阿里巴巴文娱技术

音视频 弹幕 人像 移动端 移动端开发

java培训流Stream循环遍历list

@零度

stream JAVA开发

Vue 中 JSX 的基本用法

CRMEB

一二三线互联网公司划分标准和榜单

laofo

研发效能 互联网公司 一线大厂 二线互联网 一线互联网

电商后台权限设置有哪些规范你知道吗!

CRMEB

帮助中心对企业有用吗?要不要做帮助中心页面?

小炮

写入速度提升数十倍,TDengine 在拓斯达智能工厂解决方案上的应用

TDengine

数据库 tdengine 时序数据库

如何搭建短视频app源码,实现短视频内容的播放优化

开源直播系统源码

APP开发 短视频源码

聚焦中国算力大会 | 浪潮集团肖雪: 数字化转型新场景激发算力需求

云计算

基于 spring-cloud-k8s 跨NS坑续集

Damon

微服务架构 云原生 6月月更

网络七层结构是干啥的? 看这篇文章就够了

郑州埃文科技

TCP/IP 网络结构 传输网络

OA协同办公系统的发展趋势

力软低代码开发平台

在 Flutter 中以编程方式截取任何 Widget

坚果

6月月更

面试突击55:delete、drop、truncate有什么区别?

王磊

Java 面试

架构实战营|模块3

KDA

#架构实战营

我常用的两个翻译神器!程序员必备 | JavaGuide

JavaGuide

解码 AI 开源的技术应用与未来趋势_AI&大模型_王强_InfoQ精选文章