深度学习与容器结合,Caicloud 帮助企业快速落地 AI 应用

阅读数:4 2020 年 3 月 4 日 16:05

深度学习与容器结合,Caicloud 帮助企业快速落地 AI 应用

2015 年 10 月成立的才云 Caicloud(以下简称 Caicloud),是国内容器行业入局较晚的创业公司,但其创始团队出身 Google,拥有每周运行 20 亿容器的原生 Google 经验。

聚焦数据分析和 AI 领域的 Caicloud,发展迅速,已成为业内不可忽视的力量。

深度学习与容器结合,Caicloud 帮助企业快速落地 AI 应用

容器云管理平台 Caicloud Compass,打造云端操作系统中台

Caicloud Compass 是 Caicloud 深度整合 Kubernetes 的容器云管理平台。目前开源容器技术更多支持无状态应用,对企业核心系统上大量的有状态应用支持得并不是很好。Caicloud Compass 不仅可以承载无状态的云原生应用,还打通了有状态应用,尤其是大数据类应用,从而实现了对企业核心系统的统一管理。

打通有状态应用,不只是让该应用在容器平台上运行,更是要对应用运行的全生命周期进行管理。

以 AI 任务为例,Caicloud Compass 除了支持 TensorFlow 在容器平台上的运行,还实现了从数据获取、特征工程转换、模型分布式训练、模型验证、模型灰度发布、GPU 资源监控管理等整套流程的打通,提供面向数据分析应用的 DevOps、CI/CD 解决方案,并实现与其他应用的资源隔离。

这些都不是原生容器和 Kubernetes 技术所支持的,需要进行大量技术创新。

打通企业业务和数据,实现对企业核心系统的统一管理,Caicloud 希望将 Caicloud Compass 打造成企业的云端操作系统中台,提高企业的资源利用率和运营效率。

人工智能云平台 Caicloud Clever,助力企业挖掘数据价值

目前,数字化转型已经成为潮流,Caicloud 希望利用好企业的大规模计算能力,分析挖掘出海量企业数据中的深层价值,真正帮助企业降本增效,实现业务创新。

因此,Caicloud 推出了人工智能云平台 Caicloud Clever,一个服务于算法科学家,专注于深度学习开发流程优化的数据科学平台。

在 Caicloud Compass 的支持下,Caicloud Clever 集数据导入、数据处理、模型开发、模型训练、模型评估、服务上线等功能于一体,提供一站式全方位的深度学习建模流程,算法科学家无需再关注底层资源,即可快速打造智能业务,从而降低了企业的 AI 使用门槛。

由于 Caicloud 创始团队出身 Google,Caicloud 最大优势在于大规模复杂场景和数据分析业务的管理。因此,Caicloud 瞄准服务器规模和业务流量较大的头部或腰部企业,目前重点服务金融、制造、电商、新零售等行业,已拥有数十家客户,标杆客户包括中国银联、唯品会、海尔集团、锦江国际等,平均客单价数百万元。

近日,爱分析对 Caicloud 创始人兼 CEO 张鑫进行了访谈,他对 Caicloud 的发展情况、未来战略,以及行业未来发展趋势等方面,进行了详细阐述,现分享部分内容如下。

深度学习与容器结合,Caicloud 帮助企业快速落地 AI 应用

重视产品化水平,减少定制化工作

爱分析:Caicloud 还提供 AI 模型服务,这块是否会涉及到企业的业务流程,需要投入较重的人力?
张鑫:Caicloud 不是一家算法外包公司,AI 模型服务是向客户传递 Caicloud 平台价值的一种手段;同时 Caicloud 聚焦于视觉相关的可标准化 AI 模型产品,与平台一起联动形成一站式行业解决方案。

目前大量 AI 公司做的工作,也多是把学术论文中的公开算法进行复现,就取得了很好的效果;随着 TensorFlow 这类优秀框架的开源,算法门槛也进一步降低;Google 的广告业务背后有大量数据分析,但核心算法其实是最经典的逻辑回归。

因此,算法并不是企业业务真正的核心,有很多好用的通用算法,企业真正缺乏的是提供 AI 工具和算力的平台。

Caicloud 提供 AI 模型服务时,非常有选择性,只是去做一些已经有过积累,或是基于开源工具能够快速创建出来的模型,并不会深钻到用户业务中,建立完整模型。

爱分析:如果客户有复杂的 AI 模型需求,会与其他 AI 公司进行合作吗?
张鑫:是的。Caicloud 自身拥有一个小而精的 AI 模型服务团队,基于擅长的领域进行建模;此外,建立了一些合作伙伴关系,合作伙伴可以基于 Caicloud 的平台去提供终端解决方案。

爱分析:AI 市场还处于早期,Caicloud 主要瞄准哪些客户群体?
张鑫:第一,已有 GPU 资源的企业。它们可能有容器可以解决 CPU 等资源的调度,但如何管理 GPU,如何同 CPU 进行混合调度是一个痛点。这类企业会更注重容器云平台本身的价值,而不是 AI 的业务模型。

第二,TensorFlow 的用户。过去两年 TensorFlow 迅速落地,做机器学习的企业,大概率都用过 TensorFlow,它们对 TensorFlow 的 API、基于 TensorFlow 的建模方法已经很熟悉了,痛点是 TensorFlow 的分布式部署、在 GPU 上进行自动调度、打通 DevOps 等。这类客户对上层 AI 解决方案的要求也不高。

爱分析:Caicloud 会帮助客户做传统业务上云的改造吗?
张鑫:这个同样不是 Caicloud 的主营业务。改造的过程更多是人力服务,而且要深入企业业务系统,做很多定制化的东西。

Caicloud 为了帮助企业传统业务上云,会提供一些工具、平台层面的接口及支持,传统应用的一些常用的点,Caicloud 也会将其抽象出来,沉淀到产品里。传统应用与 Caicloud 的平台进行对接时,Caicloud 希望能与企业的技术团队一起来做。Caicloud 除了销售产品,还会将知识传递和赋能给企业的技术团队,实现双赢。

Caicloud 对很多企业甚至会开放产品源代码,给予企业自主可控的权利和选项,而且通过开放的 API,企业可以自己完成很多定制开发的工作。

爱分析:开放源代码是否会对公司业务造成隐患?
张鑫:第一个隐患是企业拿到源代码后,就不需要 Caicloud 了。但目前还没有发生过这种情况,对技术人员来说,完全读取别人的源代码,可能比自己写还复杂。

第二个隐患是代码泄露问题。首先,Caicloud 会从法律层面保护自己。其次,Caicloud 产品的迭代速度非常快,即使旧的代码被泄露,Caicloud 也有信心竞争过对方。最后,一家公司的核心竞争力和壁垒在于它的知识,即使面对同样的代码,如何使用、如何产生最佳实践,大家的能力也是不一样的。

综合考虑下来,Caicloud 认为开放源代码利大于弊。

爱分析:Caicloud 目前的团队规模与结构?
张鑫:全职员工超过 100 人,70% 是研发人员,包括个位数的算法团队,Caicloud 非常注重产品化和效率,交付团队的人均产出比在赛道内同比处于较高水平。

订阅模式将逐渐普及

爱分析:未来传统企业会像互联网公司一样,逐步把容器部署到裸机上吗?
张鑫:我认为会。举两个例子:
第一,Caicloud 的第一个客户是锦江国际,刚开始使用 Caicloud 的中台时,只是部署锦江旅游的一个创新业务,但现在已经在 Caicloud 平台上部署了 95% 的业务,而且准备把底层的虚拟化去掉。

第二,银联作为 Caicloud 的客户,其云闪付平台使用的是裸机加上容器,放弃了原先使用的 IaaS。

企业在使用容器时,不愿意放弃下面的 IaaS,主要是考虑到存储和网络问题,以及容器不适合有状态应用。Kubernetes 的存储接口非常灵活,已经可以直接对接多种存储。在对网络的策略支持上,Kubernetes 的确非常简陋,但 Caicloud 做了很多工作,平台已经可以做到对网络资源的限流和把控。对于有状态应用,Caicloud 的平台也已经可以做到统一管理。

爱分析:Caicloud 在 AI 业务这块,未来是否会有新的收费模式?
张鑫:以 Caicloud 的客户唯品会为例,唯品会在全球八个国家有电商业务,底层使用了微软 Azure 公有云基础设施。Caicloud 与 Azure 合作,为唯品会提供上层数据分析业务的管理,唯品会按照订阅模式付费。

我认为在 AI 平台业务上,订阅模式的使用会越来越多。GPU 是一种昂贵的资源,需要几个月漫长采购周期,训练完模型后,可能还会出现资源闲置的现象,因此,采购 GPU 对多数企业并不划算。随着产品和市场的成熟,企业会更希望有一个弹性的付费方式,基于云端的订阅模式会越来越普遍。

本文转载自才云 Caicloud 公众号。

原文链接: https://mp.weixin.qq.com/s/VirV5JKyIsup7BJlICzSbQ

评论

发布