最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

腾讯开放 TDinsight 机器学习平台等政企大数据平台

  • 2017-12-17
  • 本文字数:1499 字

    阅读完需:约 5 分钟

2017 年 6 月 16 日,腾讯新一代高性能计算平台 Angel 在 Github 上低调开源。时隔半年,12 月 13 日,腾讯在“2017 互联网 + 大数据高峰论坛”发布“腾讯慧聚”品牌,其中就包括机器学习基础平台 TDinsight。与 Angel 和其他机器学习平台相比,TDinsight 有何优势?

TDinsight 机器学习平台

“腾讯慧聚”包括五大数据平台,分别是大数据一站式平台 Dmaster、大规模事务处理平台 Tbase、大数据实时接入平台 TDbank、大数据实时多维分析平台 Hermes,以及机器学习基础平台 TDinsight。

据腾讯互联网 + 大数据产品中心总经理刘煜宏介绍,TDinsight 机器学习平台提供一站式的机器学习平台,通过可视化的拖曳布局,组合各种数据源、组件、算法、模型和评估模块,支持各种主流的开源机器学习框架,包括 Spark、Python、R、XGBoost。覆盖特征工程、分类、聚类、回归、关联规则、时间序列等传统机器学习算法的同时,支持图算法、深度学习等更加丰富的算法库,让用户可以快速接入人工智能,释放数据潜力。

那么,TDinsight 机器学习平台相比其他相似产品有何优势?这个平台是否开源?是否意味着腾讯以后将会开放自己的 AI 能力呢?

对此,腾讯互联网 + 大数据产品中心总经理刘煜宏说道:“腾讯有几个 AI 部门,包括提到的优图、医疗觅影,就是很好的 AI 跟行业结合很好的案例,所以腾讯 AI 能力一直体现在我们产品里,现在也单独拿出来开放了。TDinsight 是机器学习基础平台,腾讯大数据去年发布的 Angel 在 6 月份开源了,Angel 是一个面向机器学习的分布式高性能计算平台。那 Angel 跟 TDinsight 是什么关系呢?其实 TDinsight 你可以认为是一个机器学习的调度平台,但是又不仅仅是调度平台,TDinsight 自身包含多种算法以及模型,并且支持多源的输入以及输出,TDinsight 采用拖拽的方式能够根据不同的算法、模型调度对应不同的机器学习组件 (框架),例如:Angel、Spark、TensorFlow、Torch 等,完成机器学习整个流程。”

虽然 TDinsight 目前已经对政企开放,但开源似乎还是一件遥不可期的事情,刘煜宏表示,“我们也是跟各行各业的定制需求结合,目前要开源出来还不是很好的时机,现在腾讯公司开源的也越来越多,包括大数据是来源于开源。我们还是会回归到社区里,包括 Tbase,已经与社区结合得非常紧密,是非常核心的开源,包括资源调度管理平台,调度是在全球计算能力领先的很重要的模块。所以大数据开源会越来越多,但不像安卓整体开源,我们也会结合社区化把很多东西反馈到里面。”

Angel 机器学习平台

Angel 平台是使用 Java 和 Scala 混合开发的机器学习框架,用户可以像用 Spark, MapReduce 一样,用它来完成机器学习的模型训练。2017 年 6 月 16 日,腾讯新一代高性能计算平台 Angel 在 Github 上低调开源。

Angel 采用参数服务器架构,支持十亿级别维度的模型训练。采用了多种业界最新技术和腾讯自主研发技术,如 SSP(Stale synchronous Parallel)、异步分布式 SGD、多线程参数共享模式 HogWild、网络带宽流量调度算法、计算和网络请求流水化、参数更新索引和训练数据预处理方案等。

这些技术使 Angel 性能大幅提高,达到常见开源系统 Spark 的数倍到数十倍,能在千万到十亿级的特征维度条件下运行。

自 2016 年初在腾讯内部上线以来,Angel 已应用于腾讯视频、腾讯社交广告及用户画像挖掘等精准推荐业务。未来还将不断拓展应用场景,目标是支持腾讯等企业级大规模机器学习任务。

Angel 相关链接: https://s.geekbang.org/search/c=0/k=Angel/t=


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-12-17 18:003634
用户头像

发布了 42 篇内容, 共 13.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

关于国际化语言 Intl

西贝

Java 大前端 国际化 格式化

典型的大型互联网应用系统的技术方案和手段

java安全编码指南之:lock和同步的正确使用

程序那些事

java安全编码 java安全 java安全编码指南 java编码

2020第十三届(南京)智慧城市技术与应用产品展览会

InfoQ_caf7dbb9aa8a

快讯2020第十三届亚洲国际物联网展览会-南京站

InfoQ_caf7dbb9aa8a

区块链教育 丨 首批区块链专业新生正式入学

CECBC

区块链技术 区块链教育

架构师训练营第三周作业

Wee权

对不起,学会这些 Linux 知识后,我有点飘

cxuan

Linux 后端 操作系统 计算机

MySQL事务隔离级别

长沙造纸农

MySQL 事务隔离级别 mysql事务 事务 MySQL 运维

全屋智能2020第十三届(南京)国际智能家居展览会

InfoQ_caf7dbb9aa8a

坚持写技术博客一年能有多少收获!

小傅哥

Java 面试 架构师 编程经验 技术博客

架构师训练营第1期第四周作业二

道长

极客大学架构师训练营

“海外同步优惠”与“中国专享折扣”十大必败榜抢先放送

爱极客侠

古北水镇的夜

张晓楠

生活 摄影

20年开源老司机手把手教你玩开源——openEuler入门指南

openEuler

Linux 开源 系统操作

2020第十三届南京国际智慧新零售暨无人售货展览会

InfoQ_caf7dbb9aa8a

产品分析

时间是一个人最好的证明

产品经理 产品设计

JDK 中的栈竟然是这样实现的?

王磊

Java 数据结构和算法

从联想ThinkStation工作站,窥见工具文明的新纪元

脑极体

用NOSql给高并发系统加速

架构师修行之路

nosql redis 分布式 微服务

手把手教你AspNetCore WebApi:Serilog(日志)

AI代笔

ASP.NET Core web api serilog

LeetCode题解:111. 二叉树的最小深度,递归,JavaScript,详细注释

Lee Chen

大前端

Spring Cloud 微服务实践(7) - 日志

xiaoboey

kafka 微服务 Spring Cloud 日志 spring cloud stream

做好分库分表其实很难之二

架构师修行之路

微服务 分库分表

内存条的讲解

亚兰—硅的传奇official

原创 内存 硬件 计算机 哔哩哔哩

架构师训练营第 1 期 - 第四周学习总结

Anyou Liu

极客大学架构师训练营

架构1期第四周作业1-大型互联网系统技术梳理

道长

极客大学架构师训练营

架构师作业第三周学习总结

Wee权

记一次MySQL日期范围查询优化

印哥爱学习

MySQL SQL优化

讲一讲我所认为的「人生三最」,你或许能够参悟到什么

非著名程序员

程序员 个人成长 时间管理 精力管理

LeetCode题解:104. 二叉树的最大深度,递归,JavaScript,详细注释

Lee Chen

大前端 LeetCode

腾讯开放TDinsight机器学习平台等政企大数据平台_大数据_陈利鑫_InfoQ精选文章