大数据与机器学习周报 第 12 期:谷歌在欧洲创建新的人工智能团队

  • 丁涛

2016 年 6 月 20 日

话题:大数据语言 & 开发架构机器学习AI

  • 《【干货】Jeff Dean Spark 2016 峰会演讲(视频 +PPT)》:上周举行的 Spark Summit 2016 大会上,谷歌大脑的负责 Jeff Dean 就深度学习发表演讲,介绍了谷歌对深度学习的使用情况,从技术上解读如何在 TensorFlow 进行大规模的深度学习。他认为,未来,行业内对深度学习的使用会持续增长。最后,他还为如何开展深度学习给出 4 点可行性建议。

  • 《4 亿用户的 LinkedIn 数据产品设计原则和架构实现》:在微软后妈收养 LinkedIn 这个新闻发布之时,有人借机将并购溢价原因归于“增长”、“数据变现”,让人忽略了最重要的原因:LinkedIn 是全球最大的职场社交网站,LinkedIn 的社交属性,人才人脉提供了不可估量的价值!

  • 《广告平台中用户画像和标注噪声处理的实践 | 视频 PPT》:在目前流行的互联网广告系统中,用户画像地位很重要,应用也很广泛。但在独立的第三方广告服务系统中,由于用户特征和标注集合的缺失,常规机器学习方法大多数情况下难以发挥应有的效用。根据 FreeWheel 的实践,基于 NLP 技术抽象用户观看记录,构建用户特征,并通过 Bayesian 概率框架和 Label Noisy 技术生成可信的标注集合,最终取得了较好的线上实践效果。

  • 《前优酷土豆大数据平台研发负责人杨大海:建立统一数据平台的重要性》:杨大海表示,对于一个外行人或刚入门的人来说,建立一个数据平台就是搭一个 Hadoop 集群而已。但基于这个集群,想要把它很好的用起来会暴露很多的问题。那么针对这些问题就需要研发很多系统来应对,所以建立统一数据平台是非常重要的

  • 《百度大数据即席查询技术》:越来越多的企业依赖于海量数据分析结果来进行关键业务决策。大规模下的交互式 / 即席数据分析,是实施数据分析和数据探索的主要途径,具有广泛的商业前景。Baidu BigSQL 由百度自主研发,为百度内部业务和广大公有云用户提供数据查询分析服务,具有简单易用、超大规模支持、数据结构灵活、成本极低等特点

  • 大数据语言 & 开发架构机器学习AI