大数据与机器学习周报 第 2 期:Square 收购 Framed Data 数据分析团队、谷歌抛弃波士顿动力

阅读数:1248 2016 年 3 月 21 日

话题:数据库大数据语言 & 开发架构文化 & 方法机器学习AI

新闻

  1. 《Square 收购 Framed Data 团队,服务贷款数据分析》:日前,美国移动支付公司 Square 宣布正式收购数据服务工具 Framed Data 团队。收购后,成员将纳入 Square Capital 团队,强化数据分析工作
  2. 《谷歌抛弃波士顿动力,内部矛盾过于激化?》:据 BloomBerg 消息称,就在今日,机器人 Atalas 所属波士顿动力公司很可能被其东家 Alphabet(Google 的母公司)放到了出售的货架上

大数据

  1. 《分布式数据库挑战与分析》:随着业务对大数据技术需求的不断演变,分布式数据库在整个生态圈中的地位愈加重要,已可预见必将成为未来大数据技术发展的又一个核心,而其中 OLAP(联机分析处理)显得尤其重要
  2. 《在生产环境使用 1 年 Elasticsearch 之后学到的经验教训》:Scrunch 的技术人员在生产环境使用了 1 年 Elasticsearch 之后学到了一些经验教训。比如,注意观察线程池,使用固态硬盘(SSD)等等技巧
  3. 《借助 Redis 让 Spark 的速度快 45 倍》:一些常驻内存的数据结构比其他的更快,把它们存入 Redis,Spark 可以运行得更快
  4. 《关于数据科学,你在书本中发现不了的三件事》:作者认为现在过多地强调了学习算法,而有些事情同样重要,甚至更加重要。包括估算、特征提取、模型选择等

机器学习

  1. 《Quora 上基于机器学习的答案排序方法》:对于 Quora 来说,如何按照答案的相关性和帮助性大小来对问题的答案进行排序是一个很重要的问题。本文描述了 Quora 是怎样借助机器学习来解决这个问题的
  2. 《机器学习的十年开源之路》:10 年来,开发者见证了多个开源框架 / 库的发布。从最早的 Shogun Machine Learning Toolbox 到去年 Google 开源的 TensorFlow。在 GitHub 上你可以找到用 10 中不同语言开发的至少 23 个相关的 repository
  3. 《Google 大神 Jeff Dean 谈 Google 的大规模深度学习》:一个多小时的视频,很精彩,信息量很大,深入浅出地介绍了 deep learning,以及过去 5、6 年 Google 在这方面的工作
  4. 《Facebook 机器学习应用团队负责人 Joaquin Quiñonero Candela:如何将人工智能技术应用于产品》:作为横跨学术界和产业界的大拿,Candela 在 Quora 上回答了许多问题。诸如:如何看待机器学习发展的现状、机器学习如何在 Facebook 变得如此流行以及如何学习机器学习
  5. 《在我们改变道路和态度之前自动驾驶汽车不会工作起来》:自动驾驶汽车比多数人设想的来得更快。我们应该逐步改变我们的基础设施,通过编程让这些汽车的行为尽可能可预测,同时教给公众如何以新的方式与它们互动

感谢杜小芳对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。