大数据与机器学习周报 第 13 期:Facebook 开源深度学习框架 Torchnet

  • 丁涛

2016 年 6 月 27 日

话题:大数据语言 & 开发架构机器学习

业界新闻

  1. 《Twitter 收购 Magic Pony Technology,利用神经网络优化图片和视频》:Twitter 在强化机器学习技术方面又迈出了重要一步,他们收购了 Magic Pony Technology 公司,帮助其在各渠道 App 上更好地提供图片和视频内容服务。Magic Pony 总部设在伦敦,该公司使用神经网络(一种可以按照人类大脑思维而设计的系统)和机器学习技术为图片提供可扩展数据

  2. 《Facebook 开源深度学习框架 Torchnet》:Facebook 日前宣布开源深度学习框架 Torchnet。Torchnet 基于广泛使用的开源深度学习框架 Torch 7 搭建,支持模块化编程方法,能减少程序员工作量、降低错误率,简化深度学习模型训练过程。相比其他巨头自己搭建的深度学习框架,Torchnet 更加开放,也将大幅推进深度学习的应用普及

  3. 《机器学习成功预测英国退出欧盟》:据国外媒体报道,6 月 24 日,在英国举行全民公投是否退出欧盟期间,有人使用机器学习算法对 Twitter 上有关“英国退欧”(#Brexit)消息进行分析,并成功预测英国退出欧盟

  4. 《2016 Spark 旧金山峰会侧记》:Spark 峰会是 Spark 领域内规模最大、最具影响力的工业会议,迄今为止已经成功举办了 6 届,规模和地域不断地扩大,从旧金山到纽约再到欧洲,从一个小型的工业会议发展到如今备受关注、极具影响力的业界顶级峰会

技术干货

  1. 《优酷土豆的 Redis 服务平台化之路》:本文首先分析了搭建 Redis 集群的几种可选方案,最后详细介绍了基于 Nginx Proxy+Redis Cluster 的架构模式

  2. 《实时流处理框架 Storm、Spark Streaming、Samza、Flink,孰优孰劣?!》:分布式流处理需求日益增加,包括支付交易、社交网络、物联网(IOT)、系统监控等。业界对流处理已经有几种适用的框架来解决,下面我们来比较各流处理框架的相同点以及区别

  3. 《Twitter 新开源的 Heron 是否可以完全取代 Storm?》:继 Storm 之后,Twitter 于今年 5 月份又开源了他们新开发的实时流式计算框架 Heron。Twitter 在 2014 年就用 Heron 完全替代 Storm,Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统。InfoQ 在第一时间联系了 Heron 的技术主管符茂松,了解一些技术内幕,看看 Twitter 的“鸟类文化”如何孵化了两代流计算平台

  4. 《21 天搭建推荐系统:实现“千人千面”个性化推荐》:大数据有三个非常经典的应用:计算广告、搜索、推荐。每一种应用最核心的地方都离不开三个字——个性化。推荐的业态比较复杂,有类似淘宝天猫这样的真正意义上大数据场景,也有很多中小网站、应用,数据量其实并不是很大。阿里云推荐引擎(https://data.aliyun.com/product/re)的初衷,是为了帮助阿里云的客户、创业者、中小网站,让他们能够更好的运营自己的产品或网站

  5. 《用 Akka 解决 Spark+ElasticSearch 实时计算平台的瓶颈》:假如有这样一个场景:系统每秒钟都会收到大量的事件,每个事件又包含很多参数,用户不仅需要准实时地还需要定期地判断每一种事件、事件的每一种参数值的组合是否超过了系统设定的阈值。面对这一场景,用户应该采用什么样的方案呢?最近,来自于 Premium Minds 的软件架构师 André Camilo 在博客上发表了一篇文章,介绍了他们是如何使用 Akka 解决这一棘手问题的

深度观点

  1. 《【李飞飞最新演讲】斯坦福 AI 实验室图像与视觉理解技术进展(191PPT)》:ImageNet 缔造者、斯坦福大学副教授、人工智能实验室主任李飞飞在刚刚结束的 ICML2016 会议发表演讲 A Quest for Computer Vision,介绍她所在的实验室用深度学习和大数据进行图像和视频理解的最新进展

  2. 《深度学习教父 Hinton 专访,AI 已跨越重要分水岭》:福布斯》昨日刊登 Geoff Hinton 专访。游走在学术和产业的 AI 大神 Hinton 谈到了自己研究兴趣的起源、在多伦多大学和谷歌所做的研究工作以及发起的私人俱乐部 NCAP。 在采访中,Hinton 谈到,现在计算能力和数据的发展让 AI 获得巨大进步,并且在很多领域得到应用,这也让他从一个 AI 的“狂热分子”变成了“狂热核心”

  3. 《张志华:机器学习=统计与计算之恋》:本文根据张志华在第九届中国 R 语言会议和上海交通大学的两次讲座整理,分为两部分:第一部分,首先对机器学习发展做一个简要的回顾,由此探讨机器学习现象所蕴含的内在本质,特别是讨论它和统计学、计算机科学、运筹优化等学科的联系,以及它和工业界、创业界相辅相成的关系。在第二部分,试图用“多级”、“自适应”以及 “平均”等概念来简约纷繁多彩的机器学习模型和计算方法背后的一些研究思路或思想

大数据语言 & 开发架构机器学习