大数据与机器学习周报 第 22 期:Facebook 图像识别很强大,一次开源三款机器视觉工具

  • 丁涛

2016 年 8 月 29 日

话题:语言 & 开发架构机器学习

业界新闻

  1. Facebook 图像识别很强大,一次开源三款机器视觉工具:Facebook 的图像识别功能一直为人所赞叹,也是一些专业人士介绍相关技术的范例。继开源了文本分类工具 fastText 之后,今日,Facebook 官方发布博客称开源 DeepMask 分割构架、SharpMask 分割精炼模块、MultiPathNet 的代码

  2. 为对抗亚马逊 AWS,SAP 以 1.25 亿美元收购 Altiscale:据外媒报道,德国企业软件公司 SAP 正在进行对大数据创业公司 Altiscale 的收购事项,交易金额预计超过 1.25 亿美元

  3. GitHub 为 MySQL 社区贡献了新的在线更改表定义工具 gh-ost:本月初,GitHub 数据库基础架构组的高级软件工程师 Shlomi Noach 在 GitHub Engineering 网站上发文宣告了 gh-ost 的开源发布。这对 MySQL 社区是一件大事,宣告停滞许久的 MySQL 表在线修改表定义操作又有了新的解决方案

技术干货

  1. 基于大数据的全球电商系统架构性能优化:传统的性能优化往往只注重一个技术指标, 最终的业务结果很难量化。本次演讲向大家介绍一个基于大数据准确度量性能对电商业务的回报的方法。也就是说,任何一个微小的局部性能优化(investment)带来的新增订单(return)可以被精确估算出来

  2. 阿里云的云计算与大数据(33 张 PPT):随着劳动人口增长率、资本回报率持续下降,倒逼中国企业创新转型。过去靠降低价格促进生产和消费的模式,正在向吃掉“消费者剩余”,每个产品都是限量版转变。过去大工业时代靠大规模同质化生产,只能卖到均衡价格,而互联网时代个性需求信息可获得,产品定制化,可以卖到消费者可承受、又不花冤枉钱的价格上限。目前低效率行业仍然较多,数据增效空间巨大。数据经济成为越来越重要的经济增长引擎

  3. 利用 Akka,PayPal 如何仅用 8 个虚拟机缩放至日处理数十亿事务:传统方式下日处理十亿笔事务的系统可能需要数百台虚拟机,PayPal 只用 8 台虚拟机就做到了这一切,CPU 占用率高达 90% 时依然可以提供快速响应,这种 PayPal 以往从未达到的事务处理密度,实现过程所需时间只是传统方法的 1/10,在降低成本的同时无须为计算基础架构扩容即可帮助该组织顺利应对增长。这是怎么做到的

深度观点

  1. 对话 Hadoop 之父 Doug Cutting|大数据和开源的未来:对中国大数据产业来说,2016 年是从垂直领域野蛮生长到爆发全国范围关注热潮的一个转折点。不论是人山人海巨头云集的贵阳数博会,还是首次在华举办的全球顶级大数据会议 Strata + Hadoop World,都揭示了中国大数据产业发展的澎湃动力

  2. 数据治理十年架构师告诉你,元数据为什么适用于微服务:企业 IT 架构已经发展了多个阶段,在 SOA 阶段主要解决应用间集成问题,但随着企业业务的发展,单个应用逐渐成为“巨石型”应用,既难以扩展又难以维护。微服务架构将“巨石”应用拆分成为多个服务,以微服务为单独单元进行开发运营,专注于单个应用

  3. 【286 页干货】一天搞懂深度学习(台湾资料科学年会课程):本文是 2016 台湾资料科学年会前导课程“一天搞懂深度学习”的全部讲义 PPT(共 268 页),由台湾大学电机工程学助理教授李宏毅主讲。作者在文中分四个部分对神经网络的原理、目前存在形态以及未来的发展进行了介绍

语言 & 开发架构机器学习