大数据与机器学习周报 第 24 期:Facebook 开源 Zstandard 算法及 MyRocks 存储引擎

  • 丁涛

2016 年 9 月 12 日

话题:大数据语言 & 开发架构机器学习

业界新闻

  1. Facebook 开源 Zstandard 算法及 MyRocks 存储引擎:Facebook 宣布其开源了自家的 Zstandard 压缩算法。这个无损的压缩技术致力于取代已存在的诸如 zlib 这种依赖过时的技术 Deflate compression algorithm 的库。除了 Zstandard 压缩算法,Facebook 把 MyRocks 存储引擎也开源了,MyRocks 现在被 Facebook 用于提升自家 MySQL 数据库的存储效率

  2. 英特尔收购视觉芯片公司 Movidius,计算机视觉将成未来?:Movidius 在计算机视觉方面有很强的技术积累,这家从 2006 年就成立的视觉计算芯片公司花费了 9 年的时间开发出了低价低功耗高性能的视觉处理器芯片——Myriad 系列 VPU(Vision Processing Unit)

  3. DeepMind 发布 WaveNets 语音合成系统,称世界最佳,直接提升 50%!:本文将向大家展示 WaveNets 是如何生成语音的,它可以模仿任何人类的声音,听上去比在存的文本到语音(TTS)系统都要自然。这个模型将机器和人类的表现之间的现有差距减小了 50% 多

技术干货

  1. 东方航空到底用 MongoDB 做了什么,为什么选择 MongoDB?:在今年的 MongoDB World W016 大会上,来自中国东方航空公司黄翀分享了使用 MongoDB 的实践经验,介绍了东航如何将 Spark 和 MongoDB 配合使用来解决所面临的问题,以及具体的步骤,一时引起热议

  2. 大规模大数据的有效利用,阿里巴巴参数服务器设计理念与实践:国内的互联网公司,阿里巴巴一年产生 86 亿包裹,平均每天 2356 万个;蚂蚁金服 / 支付宝在 2015 年双十一当天共产生 7.1 亿笔支付

  3. 用 Elasticsearch 构建电商搜索平台,一个极有代表性的基础技术架构和算法实践案例:目前搜索引擎技术已经有非常成熟的开源解决方案,最出名的 ElasticSearch 和 Solr 都是基于 lucence 的。很多中小型互联网公司搜索引擎都是基于这两个开源系统搭建的,但是即便如此,一个搜索引擎团队想把搜索引擎质量做到商用标准,从系统熟悉,服务搭建,到功能定制,通常需要花费较长时间

  4. Pinterest 数据切分:解惑快速扩展 MySQL 的数据量:这篇文章探讨的是怎样在多个 MySQL 服务器之间切分数据的技术问题。早在 2012 年我们就完成了这样分片方案,我们现在仍在使用这套方案存储核心数据

深度观点

  1. 怎样打造一个分布式数据库 | 数据库功能深度解析:首先我们聊聊 Database 的历史,在已经有这么多种数据库的背景下我们为什么要创建另外一个数据库;以及说一下现在方案遇到的困境,说一下 Google Spanner 和 F1、TiKV 和 TiDB,说一下架构的事情

  2. 【白宫重磅报告】人工智能大未来:谷歌等 5 大科技公司,斯坦福等 7 所高校联袂探讨 (349PDF):今年 6 月,白宫科技政策办公室发布了一项信息征集申请(RIF),面向公众征集有关人工智能的信息。最终一共得到了 161 份意见,提交者来自个人、学术界及研究者、非盈利组织以及产业界。6 号,白宫公布了这次 RFI 征集的所有内容——长达 389 页的《人工智能大未来》

大数据语言 & 开发架构机器学习