大数据与机器学习周报 第 17 期:谷歌正式发布 Beta 版云自然语言 API

  • 丁涛

2016 年 7 月 25 日

话题:大数据语言 & 开发架构机器学习

业界新闻

  1. 《梅耶尔透露雅虎正开发聊天机器人 与亚马逊 Alexa 竞争》:据美国科技博客网站 VentureBeat 报道,雅虎 CEO 玛丽莎·梅耶尔(Marissa Mayer)今天在第二财季财报电话会议上透露,该公司正在开发聊天机器人

  2. 《谷歌正式发布 Beta 版云自然语言 API》:谷歌近日正式向公众发布其 Beta 版的云自然语言 API(Cloud Natural Language API),这项新的 API 能够让开发者获得情感分析、实体识别、语义分析等功能服务

  3. 《Facebook 互联网服务无人机首次试飞,表现超出预期》:对于 Facebook 来说,Aquila 项目不仅仅是在证明一个概念。该公司计划为全球 70 亿人口提供互联网接入服务,无论他们收入如何,居住在哪里

技术干货

  1. 《Apache Kylin 在电信运营商的实践和案例分享》:本文介绍了北京移动网运中心使用 Kylin 的经验,并介绍了使用 Kylin 的注意事项

  2. 《Facebook 的实时流处理技术》:本文介绍了 Facebook 在设计该系统时从易用性、性能、容错、可伸缩性以及正确性等方面考虑所做的重要设计决策,这些决策和系统如何满足秒级的延迟需求,以及在构建该系统的过程中 Facebook 所总结的经验教训

  3. 《经验谈:ElasticSearch 借助 AWS 缩放至 PB 规模》:一年多以来(使用 ES 0.90.x - 2.2.x 版)管理这些系统的过程中进行了无穷无尽的设计,制定各种运维策略,并获得了不少收获。作者的目标是介绍在以某种规模运维 ElasticSearch 的过程中它认为一些比较重要的高层面结论

  4. 《Spark 在 GrowingIO 数据无埋点全量采集场景下的实践》:本文跟大家分享的是 GrowingIO 在使用 Spark 中的经验,遇见的一些问题,以及我们修复的方法

  5. 《Twitter 数据平台的架构演化:数据访问层的实现》:Twitter 数据平台运维着一些全球最大的 Hadoop 集群,其中有几个集群超过 1 万个节点,存储着数百 PB 级数据集,每天有超过 10 万个日常 job 作业处理数十 PB 级数据量

深度观点

  1. 《深度 | 大数据 + 深度学习:未来两年内将成为大部分企业的标配》:SoftServe 是全球领先的技术解决方案提供商,昨日发布了自己的 Big Data Snapshot 研究报告,研究显示 62% 的大中型公司希望在未来的两年内能将机器学习用于商业分析

  2. 《深度学习统治即将开始 | Manning 在 SIGIR 演讲 PPT 实录》:国际计算机协会信息检索大会正在意大利的比萨举行,自然语言理解领域的顶级科学家 Christopher Manning 受邀发表主旨演讲。他认为,信息检索和自然语言理解两个领域可以互通,接下来几年,深度学习将会统治 SIGIR

大数据语言 & 开发架构机器学习