阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

大数据与机器学习周报 第 10 期:Twitter Heron 正式开源

  • 2016-05-30
  • 本文字数:1758 字

    阅读完需:约 6 分钟

编者按:本系列周报从第 10 期开始做出重大改版。今后将分为“业界新闻”、“技术干货”和“深度观点”3 大版块。感谢大家一直以来的关注和支持,我们将继续努力为读者奉献高质量的内容。

业界新闻

  1. 《重磅 | Twitter Heron 正式开源》:去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。据文中介绍,Heron 支撑 Twitter 的所有实时分析业务已经有两年多了。它替代了之前使用的 Apache Storm 系统。Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统
  2. 《Spark 2.0 技术预览版正式发布下载》:在过去 Spark 社区创建了 Spark 2.0 的技术预览版,经过几天的投票,目前该技术预览版今天正式公布
  3. 《真正的人工智能?Siri 被曝将迎来革命性更新》:2015 年,苹果(已知)收购了三家与人工智能技术相关的企业,它们分别是 Emotient、Perceptio 和 VocallQ。其中,VocallQ 是一家来自英国的语音识别学习软件公司。除了 Beats 和 Siri 之外,苹果在过去几年所收购的企业似乎都没有什么名气可言。不过在今年的 WWDC 大会上,VocallQ 可能就要大放异彩了

技术干货

  1. 《童有军:怎样进行精准用户画像》:童有君现任 FreeWheel 主任工程师,以下就广告平台中用户画像和标注噪声处理进行先行采访。童表示用户画像在广告平台的应用中与传统电商在定位与需求方面着眼不同。期间谈到 LR 模型拥有两大优点,并表示看好深度学习领域的前景
  2. 《Uber 怎样使用 Spark 和 Hadoop 优化用户体验》:如果你用过 Uber,你一定会注意到它的操作是如此的简单。你一键叫车,随后车就来找你了,最后自动完成支付,整个过程行云流水。但是,在这简单的流程背后其实是用 Hadoop 和 Spark 这样复杂的基础大数据架构来支撑的
  3. 《Spark 性能优化指南——高级篇》:继基础篇讲解了每个 Spark 开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark 性能优化指南》的高级篇,将深入分析数据倾斜调优与 shuffle 调优,以解决更加棘手的性能问题
  4. 《大数据分析界的“神兽”Apache Kylin 有多牛?》:本文来自李栋在《大数据杂谈》公众号的分享。分享的主题是:聊聊“神兽”Apache Kylin 的最新特性。本次分享将首先对 Apache Kylin 进行基本介绍;接下来介绍 1.5.x 最新版本在架构上的重要更新;然后对即将发布的 1.5.2 版本进行功能预告
  5. 《Spark 多数据源计算实践及其在 GrowingIO 的实践》:本文主要介绍如何使用 Apache Spark 中的 DataSource API 以实现多个数据源混合计算的实践。GrowingIO 通过使用 SparkSQL 加 DataSourceAPI 的方法在很短时间内搭建起一套完整的数据处理平台,并且扩展性很好
  6. 《首席工程师揭秘:LinkedIn 大数据后台是如何运作的》:Jay Kreps 是来自 LinkedIn 的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计

深度观点

  1. 《深度重磅 | 麻省理工科技评论:AI 即将腾飞》:人工智能,就像字面的含义一样,它是模拟人类思考元素的集大成者,学习能力和推理能力是其核心内容。举个简单的例子,“机器学习(Machine Learning)”就是人工智能领域里很有前途的课题,其主要内容是利用大数据训练程序,让它们找到一些可遵循的规律,并且让程序本身大胆的预测结果。讲完对人工智能最基本的定义,我们有必要通过下面的图表来回顾人工智能的发展历史,包括其中的大事件
  2. 《深度点评亚马逊、微软、谷歌、IBM 等 6 大机器学习云》:机器学习云这么多,各家特色是什么?哪个适合练级,哪里高手齐聚?哪家有不为人知的 Bug?最重要的,哪个最适合解决你的问题?资深程序员实测点评亚马逊、微软、谷歌、IBM 等6大机器学习云平台,分析各自优缺点。开发者、数据科学家、商业用户或者单纯爱好者都能从本文中受益
  3. 《重磅丰田接手谷歌旗下波士顿动力6大原因》:2016 年 5 月 28 日,根据 Tech Insider 的报道,Google 旗下的波士顿动力机器人公司将被丰田收购,虽然价格还没有公开,但交易近乎完成

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-05-30 19:002853
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91313 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

极客时间运维进阶训练营第六周作业

9527

AngularJS进阶(九)控制器controller之间如何通信

No Silver Bullet

通信 AngularJS 12月月更

MASA Framework 事件总线 - 跨进程事件总线

MASA技术团队

.net MASA Framewrok MASA

Hash 的定义

HoneyMoose

云小课|云小课带你玩转可视化分析ELB日志

华为云开发者联盟

云计算 后端 华为云 12 月 PK 榜

大数据培训学习分析师怎么样

小谷哥

Vision Transformer这两年

OneFlow

人工智能 深度学习 NLP 大模型

安全配置错误规避指南

SEAL安全

配置管理 企业安全 安全配置 配置错误 12 月 PK 榜

阿里云视觉智能开放平台——年终特惠来袭

夏夜许游

人工智能 AI 视觉 特惠

HashMap 的初始值和最大值和扩容因子

HoneyMoose

Java HashMap 在获得 Key 的 Hash 值的时候用的是什么算法

HoneyMoose

一个有点咬文嚼字的 sorting 和 ordering

HoneyMoose

JavaScript进阶(八)实现图片预览并导入服务器功能

No Silver Bullet

图片预览 AngularJS 12月月更

【云享·人物】华为云AI高级专家白小龙:AI如何释放应用生产力,向AI工程化前行?

华为云开发者联盟

人工智能 华为云 AI工程化 12 月 PK 榜

web前端培训程序员学习什么呢

小谷哥

一种多引擎可视化数据流实现方案

元年技术洞察

数据中台 数字化转型 专利解析 方舟企业数字化 PaaS 平台

​ AngularJS进阶(七)AngularJS实现根据不同条件显示不同控件

No Silver Bullet

AngularJS 12月月更 条件筛选

Dubbo 3.1.3、3.2.0-beta.2 正式发布

Apache Dubbo

Java 开源 微服务 云原生 dubbo

实践案例:同程艺龙网的 Dubbo 升级经验总结

Apache Dubbo

Java 开源 微服务 云原生 dubbo

打造无证服务化:这个政务服务平台有点不一样

华为云开发者联盟

区块链 华为云 12 月 PK 榜

上海大数据培训机构怎么选择比较好

小谷哥

双十一特惠,华为云桌面助力便捷高效办公!

爱科技的水月

Java HashMap 的扩容因子为什么是 0.75

HoneyMoose

瓴羊Quick BI数据大屏,服务企业数字化转型发展

巷子

大数据培训学习编程技术的方法有哪些

小谷哥

Java Hash 碰撞

HoneyMoose

嵌入式系统的开发概述

timerring

嵌入式 12月月更

旺链科技荣膺“2022上海软件核心竞争力企业”

旺链科技

区块链 产业区块链 12 月 PK 榜

web前端培训程序员学习怎么提升技术

小谷哥

Serverless 架构下的 AI 应用开发

Serverless Devs

将 Vue.js 项目部署至静态网站托管,并开启 Gzip 压缩

华为云开发者联盟

开发 华为云 12 月 PK 榜

大数据与机器学习周报 第10期:Twitter Heron正式开源_大数据_丁涛_InfoQ精选文章