【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

大数据与机器学习周报 第 10 期:Twitter Heron 正式开源

  • 2016-05-30
  • 本文字数:1758 字

    阅读完需:约 6 分钟

编者按:本系列周报从第 10 期开始做出重大改版。今后将分为“业界新闻”、“技术干货”和“深度观点”3 大版块。感谢大家一直以来的关注和支持,我们将继续努力为读者奉献高质量的内容。

业界新闻

  1. 《重磅 | Twitter Heron 正式开源》:去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。据文中介绍,Heron 支撑 Twitter 的所有实时分析业务已经有两年多了。它替代了之前使用的 Apache Storm 系统。Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统
  2. 《Spark 2.0 技术预览版正式发布下载》:在过去 Spark 社区创建了 Spark 2.0 的技术预览版,经过几天的投票,目前该技术预览版今天正式公布
  3. 《真正的人工智能?Siri 被曝将迎来革命性更新》:2015 年,苹果(已知)收购了三家与人工智能技术相关的企业,它们分别是 Emotient、Perceptio 和 VocallQ。其中,VocallQ 是一家来自英国的语音识别学习软件公司。除了 Beats 和 Siri 之外,苹果在过去几年所收购的企业似乎都没有什么名气可言。不过在今年的 WWDC 大会上,VocallQ 可能就要大放异彩了

技术干货

  1. 《童有军:怎样进行精准用户画像》:童有君现任 FreeWheel 主任工程师,以下就广告平台中用户画像和标注噪声处理进行先行采访。童表示用户画像在广告平台的应用中与传统电商在定位与需求方面着眼不同。期间谈到 LR 模型拥有两大优点,并表示看好深度学习领域的前景
  2. 《Uber 怎样使用 Spark 和 Hadoop 优化用户体验》:如果你用过 Uber,你一定会注意到它的操作是如此的简单。你一键叫车,随后车就来找你了,最后自动完成支付,整个过程行云流水。但是,在这简单的流程背后其实是用 Hadoop 和 Spark 这样复杂的基础大数据架构来支撑的
  3. 《Spark 性能优化指南——高级篇》:继基础篇讲解了每个 Spark 开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark 性能优化指南》的高级篇,将深入分析数据倾斜调优与 shuffle 调优,以解决更加棘手的性能问题
  4. 《大数据分析界的“神兽”Apache Kylin 有多牛?》:本文来自李栋在《大数据杂谈》公众号的分享。分享的主题是:聊聊“神兽”Apache Kylin 的最新特性。本次分享将首先对 Apache Kylin 进行基本介绍;接下来介绍 1.5.x 最新版本在架构上的重要更新;然后对即将发布的 1.5.2 版本进行功能预告
  5. 《Spark 多数据源计算实践及其在 GrowingIO 的实践》:本文主要介绍如何使用 Apache Spark 中的 DataSource API 以实现多个数据源混合计算的实践。GrowingIO 通过使用 SparkSQL 加 DataSourceAPI 的方法在很短时间内搭建起一套完整的数据处理平台,并且扩展性很好
  6. 《首席工程师揭秘:LinkedIn 大数据后台是如何运作的》:Jay Kreps 是来自 LinkedIn 的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计

深度观点

  1. 《深度重磅 | 麻省理工科技评论:AI 即将腾飞》:人工智能,就像字面的含义一样,它是模拟人类思考元素的集大成者,学习能力和推理能力是其核心内容。举个简单的例子,“机器学习(Machine Learning)”就是人工智能领域里很有前途的课题,其主要内容是利用大数据训练程序,让它们找到一些可遵循的规律,并且让程序本身大胆的预测结果。讲完对人工智能最基本的定义,我们有必要通过下面的图表来回顾人工智能的发展历史,包括其中的大事件
  2. 《深度点评亚马逊、微软、谷歌、IBM 等 6 大机器学习云》:机器学习云这么多,各家特色是什么?哪个适合练级,哪里高手齐聚?哪家有不为人知的 Bug?最重要的,哪个最适合解决你的问题?资深程序员实测点评亚马逊、微软、谷歌、IBM 等6大机器学习云平台,分析各自优缺点。开发者、数据科学家、商业用户或者单纯爱好者都能从本文中受益
  3. 《重磅丰田接手谷歌旗下波士顿动力6大原因》:2016 年 5 月 28 日,根据 Tech Insider 的报道,Google 旗下的波士顿动力机器人公司将被丰田收购,虽然价格还没有公开,但交易近乎完成

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-05-30 19:002855
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91374 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

Django笔记二十九之中间件介绍

Hunter熊

Python django 中间件 middleware

首个支持RWA交易的订单簿DEX-PoseiSwap,即将开启IEO

EOSdreamer111

解密 Golang 哈希算法:深入了解 MD5、SHA-1 和 SHA-256

Java你猿哥

Java golang 算法 哈希算法 Go 语言

Java字节码 - ByteBuddy原理与使用(下)

骑牛上青山

Java bytebuddy 字节码

Last Week in Milvus

Zilliz

非结构化数据 Milvus Zilliz 向量数据库

首个支持RWA交易的订单簿DEX-PoseiSwap,即将开启IEO

股市老人

PoseiSwap缘何成DEX赛道新宠?POSE价值分析

股市老人

Nautilus Chain 或成未来最好的链上隐私生态

EOSdreamer111

首个支持RWA交易的订单簿DEX-PoseiSwap,即将开启IEO

西柚子

Java字节码 - ByteBuddy原理与使用(上)

骑牛上青山

Java JVM bytebuddy 字节码

古鱼、恐龙和大众,相逢在百度百科的“彩虹桥”

脑极体

百科

Nautilus Chain 或成未来最好的链上隐私生态

股市老人

PoseiSwap缘何成DEX赛道新宠?POSE价值分析

EOSdreamer111

Java数据库项目之满汉楼

timerring

Java

局域网内使用的多人协同编辑文档的软件哪个好?对比5款主流平台

PingCode

Confluence PingCode 文档管理工具

2023-05-15:对于某些非负整数 k ,如果交换 s1 中两个字母的位置恰好 k 次, 能够使结果字符串等于 s2 ,则认为字符串 s1 和 s2 的 相似度为 k。 给你两个字母异位词 s1

福大大架构师每日一题

Go 算法 rust 福大大

volatile 关键字与计算机底层的一些杂谈

Java你猿哥

Java volatile JVM ssm java知识点

首个支持RWA交易的订单簿DEX-PoseiSwap,即将开启IEO

BlockChain先知

MySQL 8.0不再担心被垃圾SQL搞爆内存

GreatSQL

MySQL MySQL 数据库 greatsql greatsql社区

PoseiSwap缘何成DEX赛道新宠?POSE价值分析

西柚子

在 Python 中如何使用并发模型编程

江湖十年

Python 并发编程 多线程 协程 多进程

骨灰级技术大牛左耳朵耗子(陈皓)突发心梗离世。

福大大架构师每日一题

福大大

对不起,您的访问次数已用尽!

为自己带盐

.net core 限流 AspNetCoreRateLimit

Nest.js JWT 验证授权管理

程序员海军

Node JWT nest

如何使用Go语言实现ISP原则

Jack

面试官:断网了,还能 ping 通 127.0.0.1 吗?

Java你猿哥

Java 架构 ssm ping

GitHub万赞,不愧是腾讯大牛总结的操作系统笔记,面面俱到太全了

Java你猿哥

Java 面试 多线程 ssm 线程与进程

龙蜥产品生态总监做客 InfoQ:后 CentOS 时代,国产操作系统能否扛起大旗?

OpenAnolis小助手

centos InfoQ 迁移 国产操作系统 龙蜥社区

Nautilus Chain 或成未来最好的链上隐私生态

鳄鱼视界

GitHub笔记疯抢竟崩溃!Redis完整开发实战居然包含大厂同款项目

Java你猿哥

Java redis ssm java面试 Redis 核心技术与实战

C语言编程-基本语法

智趣匠

大数据与机器学习周报 第10期:Twitter Heron正式开源_大数据_丁涛_InfoQ精选文章