红帽白皮书新鲜出炉!点击获取,让你的云战略更胜一筹! 了解详情
写点什么

大数据与机器学习周报 第 10 期:Twitter Heron 正式开源

  • 2016-05-30
  • 本文字数:1758 字

    阅读完需:约 6 分钟

编者按:本系列周报从第 10 期开始做出重大改版。今后将分为“业界新闻”、“技术干货”和“深度观点”3 大版块。感谢大家一直以来的关注和支持,我们将继续努力为读者奉献高质量的内容。

业界新闻

  1. 《重磅 | Twitter Heron 正式开源》:去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。据文中介绍,Heron 支撑 Twitter 的所有实时分析业务已经有两年多了。它替代了之前使用的 Apache Storm 系统。Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统
  2. 《Spark 2.0 技术预览版正式发布下载》:在过去 Spark 社区创建了 Spark 2.0 的技术预览版,经过几天的投票,目前该技术预览版今天正式公布
  3. 《真正的人工智能?Siri 被曝将迎来革命性更新》:2015 年,苹果(已知)收购了三家与人工智能技术相关的企业,它们分别是 Emotient、Perceptio 和 VocallQ。其中,VocallQ 是一家来自英国的语音识别学习软件公司。除了 Beats 和 Siri 之外,苹果在过去几年所收购的企业似乎都没有什么名气可言。不过在今年的 WWDC 大会上,VocallQ 可能就要大放异彩了

技术干货

  1. 《童有军:怎样进行精准用户画像》:童有君现任 FreeWheel 主任工程师,以下就广告平台中用户画像和标注噪声处理进行先行采访。童表示用户画像在广告平台的应用中与传统电商在定位与需求方面着眼不同。期间谈到 LR 模型拥有两大优点,并表示看好深度学习领域的前景
  2. 《Uber 怎样使用 Spark 和 Hadoop 优化用户体验》:如果你用过 Uber,你一定会注意到它的操作是如此的简单。你一键叫车,随后车就来找你了,最后自动完成支付,整个过程行云流水。但是,在这简单的流程背后其实是用 Hadoop 和 Spark 这样复杂的基础大数据架构来支撑的
  3. 《Spark 性能优化指南——高级篇》:继基础篇讲解了每个 Spark 开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark 性能优化指南》的高级篇,将深入分析数据倾斜调优与 shuffle 调优,以解决更加棘手的性能问题
  4. 《大数据分析界的“神兽”Apache Kylin 有多牛?》:本文来自李栋在《大数据杂谈》公众号的分享。分享的主题是:聊聊“神兽”Apache Kylin 的最新特性。本次分享将首先对 Apache Kylin 进行基本介绍;接下来介绍 1.5.x 最新版本在架构上的重要更新;然后对即将发布的 1.5.2 版本进行功能预告
  5. 《Spark 多数据源计算实践及其在 GrowingIO 的实践》:本文主要介绍如何使用 Apache Spark 中的 DataSource API 以实现多个数据源混合计算的实践。GrowingIO 通过使用 SparkSQL 加 DataSourceAPI 的方法在很短时间内搭建起一套完整的数据处理平台,并且扩展性很好
  6. 《首席工程师揭秘:LinkedIn 大数据后台是如何运作的》:Jay Kreps 是来自 LinkedIn 的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计

深度观点

  1. 《深度重磅 | 麻省理工科技评论:AI 即将腾飞》:人工智能,就像字面的含义一样,它是模拟人类思考元素的集大成者,学习能力和推理能力是其核心内容。举个简单的例子,“机器学习(Machine Learning)”就是人工智能领域里很有前途的课题,其主要内容是利用大数据训练程序,让它们找到一些可遵循的规律,并且让程序本身大胆的预测结果。讲完对人工智能最基本的定义,我们有必要通过下面的图表来回顾人工智能的发展历史,包括其中的大事件
  2. 《深度点评亚马逊、微软、谷歌、IBM 等 6 大机器学习云》:机器学习云这么多,各家特色是什么?哪个适合练级,哪里高手齐聚?哪家有不为人知的 Bug?最重要的,哪个最适合解决你的问题?资深程序员实测点评亚马逊、微软、谷歌、IBM 等6大机器学习云平台,分析各自优缺点。开发者、数据科学家、商业用户或者单纯爱好者都能从本文中受益
  3. 《重磅丰田接手谷歌旗下波士顿动力6大原因》:2016 年 5 月 28 日,根据 Tech Insider 的报道,Google 旗下的波士顿动力机器人公司将被丰田收购,虽然价格还没有公开,但交易近乎完成

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-05-30 19:002845
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91039 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

深度学习CV任务的突破与优化

百度开发者中心

人工智能 深度学习 大模型训练

OpenHarmony应用全局的UI状态存储:AppStorage

OpenHarmony开发者

OpenHarmony

AI做体育赛事解说员,比赛观看平台开发搭建AI解说升级探究

软件开发-梦幻运营部

NFTScan 支持非 EVM 公链的 NFT Collection 的认证功能

NFT Research

NFT NFT\ NFTScan

Snagit for mac(屏幕截图工具) 2023.2.4永久激活版

mac

苹果mac Windows软件 屏幕截图软件 Snagit 2023

低代码系列——可视化编辑器

互联网工科生

低代码 可视化编排

语音识别技术的挑战与机遇再探讨

来自四九城儿

数字孪生智慧市政三Web3D可视化管理平台

2D3D前端可视化开发

物联网 可视化 智慧城市 数字孪生 智慧市政

2023-10-18:用go语言,给定一个数组arr,长度为n,表示有0~n-1号设备, arr[i]表示i号设备的型号,型号的种类从0~k-1,一共k种型号, 给定一个k*k的矩阵map,来表示型号

福大大架构师每日一题

福大大架构师每日一题

HarmonyOS语言基础类库开发指南上线啦!

HarmonyOS开发者

HarmonyOS

双翻页大屏看书,Mate X5上的华为阅读让你“阅”如纸上

最新动态

低代码如何赋能实体经济走向数实融合

力软低代码开发平台

IPQ9574, IPQ9554, IPQ4029, IPQ5018-IPQ6010- high-performance multi-core cpu-leading WiFi revolution

wifi6-yiyi

ipq9574

ABAQUS常用的插件及使用介绍-ABAQUS软件教程

思茂信息

abaqus 有限元仿真 有限元技术

重构AI智慧未来,小度全屋智能生态再进化

新消费日报

内部即时通讯软件,为企业协同办公保驾护航

WorkPlus

私有化部署助力企业信息安全,WorkPlus助您完美替代企微、钉钉、飞书!

WorkPlus

语音识别技术的行业应用与发展趋势

来自四九城儿

MySQL的自增id会用完吗?用完怎么办

互联网工科生

MySQL MySQL自增ID

开源贡献难吗?

字节跳动云原生计算

flink 开源 字节

通过 Random 和 UUID 算法实现 JMeter 的随机数生成

Liam

程序员 测试 Jmeter 测试工具 随机数

Audio Hijack for Mac(音频录制软件) 4.2.5完整版

mac

苹果mac Windows软件 Audio Hijack 音频录制软件

全球领先的即时通讯厂家,为企业提供卓越沟通解决方案

WorkPlus

开放原子开源基金会开源安全委员会九月新增成员单位

开放原子开源基金会

从手动操作到自动化管理,如何实现企业身份业务全面自动化?

Authing

事件驱动 企业管理 Authing 身份自动化

优化模型之”标注错误“

矩视智能

深度学习 机器视觉

九月 Web3 游戏报告: 数量增长,巨头入场,用户获取和留存仍存挑战

Footprint Analytics

区块链游戏 NFT Web3 游戏 Web3 Games

流程图如何制作?好用的11款流程图软件盘点!

彭宏豪95

效率 流程图 流程图绘制工具 办公软件 绘图工具

Hyperworks对比其他仿真软件有哪些特色_Hyperworks介绍

智造软件

CAE软件 altair hyperworks

五大场景告诉你,如何把iPaaS运用到实处

RestCloud

数据同步 数据同步工具 ipaas

OpenHarmonyMeetup2023深圳站圆满举办

科技热闻

大数据与机器学习周报 第10期:Twitter Heron正式开源_大数据_丁涛_InfoQ精选文章