阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

大数据与机器学习周报 第 18 期:Apache Spark 2.0 正式版发布下载

  • 2016-08-01
  • 本文字数:1237 字

    阅读完需:约 4 分钟

业界新闻

  1. 《Apache Spark 2.0 正式版发布下载》:两个月前,Databricks 发布了 Apache Spark 2.0 的技术预览版,如下表所见,目前我们有 10% 的集群都在使用这个版本,根据客户使用新版的经验及反馈意见,新版得以发布,Databricks 很开心能成为 Spark 2.0 的首个商业供应商
  2. 《甲骨文宣布 93 亿美元收购 ERP 云服务商 NetSuite》:甲骨文对外宣布,已与云软件服务提供商 NetSuite 签订了最终协议。根据协议,甲骨文将以每股 109 美元现金收购 NetSuite,总额约为 93 亿美元。该交易预计将在今年完成

技术干货

  1. 《优酷蓝鲸近千节点的 Redis 集群运维经验总结》:Redis 是时下比较流行的 Nosql 技术。在优酷我们使用 Redis Cluster 构建了一套内存存储系统,项目代号蓝鲸。到目前为止集群有 700+ 节点,即将达到作者推荐的最大集群规模 1000 节点。集群从 Redis Cluster 发布不久就开始运行,到现在已经将近两年时间。在运维集群过程中遇到了很多问题,记录下来希望对他人有所帮助
  2. 《从小数据分析到大数据平台,这十几年来大数据开源技术是如何演进的?》:在 QCon 2016 北京站上,Druid 开源项目的负责人,同时也是一家位于旧金山的技术公司共同创始人的 Fangjin Yang 杨仿今老师分享了题为 《Evolution of Open Source Data Infrastructure》的主题演讲,在演讲里杨老师详细的介绍了开源大数据的过去,现在的形态以及未来几年发展的趋势和方向
  3. 《MongoDB 在 58 同城百亿量级数据下的应用实践》:58 同城作为中国最大的生活服务平台,涵盖了房产、招聘、二手、二手车、黄页等核心业务。58 同城发展之初,大规模使用关系型数据库(SQL Server、MySQL 等),随着业务扩展速度增加,数据量和并发量演变的越来越有挑战,此阶段 58 的数据存储架构也需要相应的调整以更好的满足业务快速发展的需求
  4. 为什么 Uber 工程师将 Postgres 数据库换成 MySQL?:早期的 Uber 架构是由 Python 编写的,使用的是 Postgres 数据库存储。从那时起,Uber 的架构就一直在变化,变成微服务模型和新的数据平台。具体的说,很多我们以前使用 Postgres 的地方现在改用 Schemaless,这是 Uber 基于 MySQL 构建的一个数据库分片层

深度观点

  1. 《易观 CTO 郭炜:从 0 到 N 建立高性价比的大数据平台》:其实,每一个大数据平台都不是凭空而起的,每个企业刚刚开始数据分析的时候,也不是上来就是一个大数据开源平台 Hadoop、Spark 这样一个存储的。今天分享的内容,其实是根据企业发展的不同阶段,针对业务的需求来选择不同的大数据架构,配置不同规模的数据处理人员,根据企业不同的时间点,帮助企业从 0 到 N,建立高性价比的大数据平台
  2. 《谷歌大脑与 Open AI 合著论文:机器视觉的一个致命缺陷》:计算机视觉很厉害,但是,只要稍加修改,比如使用美图软件加一个滤镜,计算机视觉就错误频出。MIT 报道把这一缺陷称为计算机视觉的“阿喀琉斯之踵”,认为这是目前视觉领域的一个致命缺陷。如果计算机视觉要得到应用,比如用人脸识别侦察罪犯,但却连“美图秀秀”都搞不定的话,那确实是一个比较严重的问题

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-08-01 19:001921
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91354 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

Selenium 中并行测试的重要性

FunTester

STC89C52+DHT20设计的环境温湿度检测仪

DS小龙哥

6 月 优质更文活动

教学实训模块升级,助力应用型数据科学人才培养|ModelWhale 版本更新

ModelWhale

数据分析 大模型 教学实训 在线编程 云课堂

完全自动驾驶车辆何时才能成为现实

来自四九城儿

接口测试|Fiddler抓包设置及证书配置

霍格沃兹测试开发学社

强化学习从基础到进阶-案例与实践[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动 A3C算法

零基础自学:2023年的今天,请谨慎进入网络安全行业

网络安全学海

黑客 网络安全 信息安全 计算机 渗透测试

强化学习从基础到进阶-常见问题和面试必知必答[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动

Vue插槽详解

高端章鱼哥

Vue 插槽

面向对象设计的逆向建模方法和开源工具

高鹏

Java 开源 架构 DDD 架构设计

机遇与挑战——超级自动化产品的国产化替代已成为大势所趋

九科Ninetech

接口测试|Fiddler弱网测试

霍格沃兹测试开发学社

2024深圳电子展,中国国际电子信息博览会(CITE电博会)

AIOTE智博会

电子展

【领域驱动设计专题】一文带领你透视DDD领域驱动模型的本质和设计原理分析指南(通用语言体系)

洛神灬殇

领域驱动设计 DDD 领域驱动设计思想 领域驱动模型

最佳实践|亚马逊可持续发展的架构模型

亚马逊云科技 (Amazon Web Services)

JavaScript

接口测试|Fiddler界面工具栏介绍(三)

霍格沃兹测试开发学社

接口测试|Fiddler设置手机抓包

霍格沃兹测试开发学社

唯一入选中国厂商!灵雀云获Gartner® 首份《DevOps平台魔力象限报告》“荣誉提及”

York

容器 DevOps 云原生 Gartner 平台工程

es笔记一之es安装与介绍

Hunter熊

elasticsearch Kibana 安装Kibana

什么是区块链?

TiAmo

区块链 去中心化 6 月 优质更文活动

探索支付宝云开发,开启一段100ms的神奇旅程!

TRaaS

支付宝小程序 云开发

接口测试|Fiddler会话栏中添加IP列

霍格沃兹测试开发学社

如何通过场景规划帮助企业实现全面预算管理?

智达方通

智达方通 全面预算管理 财务规划和分析 财务规划与预测 全面预算管理系统

何时使用Kafka而不是RabbitMQ

越长大越悲伤

Kafk Rabbit MQ 消息列队

复旦大学智能计算平台与世界科学智能大赛启动仪式

新云力量

智能 计算 复旦大学

SQL 优化(一):慎用 SQL 函数

hungxy

Java MySQL 后端

Scrum看板工具在项目管理中的作用

顿顿顿

敏捷工具 scrum工具 scrum敏捷工具

StarRocks & Friends 上海站活动回顾(含 PPT 下载链接)

StarRocks

数据库 OLAP MPP 大数据 开源

小程序容器技术在移动警务中的业务价值

FinFish

小程序容器 移动警务 警务app

解决QT QGraphicsView提升到QChartView报错的问题

智趣匠

浅析 Jetty 中的线程优化思路

vivo互联网技术

jetty EatWhatYouKill 线程策略

大数据与机器学习周报 第18期:Apache Spark 2.0正式版发布下载_大数据_丁涛_InfoQ精选文章