阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

大数据与机器学习周报 第 18 期:Apache Spark 2.0 正式版发布下载

  • 2016-08-01
  • 本文字数:1237 字

    阅读完需:约 4 分钟

业界新闻

  1. 《Apache Spark 2.0 正式版发布下载》:两个月前,Databricks 发布了 Apache Spark 2.0 的技术预览版,如下表所见,目前我们有 10% 的集群都在使用这个版本,根据客户使用新版的经验及反馈意见,新版得以发布,Databricks 很开心能成为 Spark 2.0 的首个商业供应商
  2. 《甲骨文宣布 93 亿美元收购 ERP 云服务商 NetSuite》:甲骨文对外宣布,已与云软件服务提供商 NetSuite 签订了最终协议。根据协议,甲骨文将以每股 109 美元现金收购 NetSuite,总额约为 93 亿美元。该交易预计将在今年完成

技术干货

  1. 《优酷蓝鲸近千节点的 Redis 集群运维经验总结》:Redis 是时下比较流行的 Nosql 技术。在优酷我们使用 Redis Cluster 构建了一套内存存储系统,项目代号蓝鲸。到目前为止集群有 700+ 节点,即将达到作者推荐的最大集群规模 1000 节点。集群从 Redis Cluster 发布不久就开始运行,到现在已经将近两年时间。在运维集群过程中遇到了很多问题,记录下来希望对他人有所帮助
  2. 《从小数据分析到大数据平台,这十几年来大数据开源技术是如何演进的?》:在 QCon 2016 北京站上,Druid 开源项目的负责人,同时也是一家位于旧金山的技术公司共同创始人的 Fangjin Yang 杨仿今老师分享了题为 《Evolution of Open Source Data Infrastructure》的主题演讲,在演讲里杨老师详细的介绍了开源大数据的过去,现在的形态以及未来几年发展的趋势和方向
  3. 《MongoDB 在 58 同城百亿量级数据下的应用实践》:58 同城作为中国最大的生活服务平台,涵盖了房产、招聘、二手、二手车、黄页等核心业务。58 同城发展之初,大规模使用关系型数据库(SQL Server、MySQL 等),随着业务扩展速度增加,数据量和并发量演变的越来越有挑战,此阶段 58 的数据存储架构也需要相应的调整以更好的满足业务快速发展的需求
  4. 为什么 Uber 工程师将 Postgres 数据库换成 MySQL?:早期的 Uber 架构是由 Python 编写的,使用的是 Postgres 数据库存储。从那时起,Uber 的架构就一直在变化,变成微服务模型和新的数据平台。具体的说,很多我们以前使用 Postgres 的地方现在改用 Schemaless,这是 Uber 基于 MySQL 构建的一个数据库分片层

深度观点

  1. 《易观 CTO 郭炜:从 0 到 N 建立高性价比的大数据平台》:其实,每一个大数据平台都不是凭空而起的,每个企业刚刚开始数据分析的时候,也不是上来就是一个大数据开源平台 Hadoop、Spark 这样一个存储的。今天分享的内容,其实是根据企业发展的不同阶段,针对业务的需求来选择不同的大数据架构,配置不同规模的数据处理人员,根据企业不同的时间点,帮助企业从 0 到 N,建立高性价比的大数据平台
  2. 《谷歌大脑与 Open AI 合著论文:机器视觉的一个致命缺陷》:计算机视觉很厉害,但是,只要稍加修改,比如使用美图软件加一个滤镜,计算机视觉就错误频出。MIT 报道把这一缺陷称为计算机视觉的“阿喀琉斯之踵”,认为这是目前视觉领域的一个致命缺陷。如果计算机视觉要得到应用,比如用人脸识别侦察罪犯,但却连“美图秀秀”都搞不定的话,那确实是一个比较严重的问题

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-08-01 19:001919
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91303 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

迎接10亿快递高峰,看百度OCR如何助力物流企业提速

百度大脑

人工智能 OCR

2020百度、小米、乐视、美团,小米java面试几轮

Java 程序员 后端

2021BATJ面试题大全500道:Redis+数据库+分布式,java面试简历百度云

Java 程序员 后端

2021最强面试笔记非它莫属:3000字Java面试核心手册(大厂必备),linux操作系统教程下载

Java 程序员 后端

2021最新一线互联网大厂常见高并发面试题解析,springcloud视频百度云

Java 程序员 后端

大数据实践:数据指标中心的建设思路

大数据技术指南

11月日更

15W字!腾讯总监手写“Netty速成手册”,mysql索引优化面试题

Java 程序员 后端

名震GitHub,字节跳动内部顶级数据结构刷题学习笔记根本停不下来

Java 程序员 数据结构 面试 字节

1小时破千万点击量!阿里巴巴首发:Java实践指南,mysql使用教程图解目录

Java 程序员 后端

2020-6次面试阿里,持续一个多月,终于拿到offer了!,java三层架构登录功能实现

Java 程序员 后端

2020淘宝双十一快速刷金币工具,这份字节跳动历年校招Java面试真题解析

Java 程序员 后端

2021年五面蚂蚁、三面拼多多、字节跳动最终拿offer入职拼多多,我是如何收割多家大厂offer的

Java 程序员 后端

万字长文手写数据库连接池,让抽象工厂不再抽象

Tom弹架构

Java 架构 设计模式

2021最新38道Spring大厂面试题,你碰到过哪道?,java开发工程师百度百科

Java 程序员 后端

2021 年最新版 68道Redis面试题,20000字,赶紧收藏起来备用,成功入职阿里

Java 程序员 后端

2021年总结阿里、腾讯、百度等大厂11个Redis系列高频面试题,哪些你还不会

Java 程序员 后端

2021年最新基于Spring Cloud的微服务架构分析,java技术经理岗位职责

Java 程序员 后端

代码覆盖率VS测试覆盖率

FunTester

测试 测试覆盖率 覆盖率 FunTester 代码覆盖率

发布两小时,霸榜GitHub Spring Boot实战文档

Java GitHub spring 编程 程序员

完美诠释Netty,腾讯强推599页Netty进阶神技,惊掉我的下巴

Java 编程 程序员 Netty

从OA到COP,致远互联成引领行业的“灯塔”

海比研究院

致远互联 COP 协同运营平台

2020年Java篇:蚂蚁金服、拼多多、字节跳动的面试总结,mysqlserver使用教程

Java 程序员 后端

2021最新常见200+Java面试题汇总(含答案解析),unity高级工程师面试题

Java 程序员 后端

1万字长文高速你千万级并发架构下如何提高数据库存储性能,使用指南

Java 程序员 后端

2021最新出炉BAT架构实战文档:多线程与高并发+分布式+微服务,泛微网络java面试题

Java 程序员 后端

2021最新华为面经分享:Java高分面试指南(25分类1000题50w字解析)

Java 程序员 后端

15W字!腾讯总监手写“Netty速成手册”(1),SpringBoot项目瘦身指南

Java 程序员 后端

2021字节总监最新发布:JVM +GC优质手册!面试专属,mongodb集群搭建原理

Java 程序员 后端

2021年10月最新版Java面试真题+视频解析(价值24980赶紧收藏码住!

Java 程序员 后端

2020年春招复盘:技术三面+HR面,成功斩获京东offer,springboot项目实战源码

Java 程序员 后端

进击的Java(四)

ES_her0

11月日更

大数据与机器学习周报 第18期:Apache Spark 2.0正式版发布下载_大数据_丁涛_InfoQ精选文章