Data+AI时代,如何打造下一代数智平台? 了解详情
写点什么

大数据与机器学习周报 第 16 期:谷歌 BigQuery 现在允许查询所有 GitHub 开源项目了

  • 2016-07-18
  • 本文字数:955 字

    阅读完需:约 3 分钟

业界新闻

  1. 《谷歌 BigQuery 现在允许查询所有 GitHub 开源项目了》:谷歌和 GitHub 宣布,谷歌 BigQuery 现在为 GitHub 上 280 多万个托管开源项目提供了一个完整的快照。这让用户可以使用 SQL 查询托管在 GitHub 上的将近 20 亿个开源文件
  2. 《eBay 收购 SalesPredict,看中其机器学习能力》:SalesPredict 成立于 2012 年,它主要帮助创业公司分析潜在的盈利机会,eBay 表示将会利用这些技术来对自己的顾客进行预测
  3. 《牛津大学开发新软件可以让普通汽车自动驾驶》:Oxbotica 是一家英国企业,它是从牛津大学分拆出来的,该公司正在开发新的软件系统,它可以将普通汽车变成无人驾驶汽车

技术干货

  1. 《Apache Kylin 在美团数十亿数据 OLAP 场景下的实践》:美团各业务线存在大量的 OLAP 分析场景,需要基于 Hadoop 数十亿级别的数据进行分析,直接响应分析师和城市 BD 等数千人的交互式访问请求,对 OLAP 服务的扩展性、稳定性、数据精确性和性能均有很高要求。本文主要介绍美团的具体 OLAP 需求,如何将 Kylin 应用到实际场景中,以及目前的使用方式和现状
  2. 《如果你还在停服迁移数据,那你就 out 啦!!》:很多数据库提供的原生迁移工具只能进行全量数据拷贝,为了保证迁移数据一致性,要求业务在数据迁移之前需停止服务。所以这种传统的迁移方案对业务影响极大。为降低数据迁移门槛,阿里云数据传输 DTS 推出不停服迁移功能。使用不停服迁移功能,可实现整个数据迁移过程中,业务停服时间降低到分钟级别

深度观点

  1. 《探秘 Facebook 数据中心,人工智能硬件系统 Big Sur 一瞥》:Big Sur 是由大量芯片 GPUs 组成的计算机服务器。Facebook 将其 AI 系统进行开源,有助于整个产业加速发展
  2. 《深度访谈:华为开源数据格式 CarbonData 项目,实现大数据即席查询秒级响应》:CarbonData 是一种低时延查询、存储和计算分离的轻量化文件存储格式。那么相比 SQL on Hadoop 方案、传统 NoSQL 或相对 ElasticSearch 等搜索系统,CarbonData 具有什么样的优势呢?CarbonData 的技术架构是什么样子的?未来有什么样的规划?我们采访了 CarbonData 项目的技术负责人为大家解惑
  3. 《阿里云机器学习平台》:作者以机器学习的概念入手展开了此次分享,演讲中他重点介绍了阿里云机器学习平台的基础架构和产品特点,并结合阿里内部的芝麻信用分、推荐系统等场景讲解了 PAI 平台的具体应用方案
2016-07-18 19:001580
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 10.3 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

Elasticsearch 写入流程 Making Changes Persistent

escray

elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

架构师是什么?

ES_her0

28天写作 3月日更

简述软件不可用性及解决办法

跳蚤

安全架构学习总结

跳蚤

「架构师训练营 4 期」 第十一周 - 001&2

凯迪

架构师训练营 4 期

React 中 useContext 和 useMemo 一般性使用

sadhu

React useContext useMemo React Hooks

基于 SparkMLlib 智能课堂教学评价系统-系统设计(三)

大数据技术指南

大数据 spark 智能时代 28天写作 3月日更

Vue3源码 | 深入理解响应式系统下篇-effect

梁龙先森

源码分析 大前端 Vue3

英文IT数码类播客学习笔记

SilentMacUser

红帽 互联网 播客 计算机历史

还原五百丁APP需求文档

林亚超

张开怀抱迎接Golang

Kylin

读书笔记 语法 3月日更 Java转go Go 语言

软件工程任务排期方法

steve_lee

区块链+金融落地应用详解

CECBC

金融

数据采集之Flume采集及点击流模型详解

五分钟学大数据

大数据 28天写作 3月日更 flume 点击流模型

雄岸科技区块链布局价值待考

CECBC

区块链 科技

【得物技术】前端微服务

得物技术

微服务 大前端 得物技术

员工遇到问题 - 是给答案还是给引导?

石云升

项目管理 28天写作 职场经验 管理经验 3月日更

MySQL调优

Sakura

28天写作 3月日更

区块链+版权:NFT出圈,善用技术能否“破心中贼”?

CECBC

数字技术

多应用集中落地,四川区块链产业爆发增长

CECBC

区块链

ARTS - week 2

steve_lee

我的Java转Go之路

roseduan

Java 转行 Go web Go 语言

场景化面试:Kafka 为何有如此高的吞吐量和性能

面试官问

kafka 零拷贝 PageCache

又一款Nginx 管理可视化神器!通过界面完成配置监控,一条龙!

Java小咖秀

nginx 运维 后端

第十一周作业

Geek_mewu4t

人社部拟发10几个新职业,区块链行业占两个

CECBC

区块链人才

我的学习笔记

SilentMacUser

Python JavaScript 学习 大前端 开发

大作业(一)

Binary

大作业(二)

Binary

【笔记】第七周 第 2 课

Geek_娴子

「架构师训练营 4 期」 第十周 - 001&2

凯迪

架构师训练营 4 期

大数据与机器学习周报 第16期:谷歌BigQuery现在允许查询所有GitHub开源项目了_大数据_丁涛_InfoQ精选文章