阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

大数据与机器学习周报 第 16 期:谷歌 BigQuery 现在允许查询所有 GitHub 开源项目了

  • 2016-07-18
  • 本文字数:955 字

    阅读完需:约 3 分钟

业界新闻

  1. 《谷歌 BigQuery 现在允许查询所有 GitHub 开源项目了》:谷歌和 GitHub 宣布,谷歌 BigQuery 现在为 GitHub 上 280 多万个托管开源项目提供了一个完整的快照。这让用户可以使用 SQL 查询托管在 GitHub 上的将近 20 亿个开源文件
  2. 《eBay 收购 SalesPredict,看中其机器学习能力》:SalesPredict 成立于 2012 年,它主要帮助创业公司分析潜在的盈利机会,eBay 表示将会利用这些技术来对自己的顾客进行预测
  3. 《牛津大学开发新软件可以让普通汽车自动驾驶》:Oxbotica 是一家英国企业,它是从牛津大学分拆出来的,该公司正在开发新的软件系统,它可以将普通汽车变成无人驾驶汽车

技术干货

  1. 《Apache Kylin 在美团数十亿数据 OLAP 场景下的实践》:美团各业务线存在大量的 OLAP 分析场景,需要基于 Hadoop 数十亿级别的数据进行分析,直接响应分析师和城市 BD 等数千人的交互式访问请求,对 OLAP 服务的扩展性、稳定性、数据精确性和性能均有很高要求。本文主要介绍美团的具体 OLAP 需求,如何将 Kylin 应用到实际场景中,以及目前的使用方式和现状
  2. 《如果你还在停服迁移数据,那你就 out 啦!!》:很多数据库提供的原生迁移工具只能进行全量数据拷贝,为了保证迁移数据一致性,要求业务在数据迁移之前需停止服务。所以这种传统的迁移方案对业务影响极大。为降低数据迁移门槛,阿里云数据传输 DTS 推出不停服迁移功能。使用不停服迁移功能,可实现整个数据迁移过程中,业务停服时间降低到分钟级别

深度观点

  1. 《探秘 Facebook 数据中心,人工智能硬件系统 Big Sur 一瞥》:Big Sur 是由大量芯片 GPUs 组成的计算机服务器。Facebook 将其 AI 系统进行开源,有助于整个产业加速发展
  2. 《深度访谈:华为开源数据格式 CarbonData 项目,实现大数据即席查询秒级响应》:CarbonData 是一种低时延查询、存储和计算分离的轻量化文件存储格式。那么相比 SQL on Hadoop 方案、传统 NoSQL 或相对 ElasticSearch 等搜索系统,CarbonData 具有什么样的优势呢?CarbonData 的技术架构是什么样子的?未来有什么样的规划?我们采访了 CarbonData 项目的技术负责人为大家解惑
  3. 《阿里云机器学习平台》:作者以机器学习的概念入手展开了此次分享,演讲中他重点介绍了阿里云机器学习平台的基础架构和产品特点,并结合阿里内部的芝麻信用分、推荐系统等场景讲解了 PAI 平台的具体应用方案

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-07-18 19:001183
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91359 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

笔记软件哪个好?超全的笔记软件盘点推荐:手写笔记、文本笔记、协作笔记、知识管理等!

彭宏豪95

效率工具 在线白板 办公软件 笔记软件 boardmix

定向减免!函数计算让轻量 ETL 数据加工更简单,更省钱

阿里巴巴云原生

阿里云 云原生 函数计算

活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

阿里巴巴云原生

阿里云 容器 云原生

管理者必备:测试管理岗位与职责的全面定义

测吧(北京)科技有限公司

测试

突破职业瓶颈:测试管理者如何有效提升领导力

测吧(北京)科技有限公司

测试

KubeBlocks 研发轶事之 addon 抽象

小猿姐

数据库 Kubernetes 云原生 抽象

Consul 留给你的时间不多了

阿里巴巴云原生

阿里云 云原生

Sentinel 新版本发布,提升配置灵活性以及可观测配套

阿里巴巴云原生

阿里云 开源 云原生

测试管理者的成功之路:职业发展的关键因素揭示

测吧(北京)科技有限公司

测试

测试管理的黄金法则:晋升之路上不可忽视的要点

测吧(北京)科技有限公司

测试

测试管理的方法论宝典:工具、流程与最佳实践

测吧(北京)科技有限公司

测试

《数据结构与算法分析:Java语言描述(第3版)》PDF

程序员李木子

进击的 Serverless:Java 应用如何从容地面对突增流量

阿里巴巴云原生

阿里云 Serverless 云原生

搭建开发体育赛事直播间解说平台,现成源码框架功能模块具备

软件开发-梦幻运营部

测试管理者的智慧:能力图谱指导下的职业发展之道

测吧(北京)科技有限公司

测试

项目管理中有效沟通的7大技巧

PingCode

项目管理 项目经理 沟通技巧

左耳听风 - 软件开发与架构设计的原则「读书打卡 day 13」

Java 工程师蔡姬

读书笔记 程序员 个人成长 职业发展

《Java性能权威指南(第2版)》PDF

程序员李木子

管理型人才的心理修炼:从技术到测试管理的平稳转变

测吧(北京)科技有限公司

测试

玩转数据处理利器:学会使用 YAML 文件轻松处理数据

测试人

软件测试 测试开发

C# 循环与条件语句详解

小万哥

C# 程序人生 编程语言 软件工程 后端开发

走出大模型部署新手村!小明这样用魔搭×函数计算

阿里巴巴云原生

阿里云 云原生 函数计算

Databend 开源周报第 129 期

Databend

聚道云连接器实现航信与用友NC凭证对接,助力企业实现数字化转型

聚道云软件连接器

案例分享

OpenKruiseGame × KubeSphere 联合发布游戏服运维控制台,推动云原生游戏落地

阿里巴巴云原生

阿里云 开源 容器 云原生

强大的日志权限管理:多索引与访问规则的创新应用

观测云

日志 数据安全

「回看 Milvus 的 2023」:AI 热潮中的非典型向量数据库

Zilliz

Milvus 大模型 AIGC 向量数据库

运营商大模型,数字中国的一枚“落子”

脑极体

AI 大模型

如何查看苹果手机的CPU型号?

雪奈椰子

影视行业使用云电脑能有哪些好处?云电脑有什么优势

青椒云云电脑

云桌面 云电脑 云电脑平台

云原生离线工作流编排利器 -- 分布式工作流 Argo 集群

阿里巴巴云原生

阿里云 云原生

大数据与机器学习周报 第16期:谷歌BigQuery现在允许查询所有GitHub开源项目了_大数据_丁涛_InfoQ精选文章