在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉
2016-09-19 19:002789
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 11.1 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

不一样的ECS U实例

六月的雨在InfoQ

MySQL nginx 阿里云ECS U 6 月 优质更文活动

WiFi7来了,WiFi6会下岗吗?

脑极体

wifi

综合指南|如何为平台工程选择关键 KPI

SEAL安全

KPI 平台工程

Disk Xray for Mac:Mac磁盘精准分析工具

背包客

macos Mac软件 MacBook Pro Mac磁盘管理 Disk Xray

线性代数(一)矩阵和方程组

Studying_swz

6 月 优质更文活动

小程序的快速渲染机制是如何实现的?

Onegun

小程序 移动应用开发 小程序容器

常用的表格检测识别方法-表格内容识别方法

合合技术团队

文字识别 表格识别 表格检测

阿里云PAIx达摩院GraphScope开源基于PyTorch的GPU加速分布式GNN框架

阿里云大数据AI技术

人工智能 机器学习 gpu GNN 企业号 6 月 PK 榜

易安联新品EnDTA天织·DNS威胁分析平台,开放公测!

权说安全

DNS 零信任 威胁检测

一小时快速拆解 Milvus 2.2.9

Zilliz

非结构化数据 Milvus Zilliz 向量数据库 zillizcloud

YRCloudFile 分布式存储加速基因测序 解锁生命密码

焱融科技

WiFi7来了,WiFi6会下岗吗?

白洞计划

wifi

TiDB 7.1 LTS 发版:为关键业务提供业务稳定性和多租户场景支持

PingCAP

数据库 开源 TiDB

linux常见命令总结

Studying_swz

6 月 优质更文活动

助力数字门户搭建--小程序容器技术

没有用户名丶

Kubernetes关键组件解析

穿过生命散发芬芳

k8s 6 月 优质更文活动

平凯星辰重磅支持 2023 开放原子全球开源峰会,开源数据库分论坛成功召开

编程猫

AIGC繁花,绽放在精耕的算力土壤之上

脑极体

AI 服务器

更好的保护你的数据KEY

坚果

6 月 优质更文活动

Django笔记四十二之model使用validator验证器

Hunter熊

Python django model validator

用友发布《数智化赋能泛地产行业高质量发展白皮书》,推动地产行业数智化3.0

用友BIP

VMware虚拟机和主机传输文件

ThreadLocal变量存储为什么不用Map

M

原创 ThreadLocal Java'

魏可伟受邀参加 2023 开放原子全球开源峰会

KaiwuDB

KaiwuDB 2023开放原子全球开源峰会

C语言编程—内存管理

芯动大师

C语言 内存管理 6 月 优质更文活动

Capture One Pro 23 for Mac(Raw图像处理软件) 中文最新版

背包客

深度学习 macos Mac软件 图像处理软件 Capture One

ICASSP 2023 | 深度窄带网络消除实时语音通信中的干扰音

阿里技术

实时语音 音频处理

证券行业异构系统众多,微服务和网格如何全都要

网易数帆

微服务 云原生 服务网格 证券行业

STM32单片机上RGB数据转为JPEG格式办法

DS小龙哥

6 月 优质更文活动

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章