NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-09-19 19:002188
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91392 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

OAtuth2.0 知多少

圣杰

oauth2.0 dotnet

小结Spring中bean的作用域与生命周期

李楠

spring 生命周期 bean 作用域

智能云网:从时代所需,到运营商所向

脑极体

Java 训练营第一周习题:02 加载字节码文件

现实中游走

Java

第二次书摘的微信视频号直播复盘

小匚

用户体验

c语言函数与指针基础

赫鲁小夫

菜单展示的递归与非递归形式实现 (go语言版)

松小鼠

数据结构和算法

LeetCode题解:322. 零钱兑换,动态规划,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

区块链技术的价值传递

CECBC

区块链

量化炒币机器人软件系统开发|量化炒币机器人app开发

系统开发

Your small business questions, answered

小韩

【转】阿秀:C++经典49问49答

杨明越

产品训练营第五周作业

朱航

产品训练营第五周作业

产品经理训练营

云算力系统开发|云算力APP软件开发

系统开发

计算机内部的总线是什么

FishyFine

计算机结构

快速搭建本土「Clubhouse」

anyRTC开发者

ios android WebRTC RTC 语音通话

2021 iOS底层提升计划

iOS底层

最值得期待的Python进阶宝典《Effective Python》第2版中文版来咯!

华章IT

Python 代码整洁 Python编程 EffectivePython Python进阶

Python编程入门手记

吕湛全

2021华为软件精英挑战赛正式开启,冠军奖金20万!

2021华为软件精英挑战赛

华为 软件 比赛 软件挑战赛

2021最新总结:阿里/京东/饿了么/拼多多/爱奇艺面经分享(堪称Offer收割机)

比伯

Java 编程 架构 面试 计算机

Linux Jenkins 自动打包vue部署到远程window服务器

三爻

Vue jenkins Win

开源微服务运行时 Dapr 发布 1.0 版本

阿里巴巴云原生

开源 容器 微服务 开发者 云原生

作业5

赝品

jenkins Android 自动构建-扫码下载

三爻

助力文化荟萃,区块链或可打造“新”春晚?

CECBC

区块链 春晚

区块链技术带来金融服务的信任变革

CECBC

金融

关于零售业数字化势在必行的一些杰出观点

小刘在学习

新零售

编程常见必备知识

梦醒了

编程 链表 函数

量化机器人APP开发|量化机器人软件系统开发

系统开发

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章