【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-09-19 19:002186
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91329 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

话说性能那些事

朱月俊

Cmder 使用 笔记

wkq2786130

cmder tools

K8S 中的 Grafana 数据持久化

耳东@Erdong

Kubernetes k8s Grafana 配置文件持久化

架构师训练营第7周

大丁💸💵💴💶🚀🐟

写在《SRE生存指南》出版之际

冯文辉

DevOps SRE

随着并发的增加,响应时间和吞吐的变化

朱月俊

问题驱动

学习 问题驱动

jvm-config

wkq2786130

Java JVM

OrientDB etl 工具 导入 rdbms数据

wkq2786130

过早三件套之面窝

zhoo299

美食

MySQL 锁表后快速解决方法 及 锁表原因

wkq2786130

MySQL

elasticsearch 游标 使用

wkq2786130

elasticsearch

性能优化-架构师体现技术全面性的时刻

LEAF

elasticsearch-restful-api笔记

wkq2786130

elasticsearch

jqGrid表格封装和使用方法

Seven_xw1213

Java 大前端 封装 jqgrid

百万并发「零拷贝」技术系列之初探门径

码农神说

Java 架构 零拷贝

第7周总结+作业

林毋梦

neo4j load csv 使用

wkq2786130

canal 笔记

wkq2786130

MySQL canal

JVM性能调优监控工具 jps jstat jinfo jmap jhat jstack

wkq2786130

Java JVM

neo4j 批量 导入 数据 的 几种方式

wkq2786130

neo4j

GoF设计模式 | 单例模式

Peision

Java 后端 23种设计模式

GoF设计模式 | 工厂方法模式

Peision

Java 23种设计模式

Scrapy爬虫入门

烫烫烫个喵啊

python 爬虫

架构师训练营第7周

大丁💸💵💴💶🚀🐟

架构师训练营第七周学习总结

fenix

极客大学架构师训练营

Neo4j APOC 使用

wkq2786130

neo4j apoc

解决 EXT4 使用无法挂载

耳东@Erdong

ext4 journal

手撕设计模式

Peision

Java 后端 设计模式 23种设计模式

蚂蚁金服上市了,我不想努力了

YourBatman

IPO 财务自由 蚂蚁金服 财富自由

一张PDF了解JDK11 GC调优秘籍-附PDF下载

程序那些事

Java jdk GC 秘籍 JDK11

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章