写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉
2016-09-19 19:002551
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 10.3 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

spine动画文件转dragonbones骨骼文件

风翱

9月日更 dragonbones

大厂敲门砖!P9技术官级别的顶级并发编程宝典,献给想去大厂的你

Java 编程 面试 程序人生 p9

面对面小程序开源

OpenIM

流媒体:依托于声网的连麦解决方案

声网

音视频 流媒体

如何给技术部员工做考核?

石云升

团队管理 管理 引航计划 内容合集 9月日更

【SoCC2018论文】DAGOR:微信「大规模微服务过载控制系统」

OpenIM

上线半天下载量破100W!美团大佬的Java性能调优实战手册,超详细

Java 编程 面试 性能调优

北鲲云超算平台凝聚技术实力,赋能高算力需求行业加速发展

北鲲云

测试九剑之-破箭式

薛飞

自动化测试 测试管理

GraphQL 快速入门【1】简介

码语者

Rest graphql

【网络安全】Spring框架漏洞总结(一)

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

【得物技术】浅谈重复http请求的取消

得物技术

方法 HTTP 场景 crud 请求

kube-ovn 组网结构

Geek_f24c45

k8s Kube-OVN cni

用诸葛孔明的智慧,读懂新型数据中心的“四新”机遇与产业逻辑

脑极体

分分合合分分,谷歌医疗走向大败退

脑极体

如何从数据到资产

奔向架构师

数据治理 9月日更

Python——内置函数----让你偷懒的工具

在即

9月日更

网卡修改网速和buffer

耳东@Erdong

9月日更 网卡

京东云金秋上云特惠进行中!扫码参与活动

京东科技开发者

云计算 云主机 大促

联想新IT引擎引领智能化变革,助力“中国力量”更加强大

科技范儿

Elasticsearch 原理解析(介绍)

ZzC🍖

搜索引擎 elasticsearch

低代码时代来临,织信Informat携手低码星球探讨「企业数字化转型之路」

优秀

低代码

java拼团小程序源码(毕设)

清风

毕业设计

Python Qt GUI设计:UI界面可视化组件、属性概述(基础篇—4)

不脱发的程序猿

Python qt GUI设计 PyQt5

从零到MySQL架构师学习内容整理

hanaper

MySQL五个常见的高可用方案

hanaper

ebay支付账务系统架构解析之“读”一无二

贾奇 (Jacky)

支付系统 CQRS 读写分离

区块链技术解决信任问题

CECBC

数字化助力能源高效利用

CECBC

坍缩的企业

涛哥 数字产品和业务架构

企业架构

自定义aop实现Cacheable注解(零拷贝), CacheItemGet,CacheMapGet,CacheMapPut

张音乐

Java 缓存 注解 9月日更

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章