写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉
2016-09-19 19:002657
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 10.6 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

LED显示屏与OLED显示屏的天壤之别

Dylan

技术 LED LED display OLED LED屏幕

区块链ETF系统的开发步骤

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

奇瑞重塑安全底线:最“胆小”的车企,如何成为安全规则制定者?

科技热闻

RAG创始人关于RAG Agent的10个思考(下)

Bruce Talk

AI RAG知识库

我这是“小作坊”,没那么多时间为爱奉献!

程序员郭顺发

易安联完成C1轮融资,加速领跑国内零信任安全市场化

权说安全

零信任

Uniapp开发鸿蒙应用时如何运行和调试项目

幽蓝计划

StarRocks MCP Server 开源发布:为 AI 应用提供强大分析中枢

StarRocks

数据分析 OLAP StarRocks MCP Server

通义灵码新增Inline Chat能力,代码问题即时提问

阿里巴巴云原生

通义灵码 通义灵码2.0

时序数据库、实时数据库与实时数仓:如何为实时数据场景选择最佳解决方案?

镜舟科技

数据分析 数据处理 时序数据库 实时数据库 实时数据仓库

2025 StartDT Day 产品发布会,5月20日见!

奇点云

大模型

MoE大模型迎来“原生战友”:昇腾超节点重构AI基础设施

Alter

AI 大模型 昇腾AI MoE

StarRocks Community Monthly Newsletter (Apr)

StarRocks

数据库 数据分析 存算分离 StarRocks 数据查询

MES如何破解工厂交期困局?MES让设备主动报工,生产过程实时可控!

万界星空科技

数字化 制造业 智能制造 mes 万界星空科技mes

海量文件一键“电子收纳”,合合信息扫描全能王“AI工具箱”获律师群体青睐

合合技术团队

文档管理 #人工智能 #大数据

《算法导论(第4版)》阅读笔记:p82-p82

codists

算法

Nagarro发布多项财年业绩

财见

等保测评2025 版新报告模板,是以哪个时间节点为准?

黑龙江陆陆信息测评部

【FAQ】HarmonyOS SDK 闭源开放能力 —Vision Kit (3)

HarmonyOS SDK

harmoyos

通义灵码新增Inline Chat能力,代码问题即时提问

阿里云云效

AI 通义灵码

Ascend的aclgraph(一)aclgraph是什么?torchair又是怎么成图的?

zjun

Ascend pytroch aclgraph

Ascend的aclgraph(二)_npu_backend中还有些什么秘密?

zjun

Ascend pytroch aclgraph

新一代SRE:AI、可观测与未来丨暨2025第三届中国SRE大会,邀您共赴科技盛宴!

雅菲奥朗

为什么在中国开源软件赚不到钱?

雅菲奥朗

#开源

《算法导论(第4版)》阅读笔记:p83-p85

codists

算法

Amazon Q 从入门到精通 – 测试与重构

亚马逊云科技 (Amazon Web Services)

你知道什么是中间件吗?国产中间件有哪些品牌?

行云管家

中间件 信创 堡垒机 国产化

RAG创始人关于RAG Agent的10个思考(上)

Bruce Talk

AI RAG知识库

腾讯云COS MCP Server + CodeBuddy ,让你的idea 不止停留在想象中...

六月的雨在InfoQ

MCP MCP Server MCP头号玩家

10K Stars 成就达成,StarRocks 开启下一个里程碑!

StarRocks

数据库 AI OLAP StarRocks

如何用好“对话式编程”?牢记这十二条策略

Baihai IDP

程序员 AI LLM AI Agent AI 编程

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章