阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

大数据与机器学习周报 第 21 期:Facebook 开源快速文本分类工具 fastText

  • 2016-08-22
  • 本文字数:1079 字

    阅读完需:约 4 分钟

业界新闻

  1. Facebook 开源快速文本分类工具 fastText :Facebook 今天开源了其 AI 构建机器人的研究:fastText。fastText 可以将文本分类的训练时间从几天缩短到几秒!
  2. 北京发布大数据发展计划:两年内,北京将建成电子证照库,市民同一种证照只需要提交一次就可在多个政府部门间互通使用
  3. 自动驾驶大战在即 现代汽车找 Google 结盟?:当今车坛最热门的话题,莫过于自动驾驶技术,无论大小车厂,都卯足全力投入其中,就怕在这波潮流中落后,韩国车厂现代(Hyundai)也很清楚这一点,在手上缺乏相关技术的情况下,寻求外部合作的可能性相当高

技术干货

  1. 10 亿级流数据交互查询,为什么抛弃 MySQL 选择 VoltDB?:大数据时代,随着数据量的爆炸式增长,对于数据的处理速度要求也越来越高,以往基于 MySQL 的数据处理方案已无法满足大吞吐、低延迟的写入和高速查询的场景;百分点总结出了一套完整的解决方案,本文就带你一同了解 VoltDB 在流数据交互查询的应用实践
  2. 每天近百亿条用户数据,携程大数据高并发应用架构涅槃:互联网二次革命的移动互联网时代,如何吸引用户、留住用户并深入挖掘用户价值,在激烈的竞争中脱颖而出,是各大电商的重要课题。通过各类大数据对用户进行研究,以数据驱动产品是解决这个课题的主要手段,携程的大数据团队也由此应运而生;经过几年的努力,大数据的相关技术为业务带来了惊人的提升与帮助
  3. Yelp 的实时流技术:利用 MySQLStreamer 将数据库变更发送给 Kafka :这是关于 Yelp 的实时流数据基础设施系列文章的第二篇。这个系列会深度讲解我们如何用“确保只有一次”的方式把 MySQL 数据库中的改动实时地以流的方式传输出去,我们如何自动跟踪表模式变化,如何处理和转换流,以及最终如何把这些数据存储到 Redshift 或 Salesforce 之类的数据仓库中去

深度观点

  1. 深度 | 机器学习敲门砖:任何人都能看懂的 TensorFlow 介绍:本文是日本东京 TensorFlow 聚会联合组织者 Hin Khor 所写的 TensorFlow 系列介绍文章的前两部分,自称给出了关于 TensorFlow 的 gentlest 的介绍。这两部分谈到单一特征问题的线性回归问题以及训练(training)的含义,机器之心将继续关注本系列文章的后续更新
  2. 业界 | 微软研究院 Microsoft Translator 产品战略总监:智能翻译背后的技术和愿景:世界越来越小,全球协作、共同创新已经成为常态。在微软研究院,我们对此尤为感同身受——从北京到雷德蒙,从剑桥到班加罗尔,全球范围内的无边界沟通与协作是我们科研合作与产品创新的关键基础。全球一体化带来的发展机遇应该属于每个人,为了帮助全球各地的人们跨越语言的障碍,实现高效沟通与广泛协作,我们带来了 Microsoft Translator

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-08-22 19:002383
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 91370 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

机器学习会取代数据科学吗?

3D建模设计

机器学习

【高危】WPS Office 远程代码执行漏洞(WPSSRC-2023-0701绕过) (MPS-qjky-hw9x)

墨菲安全

网络安全 漏洞 WPS Office

AIGC如何借AI Agent落地?TARS-RPA-Agent破解RPA与LLM融合难题

王吉伟频道

RPA AIGC autogpt AI大语言模型 AI Agent

中小企业建站,采购云服务器上需注意什么?

YG科技

YashanDB获强制性国家标准GB 18030-2022最高级别认证

YashanDB

火山引擎云调度GTM“同城容灾”与“异地多活”实践

火山引擎边缘云

容灾 容灾备份 容灾多活

C++函数重载

智趣匠

如何使用图形数据库构建实时推荐引擎

3D建模设计

数据分析 数据工程

CloudEon入选开源中国最有价值开源项目(GVP)

CloudEon开源

服务质量不能掉链子,中小企业采购云服务器为何更要选择大厂?

YG科技

Presto 设计与实现(七):Event

冰心的小屋

数据湖 Event presto presto 设计与实现

当高并发来袭:StarRocks Query Cache 一招搞定!

StarRocks

数据库 后端 高并发 StarRocks 湖仓一体

制造业为什么要数字化?

优秀

制造业数字化

连接未来 驱动创新|腾讯云 CODING DevOps 主题沙龙诚邀您的参与

CODING DevOps

金融场景的“四边形战士”,容联云赤兔大模型向行业飞驰

脑极体

金融 AI大模型

对话无服务器专家 Luca Mezzalira:你真的为 Serverless × AI 做好准备了吗?

亚马逊云科技 (Amazon Web Services)

Java 人工智能

【严重】Smartbi windowUnloading 限制绕过导致远程代码执行 (MPS-e2z8-wdi6)

墨菲安全

网络安全 漏洞

【高危】致远A8前台上传解压漏洞 (MPS-6tdh-8qpu)

墨菲安全

网络安全 漏洞 致远

对 JDK8 新出的Optional类的探索与思考

emanjusaka

Java jdk 后端

精进语言模型:探索LLM Training微调与奖励模型技术的新途径

汀丶人工智能

自然语言处理 强化学习 深度强化学习 LLM模型

使用大型语言模型进行自主视觉信息搜索

3D建模设计

LLM 大语言模型

谁能代表中国软件的未来

B Impact

采购云服务器安全与成本不可兼得?云耀云服务器L或许可以了解一下

轶天下事

使用 OpenAI GPT 模型的最佳实践

3D建模设计

人工智能 openai GPT

利用 XGBoost 进行时间序列预测

3D建模设计

机器学习

低代码开发平台能开发什么类型的系统和软件?

优秀

低代码开发平台

企业新业务拓展,云耀云服务器L实例能否助其进行快速开发

YG科技

初创公司预算有限,在云服务器选择上应该如何选择?

YG科技

ARTS 打卡第 13 天

自由

ARTS 打卡计划

领域驱动设计(DDD): 三层架构到DDD架构演化

付威

领域驱动设计

第二期YCA认证培训圆满结束!

YashanDB

大数据与机器学习周报 第21期:Facebook 开源快速文本分类工具fastText_大数据_丁涛_InfoQ精选文章