大数据与机器学习周报 第 5 期:Facebook 发布了新工具 AAT,盲人也可以“看到”图片内容了

阅读数:932 2016 年 4 月 11 日

话题:大数据语言 & 开发架构机器学习

新闻

  1. 《Facebook 发布了新工具 AAT,盲人也可以“看到”图片内容了》:Facebook 新发布了一个工具——自动选择文本( Automatic Alternative Text ,以下简称 AAT ),通过物体识别技术识别图像内容并读出相关文本,帮助盲人和视力障碍者 “看到” 网站上的图片。这个工具由 Facebook 的无障碍小组研发,他们已经在这一项工具的研发上花费了几个月的精力

  2. 《Salesforce 收购人工智能初创公司 MetaMind》:对于此次收购,MetaMind 的联合创始人兼 CEO Richard Socher 表示:“Salesforce 打算将 MetaMind 的技术融入到 Salesforce 的产品中去。对于 Salesforce 的非付费用户,MetaMind 产品将于 5 月 4 日 正式停止服务;对于 Salesforce 的付费用户,MetaMind 将于 6 月 4 日 正式停止服务。我们将在 4 月 11 日 后开始删除用户储存在上面的数据。”

  3. 《麻省理工学院推出“数据美国”大数据可视化工具》:数据美国”项目得益于美国总统奥巴马 2013 年签署的一项政务数据公开(Open Data)法令,要求所有新增政府数据都必须以电脑文件形式向企业、研究者和公众开放。当时的美国联邦政府 CIO Steven VanRoekel 以 GPS 和天气数据对公众开放催生导航市场为例,指出开放数据将推动企业创新。奥巴马认为,政务数据公开 OpenData 将刺激企业创新,增加就业机会,并提高政府执政效率

大数据

  1. 《深入对比数据科学工具箱:Python 和 R 之争》:本文从应用场景、数据流编程、数据可视化、速度等多个方面对 Python 和 R 做了对比

  2. 《Spark 在美团的实践》:大数据处理渗透到了美团各业务线的各种应用场景,选择合适、高效的数据处理引擎能够大大提高数据生产的效率,进而间接或直接提升相关团队的工作效率

  3. 《你的大数据项目使用的工具正确吗?》:工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets 网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具,并提供了调查的匿名原始数据

  4. 《专访卢亿雷:谈 Hadoop 生态的最新发展》:在 2016 年 Hadoop 十岁生日之际,InfoQ 策划了一个 Hadoop 热点系列文章,为大家梳理 Hadoop 这十年的变化,技术圈的生态状况,回顾以前,激励当下。本文是 InfoQ 处于一线开发的社区编辑对卢亿雷老师进行的采访,对大家关心的问题进行了专业的解答

  5. 《淘宝实战——教你数据挖掘好方法》:下面通过 4 种对应的场景来帮助读者理解数据挖掘的 4 种任务

  6. 《大数据到底在用什么姿势塑造我们》:从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值

机器学习

  1. 《硅谷认为人工智能是下一个热点》:当硅谷巨头们还在讨论最新的科技热潮是否正在滑向萧条时,关于什么会推动行业下一次井喷式发展的言论已经出现了。我们使用计算机的方式正在朝着这样一种趋势发展(如果以经验判断,这种趋势只是行业泡沫)——将海量数据储存在所谓的云计算中心,然后根据数据分析结果建立新的商业模式。与这种使用方式联系最紧密的词应该是 “机器学习” 和 “人工智能”,或者说是 “AI”。其所涉及市场催生的创新产品影响范围极广,从遍布全球的计算机系统到自助餐厅的支付方式

  2. 《谷歌大脑团队科学家出书了》

    经过两年半的努力,由谷歌大脑团队科学家 Ian Goodfellow, Yoshua Bengio and Aaron Courville 撰写 MIT 出版的《Deep Learning》,今天完成最终稿了,打印版本还需要些时日

  3. 《mxnet:结合 R 与 GPU 加速深度学习》:近年来,深度学习可谓是机器学习方向的明星概念,不同的模型分别在图像处理与自然语言处理等任务中取得了前所未有的好成绩。在实际的应用中,大家除了关心模型的准确度,还常常希望能比较快速地完成模型的训练。一个常用的加速手段便是将模型放在 GPU 上进行训练。然而由于种种原因,R 语言似乎缺少一个能够在 GPU 上训练深度学习模型的程序包

  4. 《将机器学习平台 H2O 应用于物联网》:H2O 是一个开源的、功能丰富的机器学习平台。它整合了 R 和 Spark,且因其易用性而出名。本文是对其应用于物联网领域的概览

  5. 《2025 年前实现大陆汽车无人驾驶技术纵览》:众所周知,勇于创新的互联网巨头谷歌在 2009 年启动了无人驾驶汽车的试验研究,作为一家非汽车制造商,此举也让欧美日各大汽车制造商的无人驾驶技术浮出水面。Tesla 甚至喊出要第一个将无人驾驶汽车推向市场。相比而言,汽车零部件巨头在自动驾驶领域的研发更显低调,今天我们就来看一看德国大陆汽车集团在这方面的技术储备


感谢杜小芳对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。