写点什么

谷歌推出云自然语言 API

  • 2016-09-04
  • 本文字数:1083 字

    阅读完需:约 4 分钟

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7 月 20 日,谷歌也加入进来,发布了测试版的云自然语言 API 。谷歌的 NLP API 让用户可以利用如下三个核心的 NLP 特性:

  • 情感分析——分析语言的基调,比如积极或消极;
  • 实体识别——识别语言中不同的实体,比如人或组织;
  • 语法分析——识别语言中的各种词性,比如句子 X 包含 3 个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其 API 与其他自建的数据科学工具的不同之处。

NLP 软件是一种构建用来理解人类语言或文本的程序。像谷歌和 IBM 这样的科技巨头发布了大量便于开发人员使用的 API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师 Sara Robinson 使用该 API 的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用 NLP API 的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照 Robinson 的说法,从头构建 NLP 软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种 NLP API,让用户可以利用 NLP 算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson 的 Conversation API 也是最近出现的 NLP API。借助该 API,你可以使用 NLP 解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API 有交互式的 Swagger 文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的 NLP API 面向更为广泛的 NLP 使用场景,而 Watson 的 API 主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的 IoT(物联网)技术构建。在 IoT 环境里,NLP 是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook 采取了一种更为直接的路线,即向更大的技术社区公布内部使用的 NLP 代码。今年 7 月,他们把词汇表征学习和句子分类库 fastText 的所有源代码都发布在了 GitHub 上。虽然开发人员不会完全忠于一个干净的 API,但能够从 Facebook 的代码创建分支,让开发人员可以在更高的层面上参与到现有的 NLP 数据科学社区。在社区环境里,这个库很容易衍生出更多的 NLP API 和库。无论形式如何,可以确定的是,NLP 离普通大众越来越近。

查看英文原文 Google Launches Cloud Natural Language API

2016-09-04 19:005855
用户头像

发布了 1008 篇内容, 共 433.1 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

青椒云如何通过云桌面实现移动图形工作站

青椒云云电脑

图形工作站 移动图形工作站

从打点平台谈打点治理

百度Geek说

数据质量 企业号 6 月 PK 榜 打点平台 打点治理

如何将您的 API 管理从 Postman 迁移到 Apifox:详细步骤

Apifox

Postman Apifox API 接口工具 API 接口

成就数智企业!用友BIP构建AI+全场景智能服务

用友BIP

浅析Spring中Async注解底层异步线程池原理

得物技术

Java spring 企业号2024年6月PK榜

从“数据孤岛”、Data Fabric(数据编织)谈逻辑数据平台

Aloudata

数据孤岛 数据虚拟化 Data Fabric 数据编织

selenium滑块解锁实现的研究

霍格沃兹测试开发学社

IM跨平台技术学习(十一):环信基于Electron打包Web IM桌面端的技术实践

JackJiang

网络编程 即时通讯 IM

TiKV 源码分析之 PointGet

vivo互联网技术

TiKV PointGet

旅游行业电商平台:数字化转型的引擎与未来发展趋势

天津汇柏科技有限公司

数字化转型 电商平台 旅游数智化

首期“软件企业 AI 开发提效实战营”成功举办

阿里巴巴云原生

人工智能 阿里云 云原生

解决`LocalStorage.getShared()`返回undefined的问题

彭康佳

android 鸿蒙

AI+财务丨以共享智能化为牵引,缔造全链路的无人值守能力

用友BIP

首期“软件企业 AI 开发提效实战营”成功举办

阿里云云效

人工智能 阿里云 云原生

直播预约丨《指标体系建设实战》第三期:指标平台功能架构及落地实践

袋鼠云数栈

指标体系 数据指标 指标 指标平台 指标建设

以 ZGC 为例,谈一谈 JVM 是如何实现 Reference 语义的

bin的技术小屋

ZGC JVM GC

解决@LocalStorageProp值未更新问题的详细指南

彭康佳

android 华为 鸿蒙 ArxUI

2024福建等保测评公司有哪些?分别叫做什么名字?

行云管家

等保 等保测评 福建

Apple vision pro空间计算,定义全新交互体验

AR玩家

AR AR眼镜 Rokid Vision pro 炬目AR

用移动图形工作站做设计是种什么样的体验?

青椒云云电脑

图形工作站 移动图形工作站

移动图形工作站有哪些价格实惠的推荐?

青椒云云电脑

图形工作站 移动图形工作站

文献解读-流行病学-第九期|《与Covid-19严重程度相关的免疫基因先天性缺陷的罕见变异》

INSVAST

基因数据分析 生信服务

五月答谢 - 清凉礼包大派送,先到先得

Laval小助手

实现全国算力互联互通,我们是认真的!

天翼云开发者社区

云计算 算力

谷歌推出云自然语言API_Google_Margot Krouwer_InfoQ精选文章