AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

谷歌推出云自然语言 API

  • 2016-09-04
  • 本文字数:1083 字

    阅读完需:约 4 分钟

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7 月 20 日,谷歌也加入进来,发布了测试版的云自然语言 API 。谷歌的 NLP API 让用户可以利用如下三个核心的 NLP 特性:

  • 情感分析——分析语言的基调,比如积极或消极;
  • 实体识别——识别语言中不同的实体,比如人或组织;
  • 语法分析——识别语言中的各种词性,比如句子 X 包含 3 个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其 API 与其他自建的数据科学工具的不同之处。

NLP 软件是一种构建用来理解人类语言或文本的程序。像谷歌和 IBM 这样的科技巨头发布了大量便于开发人员使用的 API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师 Sara Robinson 使用该 API 的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用 NLP API 的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照 Robinson 的说法,从头构建 NLP 软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种 NLP API,让用户可以利用 NLP 算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson 的 Conversation API 也是最近出现的 NLP API。借助该 API,你可以使用 NLP 解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API 有交互式的 Swagger 文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的 NLP API 面向更为广泛的 NLP 使用场景,而 Watson 的 API 主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的 IoT(物联网)技术构建。在 IoT 环境里,NLP 是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook 采取了一种更为直接的路线,即向更大的技术社区公布内部使用的 NLP 代码。今年 7 月,他们把词汇表征学习和句子分类库 fastText 的所有源代码都发布在了 GitHub 上。虽然开发人员不会完全忠于一个干净的 API,但能够从 Facebook 的代码创建分支,让开发人员可以在更高的层面上参与到现有的 NLP 数据科学社区。在社区环境里,这个库很容易衍生出更多的 NLP API 和库。无论形式如何,可以确定的是,NLP 离普通大众越来越近。

查看英文原文 Google Launches Cloud Natural Language API

2016-09-04 19:005766
用户头像

发布了 1008 篇内容, 共 424.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

安全系列之——RSA的前世今生

诸葛小猿

安全 加密解密 非对称加密 rsa

没想到 Hash 冲突还能这么玩,你的服务中招了吗?

程序猿石头

Java 安全攻防 后端 hashmap hash

OMG组织的企业架构建模规范

周金根

影响企业架构项目成功的8个重要步骤

周金根

股权交易中心+区块链试点将开始

CECBC

防篡改 股权交易 可追溯 信息存证

设计模式之外观模式解析

Seven七哥

程序员 设计模式 外观模式

JVM系列-读懂 GC 日志

Rayjun

Java JVM GC

在线互动课堂低延迟交互利器:高性能异步化设计与监控

徐敏

线程模型 异步 Task 在线课堂

Zookeeper从入门到放弃之Zookeeper典型应用场景

小隐乐乐

zookeeper 分布式 分布式锁

LeetCode题解:206. 反转链表,JavaScript,While循环迭代,详细注释

Lee Chen

大前端 LeetCode

企业架构实施简介

周金根

【总结】性能优化2

小胖子

Java架构-不要成为项目风险的奴隶

我是苞谷

Java

癌症筛查清单

Lee Chen

大前端 随笔杂谈

TOGAF实用教程(IT帮)

周金根

编程核心能力之重构

顿晓

学习 重构

ARTS WEEK6

紫枫

ARTS 打卡计划

性能测试 + 操作系统 + 锁

鲁米

Java架构-代码分层的设计之道

我是苞谷

比 996 更可怕的是职场 PUA

非著名程序员

职场 职场成长 职场误区 职场 PUA

面试题:Java 中的 ==, equals 与 hashCode 的区别与联系

简爱W

【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏

华为云开发者联盟

容器 层次 API 网关 华为云

区块链如何切入供应链金融市场?

CECBC

高并发系统设计要点

南方有乔木兮

Java

搞事情?Spring Boot今天一口气发布三个版本

YourBatman

Spring Boot 新特性

如何去学好JS的8条小建议

华为云开发者联盟

html 编程 大前端 js 代码

浅析区块链如何改变生活

CECBC

数字银行 供应链 身体监测 资产管理

Golang新手常犯错误之【循环迭代篇】

卓丁

常见错误 引用迭代 Go 语言

应用程序研发之基础知识分层与进化

superman

Unix路径是如何简化算法,架构师性能优化 John 易筋 ARTS 打卡 Week 10

John(易筋)

ARTS 打卡计划

拥抱400GE新引擎,跨越新基建的时代龙门

脑极体

谷歌推出云自然语言API_Google_Margot Krouwer_InfoQ精选文章