AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

谷歌推出云自然语言 API

  • 2016-09-04
  • 本文字数:1083 字

    阅读完需:约 4 分钟

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7 月 20 日,谷歌也加入进来,发布了测试版的云自然语言 API 。谷歌的 NLP API 让用户可以利用如下三个核心的 NLP 特性:

  • 情感分析——分析语言的基调,比如积极或消极;
  • 实体识别——识别语言中不同的实体,比如人或组织;
  • 语法分析——识别语言中的各种词性,比如句子 X 包含 3 个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其 API 与其他自建的数据科学工具的不同之处。

NLP 软件是一种构建用来理解人类语言或文本的程序。像谷歌和 IBM 这样的科技巨头发布了大量便于开发人员使用的 API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师 Sara Robinson 使用该 API 的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用 NLP API 的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照 Robinson 的说法,从头构建 NLP 软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种 NLP API,让用户可以利用 NLP 算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson 的 Conversation API 也是最近出现的 NLP API。借助该 API,你可以使用 NLP 解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API 有交互式的 Swagger 文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的 NLP API 面向更为广泛的 NLP 使用场景,而 Watson 的 API 主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的 IoT(物联网)技术构建。在 IoT 环境里,NLP 是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook 采取了一种更为直接的路线,即向更大的技术社区公布内部使用的 NLP 代码。今年 7 月,他们把词汇表征学习和句子分类库 fastText 的所有源代码都发布在了 GitHub 上。虽然开发人员不会完全忠于一个干净的 API,但能够从 Facebook 的代码创建分支,让开发人员可以在更高的层面上参与到现有的 NLP 数据科学社区。在社区环境里,这个库很容易衍生出更多的 NLP API 和库。无论形式如何,可以确定的是,NLP 离普通大众越来越近。

查看英文原文 Google Launches Cloud Natural Language API

2016-09-04 19:005757
用户头像

发布了 1008 篇内容, 共 423.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

自动驾驶产品化竞备开启:百度Apollo如何定义量产车?

脑极体

作为一名后台开发人员,你必须知道的两种过滤器

C++后台开发

后台开发 后端开发 Linux服务器开发 C/C++后台开发 C/C++开发

@Entity 里面的 JPA 注解

Damon

7月月更

界面设计四大原则

空城机

设计模式 7月月更

Docker安装Elasticsearch、ik分词器、可视化工具

宁在春

Docker Elastic Stack 7月月更

阿里二面:什么是CAS?

Java永远的神

Java 程序员 面试 程序人生 CAS

OpenIM重大优化-消息按需加载 一致性缓存 uniapp发布

Geek_1ef48b

12张图+6K字图解ZGC垃圾回收器及调优技巧

程序员小毕

程序员 面试 程序人生 ZGC JVM

【Go实现】实践GoF的23种设计模式:观察者模式

元闰子

Go 设计模式 观察者模式 Go 语言

Protocol buffers 的问题和滥用

HoneyMoose

面试官:MySQL 数据库查询慢,除了索引问题还可能是什么原因?

Java全栈架构师

Java MySQL 数据库 面试 后端

参与开源社区还有证书拿?

玩转Devop和研发效能DevStream/DevLake

GitHub 开源 开发者 证书

Java开发环境配置 / Vscode搭建

攻城狮杰森

Java jdk 7月月更

Vue Router 守卫

程序员海军

Vue 7月月更

OpenIM重大升级-群聊读扩散模型发布 群管理功能升级

Geek_1ef48b

SpringBoot项目使用Tomcat为什么让大厂禁止?

Java程序员

Java 程序员 Sprint Boot

类的基础

GalaxyCreater

基于 Web SDK 实现视频通话场景 | 声网 SDK 教程

声网

视频 SDK 教程

7大专题详解SpringBoot,阿里这套SpringBoot全栈笔记真香

Java永远的神

Java 程序员 面试 程序人生 springboot

李宏毅《机器学习》丨7. Conclusion(总结)

AXYZdong

7月月更

OSI模型第一层:物理层,基石般的存在!

wljslmz

物理层 网络技术 OSI模型 7月月更

一时跳槽一时爽,一直跳槽一直爽?

KEY.L

7月月更

全新出品!Github总榜排行第七的SpringCloud生态全栈笔记我粉了

Java全栈架构师

Java 程序员 面试 微服务 SpringCloud

IntelliJ IDEA使用

GalaxyCreater

Java IDEA

做一个有职业操守的软件匠人

Bruce Talk

技术 敏捷 TDD Agile

python小知识-代码规范最佳实践

AIWeker

7月月更 pyhon小知识

mysql进阶(十九)SQL语句如何精准查找某一时间段的数据

No Silver Bullet

MySQL 7月月更 精确查找

深入浅出边缘云 | 1. 概述

俞凡

架构 边缘计算 网络 深入浅出边缘云

springMvc参数获取

沃德

Java 7月月更

图的存储结构与方法(二)

乔乔

7月月更

多线程&高并发(全网最新:面试题+导图+笔记)面试手稳心不慌

冉然学Java

Java 编程 多线程并发 高并发系统 资料分享

谷歌推出云自然语言API_Google_Margot Krouwer_InfoQ精选文章