【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

谷歌推出云自然语言 API

  • 2016-09-04
  • 本文字数:1083 字

    阅读完需:约 4 分钟

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7 月 20 日,谷歌也加入进来,发布了测试版的云自然语言 API 。谷歌的 NLP API 让用户可以利用如下三个核心的 NLP 特性:

  • 情感分析——分析语言的基调,比如积极或消极;
  • 实体识别——识别语言中不同的实体,比如人或组织;
  • 语法分析——识别语言中的各种词性,比如句子 X 包含 3 个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其 API 与其他自建的数据科学工具的不同之处。

NLP 软件是一种构建用来理解人类语言或文本的程序。像谷歌和 IBM 这样的科技巨头发布了大量便于开发人员使用的 API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师 Sara Robinson 使用该 API 的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用 NLP API 的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照 Robinson 的说法,从头构建 NLP 软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种 NLP API,让用户可以利用 NLP 算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson 的 Conversation API 也是最近出现的 NLP API。借助该 API,你可以使用 NLP 解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API 有交互式的 Swagger 文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的 NLP API 面向更为广泛的 NLP 使用场景,而 Watson 的 API 主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的 IoT(物联网)技术构建。在 IoT 环境里,NLP 是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook 采取了一种更为直接的路线,即向更大的技术社区公布内部使用的 NLP 代码。今年 7 月,他们把词汇表征学习和句子分类库 fastText 的所有源代码都发布在了 GitHub 上。虽然开发人员不会完全忠于一个干净的 API,但能够从 Facebook 的代码创建分支,让开发人员可以在更高的层面上参与到现有的 NLP 数据科学社区。在社区环境里,这个库很容易衍生出更多的 NLP API 和库。无论形式如何,可以确定的是,NLP 离普通大众越来越近。

查看英文原文 Google Launches Cloud Natural Language API

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-09-04 19:005250
用户头像

发布了 1008 篇内容, 共 372.2 次阅读, 收获喜欢 340 次。

关注

评论

发布
暂无评论
发现更多内容

AI训练性能提升30%,阿里云发布GPU计算裸金属实例ebmgn7ex

云布道师

弹性计算

钉钉协作Tab前端进化之路

阿里技术

前端 钉钉

不降功能只降资源,六个应用场景带你了解OCP Express

OceanBase 数据库

数据库 oceanbase

【4月8日】Elastic 中国开发者大会 2023 议程预告

极限实验室

大数据 elasticsearch elastic 开源 开发者大会

ShareSDK Android SDK API

MobTech袤博科技

OceanBase 信息技术服务管理体系通过 ISO20000 认证和 ITSS 认证

OceanBase 数据库

数据库 oceanbase

魔法诗~~~一套基于Vue开发的实用、高端、炫酷的响应式前端网页!!!

京茶吉鹿

Vue 前端 网页设计

mysqldump 详解

GreatSQL

MySQL greatsql greatsql社区

首届OceanBase开发者大会|NineData首席架构师谭宇受邀参会,并发表了主题演讲

NineData

多云架构 数据管理 oceanbase 开发者大会 NineData

即时通讯技术文集(第11期):IM通信格式的选型及Protobuf专题 [共16篇]

JackJiang

网络编程 即时通讯 IM

百度内容理解推理服务FaaS实战——Punica系统

百度Geek说

云原生 Faas 成本优化 企业号 3 月 PK 榜 AI推理

kafka Log存储解析以及索引机制

石臻臻的杂货铺

kafka

一种自平衡解决数据倾斜的分表方法

京东科技开发者

数据倾斜 分布分表 企业号 3 月 PK 榜 B 端产品 数据分表

机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等

汀丶人工智能

数据挖掘 机器学习 决策树 LightGBM

揭秘网页性能监控|如何从多个角度分析监控结果

云智慧AIOps社区

监控 监控宝 网站监控 网页性能优化 监控产品

Nautilus Chain 首个生态基础设施 Poseiswap,公布空投规则

股市老人

履约核心引擎低代码化原理与实践

京东科技开发者

低代码 规则引擎 企业号 3 月 PK 榜 履约中心

Swift之struct二进制大小分析

京东科技开发者

swift App struct 移动开发 企业号 3 月 PK 榜

数仓安全测试之SSRF漏洞

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

软件工程高效学 | 实践工具:Microsoft Office Visio

TiAmo

开发工具 Visio绘图注释工具

c4d超强三维动画设计:CINEMA 4D Studio R2023.2.0 中文激活版

真大的脸盆

Mac Mac 软件 C4D

避免使用CSS @import 影响页面加载速度

南城FE

CSS css3 前端

java实现布隆过滤器

小小怪下士

Java 程序员 布隆过滤器

ChatGPT 开源了第一款插件,都来学习一下源码吧!

Python猫

Nautilus Chain 首个生态基础设施 Poseiswap,公布空投规则

EOSdreamer111

IntelliJ IDEA 2023.1 版本可以安装了

HoneyMoose

pytest学习和使用5-Pytest和Unittest中的断言如何使用?

Python 自动化测试 pytest 测试报告 Allure

ShareSDK Android端权限说明

MobTech袤博科技

Swift之struct二进制大小分析

京东科技开发者

swift 数据结构 struct 二进制 企业号 3 月 PK 榜

为什么 MySQL 不推荐使用 join?

Java你猿哥

Java MySQL sql 后端 ssm

Java开发新手必读:PO、VO、DAO、BO、DTO、POJO,区别在哪儿?

Java你猿哥

Java 后端 ssm Java工程师 Java基础知识点

谷歌推出云自然语言API_Google_Margot Krouwer_InfoQ精选文章