2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Android Smart Linkify API 背后的机器学习

  • 2018-08-23
  • 本文字数:918 字

    阅读完需:约 3 分钟

上周,谷歌发布了代号为 Pie 的 Android 9 。Android 正在推出一系列由人工智能提供支持的新功能。 Android Smart Linkify 是最重要的新 AI 功能之一。

Smart Linkify 建立在先前版本 Android Oreo 发布的 Smart Text Selection 之上。Smart Linkify 可以检测文本中的某些类型的实体(例如地址、电话号码)并添加可点击的链接,允许用户直接启动地图或拨打电话。它由设备内的前馈神经网络提供支持,每种语言大小仅 500KB,推理代码不超过 250KB。这个系统为几近实时的系统,在 Google Pixel 手机上计算时间短于 20 毫秒。

系统首先通过空格将输入文本拆分为单词,并计算最多 15 个单词所有可能的单词子序列。每个子序列被提供给神经网络,神经网络基于其有效性为它们分配 [0 … 1] 范围的值。在删除重叠实体后,系统为子序列打较高的分数。在整个过程的第一部分结束时,每个未知类型都有一个不重复单词子序列。

然后使用第二个神经网络来识别每个单词子序列的类型,无论是电话号码、地址还是未识别的实体。神经网络将上下文中的单词子序列作为输入。通过将子序列的前三个和后三个单词作为实体,将它们前面的五个单词作为左上下文,将随后的五个单词作为右上下文,然后将它们作为不同的特征来识别单词的含义。这个神经网络中一个有趣的优化是使用二进制特征来识别以大写字母开头的单词。其背后的原因是,邮政地址非常独特,使用这种方式更容易识别出来。

为了训练神经网络,谷歌团队从真实数据中生成了虚假样本。他们使用 Schema.org 注解的实体、地址、电话号码和随机单词的自定义列表合成了一个训练集。他们采用可观察的实体并用随机单词围绕它们达到更理想的结果。另外,有意生成负数据训练样本,让神经网络避免将“ID:”识别为电话号码。

国际化是这个功能的一个重要方面,根据测试,一种模型适用于所有拉丁语言,并可以为中文、日文、韩文、泰文、阿拉伯文和俄文添加单独的模型。目前,API 支持 16 种语言,未来几个月将支持更多语言。这些模型使用 TensorFlow 进行训练,自定义的推理库由 TensorFlow Lite 和 FlatBuffers 提供支持。开发人员可以通过 TextClassifier API generateLinks 方法开始使用 Smart Linkify。

查看英文原文 The Machine Learning behind Android Smart Linkify API

2018-08-23 07:441862
用户头像

发布了 731 篇内容, 共 480.6 次阅读, 收获喜欢 2008 次。

关注

评论

发布
暂无评论
发现更多内容

平顶山等保测评机构有哪些?电话多少?

行云管家

等保 等保测评 平顶山

堡垒机有远程协助解决难题功能吗?哪家的好用?

行云管家

网络安全 堡垒机

7thonline第七在线7大价值助力品牌实现智能化商品管理

第七在线

浅谈机器学习,聊聊训练过程,就酱!

蛋先生DX

神经网络 机器学习 深度学习

鸿蒙实战开发:网络层的艺术——优雅封装与搭建指南(下)

王二蛋和他的张大花

鸿蒙

TDengine 集群能力:超越 InfluxDB 的水平扩展与开源优势

TDengine

tdengine 时序数据库 数据库·

HyperWorks批处理网格的类型设置

智造软件

CAE软件 hyperworks BatchMesher

全能型系统优化软件:ccleaner pro mac中文汉化版

Rose

鸿蒙实战开发:网络层的艺术——优雅封装与搭建指南(上)

王二蛋和他的张大花

鸿蒙

IDEA中通义灵码的使用技巧

威哥爱编程

IDEA Java. 通义灵码 AI辅助

Python淘宝数据挖掘与词云图制作指南

代码忍者

API 接口 pinduoduo API

【CoCollider】让系统和应用适配如此简单

iofomo

开发 Android; ios 开发 应用适配 API 测试

鸿蒙网络编程系列43-仓颉版HttpRequest下载文件示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙OS创新实践:动态声控话筒开发指南

王二蛋和他的张大花

鸿蒙

鸿蒙网络编程系列44-仓颉版HttpRequest上传文件示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

CST软件如何实现S-parameter随其他参数变化的1D曲线

思茂信息

教程 cst cst仿真软件

数字身份发展趋势前瞻:身份即服务

芯盾时代

身份安全 iam Idaas SaaS应用

在昇腾Ascend 910B上运行Qwen2.5推理

GPUStack

AI 大模型 昇腾 生成式AI NPU

未来已来,软件行业的下一个风口在哪里?

天津汇柏科技有限公司

人工智能 软件

鸿蒙开发实战:揭秘页面与项目生命周期,实现精准监控

王二蛋和他的张大花

鸿蒙

畅享云边大模型!火山引擎 x 地瓜机器人,大模型网关能力免费开放

火山引擎边缘云

边缘计算 机器人 智能IoT边缘服务 大模型 边缘智能

Android Smart Linkify API背后的机器学习_移动_Alex Giamas_InfoQ精选文章