红帽白皮书新鲜出炉!点击获取,让你的云战略更胜一筹! 了解详情
写点什么

Android Smart Linkify API 背后的机器学习

  • 2018-08-23
  • 本文字数:918 字

    阅读完需:约 3 分钟

上周,谷歌发布了代号为 Pie 的 Android 9 。Android 正在推出一系列由人工智能提供支持的新功能。 Android Smart Linkify 是最重要的新 AI 功能之一。

Smart Linkify 建立在先前版本 Android Oreo 发布的 Smart Text Selection 之上。Smart Linkify 可以检测文本中的某些类型的实体(例如地址、电话号码)并添加可点击的链接,允许用户直接启动地图或拨打电话。它由设备内的前馈神经网络提供支持,每种语言大小仅 500KB,推理代码不超过 250KB。这个系统为几近实时的系统,在 Google Pixel 手机上计算时间短于 20 毫秒。

系统首先通过空格将输入文本拆分为单词,并计算最多 15 个单词所有可能的单词子序列。每个子序列被提供给神经网络,神经网络基于其有效性为它们分配 [0 … 1] 范围的值。在删除重叠实体后,系统为子序列打较高的分数。在整个过程的第一部分结束时,每个未知类型都有一个不重复单词子序列。

然后使用第二个神经网络来识别每个单词子序列的类型,无论是电话号码、地址还是未识别的实体。神经网络将上下文中的单词子序列作为输入。通过将子序列的前三个和后三个单词作为实体,将它们前面的五个单词作为左上下文,将随后的五个单词作为右上下文,然后将它们作为不同的特征来识别单词的含义。这个神经网络中一个有趣的优化是使用二进制特征来识别以大写字母开头的单词。其背后的原因是,邮政地址非常独特,使用这种方式更容易识别出来。

为了训练神经网络,谷歌团队从真实数据中生成了虚假样本。他们使用 Schema.org 注解的实体、地址、电话号码和随机单词的自定义列表合成了一个训练集。他们采用可观察的实体并用随机单词围绕它们达到更理想的结果。另外,有意生成负数据训练样本,让神经网络避免将“ID:”识别为电话号码。

国际化是这个功能的一个重要方面,根据测试,一种模型适用于所有拉丁语言,并可以为中文、日文、韩文、泰文、阿拉伯文和俄文添加单独的模型。目前,API 支持 16 种语言,未来几个月将支持更多语言。这些模型使用 TensorFlow 进行训练,自定义的推理库由 TensorFlow Lite 和 FlatBuffers 提供支持。开发人员可以通过 TextClassifier API generateLinks 方法开始使用 Smart Linkify。

查看英文原文 The Machine Learning behind Android Smart Linkify API

2018-08-23 07:441201
用户头像

发布了 731 篇内容, 共 432.0 次阅读, 收获喜欢 1996 次。

关注

评论

发布
暂无评论
发现更多内容

如何删除/替换3D模型的材质贴图

3D建模设计

材质合批 材质修改 材质贴图 材质纹理

京东哥伦布即时设计平台ChatGPT落地实践 | 京东云技术团队

京东科技开发者

前端 ChatGPT 即时设计

HarmonyOS:使用MindSpore Lite引擎进行模型推理

HarmonyOS开发者

HarmonyOS

认证LeSS实践者课程 - 2024.1,广州

ShineScrum捷行

大规模敏捷

从技术角度分析如何选择灰度测试方式

Onegun

功能测试 灰度测试

JAVA基于物联网技术的智慧校园电子班牌原生微信小程序源码

源码星辰

智慧校园管理系统

数据驱动国有企业数智化转型,平台底座将发挥重要作用

用友BIP

数据驱动

云教室服务器配置详解

青椒云云电脑

云教室 云教室解决方案

JetBrains DataGrip 2023 Mac v2023.3.1中文激活版

影影绰绰一往直前

一招MAX降低10倍,现在它是我的了 | 京东云技术团队

京东科技开发者

缓存 性能优化 缓存优化 OHC

软件测试/人工智能|教你掌握 Conda 的基本用法

霍格沃兹测试开发学社

数据中台即服务——数据中台的四大支柱

用友BIP

如何创建逼真的3D模型

3D建模设计

材质修改 材质贴图 材质纹理

JetBrains RubyMine 2023 for Mac:Ruby开发的最佳拍档

影影绰绰一往直前

模型放置到3D场景中后模型位置与鼠标选中的位置不一致怎么办?

3D建模设计

材质合批 材质修改 材质贴图 材质纹理

38 | 分治算法:谈一谈大规模计算框架MapReduce中的分治思想

鲁米

Beyond Compare 4 for Mac:你的团队协作神器

影影绰绰一往直前

39 | 回溯算法:从电影《蝴蝶效应》中学习回溯算法的核心思想

鲁米

阿里云人工智能平台PAI多篇论文入选EMNLP 2023

阿里云大数据AI技术

AI

中国如何才能出世界级零售企业?

第七在线

最佳实践 | 第七在线智能采购计划助力全渠道销售决策

第七在线

云桌面的应用场景及利弊

青椒云云电脑

云桌面 云电脑 云桌面系统

Adobe Acrobat Pro DC 2023 for Mac:打造高效文档处理体验

影影绰绰一往直前

云桌面技术的革新

青椒云云电脑

桌面云 云桌面

分布式基础概念-消息中间件[Kafka]

派大星

大数据 Java 面试题

11种编程语言中,返回多个不同类型的方法样例

华为云开发者联盟

编程语言 开发 华为云 华为云开发者联盟

摆脱Excel 寻求现代零售智能化管理的出路

第七在线

GLB/GLTF 模型压缩轻量化

3D建模设计

材质合批 材质修改 材质贴图 材质纹理

第七在线(7thonline):助力零售业解决发展难题,驱动智能化转型

第七在线

CNCF首个云原生多云容器编排项目Karmada正式晋级孵化

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟

桌面云的发展前景与机遇

青椒云云电脑

桌面云 云桌面 云桌面厂家

Android Smart Linkify API背后的机器学习_移动_Alex Giamas_InfoQ精选文章