写点什么

Apple 是如何进行实时手写汉字识别的

  • 2017-12-25
  • 本文字数:1192 字

    阅读完需:约 4 分钟

Apple详细介绍了他们用于进行手写中文汉字识别的实时机器学习引擎,该引擎支持近 30,000 个汉字。据 Apple 所说,随着字符池大小的增加,该模型的精度的降低程度仅呈渐进分布。这使得研究人员能够识别像 GB18030-2005 这种大字符集中的汉字,其精确度仅比识别 GB2312-80 这种小字符集中的汉字的精确度略低一点。

中国国家标准字符集 GB18030-2005 包含 27,533 个条目,这么多的汉字使得多年以来键盘的实现颇具挑战性,因此一个手写识别器的价值在使用中文的人群中不言而喻。多年以来,随着时间和地域的变化,许多中文也已经被演变出了不同的版本。潜在字符值的庞大语料库、书写方式的不同、每个人独特的手写风格的属性和特质使得中文手写识别问题成为了一个极具挑战性的机器学习问题。

卷积神经网络(CNN)通常用于解决图像识别和标记相关的机器学习问题。文章中提到的早期的研究方法经过了一段时间的模型方法的演变,笔顺在将剩余字符切分子集的概率中所产生的影响很大,早期模型希望在匹配的过程中能够产生更多的可能性。

虽然早期识别算法主要依赖于基于笔顺分析的结构方法,但在之后,需要实现笔顺无关的方法,因此激发了对使用整体形状信息的统计方法的兴趣。这显然会使大语料库的识别变得复杂,因为正确的字符分类往往会随着分类的数量而变得更加困难。

在基于笔顺的方法中,应用到大字符集时暴露出了许多问题。对于每一个n个笔顺的汉字来说,随着字符集的增大,计算的复杂性和计算开销大大提升。这使得 Apple 的研究员们使用一种更倾向于“形状驱动(shape driven)”的方法,它是不依赖于笔顺的。

Apple 所使用的方法类似于基于 MNIST 的一种在拉丁文手写识别上很好用的方法,在这种方法中 CNN(Convolutional Neural Networks)是行业标准。但是,对于 3 万多汉字的实时识别来说,使用 CNN 就显得很具有挑战性了。字符库之间的冲突和模糊性为该问题增加了额外的复杂性。

快速的书写会导致书写的样式呈曲线化,这会增加识别的不确定性。比如,对于 U+738B (王) and U+4E94 (五)的识别。最后,国际化会导致意想不到的冲突:例如,汉字 U+4E8C (二)的草体很有可能会和拉丁文中的“2”或者“Z”产生冲突。

每一个手写输入都会被转换成为一个 48 x 48 像素的图像,该图像用于表示原始字符。这是第一个被输入到剩余前馈神经网络(feed-forward neural network)的卷积特性。预处理步骤,或卷积步骤被用来最小化 CNN 处理图像所需的整体尺寸。有限数量的像素和这些像素的可能值为模型的复杂度提供了一个上限,并且能够产生一个可靠的输入字符的粗糙表示,经过训练的网络能够在 Apple Watch 等外部设备上运行。

训练数据集是根据各种不同地域和基于人口学从使用中文的人群中进行收集的上千万的手写文字。研究人员表示,成功识别的准确度足以使其在商业软件中具有良好的表现。

查看英文原文: How Apple Does Realtime Recognition of Handwritten Chinese Characters

2017-12-25 18:001676
AI

评论

发布
暂无评论
发现更多内容

2022华为开发者大会:华为阅读人-车-家一键流转,实现全场景数字阅读新增长

最新动态

GIT分支操作

追风少年

11月月更

简单剖析开发:区块链杠杆合约交易所的核心优势

W13902449729

区块链交易所 合约交易所开发

HTML学习笔记(二)

lxmoe

html 前端 学习笔记 11月月更

永续合约交易所的开发有哪些特征?

W13902449729

合约交易所开发 区块链交易所开发

基于开源IM即时通讯框架MobileIMSDK:RainbowChat-iOS端v6.1版已发布

JackJiang

即时通讯 MobileIMSDK im开发 开源im

HDC 2022 Day2精彩速递:开发者齐聚松山湖,深度体验鸿蒙开发套件

最新动态

一款设计和模拟数字逻辑电路的LogiSim工具

向阳逐梦

集成电路 Verilog 11月月更 logisim 模电与书店

【C语言】char 关键字

謓泽

11月月更

Fastjson最想版本RCE漏洞【漏洞分析】

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

GIT详细基础笔记

追风少年

11月月更

Vue组合式函数(二)封装一个请求

Augus

Vue3 11月月更

从零到一带你构建可靠的大型分布式系统,不愧是IT领域又一神作!

Java永远的神

Java 分布式 程序人生 后端 架构师

架构实战营模块 4 作业

陌生流云

#架构实战营

HDC2022 携手共创鸿蒙生态 增长解决方案焕新升级构筑商业增长闭环

最新动态

Go语言入门13—并发

良猿

Go golang 后端 开发 11月月更

去哪儿的常态化容量保障是怎么做的?

TakinTalks稳定性社区

计算机网络:差错控制

timerring

计算机网络 11月月更

2022HDC|华为阅读:探索阅读体验新变革 助力阅读生态创新发展

最新动态

SQL Sever提供的字符串类型

乔乔

11月月更

美图是如何搭建压测监控一体化平台的?

TakinTalks稳定性社区

压测平台

华为开发者大会2022:HMS Core 3D建模服务再升级,万物皆可驱动

HMS Core

hdc HMS Core

从3开始,在业务系统中增加分页功能

海风极客

go语言 11月月更 后端系统

2022-11-05:给定一个逆波兰式,转化成正确的中序表达式。要求只有必要加括号的地方才加括号。

福大大架构师每日一题

算法 rust 福大大

Sonatype Nexus 如何把多仓库合并在一起

HoneyMoose

GIT团队协作

追风少年

11月月更

MetaForce佛萨奇2.0矩阵系统开发(搭建)

l8l259l3365

Apple是如何进行实时手写汉字识别的_AI_Dylan Raithel_InfoQ精选文章