【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

如何洞察特殊需求?搜狗输入法无障碍的研发实践与思考

  • 2022-04-30
  • 本文字数:4965 字

    阅读完需:约 16 分钟

如何洞察特殊需求?搜狗输入法无障碍的研发实践与思考

你有没有想过,在设计应用时、开发应用时把无障碍功能场景和需求也考虑进来?


信息无障碍是指任何人(无论是健全人还是残疾人,无论是年轻人还是老年人)在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。


在当下的数字时代,并不是所有人都能毫无障碍、顺利地使用各种数字产品和工具,甚至不少人仍难以上网。据世界卫生组织估计,全球目前约有 15%的人口患有残疾,超过 10 亿人。


如果开发者能将无障碍设计集成到应用中去,将能够帮更多的障碍人士使用到这些产品。近日,InfoQ 有幸与腾讯旗下搜狗输入法无障碍产品专家赵义涛就搜狗输入法无障碍适配及开发等相关话题进行交流,希望本文能让读者对数字技术和无障碍的关系有进一步了解。

无障碍输入

自个人电脑在国内普及后的多年以来,如果说装机必备的产品有哪些,“输入法”类别的软件往往占据着一席之地。


Wikipedia 对“输入法编辑器”如此定义道:键盘击键或鼠标移动翻译成字符来输入的操作系统组件。键盘原在打字机时代为英文字母而设计,但键盘只有一百来键,在没有软件的帮助下它是无法输入中文或其他大型形意文字的语言。


因此,针对不同语言往往需要有相应的输入法软件去进行信息处理,在中文世界,这个软件就是中文输入法。


然而,在大多数网民对输入法的存在已经习以为常的当下,对于障碍人士来说,输入法却存在着各式各样的痛点。


2019 年 11 月,“脑瘫女孩寻求破解鼠标打字输入法,黑客大神暖心帮助”一事引起热议,让障碍人士的需求得以走进大众视野。事件背景是一位名叫方瑜的脑瘫女孩在网上进行求助,方瑜全身只有双脚可以活动,多年来她一直使用一款冷门特殊的输入法产品“鼠标打字·高级版 III”,用脚控制鼠标写博客,但该软件很久没更新,方瑜购买的正版序列号也已经过期,于是她在换新电脑之后便发现自己已经无法继续正常使用原先的软件打字。



因此,方瑜在网上发出求助帖,希望网友能为其联系该鼠标输入法产品的开发者,却得悉软件的开发者(李经冀、李经颂两兄弟)都已经相继患癌症去世。所幸的是,一次善意接力行动也随之展开,前有技术人士连夜帮方瑜破解软件,后有搜狗输入法团队接棒研发这款输入法。


负责接棒的是赵义涛所在小组,其团队很快联系到开发者的家人,并购买了这款产品的专利。同年 12 月 19 日,一款新的专为特殊人群研发的输入工具正式对外发布,名为“点点输入”。

到用户身边去观察

“点点输入”面向的是不方便使用键盘打字的这部分人群,不管是通过鼠标还是触控屏打字,这与当前主流的键盘打字方案还是有很大的差异。


现在要想做出像李家兄弟所研发的鼠标输入法这类产品,赵义涛认为主要困难不是在于开发和代码逻辑之类的技术问题,而是产品设计——如何设计出一套与市面上主流方案不一样的良好的方案。


“通过鼠标点击交互,背后有很多的问题要解决,如何让效率最大化,让产品更易用,让用户一看就能懂,这其实是一个全新的产品设计。”于赵义涛而言,他作为产品经理必须要代入用户的操作流程去思考:若是用手去模拟鼠标操作还稍微容易些,但像方瑜这样只能用脚去交互的话,是不是会更困难?


“其实不是特别容易想清楚。”赵义涛说,有时候面向一个人群,这个人群有某个特征,但其实他们可能还会有些隐藏特征。


“比如说面向盲人群体,我们之前以为所有的盲人都会盲文,就想着说要不要设计一个盲文输入法,结果去跟相关从业人员聊的时候,我们才发现好多盲人其实没有学过盲文。而且我们做一些面向视障用户的产品的时候,会发现用户不一定是全‘盲’,有可能是视力不够好,这里面也是有差异的。”


赵义涛进一步指出,理解人群的特征这件事本身就有一定的难度,但是,如果没有理解清楚目标人群的特征,那做出来的产品可能就适配不了目标人群的某个常见场景,只能适配到自己想象的个体或者一小部分场景。

从“鼠标输入”到“点点输入”

虽然点点输入是在已有的鼠标输入产品的基础上,重构原版代码再制作新版,并非一个从 0-1 的产品。但在开发前和正式发布前,搜狗输入法团队还是与方瑜进行了大量沟通,为的是深入了解需求、理解需求。


“如果想要了解一群你原来不是很熟悉的人,最好的方式是,到他们身边去观察。”事实上,在接触方瑜之前,赵义涛也从未做过无障碍产品。


他先是上网搜索“脑瘫”,得知脑瘫的症状有很多种,大的症状下面也有许多不同的小症状,面对这个情况,他陷入苦思:”会是什么样的场景和情况,以至于会需要这么一款产品,这款产品有没有其他需要优化的点,我们是不是把人家产品复刻一遍就 OK 了?”


为了找寻答案,团队决定去宁波拜访方瑜,面对面去观察方瑜对鼠标输入法产品的使用场景:她是怎么用输入法,怎么用鼠标,用来做什么......“只有真正了解真实的场景和用户诉求之后,才能大概梳理出比较清晰的产品需求。”

复刻、升级优化、迭代

确定需求之后,便是研发、上线、不断反馈和再优化的过程。从接触方瑜到把“点点输入”做出来,搜狗输入法团队前后仅花了 8 天。据介绍,第一版“点点输入”主要复刻了原来那版鼠标输入法的交互逻辑和核心能力,并在这基础上做优化和升级。比如,新增了一些快捷键能力,把一些常用的快捷键(复制粘贴、翻页、Page Up、Page Down 等)梳理出来并放进点点输入。此外,点点输入也接入了搜狗输入法的庞大词库。



从 2019 年年底发布至今,经过两年的发展,点点输入用户数已经突破 10 万,这个量级听上去虽然不小,但对比搜狗输入法动辄几个亿的用户量来说,却微不足道。尤其是,点点输入能收获的有效产品反馈鲜少,从产品迭代的角度来看,这需要团队成员更多地把自己代入使用场景,并基于前期对用户的理解去找一些可以优化的点,继而做出尝试。


比如考虑到用点点输入的人大概率是经常会用它,团队做了输入法皮肤的优化,推出深色皮肤、护眼皮肤。


无论是原先的鼠标输入法还是后来的点点输入,均支持两种输入模式,分别是部首输入和拼音输入。


其中,部首输入是方瑜所熟悉的模式,点点输入并没有改变这部分逻辑,还是沿用原来的策略。而拼音输入则有所迭代。汉语拼音大概有 400 个合法音节,在一个键盘上完全显示并不现实。后来,赵义涛在将自己代入用户、反复用鼠标打字后想出了“声母+韵母”的方式,其中“韵母”部分是指声母之外的其他字母,虽然不符合标准语法但效率有所提升——用户两次点触就能精准地找到自己所需要的拼音串。

无障碍产品的开发流程

由于输入法技术的成熟性,点点输入的研发相对来说并不复杂。但事实上,大多数无障碍产品的设计和研发往往不那么轻松。


赵义涛举例,有用户提出希望 PC 端有一个好用的语音转文字的产品,这时候就需要把需求转给相应的团队,让他们去做产品方案和评估。如果是给听障人群做语音转文字识别功能,那么对企业的语音识别能力显然是有要求的,因为听障人群可能有时候面临的环境比较嘈杂,有时候可能在一些特殊环境中,在不同环境的语音识别需求均存在着差异。


因此,无障碍产品跟场景、用户的需求和当前相关技术的发展都息息相关。其主流程和一般的 C 端通用产品无异:收集需求、做产品设计(需求产品化)、开发、测试、将产品交付给用户试用和体验,根据反馈再优化......


不过,细究起来,在收集需求以及产品化的过程,无障碍产品还是和普通产品存在一定的差异。

产品化

赵义涛表示,无障碍产品收集需求的渠道很少,多数时候需要自发去寻找用户进行沟通,又或者通过一些人脉关系来接触目标用户。


收集需求之后,下一步是把需求抽取出来,从中找到一些共性、能够采用通用方案解决的需求,再去输出相应的产品方案。在这过程中,需要结合产品需求、用户需求去考虑落地周期是否乐观,是否能结合自有的产品和技术能力来实现。另外,无障碍领域也会更看重产品的易用性。


但要真正理解障碍人士背后的需求并非易事。“产品化的过程中,(无障碍产品)和常规产品的差异在于,你需要反复去跟用户聊,因为有可能在你收集完需求之后,你当时是理解了,但在产品化的过程中,随着理解不断深入,你可能会疑惑为什么他当时要这么想,这里面是不是还有一些特殊的原因,这过程很可能需要反复地再去跟用户确认。”


他进一步说道,当产品负责人对于需求的理解足够清晰,并设计好产品之后,就进入交付开发流程,后续的产品研发期也跟常规产品的研发流程相差不多。但是,当产品出来后,由于无障碍面临的用户群体相对小众,很难像大众化产品那样通过线上灰度测试来观察数据,甚至没有灰度目标,往往只能把产品给到一些他们认为比较符合产品需求的目标用户。

协调资源

赵义涛目前在腾讯旗下搜狗输入法负责无障碍产品。但事实上,“无障碍”并不是作为一个独立的团队在运作,也就是说,搜狗输入法部门并没有专门负责无障碍产品的团队,而是各个业务线基于业务线的能力特征和用户诉求,去做一些无障碍相关工作。


“因为其实很难做到真正意义上的独立,它(无障碍)是被放到我们所有团队的日常工作中。如果大家在工作中,发现有些地方可以去做无障碍的优化,或者说觉得这块应该在“无障碍”设计下一些力气的话,那我们就可以自觉去做一些相关的事情。”


因此,相比常规业务开发,在资源的划分上,无障碍产品能获得的资源则不那么明确,需要相关负责人去灵活调配资源。但随着互联网行业对履行社会价值的重视,技术与公益相结合的项目也越来越多了。


据了解,早在 2015 年,搜狗输入法团队就开始探索和障碍人士的一些常用软件进行适配。比如读屏软件(屏幕阅读器),这是一种辅助技术,适用于视力障碍人士,可以阅读和说出屏幕上显示的文本、图像和按钮。


除了一些基础适配,目前搜狗输入法也在积极主动研发更多针对障碍人群不同输入需求场景的解决方案,预计年内上线。今年 1 月,他们还发布了“眼动输入”解决方案,该方案主要借助一款内置眼球追踪技术的眼控仪,让残障用户通过眼球转动和凝视,即可操作电脑完成文字输入。

挑战与希望

无障碍设计概念是由联合国组织于 1974 年提出的设计主张,强调在科学技术高度发展的现代社会,一切有关人类衣食住行的公共空间环境以及各类建筑设施、设备的规划设计,都必须充分考虑具有不同程度生理伤残缺陷者和正常活动能力衰退者(如残疾人、老年人)的使用需求。


随着过去数十年来互联网的普及,障碍人士若想顺利通过互联网获取信息和实现交流,这需要互联网产品进行信息无障碍的优化,但目前这方面还有不小的挑战。


“我们现在整个互联网从业人群,真正意义上的残障用户是很少很少的,尤其是产品研发这个方向,大家更是把自己深度很难代入到用户场景中,毕竟不是生活在这样的场景里。比如说视障用户市场,用户的生活实际上是什么样子的,我到现在也没有完全清楚。”


“我们可以自己模拟,就是暂时性的失明,把眼一闭就看不见了,但是他们也会有一些辅助工具,有一些失明的用户会用读屏产品,那在用这些辅助工具和通用的一些解决方案的时候,用户又在中间遇到了什么问题?另外,面向先天性盲人,他对世界的认知可能跟我们对世界的认知存在差异,以及对一些软件交互的认知也是有差异的,你甚至很难去理解。”


“对我个人而言,(无障碍产品设计)最大的挑战其实还是对用户的理解。这是最难的一点。”赵义涛感慨,目前业内仍主要以局外人的视角从外部观察,通过观察尽可能地理解用户,理解之后才有可能设计出一款比较适配他们需求的产品。


好消息是,在与障碍人士的连接上,有了新的通道。


2022 年 1 月 13 日,一项名为"众声"的无障碍输入公益计划正式发布,该计划由中国残疾人联合会直属中国残疾人辅助器具中心指导,腾讯旗下搜狗输入法、深圳市信息无障碍研究会、全国残疾人用品开发供应总站共同发起。


据悉,"众声"计划的核心是把搜狗输入法和腾讯技术公益所沉淀的无障碍输入技术和相关解决方案,都免费开放给全行业。这些技术,除了点点输入,还有视障输入、长辈输入、OCR 读图、AI 手语翻译等,还有前面提及的用眼球转动就可以打字的眼动输入。


原本赵义涛团队要接触无障碍目标用户,往往是通过点对点的方式去认识,又或者通过合作单位去对接。而"众声"计划发出后,他认为技术提供方和用户之间的通道有望被打通,如此一来,大家便能听到更多贴近用户的真实声音,也有利于产品需求的收集和反馈,把产品做好的概率也就更大。


“互联网,应该是要连接所有的人,但如果有一群人被遗漏了,那它是不完善的。”赵义涛希望,行业内有越来越多的人关注无障碍设计,提升对无障碍的认知,并付诸行动,共同建设更完善的无障碍环境,让障碍人士都能在网上自由冲浪。

2022-04-30 11:252876
用户头像
罗燕珊 InfoQ中文站编辑

发布了 415 篇内容, 共 239.7 次阅读, 收获喜欢 756 次。

关注

评论 2 条评论

发布
用户头像
应该是:汉语拼音大概有 400 个合法音节,不是合法音乐。
2022-05-07 09:10
回复
已修改,谢谢指正
2022-05-08 10:02
回复
没有更多了
发现更多内容

为了面试阿里巴巴、腾讯、字节跳动,linux内核架构

Java 程序员 后端

三面阿里云斩获offer:微服务+Redis,积累总结

Java 程序员 后端

不会吧不会吧?字节“百万级,nginx视频教程吾爱破解

Java 程序员 后端

不是吧阿sir,你这Redis太熟了吧,震惊面试官第六年

Java 程序员 后端

主动学习微服务架构深度解析:微服务的采用前提,微服务使用场景

Java 程序员 后端

一篇文章让你了解基于Spring的测试,java自学百度网盘

Java 程序员 后端

三、Spring Cloud之软负载均衡 Ribbon,mysql架构

Java 程序员 后端

不错,这么好的东西不白嫖也太可惜了!阿里内部首发

Java 程序员 后端

架构实战营模块二作业

孙志强

架构实战营

三面腾讯,已拿offer!分享复习经验和后台开发面经

Java 程序员 后端

上线半天下载量破100W!美团大佬的Java性能调优实战手册,超详细

Java 程序员 后端

上线半天下载量破100W!阿里内部微服务进阶笔记,超详细

Java 程序员 后端

为什么不想做Java了,6年经验去面试10分钟结束,现在Java面试怎么这么难

Java 程序员 后端

为什么我不建议你用阿里巴巴Java规范,而使用 Google Guava 编程?

Java 程序员 后端

二、docker 镜像容器常用操作(让我们用docker 溜得飞起)

Java 程序员 后端

云服务器下centos7,nginx面试题

Java 程序员 后端

不是吧阿sir,你这多线程并发也太熟了吧,震惊面试官第四年

Java 程序员 后端

三面遭阿里新微服务框架暴锤,含恨吃透这份手抄本笔记,终入阿里(1)

Java 程序员 后端

不到30岁开上兰博基尼的程序员,为什么这么强,他告诉我只需要把多线程搞好你也行

Java 程序员 后端

五、redis配置信息以及常用命令,java语言程序设计基础篇第十一版pdf

Java 程序员 后端

一篇送给临近35岁程序员的文章,mysql数据库sql语句面试题

Java 程序员 后端

一行Java代码实现两玩家交换装备【并发编程】

Java 程序员 后端

不要再本地启动项目调试了,试SpringBoot远程调试你会发现新大陆!

Java 程序员 后端

两年JAVA程序员的面试总结,mysql索引原理

Java 程序员 后端

为什么不想做Java了, 现在Java面试怎么这么难,从自身找原因

Java 程序员 后端

万字长文,字节大牛百万调优经验之作:JVM调优实战笔记

Java 程序员 后端

三面蚂蚁金服终获 java高岗 offer,却直言再也不想体验第二次了

Java 程序员 后端

三面遭阿里新微服务框架暴锤,含恨吃透这份手抄本笔记,终入阿里

Java 程序员 后端

不是吧,就因为他和面试官多聊了半个小时红黑树,进了腾讯

Java 程序员 后端

世界顶级SQL技术专家呕心沥血半年才整理出这份:SQL优化核心思想笔记,手慢无

Java 程序员 后端

为什么一个还没毕业的大学生能够把 IO 讲的这么好?

Java 程序员 后端

如何洞察特殊需求?搜狗输入法无障碍的研发实践与思考_文化 & 方法_罗燕珊_InfoQ精选文章