InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

夸克程序员揭秘:手机如何变成一台智能扫描仪?

  • 2022-08-29
    北京
  • 本文字数:1839 字

    阅读完需:约 6 分钟

夸克程序员揭秘:手机如何变成一台智能扫描仪?

8 月 24 日,在夸克“Meet AI”开放日上,夸克 AI 视觉团队分享了夸克在 AI 视觉技术上的研发理念和实力。


数据显示,目前超过一半的夸克用户使用相机来提升学习、工作效率。今年 5 月,夸克的 Slogan 由“新生代智能搜索”升级为“你的高效拍档”。在搜索引擎之外,夸克 App 定位为「智能工具+内容+服务」的新模式,围绕用户的交互体验与使用场景迭代创新,满足用户主动获取信息、解决实际问题的需求。

手机扫描正在超越传统扫描仪


随着居家学习、移动工作的需求爆发,大学生和职场人对扫描的需求也发生了全新变化。夸克扫描王数据显示,学习是排名第一的使用场景,工作需求紧随其后,用户不仅需要清晰度更好的扫描内容,他们对后期的编辑、分享、存储甚至创作都有了更加个性化的需求,而传统的扫描仪已经很难满足这一变化。


夸克视觉技术负责人黄锐华表示,夸克的用户群体大多数是年轻用户群体,超过一半用户小于 25 岁,这部分用户群体的典型职业是学生和初入职场的工作者,这些年轻人善于挖掘和使用各种工具为学习和工作提效,而简单的搜索无法满足用户需求,因此夸克围绕搜索提供了一些智能工具的能力,希望以智能为核心,满足用户在办公、学习场景中的工具需求。



经过多年的技术沉淀和探索,夸克 AI 视觉技术加持的智能搜索、智能工具成为用户获取信息的重要入口之一,通过手机硬件与云端强大算力结合,夸克采用业界最新的深度学习算法,构建了一套完整的训练模型和技术能力,并且已经应用在日常学习、办公、生活等领域中,给用户提供智能化解决方案 。


其中,夸克扫描王就是以 AI 视觉技术为核心的智能工具,从识别、录入、编辑、管理、个性化创意等方面,满足不同场景下的用户需求,帮助他们处理各类扫描问题。支持高清扫描、文字提取、格式转换、照片修复、魔法擦除、自拍证件照等十余项功能,把手机变成了一台智能扫描仪。


黄锐华表示,手机扫描正在超越传统扫描仪,给大学生和职场人带来更高效、更便捷的信息服务体验。在基于手机相机功能的搜索行为中,大学生的学习场景占比超过一半。


夸克扫描王在云端算力和视觉技术上的突破,帮助用户完成从传统图片、文件到数字化资产的进化,提升扫描效率。


尤其在面对一些复杂场景时,夸克扫描王也针对性的提出了多项技术解决方案。当被扫描内容模糊或有污渍时,夸克扫描王可以实现自动修复并提升清晰度;针对手机扫描容易出现的角度不正、遮挡等常见问题,夸克扫描王通过智能算法和图像识别进行摆正、校对;针对个性化的信息处理需求,夸克加大了在识别文字和版式上的技术投入,实现了提取文字、拍黑板、加密以及擦除等实用功能。

自研多项 AI 技术,攻克扫描难题


在提升手机扫描的能力方面,夸克 AI 自研了多项 AI 技术。


夸克突破了传统光学字符识别的技术瓶颈,首次将多模算法引入文字识别领域,让公式识别、手写识别的效果得到了大幅度提升,印刷文字识别精度达到 99.99%,手写文字识别精度达到 98.5%+。就算面对复杂的 Word、Excel、PPT 等板式和结构时,夸克扫描王也能像人一样进行深入理解,并通过自然语言处理和计算机视觉技术的深度融合,帮助用户精准、快速的解决复杂问题。


夸克 App 视觉算法工程师顾添锦详细介绍了多模态算法,多模态包括两种模态,一种是图像(视觉)数据,另一种是文本数据。在传统的深度学习领域,图像和文本两个模型一般是不搭界,“井水不犯河水”的状态。但在两年前,业界开始用这两种模态的数据进行混合训练,夸克视觉 AI 团队也进行了一些探索,把文字和图像和文字本身进行连接,这样就可以替代传统的 OCR 识别算法。


这种方法的好处一方面是,在做模型训练时,图像特征跟文本特征可以相互验证,提升各自的准确率。同时,降低了数据的标注成本,文本数据可以有几十亿、上百亿的数据供使用,可以对大量的文本数据进行预训练,语义部分可以输出一些常用的文字组合的能力,再把图像输入进去时,对一些模糊场景有一定的文本脑补能力,这样能大幅度提升识别的能力。


同时,夸克也把游戏引擎数据模拟方法与半监督模型训练方法引入到了文件扫描的模型开发中,通过深度模拟和还原快速提升文件矫正、字迹清晰度、背景杂质擦除的实际效果, 进一步拓展了手机扫描的能力和应用场景,提升用户的满意度、导出率。


此外,夸克还研发出了手机扫描的“离线模式”,无需网络也可以完成高质量的扫描,能在未知的环境中进一步保护用户数据隐私和安全。夸克也成为第一个将扫描 AI 算法上端的 App。


夸克扫描王还研发了魔法擦除、记录屏幕、照片修复等实用功能,让图片更具美感和真实感。去杂质、擦除、植发等特色使用方法可以辅助用户创作。

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2022-08-29 10:264607
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 457.5 次阅读, 收获喜欢 1946 次。

关注

评论

发布
暂无评论
发现更多内容

一个典型的大型互联网应用系统使用了哪些技术

L001

极客大学架构师训练营

大型互联网应用系统浅析

飞雪

week4.学习总结

个人练习生niki👍

写给大忙人看的进程和线程

cxuan

后端 操作系统

架构师训练营 第四周【作业】

小K

Week4-总结

龙7

架构师训练营 - 学习笔记 - 第四周

小遵

学习总结 - 架构师训练营 - 第四周

走过路过飞过

从软件架构演进“看”做好事情的三条边

学习 架构模式 极客大学架构师训练营 架构演进 三条边

软件测试缺陷等级划分准则

海浪豆豆

软件测试

架构学习第四周作业

云峰

架构师训练营第 0 期第四周作业

无名氏

大型互联网应用解决问题的技术方案和手段

GAC·DU

第4周作业

一个典型的大型互联网应用系统使用了哪些技术方案和手段,主要解决什么问题?请列举描述。

娄江国

极客大学架构师训练营

第 04 周作业提交

白杨

第四周作业

changtai

极客大学架构师训练营

架构师训练营第四周作业

努力努力再努力m

极客大学架构师训练营

互联网系统架构

陈皮

架构师训练营 - 第四周 - 作业

Anrika

极客大学架构师训练营

第4周总结

娄江国

极客大学架构师训练营

互联网系统的问题与方案 - 第四周作业

X﹏X

Week 04- 作业一:一个典型的大型互联网应用系统使用了哪些技术方案和手段

dean

极客大学架构师训练营

大型网站架构演化历程

stars

架构师训练营第四周作业

fenix

面向对象学习

一叶知秋

架构师训练营 第四周 学习总结

RZC

架构师训练营第四周课程总结

狂奔嘀兔纸

极客大学架构师训练营

第四周总结

GAC·DU

大型互联网应用系统使用的方案

ashuai1106

架构师 极客大学架构师训练营

大型互联网应用系统案例

戴维斯

极客大学架构师训练营

  • 扫码添加小助手
    领取最新资料包
夸克程序员揭秘:手机如何变成一台智能扫描仪?_语言 & 开发_刘燕_InfoQ精选文章