写点什么

打造视觉智能引擎,AI 识货赋能商品数字化 | StartDT AI Lab

  • 2019-09-16
  • 本文字数:2314 字

    阅读完需:约 8 分钟

打造视觉智能引擎,AI识货赋能商品数字化 | StartDT AI Lab



自零售领域近些年围绕转型升级建设性地提出了以“人、货、场”三核心为基础的新零售蓝图之后,各方新技术蜂拥在零售的各型场景中角力。在之前的分享中,我们主要介绍了如何通过人工智能技术,从“人”的维度切入零售场景的。而本文将着重介绍我们(奇点云)自研的人工智能技术是如何从“货”的维度赋能零售商业的。


视觉智能引擎作为 AI 落地的第一步,在商品数字化方面发挥着主要作用。而从视觉角度来说,“货”的形态差异相较于“人”来说有了显著增加。不同的垂直行业为顺应市场需求所开发的产品,无论在产品功能还是形态上都千差万别,甚至同类型产品也会产生出不同的形态以顺应差异化的细分需求。这对视觉智能引擎提出了新的挑战,也激发出了 StartDT AI Lab(注,「StartDT AI Lab 」栏目致力于展现奇点云在算法技术上的突破,分享算法研发成果在商业场景的应用能力,专注于“AI+大数据”领域。)更大的技术突破。


下面从已经商业落地的场景中选了几个比较有代表性的行业场景来展示 StartDT AI Lab 已取得的技术突破。

AI 识货赋能服饰行业

我们在 17 年率先推出服装识别技术,结合产品——奇点魔镜实现落地。在这个场景中,用户站在奇点魔镜前站定几秒后,奇点魔镜首先将对用户的穿着进行分割理解,从中分离出 T 恤、风衣、夹克、牛仔裤等各种类型的服饰,然后通过对单品服饰的分析,例如 T 恤,我们可以对其抽取特征,分析出 T 恤的风格、袖长、版型等属性,最后在我们自建的百万级服饰商品库中,使用推荐算法为用户推荐相似的、配套的商品,从而达到引流客户、智能导购的效果。



在这个链路中,我们当时碰到的主要问题和解决方案:


  • 1.获取用户准确的衣着信息并获取特征时,像 T 恤、短裤这样上下装明显的衣着较容易获取,但像连衣裙、风衣类较长的衣着却较难处理。我们通过收集大量数据、清洗打标、完善数据集,并使用级连方法,先对服饰一级标签进行检测分析,再进行二次处理,从而提高了分割效果。

  • 2.服饰属性多样且没有统一的标准,如何快速同时判断成为难题。我们将属性的分类器各自独立互不影响,使用特征作为输入,减少了重复运算,另外我们将分类器同时接在 Graph 中,使整体过程 End-to-End,快速有效。

  • 3.大规模检索:当数据库较大时,检索速度慢,无法快速响应。我们将比对数据库部署在分布式集群上,实现了特征比对层面的 map-reduce,使我们在应对各种级别的比对时游刃有余。

AI 识货赋能快消饮品行业

我们在快消饮品行业已有近两年的探索历史。各式各样的饮品——包括矿泉水、碳酸饮料、果汁、啤酒、白酒等都可以在奇点魔柜中售卖。我们通过自研的深度学习算法、数据采样方法,配合我们定制化的硬件配置,实现了在商用场景中 99%以上的识别准确率。我们将货损率控制在 1%以内,低于快消饮品行业平均货损水平。此外,我们在不到 1 平米的占地空间上实现了极高的坪占比,单柜单月零售额可达千元级别,却仅需少量的维护工作。



在正式商用的背后,StartDT AI Lab 主要的 contribution 有以下几点:


No.1 快速有效的小物体检测算法


和大多数场景不同,我们的检测目标往往是最小边接近 16 像素的小目标,且在一张图上有相当多的目标。我们通过自适应 anchor 的方法,使先验 anchor 更加准确;此外我们通过一种特征增强算法,使细节特征得以在深度网络中尽可能减少损失,从而避免了因特征过少带来的低分值检测结果不稳定的问题。此外我们还自研了一种自蒸馏方法,在不增加参数的情况下提升了模型准确率,从而达到了商用水准。


No.2 与度量学习结合的识别技术


度量学习在过去的几年中被广泛使用在人脸识别模型上,并取得了非常不错的效果。我们将其引入商品识别,结合经典的神经网络方法,使识别结果更加准确可靠;此外模型还可输出可比对特征,支持特征比对方式出结果,支持不同类间相似比较,从而在选品层面就避免了相似商品同时售卖无法识别的问题。


No.3 小数据集增强


我们的数据集相对使用场景,其实是一个小数据集。如何使用小数据集在大数据场景下获得商用级准确度?我们自研了一种 mix 方法,使检测模型获得了非常高的召回率;此外我们还使用了 GAN,在训练分类器的过程中同时训练生成器,再拿生成结果同时训练分类器,使分类器训练更充分,更平滑。


在生鲜/药品等垂直领域,我们也敢于摸索和尝试,发挥自有深度学习算法和采样方法的优势,结合自研的硬件优点,首创能将繁复多类的生鲜不受类别影响的智能货柜。众所周知,在垂直领域中,同一 sku 的外观变化多样,适配成本高。我们通过特定产品设计,完美支持各类蔬菜水果等生鲜,准确率更是可以做到近乎 100%。让顾客不受限于菜市场/药房等特殊场地的限制同时,更可以发挥无人货柜的完美优势——不受时间限制。





StartDT AI Lab 在黑暗中探索的收获与创新:


No.1 新颖的深度学习式场景思考


为了摆脱生鲜场景下,各种形状和尺寸带来的异同和难以兼容,以及客户快速上新的切实需求,我们在场景落地的实际道路上,结合商品的特性、产品的优势和深度学习算法的原理,给奇形怪状的生鲜产品进行特殊的包装,该方案解决了生鲜产品之间的差异性,并能支持客户快速上新。


No.2 独具创新特色的数据增广


光有新颖的方案设计还不足以让深度学习在一个实际场景中完美落地,准确率是客户第一要素,数据是深度学习的资本。StartDT AI Lab 在深入分析了生鲜和药品等垂直领域的数据特性和算法性能之后,创新性地在采样数据集上进行数据增广,让准确率近乎完美,诠释了什么是将深度学习进行落地的概念。


从以上案例中,呈现了 StartDT AI Lab 在“货”的数字化探索,虽然还是比较初步的商品数字化阶段,但也通过 AI 技术首次实现了商品售卖周期内的全链路数字化跟踪,并在此基础上实现了零售前端成本削减,提高了用户调研自动化的效率。


2019-09-16 17:251708

评论

发布
暂无评论
发现更多内容

Unity 之 安卓堆栈跟踪和日志工具 (Android Logcat | 符号表解析Bugly捕获)

陈言必行

Unity 三周年连更 日志工具

CSS架构之BEM设计模式

肥晨

CSS bem 三周年连更 css架构

使用chatGPT自动回复抖音评论

南城FE

人工智能 AI 前端 后端

Redis复制(replication)

京茶吉鹿

数据库 nosql redis

数据库原理及MySQL应用 | 数据表操作

TiAmo

数据库 MySQL数据库 数据表 三周年连更

CloudQuery 询盾社区版 v1.5.0 正式发布!

BinTools图尔兹

数据库 社区活动 版本发布

【直播回顾】数字化转型成为银行业发展的关键(中)

易观分析

金融 银行

NFTScan 与 NodeReal 达成战略合作:NFT API 已上架 NodeReal API Marketplace

NFT Research

NFT NFTScan

布隆过滤器:后端开发者必学的知识点

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

发现Mysql的主从数据库没有同步,差点凉凉了

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Java中「Future」接口详解

Java 架构

Ai工具推荐 - Claude(手机端也可使用的媲美ChatGPT的产品)

炜娓道来程序人生

AI 工具 ChatGPT

从零开始学习MySQL调试跟踪(2)

GreatSQL

跨平台应用开发进阶(四十七)APP字体库文件处理方案

No Silver Bullet

App 跨平台应用开发 三周年连更 字体库

学会提示-AI时代职场必修课

京东科技开发者

人工智能 京东云 GPT ChatGPT4 企业号 4 月 PK 榜

大模型的三大法宝:Finetune, Prompt Engineering, Reward

Baihai IDP

人工智能 大模型 基础模型 企业号 4 月 PK 榜 RLHF

测试ChatGPT能不能帮助我们傻瓜式的搭建Spring Boot工程

致知Fighting

Java ChatGPT

面对一堆烂代码,重构,还是重新开发?

架构精进之路

程序员 重构 三周年连更

IDPChat:探索基于LLaMA和Stable Diffusion的「开源」中文多模态AI大模型

Baihai IDP

人工智能 开源 大模型 Stable Diffusion llama

报名啦!来飞桨中国行,听深度学习平台+大模型如何破局产业智能化

飞桨PaddlePaddle

飞桨 产业赋能

如何基于 zap 封装一个更好用的日志库

江湖十年

后端 日志 log Go 语言

连续信源的熵与RD

timerring

信息论 三周年连更

支持宽屏格式的音乐播放器:Swinsian mac版

真大的脸盆

Mac Mac 软件 播放器 音乐播放器

缓存空间优化实践

京东科技开发者

redis 京东云 企业号 4 月 PK 榜

【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战

汀丶人工智能

人工智能 数据挖掘 机器学习 深度学习

突破规模化运维瓶颈 SREWorks云原生数智运维平台揭秘

阿里云大数据AI技术

大数据 运维 企业号 4 月 PK 榜 规模化

从ChatGPT看爆火技术概念及医疗领域科技与应用场景

京东科技开发者

人工智能 京东云 企业号 4 月 PK 榜

TiDB与MySQL的SQL差异及执行计划简析

京东科技开发者

数据库 开源 TiDB 京东云 企业号 4 月 PK 榜

分布式实时搜索和分析引擎——Elasticsearch

会踢球的程序源

Java elasticsearch 后端

大数据基础知识

数新网络官方账号

大数据

深入浅出的实践大数据DAG图

数新网络官方账号

打造视觉智能引擎,AI识货赋能商品数字化 | StartDT AI Lab _AI&大模型_阿北@奇点云_InfoQ精选文章