NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

摩拜单车背后的人工智能二三事

  • 2018-01-03
  • 本文字数:3498 字

    阅读完需:约 11 分钟

共享单车在不到一年的时间里成为城市一道彩色风景线,在便利市民短途出行的同时,单车的运营管理也日渐成为一个巨大的挑战。

我们每天都能见到大量的共享单车,有的地方共享单车成排投放,有的地方却看不到这些小车的身影。对于平台来说,在哪里投放共享单车、投放多少共享单车是一个值得研究的问题。如果投放车辆的地方没人需要,那投放效果就会大打折扣;如果人们在需要的地方找不到车,平台也会蒙受损失。

但是怎样确定哪里是合适的投放地点呢?单车被骑走到城市的各个角落后,如何调度才能保证它们能被更多人骑到?每天都有成千上万的故障车辆图片被上报给平台,其中的真假又如何分辨?这些问题的解决其实都离不开人工智能。

摩拜单车首席数据科学家尹大朏将在全球人工智能与机器学习技术大会(AICon)上分享《摩拜如何使用人工智能实现单车精细化运营》,为大家介绍摩拜单车如何利用大数据和人工智能技术解决运营中出现的违停、潮汐现象,以及在优化调度方面的最新探索。会前 InfoQ 对尹大朏进行了独家专访,带领读者一窥人工智能在摩拜落地应用的二三事。

声明 | 本文为 AI 前线公众号(ID:ai-front)独家稿件,未经许可,不得转载

从学术界到工业界

尹大朏在北大获取博士学位后继续在清华大学完成了博士后研究,经过一段比较长的学术研究生涯之后进入了工业界。在加入摩拜之前,他分别在 Esri 和 Dhgate 任职产品工程师和高级数据工程师。对他来说,在学术界做研究和在工业界做产品最大的差异就是速度,工业界对应用的成果转化速度的要求高于学术界,学术界对理论的证明更加看重。当研究人员从学术界转入业界,角色转换是必须经历的过程,尹大朏对此给出的建议是“要 Move Fast”,读书多往往纠结于细节,追求完美;而商场如战场,对时间要求更加紧迫;在学术界可以“十年磨一剑”,在工业界就需要“小步快跑”。

加入摩拜后,尹大朏从 0 到 1 组建了摩拜的数据团队。在团队组建的过程中尹大朏也遇到了一些挑战。新员工来自各个地方,有从成熟的大公司跳槽过来的,也有刚毕业的学生,要让他们融入公司创业环境,并且学会配合、形成战斗力,是较大的挑战。尹大朏的方法是多创造一些机会,让大家多在一起 group study,共同成长。

如今摩拜的数据团队日趋成熟,团队包括了算法及人工智能、商业智能分析、可视化分析、数据服务及数据架构组。团队产生的报表、算法和数据服务支撑着运营、财务、产品、市场、客服及政务等各个业务线,以数字驱动的方式加速公司业务发展。

人工智能落地摩拜单车

尹大朏告诉我们,摩拜很早就在人工智能技术上有所布局。在有了一定的数据积累之后,摩拜开始有选择地使用一些主流的 AI 技术来做预测和分类的工作。

目前主流的 AI 技术应用往往应用于图像声音处理、自然语言处理、推荐系统和无人驾驶等领域在自行车出行领域的 AI 技术应用并不算多,这也是摩拜在共享单车业务场景下应用人工智能技术遇到的一大挑战。这就要求研究人员能够基于对单车领域的理解,嫁接已有的 AI 技术。尹大朏将使用 DNN 的思想做供需预测看作是“一个 idea comes from idea 的过程”,摩拜借鉴了微软亚洲研究院郑宇老师的一篇关于环境污染预测的文章,论文使用了 ResNet(DNN 的一个变种)来做大气污染物扩散预测。而共享单车的运营场景同样也是要解决空间上的预测问题,因此这篇论文就成了启发摩拜数据科学团队的灵感来源,团队基于 ResNet 做出来了一些工作。

目前人工智能在摩拜主要的应用场景包括:

一、基于深度神经网络的供需平衡预测:供需状况的预测是调度工作的基础,摩拜的方法是把空间划分为若干网格,把每个网格里面的车辆数、历史的订单量和天气预报信息结合起来,利用 DNN 来训练,得到未来某个时刻的骑行量预测值。

二、利用图片识别等技术辅助客服提高工作效率:摩拜鼓励用户及时举报不文明的用车行为,为此在 APP 中设置了举报按钮,用户可以拍下违停的图片,上传给客服人员。对这些被举报的用户,如果连续举报多次,摩拜会给他们发短信警告。但问题是每天客服会收到成千上万张图片,甚至很多图片是重复的,因为同一辆车被很多用户举报,这样会给客服人员造成很大的负担。因此摩拜使用深度学习技术对图片进行识别,判断图片中是否是违停在小区的自行车。现在摩拜的客服已经很少直接阅读图片,大概只有不到 1% 的图片因为机器难以判别需要人工干预,剩下 99% 完全可以用机器来识别,从而大大降低了客服的工作量。

“魔方”人工智能平台的架构及演进

摩拜的大数据人工智能平台又名“魔方”,“魔方”的核心应用之一是对共享单车全天候供需做出精准预测,为车辆投放、调度和运维提供智慧指引。

“魔方”的整体架构主要参照主流互联网公司架构,以 Hadoop 作为基础文件存储,Spark、Storm、Flink 做流式计算,TensorFlow 做机器学习的模型训练和预测。

摩拜的数据平台架构基本上是伴随着摩拜的业务扩张逐步演进的。最初摩拜所有的数据报表都建立在 MySQL 这样的关系型数据库上,随着业务极速扩张,数据量也呈几何级上升,查询非常慢,于是摩拜建立了基于 Hadoop 生态体系的数据平台,过渡到使用 Hive/Impala 进行大量数据的查询。后来业务持续发展,摩拜陆续使用了 Kylin 做 OLAP,加入了 Spark/Storm 流式数据分析进行单车状态和实时开锁情况的监控,并引入了 Tensor Flow 做在线的红包车金额制定等机器学习应用。

目前“魔方”平台进行投放量的预测和实时调度主要基于车辆数据、历史订单数据、天气和节假日信息等数据。这些信息大部分通过摩拜的系统获得,天气信息则来自网上公开渠道。其中车辆信息是每个网格里面的存量单车,这是摩拜进行预测的基础,而历史订单提供过去的趋势,天气则是对订单影响最大的随机事件,这些信息都被融合在模型中作为预测变量。

单车出行数据不止于运营

目前摩拜获取到的海量共享单车数据除了单车的位置和骑行路线信息,还有大量来自摩拜单车智能锁的车锁状态信息,以及服务器产生的大量日志。

尹大朏向我们介绍了几个运营之外的数据应用案例:

  1. 北京市最近获批在西二旗和中关村之间建设一条自行车高速道路,在这条道路的规划阶段,摩拜贡献了部分轨迹数据供城市规划师作为该条道路选址的参考;
  2. 厦门在建设地铁的时候希望用真实的出行数据作为修建新线路的指导,找出出行量较大的地区以便进行地铁选线,摩拜的单车出行数据恰好可以满足需求;
  3. 摩拜和世界银行合作进行的城市规划研究发现:长期以来城市建设规划沿袭的 TOD(Transit Oriented Design)理论强调的方法论是让建设集中在地铁枢纽 800 米范围内,而我们的实际轨迹显示大家骑自行车出行的范围可以扩展到 3-5 公里。如此一来就扩展了传统 TOD 理论的出行范围,使得建设不会过分集中在地铁周边,对今后的城市建设会有比较大的影响。

摩拜单车目前已经部署到国内很多城市,甚至也进入了国外,不同城市、不同区域的共享单车数据有很多不一样的地方,尹大朏也跟我们分享了一个例子。

上面的图是北京上地和广州西村地铁站周边地区的工作日和周末出行模式,可以看到上地是典型的工作区,大家上班很规律,出行基本集中在上下班,周末没有很多骑行,而广州西村地区就很不同,平时和周末都有很多骑行。这些特征反映了两地的经济生活方式不同。

未来展望

未来摩拜将尝试把魔方建设成为一个综合的智慧出行平台,摩拜也会持续关注 AI 方面的最新进展,包括 GAN(对抗生成网络)等方面的工作,同时还会继续加强轨迹挖掘、个性化推荐等方面的研究,使摩拜的业务更加完善。

采访嘉宾介绍

尹大朏,摩拜单车数据科学家。他从 0 到 1 组建了摩拜的数据团队,目前该团队包括了算法及人工智能、商业智能分析、可视化分析、数据服务及数据架构组。团队产生的报表、算法和数据服务支撑着运营、财务、产品、市场、客服及政务等各个业务线,帮助公司以数据驱动的方式高速发展。在加入摩拜之前,他在 Esri 和 Dhgate 分别任职产品工程师和高级数据工程师。更早的时候,他在北大获取博士学位后继续在清华大学完成博士后研究。

一个彩蛋

在文章开头我们说过,尹大胐老师将参加全球人工智能与机器学习技术大会(AICon),届时,尹老师会带来更多精彩分享,可到现场与他面对面交流探讨。大会将于2018 年1 月13-14 在北京盛大开幕,来自Amazon、Snapchat、Etsy、BAT、360、小米、京东等40+ 公司AI 技术负责人也将前来分享他们的机器学习落地实践经验,希望对你有所帮助。

更多大会精彩内容,欢迎点击官网 https://aicon.geekbang.org/schedule?utm_source=InfoQ&utm_medium=website )详细了解!

目前大会倒计时 7 天报名进行中,如在报名中遇到任何问题,敬请咨询票务经理豆包,电话:18514549229,微信:18514549229,QQ:209463896

感谢蔡芳芳对本文的策划和审校。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-01-03 17:152632

评论

发布
暂无评论
发现更多内容

云原生训练营学习总结

arctec

Mysql应用开发规范

阿丞

MySQL

Dio 封装之金屋藏娇

岛上码农

flutter ios开发 安卓开发 4月月更 跨平台开发

企业架构的7个关键趋势

涛哥 数字产品和业务架构

企业架构

我们需要一个元宇宙吗?

涛哥 数字产品和业务架构

元宇宙

imazing是什么软件?

茶色酒

imazing

丙午篇 「準佛」 《「內元宇宙」聯載》

因田木

陰陽五行

Docker下,极速体验pinpoint1.6.3

程序员欣宸

Java 分布式 4月月更

元宇宙是人类的终极未来吗?

涛哥 数字产品和业务架构

元宇宙

业务架构师的思维转变

涛哥 数字产品和业务架构

微信小程序开发系列 (三) :微信小程序如何响应用户点击事件和微信平台 API 的使用方法介绍

Jerry Wang

微信小程序 微信公众平台 前端开发 4月月更 微信平台

苹果手机怎么恢复备份?iOS备份恢复教程

茶色酒

苹果手机备份

自己动手写 Docker 系列 -- 6.5 启动时给容器配置网络

Go Docker 4月月更

别再用老版云效Projex项目协作了,该升级了

阿里云云效

阿里云 项目管理 研发团队 项目协作 项目协作工具

架构实战营 - 第 6 期 模块四课后作业

乐邦

「架构实战营」

云原生训练营 -Week10

jjn0703

云原生训练营

Go 语言入门很简单:正则表达式

宇宙之一粟

正则表达式 Go 语言 4月月更

提前起跑的OPPO,靠闪充完成一次“三级跳”

脑极体

redis优化系列(四)哨兵机制

乌龟哥哥

4月月更

元宇宙或许翻译错了

涛哥 数字产品和业务架构

元宇宙

[Day24]-[二叉树] 相同树

方勇(gopher)

LeetCode 二叉树 DFS BFS 数据结构算法

imazingAPP软件怎么安装到苹果手机电脑上面?

茶色酒

imazing

C语言总结_数组全方位练习

DS小龙哥

4月月更

想学习算法交易的工程师们,机会来啦~

非凸科技

rust 招聘 基金 量化交易 算法交易

时序数据库 vs OLAP

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

Plato Farm的“P2E”经济模型,赚取更多的MARK是关键

BlockChain先知

元宇宙(Metaverse)对普通人意味着什么?

涛哥 数字产品和业务架构

元宇宙

华为云大咖带你玩转云原生基础设施之K8s

坚果

4月月更

什么是瀑布开发?适用于哪些场景?有哪些瀑布开发管理系统?

PingCode

微服务与领域驱动设计,架构实践总结

架构 微服务 领域驱动设计 软件架构

ThinkPHP6+swoole+easywechat使用教程

CRMEB

摩拜单车背后的人工智能二三事_语言 & 开发_尹大胐_InfoQ精选文章