机器学习在滴滴网络定位中的探索和实践_移动_滴滴技术_InfoQ精选文章

大咖直播-鸿蒙原生开发与智能提效实战！>>> 了解详情 



 写点什么

登录/注册

机器学习在滴滴网络定位中的探索和实践

今天给大家分享的是机器学习在滴滴网络定位中的实践工作，会重点介绍三阶段的演进：无监督模型、有监督回归模型、端到端 CNN 模型。

1. 什么是网络定位

目前定位技术主要包括 GPS、网络定位、惯性航位推算、MM（地图匹配）、视觉定位等。GPS 是最为人熟知的定位技术，是依靠设备与卫星交互来获取经纬度的方式。GPS 精度高，但有冷启动耗时长、耗电大、遮挡场景不可用等缺点。在滴滴场景下，乘客和司机在有遮挡的场景下，例如室内、高架下等，GPS 通常处于不可用状态。这时就需要有其他定位技术作为 GPS 的补充，使得乘客发单、司机导航等服务依然可用。其中最主要的补充便是网络定位。

室内类场景虽然有遮挡，但设备通常可以扫描到 Cell（基站）和 Wifi 列表，而且 Cell 和 Wifi 设备位置相对稳定，连接其上的设备可以借其定位，这就产生了网络定位。网络定位包括 wifi 定位和基站定位，是指基于终端扫描到的 wifi 或基站列表进行的定位技术。Wifi 的接入设备通常称为 AP（Acess Point），方便起见，下文将 AP 和基站统称为 AP。

网络定位通常采用的是指纹定位技术，是一个根据 query 匹配指纹库信息，并计算得到坐标位置的过程。如下图所示，网络定位系统主要包括离线建库和在线定位两个阶段。

离线建库主要是基于有 GPS 时的采集数据，建指纹库的过程。指纹库中记录 AP 的各类信息在不同地理网格内的采集数据分布，如下图所示。

在线阶段，根据线上 query 匹配指纹库信息，并计算得到坐标位置。

本文介绍的主要是在线定位部分，即 query 匹配指纹库、计算坐标位置。

2. 网络定位匹配算法迭代

在线定位算法共经历了无监督概率模型、有监督回归模型、端到端 CNN 模型三次大的迭代。前两个阶段的网络定位主要包括网格召回、网格排序、网格平滑三步，如下图图一所示。端到端 CNN 模型去除了网格排序和网格平滑，基于一个召回中心点，直接回归位置坐标，如下图图二所示。

图一

图二

2.1 无监督概率模型

网络定位要完成在线 AP 与离线 AP 指纹库的匹配，是联合概率计算的过程。

以 AP 指纹库的信号强度分布为例，看下网格概率计算过程。

纵轴为采集数据中的 AP 编号，横轴为空间网格编码，相交点表示每个 AP 在对应网格中的采集信号强度分布。空值表示 AP 在对应的位置无采集数据。

以一个实时定位 query 信息：（AP1：RSSI=1，AP3：RSSI=0）为例，介绍网格召回、排序、平滑的过程。

召回阶段，基于扫描到的 AP1 和 AP3，可以召回 Grid1、Grid2、Grid4；

排序阶段，结合离线 AP 库，基于独立性假设和贝叶斯公式，计算各网格的权重：

$a p_{j}$ 表示观测到的 APj 的信息。以信号强度 RSSI 单一特征为例，上例中，

网格平滑阶段，基于上述的统计概率，排序获取 TopK 个网格，采用爬山法求解最优坐标：

其中， $d_{i}$ 为预测位置到 $G r i d_{i}$ 的距离。

2.2 有监督回归模型

无监督概率模型的方法，思路清晰易懂，易实现，是早期网络定位的主要方式。但有以下问题：

联合概率的方式对采集信息不充分的位置不友好，例如上例 $W_{G r i d_{2}} = 0$
难以拟合多维特征，尾部 badcase 较严重
技术目标无法得到直接优化，天花板较低

出于对以上问题的思考，整体流程仍保持网格召回、排序、平滑三阶段，我们将网格排序升级为有监督回归模型，通过引入多元特征和显式的优化目标，实现对网格的更精准打分。

Label：待预测网格与真实位置的位置偏差，回归任务。

特征工程：构建近百维特征，主要包含 AP 特征，网格特征，前文信息等。

模型选择：一期上线 GBDT 模型；二期对比了 GBDT、FM、DeepFM、FM+GBDT 等，最终线上最优融合模型结构如下。

原始特征中的稠密特征和低维稀疏特征经过 GBDT 进行特征组合、交叉；GBDT 输出的叶子节点编号与高维稀疏特征经过 DeepFM 网络，最终输出网格与真值的位置偏差。

TopK 网格平滑：预测偏差距离从小到大排序，截取 TopK 网格；爬山法，梯度下降求解最优坐标。

2.3 端到端 CNN 模型

有监督模型在特征利用、模型结构、优化目标等方面提供了更大的操作空间，可以极大地打开天花板。上线后定位精度等指标取得了显著的收益。

但该方法仍有以下问题：

每个网格孤立刻画，信息采集时的不均衡、有偏的问题无法有效解决
TopK 平滑层与排序层割裂，无法联合优化，且引入部分人工超参

对于以上问题，考虑以下解决方案：

CNN 网络：充分利用空间信息的局部相关性，增强特征的提取能力
端到端网络：合并排序与平滑层，改为直接回归位置坐标，目标更统一，减少人工超参

最终，整体网络结构如下:

下面以基站定位为例，介绍该结构的实现细节。

首先介绍下输入特征的构建：

Wide 网络特征：表达 Query 信息的 Wide 特征共十几维
CNN 特征图的构建：
召回中心：采集热度较高的 TopN 网格的经纬度中位数作为图的中心点。
特征图构建：选取 C 维图特征，每一维特征为一个 channel；基于召回中心，构建 M*M 分辨率的特征图。

CNN 特征类别

网格上各个 channel 的特征计算

输入特征图的示例

网络结构：在 CNN 网络部分，采用多尺度卷积核提取特征后，经过两个卷积+池化层后，将特征图打平。Wide 部分稀疏特征经过 embedding 后，与稠密特征级联。两部分 tensor 级联后经过全连接层，最终输出与召回中心点的位置偏差。

Label 与 Loss：label 为真实位置与召回中心位置的偏移 dx 和 dy，召回中心点+预测偏移即得预测位置。loss 最初使用的是经纬度的 L2 loss：

考虑到经纬度在球面上表达距离的差异，我们改为了使用球面距离偏差作为 label，也获得了稳定的收益：

dx 和 dy 表示真实空间距离

CNN 模型在线上 AB 实验取得了显著的收益，已全量上线。

CNN 端到端模型升级了信息的表达方式，由单网格、结构化的信息表达改为了 Image 的表达方式，配合 cnn 网络结构，获取了效果的显著提升；并且将几十甚至几百个网格的预测问题改为了单次位置回归问题，虽然模型复杂度有所增加，但整体性能基本持平。

2.4 线上效果

网络定位三阶段的模型先后上线进行了 AB 对比实验。以基站定位三个主要技术指标为例，对比结果如下表所示：

3. 总结与展望

本文总结了定位策略团队在网络定位算法侧的工作，介绍了无监督概率模型、有监督回归模型、端到端 CNN 的演进及其中的思考。

无 GPS 时的定位仍面临着很多困难，未来我们将在以下方面持续探索：

模型效果优化：
目前 CNN 模型在基础信息利用、召回等方面仍有较大优化空间。
性能问题：
考虑线上性能，在基础信息和网络结构上做了很多删减。期望通过更优的召回策略、蒸馏剪枝等平衡效果与性能。
5G 技术：
5G 的天然优势（高频率、高密度、低延时）也必定会带来定位精度的显著提升，相关调研工作正在进行。
复杂场景定位：
对于室内、地下停车场等典型复杂场景，网络定位面临着真值获取难、移动 ap 等难点。细分场景也逐渐向模型化方向演进。

以上就是滴滴网络定位近期工作的实践介绍，欢迎随时交流。

作者介绍：

刘磊，滴滴专家算法工程师

2017 年加入滴滴，目前从事地图定位算法方向，多年 LBS 领域算法研究工作，在滴滴先后从事猜你想去、上下车点推荐、定位算法等方向的开发工作。

尹卜一，滴滴高级算法工程师

2018 年加入滴滴，主要从事网络定位、惯导推算等方向的算法开发工作。

林宇，滴滴高级算法工程师

2018 年加入滴滴，主要从事网络定位、融合定位等方向的算法开发工作。

本文转载自公众号（ID：）。

原文链接：

机器学习在滴滴网络定位中的探索和实践

评论

发布

暂无评论

RPA机器人如何确保敏感数据的安全性

数据安全 #数据

Redis Desktop Manager (RESP) mac数据库管理工具

Redisson读写锁和分布式锁的项目实践

量贩潮汐·WholesaleTide

基于 AST 的全栈代码生成技术白皮书

代码制造者

可视化开发抽象语法树AST

提高IT运维效率，深度解读京东云AIOps落地实践（异常检测篇）

京东科技开发者

HR 必看！RPA 如何帮你从繁琐人资工作中 “解脱”？

人力云人力资源产业

委外管理真能救企业？成本降低效率提升才是关键！

积木链小链

数字化智能制造委外管理

Google推出XR眼镜，DePIN 将驱动下一代空间计算

技术去中心化算力 web3 DePIN

苹果电脑分屏办公怎么用？mac分屏办公就用 magnet

【CodeBuddy】三分钟开发一个实用小功能之：可爱风空调遥控器

反转链表（花式反转）

不在线第一只蜗牛

数据结构算法链表

最新调查显示，尽管存在知识差距，但市场营销领导者认为通用顶级域 (gTLD) 潜力巨大

奥特斯在充满挑战的市场环境中实现营收增长

兼容M1的数据分析软件Minitab Express for Mac

AutoCAD 2019中文版(附安装教程图解)-Mac/win

提高IT运维效率，深度解读京东云基于自然语言处理的运维日志异常检测AIOps落地实践

京东科技开发者

鸿蒙开发：健康保险类应用的ArkUI实践

2025中国企业出海：技术如何成为增长引擎

小程序容器小游戏引擎小程序技术小游戏技术

Mobupps荣膺Great Place to Work®认证

IBM 研究：CEO们在应对企业挑战的同时加码AI投入

App Builder技术选型指南：从AI编程到小程序容器，外卖App开发实战

APP开发小程序容器小程序技术小程序容器技术 AI编程

高效办公！Paste for Mac 剪贴板神器！

阿里巴巴 MCP 分布式落地实践：快速转换 HSF 到 MCP server

阿里巴巴云原生

阿里云云原生 Higress

科研党必备！FlowJo 10 助力流式细胞术分析，一键出图，拒绝繁琐

科研数学软件：MATLAB R2024a完整版安装教程

2025 开源之夏开启报名｜AI + 云原生，10个开源项目、24个课题任您挑选

阿里巴巴云原生

阿里云开源云原生

怎么用DeepSeek一键生成思维导图？DS最新使用技巧分享！

职场工具箱

AI 办公软件 AIGC DeepSeek AI生成思维导图

RPA机器人流程自动化如何优化人力资源工作流程

人力资源 RPA评测人力资源管理

鸿蒙开发：金融记账应用ArkUI实践

从校园实验室到京东零售：一位算法工程师的风控实战录

京东科技开发者

VMware vCenter Server 9.0 下载 - 集中管理 vSphere 环境