写点什么

一场“垃圾堆积问题”的 AI 数据漂流

  • 2025-10-15
    北京
  • 本文字数:3601 字

    阅读完需:约 12 分钟

大小:1.84M时长:10:44
一场“垃圾堆积问题”的AI数据漂流

随着城市人口激增与基础设施日趋复杂,海量治理事件与跨部门协同需求交织,城市治理传统人工处置模式已难以应对效率与精准度的双重挑战。


老余是厦门市思明区的城市治理服务队成员,与同事们日常负责采集城市设施损坏、环境卫生、交通问题等数据。传统数据上报需经历多个环节,耗时长、效率低。而现在,如果老余发现小区门口有垃圾堆积,只需要掏出手机拍照并简单描述,即可一键完成提交,自此一场城市治理数据的 AI 漂流就此开启。在数字化浪潮席卷全球的今天,城市治理正面临着从传统模式向智能化转型的关键变革。


厦门智慧思明数据有限公司(以下简称 “智慧思明公司”)依托百度飞桨平台与文心大模型技术,打造建设运营一体化的一网统管城市治理 AI 智能应用助手,重构全流程,帮助从业者提升工作效率和内容质量。


目前,项目已在厦门市思明区的多个核心部门已经用上了这款“一网统管城市治理 AI 智能应用助手”,覆盖了城市管理、社区服务等重点领域,有效派发率 99%,AI 智能派发率达到 48%,处置达标率 98%,用户群体逐步扩大


智慧思明·一网统管系统界面


基于百度 AI 支持的智能应用助手技术架构

起始站:智能上报,从“手动填报”到“一拍即识”


数据 AI 漂流的起点,从信息的采集上报开始。曾经复杂的流程,即便是一线服务多年的老余也挠头。首先是工单上报要求严格细致: 每个待处理事项都需要至少拍摄两张以上照片——一张清晰展现地理位置,一张特写定位具体问题——并配以详尽的文字描述,准确说明事件发生的具体位置、角落及具体情况。同时,上报还需要遵循“一张工单一事项”原则,即使同一地点出现多个问题(如既有垃圾堆积又有道路破损),也必须拆分成独立的工单分别提交。而工单分类也面临较大压力,因为需要手动从庞大的城市治理事件三级分类体系中选择精确的事件类型,该体系总计包含超过 900 种细分类型(例如,垃圾问题就细分为垃圾满溢、垃圾乱倒、乱堆物料、门前三包不达标等不同类别),以便将工单准确派发给对应的责任单位或部门。


一旦上述要求不能准确满足,工单就有可能会被打回反复调整,这无疑增加了城市服务队伍工作压力。


智慧思明公司技术总监黄磊介绍,针对这些实际操作中展示出的问题,智慧思明公司基于飞桨低代码开发工具 PaddleX 中的 CLIP 图像分类模型与多模态大模型开发套件 PaddleMIX 中的 InternVL 多模态模型,打造 AI 智能上报功能,实现 “拍照即识别、多问题一框全揽” 的跨越式升级,为巡查员提供了强大的辅助。


AI 智能上报


CLIP 图像分类模型是看图说话小能手,凭借其轻量级双塔架构和零样本迁移特性,为系统提供高效的图像-文本基础对齐能力,适用于海量数据快速筛选;InternVL 则更像是一个专注细节的侦探,在 CLIP 输出的粗粒度结果上进行细粒度语义解析。依托飞桨框架实现无缝衔接,构建‌“CLIP 粗筛+InternVL 精判”‌的交互系统,推理时间减少 40%,通过图像、文本双向识别,能够兼顾效率与精度。


智慧思明公司作为百度飞桨(厦门)人工智能产业赋能中心的联运合作伙伴,在项目推进过程中,得到了中心技术人员及区域 PPDE(飞桨开发者技术专家)的全程深度支持。特别是在对 InternVL 进行适配时,中心携手区域 PPDE 从技术路线规划、模型部署到推理速度优化,为智慧思明公司提供了专业化的关键助力。


例如垃圾堆积问题的图片上传后,系统先调用飞桨低代码开发工具 PaddleX 中的图像分类模型 CLlP_vit_base_patch16 _224 完成二级事件类型识别,再将识别结果交由多模态大模型开发套件 PaddleMIX 多模态模型 InternVL,进一步细分出三级事件类型,最后回填事件内容与详情。


不论是城市治理服务队队员还是普通市民,通过“智慧思明·一网统管平台”,仅需上传事件照片和简要描述,地理位置信息自动关联,即可协助形成最源头处的采集数据。“AI 智能上报系统让我们能够迅速获取并处理上报的事件,减少了传统方式下的繁琐步骤,极大提升了我们的工作效率和准确性。”老余说。


现在上报一个事项的操作时间从 5 分钟压缩至几十秒,识别准确率达到 95%以上;同时,系统支持一张图片识别多个问题,重复操作减少 60%;一线人员也不用再事无巨细记忆复杂分类标准,显著降低工作人员的学习负担

第二站:智能分派,从“经验派单”到“数据驱动”


老余提交垃圾问题的信息后,数据来到第二站:事项分派环节。坐席组人员需依据上报内容进行研判,将事件分派至对应处理部门,这决定着事项能否得到恰当处理。过去,这个关键环节面临着极大的压力。


城市治理事项的分派处置具有多链路层级,对于坐席组人员的经验和记忆要求高。例如,同为垃圾堆积问题,在区属范围的要派给园林局,街道管辖范围的则需分派给所属街道办。同时,同一事项多人上报时有发生,给后续环节都带来重复的无效劳动和资源浪费。


智慧思明公司 AI 架构师廖陶东介绍,基于既往城服队员上报的历史数据,为模型训练提供了海量的城市治理类高精标注数据样本。在分派环节,智慧思明公司构建了“智能分派”“智能核单”“智能问答”等功能,破解人工分派经验依赖、效率偏低的难题:


  • 数据整合:基于海量历史工单数据,按照事件类型、地址、描述、首派单位、接管单位等 56 个关键字段进行拆分,通过百度研发的高性能文本向量化模型文心大模型 ERNIE-text-embedding,对数据进行向量化处理,构建自有知识库;

  • 向量匹配:向量模型将新上报事项编码为语义向量,通过余弦相似度等算法快速匹配目标事件与知识库中的候选事件向量,实现毫秒级响应;

  • 智能合单:当向量匹配超过一定阈值,系统将对事件标记为重复派单,交由坐席组进行确认和工单合并,以减少派单冲突问题;

  • 人工验证:生成分派结果后,坐席人员可直接对智能推荐结果进行二次判断和修改。


AI 智能分派


截至目前,智能派单系统累计推荐工单 26434 件,按推荐单位成功派发率达 70%以上。“能够快速定位相似事件处理经验,减少了独立决策的压力,尤其在面对复杂事件时,显著提升了信心和效率。”一位坐席员反馈。

第三站:智能研判,从“人工复核”到“智能助手”


老余的工单被判定为垃圾管养问题,分派至园林局。后续又交由研判中心复核组,对分派及上报结果二次复核,以确保事项处置合理。


但传统复核非常依赖工作人员经验,同时复核事件流程长,跨区域、跨时间等多维度数据查询、整合周期长,若研判人员因经验不足,整体效率还会再打折扣,复核难以及时支撑决策。


智慧思明公司基于文心大模型开发出“智能研判助手”,涵盖研判工作手册所有规定,复核组人员可通过自然语言提问,基于文心大模型对话补全能力,准确识别和理解出工作人员语言中所提供的多维信息,实现查询历史数据、进行规范问答,还能分析分派结果是否合理。


遇复杂场景时,研判助手可自动校验事件分派合理性,并通过文心大模型的“函数调用”功能调用数据中台 API 接口,整合现有及历史数据。最终,根据需求分析结果,调用文心大模型能力,自动生成文字结果。若不合理,还可给出应分派至的委办局或街道等意见,辅助研判组完成复核处理。


通过与研判助手直接咨询问答,为研判提供佐证支撑,工作人员处理疑难件的时间减少了 40%,从原先平均每件 8 分钟缩短至 5 分钟,查阅资料的时间减少了 50%,大幅提高了整体工作效率。


AI 智能研判分析

第四站:智能报告,从“逐个归纳”到“秒级输出”


城市治理的数据终端,呈现为一份数据详实、分析得当的报告。


数据分析师需要调动各个平台的多种数据,对城市治理状况进行周期性归纳,形成大量统计分析报表。同时,报告以周报、月报的形式定时产出,涵盖上报事件、分派事件、研判及二次复核等多元数据,频率要求高而手工整理耗时极长、导致工作效率低。


在此背景下,“智能分析助手”应运而生


  • 任务拆分:基于工作流工具,将一份报告任务拆解固定格式和多个子任务;

  • 数据检索:根据要求从实时数据中台匹配召回子任务中需要的上下文,实时汇聚上报、分派、研判等全流程数据;

  • 内容生成:使用文心大模型编写指定任务,生成含文字、图表等形式的周报、月报内容;

  • 人工助力:报告初步生成后,通过数据分析师的人工补充和集成,原先 3-5 小时才能完成的周报,经 AI 赋能可实现 1 分钟生成,30 分钟内完成人员检查确认。


AI 智能分析报告


黄磊介绍,智慧思明公司项目选择百度 AI,背后是技术适配与生态协同的双重考量。飞桨的视觉模型展现出多模态交互的强劲实力;飞桨低代码开发工具 PaddleX 技术门槛低,普通 Python 工程师也能快速上手训练。更关键的是,百度 AI 生态构建的技术服务网络,与智慧思明公司推进城市治理智能化的需求深度契合。从模型能力迭代到生态活动赋能,百度持续输出的技术培训、算法大赛、经验交流等资源,助力团队突破 “跨业务技术复合人才短缺” 的瓶颈。


百度 AI 将携手以智慧思明公司为代表的城市治理数字化服务企业,通过应用 AI 技术赋能更多城市管理模块,进一步扩展从社区服务到城市级管理的全方位智能化覆盖,建立一个基于 AI 的城市综合治理平台,实现更广泛的场景联动和业务融合。让城市治理场景中的 AI 应用,既有技术深度,又有落地速度,为智慧思明公司打造城市治理新范式提供核心动力。

2025-10-15 16:3215

评论

发布
暂无评论

AI时代深度思考-Remote Agent新一代软件开发协同范式

AI agent cursor

CrossOver和虚拟机哪个好用?苹果电脑怎么运行Windows软件?

阿拉灯神丁

pd虚拟机 CrossOver Mac下载 如何在Mac运行win

在AI时代挖掘真实需求:从某知名代理工具的用户反馈看功能演进

qife122

需求分析 代理工具

第五款 HarmonyOS 上架作品 奇趣故事匣 来了

万少

HarmonyOS

Kyutai 开源 TTS 模型;Rokid Glasses :语音 AR 免提导航丨日报

声网

基于 ETL 工具实现人大金仓数据库的数据迁移与整合实操指南

谷云科技RestCloud

数据库 数据迁移 ETL 人大金仓 数据集成工具

车用虚拟化技术:域控融合的必经之路

财见

全球百万用户的选择:咕泡科技,推动每一次人才升级!

咕泡科技

人工智能 AI 咕泡科技

Cloudflare 日志采集和分析最佳实践

观测云

Cloudflare

http流量镜像

八苦-瞿昙

n8n完全指南:从入门到精通的工作流自动化实践

知识浅谈

n8n 自动化、

大数据-32 ZooKeeper 分布式锁 Java 附带案例 代码

武子康

Java 大数据 hadoop zookeeper 分布式

漏洞赏金猎人如何最大化利用VPS:从自动化脚本到高级安全测试

qife122

网络安全 漏洞挖掘

对话式 AI workshop:Voice Agent 全球五城开发实录

声网

7年前被骗的钱回来了!虽然被骗4.1w只回来不到2千,但我又一次相信公平正义了!

程序员晚枫

从零构建分布式索引系统OriginDB:原型篇

shihlei

MySQL 数据库 lucene redisearch 内存索引数据库

开启报名|Nacos3.0 开源开发者沙龙·杭州场 Agent&MCP 专场

阿里巴巴云原生

阿里云 云原生 nacos

StarRocks × Tableau 连接器完整使用指南 | 高效数据分析从连接开始

镜舟科技

数据分析 StarRocks Tableau 可视化数据 交互式分析

大数据-31 ZooKeeper 内部原理 Leader选举 ZAB协议

武子康

Java 大数据 zookeeper 分布式 注册中心

北京中烟创新科技有限公司:资质与荣誉的双重里程碑(深度解析)

中烟创新

0day漏洞的崛起:网络安全领域的隐形威胁

qife122

网络安全 0day攻击

Spring AI Alibaba 游乐场开放!一站式体验AI 应用开发全流程

阿里巴巴云原生

阿里云 开源 云原生 Spring AI Alibaba

Datax安装及基本使用

刘大猫

人工智能 数据挖掘 算法 数据分析 DataX

在AI时代挖掘新需求:从安全黑名单项目中洞察用户真实诉求

qife122

网络安全 需求分析

商场广告:LED显示屏如何成为吸睛利器?

Dylan

广告 LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏

为什么越来越多 Airtable 用户开始尝试 NocoBase?

NocoBase

开源 低代码 零代码 开发工具 Airtable

WebGL开发数字孪生项目的流程

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

Parallels Desktop对Mac的损害大吗 PD虚拟机怎么设置内存和CPU 运行Parallels玩游戏发热怎么办

阿拉灯神丁

Mac 软件 pd虚拟机 Parallels Desktop Parallels 永久密钥 虚拟机安装

使用Freeway工具进行WiFi渗透测试的实用指南

qife122

网络安全 WiFi安全

2025年需重点关注的高危CVE:关键漏洞追踪指南

qife122

网络安全 CVE

iPaaS 与 API 管理:企业数字化转型的双引擎

谷云科技RestCloud

集成平台 API管理 ipaas

一场“垃圾堆积问题”的AI数据漂流_DataOps_飞桨PaddlePaddle_InfoQ精选文章