写点什么

构建用户安全评级,UGC 智能化审核应用实践

  • 2021-04-13
  • 本文字数:3640 字

    阅读完需:约 12 分钟

构建用户安全评级,UGC智能化审核应用实践

导言

将人工智能(AI, Artificial Intelligence)技术,用于审核互联网上用户生产内容(UGC,User Generated Content)日益广泛,能够提高人工审核的效率。AI 审核既要考虑单个内容的违规情况,也要延伸到发布该内容的用户维度上。本文将分享智能化审核在爱奇艺审核业务中的实践和应用:对用户的安全性进行建模和评级,同时结合 AI 内容安全检测,实现更智能化、更高效的 UGC 审核策略。

背景

互联网内容安全审核,即对用户生产的视频、音频、图片、文字等内容进行审查,合规的内容才能发布,以净化网络环境。


目前业界采用的审核策略是 AI+人工。其中 AI 策略主要是采用深度学习模型,从图片、文本、音频等内容维度,智能识别其中的涉政、涉黄、暴恐等违规信息,即 AI 内容安全检测。图 1 是当前主流的智能化审核解决方案。

图 1:主流的智能化审核解决方案


然而,搭建一套 AI 内容安全检测服务的成本较高:一方面,针对涉黄、暴恐等不同的违规类型,需要大量、分类别、高质量的标注数据,主要是人工标注;另一方面,为达到可用的准确率,普遍采用深度模型,训练和推理都依赖昂贵的 GPU 资源。


业界也考虑到,内容的安全不应只在单个内容上,还需要结合更高的维度,如上传内容的用户,主要有两个形式:1,建立用户黑、白名单;2,基于用户历史数据,定义运营规则,给用户打分。这种方案存在准确度低、误判高的问题。


为了优化上述问题,本文借鉴用户风控的思想,提出了用户安全评级:采用机器学习算法,对用户的信誉度、安全性进行建模,能够预测用户的未来表现。之后,再结合 AI 内容安全检测和人工审核,制定灵活的审核策略,实现了智能化审核,并在爱奇艺审核业务中落地。

UGC 智能化审核

方案设计

本文提出的 UGC 智能化审核方案,主要包含两个部分:


用户安全评级。评估用户的安全性,一方面,为了可量化、更客观,主要从用户上传内容的通过率、高危率等维度进行衡量。另一方面,为了具有前瞻性,采用 AI 算法,对其进行预测。


智能化审核策略。用户上传一条内容后,将优先调用其安全评级,对高等级用户的内容,可以不调用 AI 内容安全检测服务。并且可以影响审核优先级,用户等级越高,审核的耗时越短。


因此,该方案具有以下优势:

1.用户安全评级定义客观,并具有未来预见性,因此准确度高;

2.节约成本。用户安全评级不依赖人工标注,并且计算轻量。也减少了 AI 计算资源;

3.降低合规内容的审核耗时,提升用户体验;

4.辅助审核,提高人工审核效率。

用户安全评级

用户安全评级的建模,采用了自监督的机器学习方案。首先,收集用户历史上传和审核数据、用户画像、用户注册认证等业务方数据;然后,统计计算用户的特征,并自动化标注其安全等级,从而形成训练数据;之后,结合业务特点,进行提取、筛选、变换等特征工程;最后,选择合适的 AI 算法,进行模型训练,并评估效果。整体流程如图 2

图 2:用户安全评级的构建流程

——用户安全评级的无监督标注

用户安全评级,是以用户上传内容的审核结果表现为标准,划分为不同的安全等级。等级越高,其生产的 UGC 越安全,即审核通过的概率越高、违规的程度越低; 反之亦然。


用户安全等级的标注,同时要具有一定的预见性和前瞻性,所以主要参考用户在“未来”一段时间内的表现,历史的表现为辅。另外,如果采用人工标注的方式,一方面,评估标准不好确定,难度大;另一方面,用户的表现是变化的,需要经常标注一批用户等级,以保持模型更新迭代,很耗人力。


为此,本方案采用了无监督标注、客观直接的等级评估标准。不同时间区间(如未来 1 天,历史 1 天、7 天)设置不同的权重系数,加权计算每个用户的综合通过率 PassRate, 

其中,pi为一个用户在时间区间 i 内生产内容的审核通过量,ti为该时间区间内生产内容的总量,wi为相应时间区间的权重系数。


再结合置信度(如通过率方差、上传总量),定义各个安全等级的标准,从而将每个用户划分到对应的等级。比如,共划分 10 级。


——特征工程及模型训练

所需特征,主要是用户在审核业务中的历史行为,如在历史近 1 天、7 天、30 天等各时间区间内的通过率、上传量、高危量等维度的特征。同时,也可以尽可能从其他业务方收集用户的数据,例如,用户的注册信息、用户画像、被举报等数据,能从一定角度反应用户的安全性。


有了用户的特征数据,和上小节中的用户安全等级标注进行拼接,构造出训练数据,样本形式如表 1

表 1:用户安全等级模型的样本


构造完训练数据之后,便可以选择合适的算法,进行特征工程,和用户安全等级模型的训练。


用户安全等级模型,属于多分类问题。考虑到特征中连续值较多的特点,选用 GBDT 算法(Gradient Boosting Decison Tree,梯度提升决策树),并选用了 XGBoost 开源框架。XGBoost 是 GBDT 的高效实现,具备运行效率高、健壮性好等特点。


为减少特征工程,提高预测的准确度,也采用了 DeepFM 深度学习算法,并改进了网络结构,见图 3。比如,将通过率特征分桶转化为 one-hot 特征,支持 multi-hot 类型特征。最后,会将 GBDT 和 DeepFM 两个模型的预测结果进行融合。

图 3:用户安全等级的 DeepFM 网络结构


由于整体用户的表现会随时间有变动,为了保证模型效果的稳定性,模型会定期地自动化更新。因为是无监督标注,所以模型更新很简便:统计计算每天的用户特征和对应的等级标签,即当天的样本,再和历史样本合并,得到训练样本,随机划分训练集和测试集;然后分别训练 GBDT 和 DeepFM 模型;并在测试集上评估效果,若效果达到预设的阈值,即可发布到线上服务。


——模型优化

UGC 审核不通过的原因有很多种,有广告、灌水等普通违规类型,也有涉政、色情等高危违规类型。高危内容的影响恶劣,危害极大,为了识别这类内容,本文特别重点关注。用户安全等级模型,由于主要以用户通过率为标准,对于高危违规内容的预测能力较弱。为此,专门增加了一个高危用户的检测模型,用于预测用户在未来几天是否会发布高危违规类型的内容。


高危用户的标注,和用户安全等级的标注类似,但更简单,主要是看用户在未来几天是否发布了高危内容。用户特征也与用户安全等级模型的相似,构造出的训练数据形式如表 2


表 2:高危用户检测模型的样本


高危用户检测模型,属于二分类问题,主要在于召回高危用户,筛选出高危内容,以降低平台的风险。算法也选用了 GBDT 模型与改进的 DeepFM 模型。具体流程如图 4


增加高危用户检测模型后,大幅提升了对高危用户和内容的检测能力。

图 4:用户安全评级的综合流程


——模型推理

得益于公司完善的大数据处理平台和机器学习平台,训练数据的收集和计算,用户安全等级模型和高危用户检测模型的训练、评估和推理部署,能够很方便、高效地完成。


当某用户上传了一条内容,首先可能会经过用户风控等环节,决定用户能否上传内容。上传成功后,进入审核流程:基于用户 ID,先获取模型所需的用户特征,再实时请求用户等级模型和高危模型的线上推理服务,从而获得用户的安全等级和高危结果。


将两种预测结果融合,确定最终的用户安全类别。首先,对于十级的安全等级,根据各业务的实际情况,可将 1-10 安全等级灵活地划归为高、中、低三个等级,如 9~10 级为高等级用户;5~8 级为中等级;1~4 级为低等级。然后,结合是否高危,最终划分为三类用户:安全用户、一般用户、危险用户,如表 3

智能化审核策略

得到用户的安全类别后,可以灵活地配置不同的审核和发布策略,实现智能化的审核。例如,可以定制表 3 策略:

表 3:用户类别划分及智能化审核策略


无论是极速通道,还是普通通道,经审核后发布到线上的 UGC,还将监测其在线上的曝光量、曝光时长、举报等指标,当达到一定阈值时,将其召回,回流到监控审核流程。这种策略,使得所有的内容,都会经过交叉审核、人工审核,并且可能会经过多次人工审核,确保了内容的安全可控。


对于各个 UGC 在人工审核时的优先级,上传用户的安全等级将作为一项重要因子参与到优先级的计算,最终的优先级还会参考内容的上传时间、是否新用户上传等多种因素。安全评级越高,其上传的 UGC 越优先被审核,降低了合规 UGC 的审核时长。


综上所述,智能化的审核策略如图 5 所示:

图 5,智能化审核策略

总结

本方案构建了一套用户安全评级模型,定义了以通过率和高危违规与否为主要衡量指标的用户安全标准。无监督标注数据,基于各维度的历史行为和属性等特征,训练得到用户安全等级模型和高危用户检测模型;并融合两个模型的结果,准确地预测出用户的安全类型。之后,再结合 AI 内容安全检测的结果,筛选出安全的内容,极速通道审核发布。既降低了 AI 内容模型的计算资源和时间消耗;又大幅缩短了审核发布时间,提升了用户体验;并且,通过人工审核,确保了内容的安全可控。


该智能化审核方案在 UGC 视频审核业务上线后,AI 内容模型的计算资源减少了 25%;优质视频的平均审核时长缩短了 80%。


后续,将继续探索通过优化标注方案和改进算法模型,以提高用户安全类别的预测准确性;同时对于图文审核、直播审核等业务,分别训练模型,以赋能更多业务。从而持续提升审核的时效和效率,优化用户体验,保障爱奇艺的内容安全。


本文转载自:爱奇艺技术产品团队(ID:iQIYI-TP)

原文链接:构建用户安全评级,UGC智能化审核应用实践

2021-04-13 07:003656

评论

发布
暂无评论
发现更多内容

在线正则表达式大全测试

入门小站

工具

区块链架构下 智慧城市发展加速

CECBC

区块链等技术助力北京海关监管

CECBC

在线Javascript美化格式化工具

入门小站

工具

java版gRPC实战之三:服务端流

程序员欣宸

gRPC

前端食堂技术周刊第 30 期:Vercel 支持零配置部署使用 pnpm 项目、React 新文档更新、Angular Roadmap、Remix Stacks

童欧巴

JavaScript 编程 前端 周刊 资讯

“中本聪岛”加密乌托邦

CECBC

URL的四种形式对比说明

源字节1号

前端开发 后端开发 网站开发

融云猿桌派:35 岁程序员,正值当打之年,尚有星辰大海

融云 RongCloud

程序员

开放报名丨《音视频社交新风口》线上峰会,聚焦海外社交生态升级

融云 RongCloud

JS Array数组几个循环实用方法总结

MegaQi

JavaScrip 测试发开 web前端开发

Linux之file命令

入门小站

Linux

一文带你了解 Python 中的生成器

踏雪痕

Python 生成器 3月程序媛福利 3月月更

基于微信小程序的实验室预约小程序平台详细设计

CC同学

数字医疗时代的数据安全如何保障?

CECBC

服务器防渗透--信息收集

喀拉峻

网络安全

黑匣子为什么难成为“云匣子”?

脑极体

加密货币监控和区块链分析如何帮助避免加密货币欺诈?

CECBC

Flutter 路由及路由拦截跳转404

岛上码农

flutter ios Android开发 移动端 3月月更

超分算法在 WebRTC 高清视频传输弱网优化中的应用

融云 RongCloud

PyTorch

java版gRPC实战之二:服务发布和调用

程序员欣宸

Java gRPC

360大数据技术专家 程建云:IoTDB在360的落地实践 | Apache IoTDB Talk

Apache IoTDB

时序数据库 IoTDB Apache IoTDB

高层次人才一站式服务平台系统开发

a13823115807

Paxos vs. Raft:我们对共识算法达成共识了吗?

多颗糖

分布式系统 raft PAXOS

kubeadm工作原理-kubeadm init原理分析-kubeadm join原理分析

良凯尔

容器 云原生 kubeadm #Kubernetes# Kubernetes 集群

小程序电商业务微服务拆分及微服务基础设施选型

Geek_36cc7c

[Day3]-[快慢指针]解决链表问题

方勇(gopher)

LeetCode 数据结构与算法

架构实战营-模块一-作业

CityAnimal

架构实战营 #架构实战营 「架构实战营」

java版gRPC实战之四:客户端流

程序员欣宸

gRPC grpc双向流

深入浅出 Java FileChannel 的堆外内存使用

Apache IoTDB

java版gRPC实战之五:双向流

程序员欣宸

gRPC grpc双向流

构建用户安全评级,UGC智能化审核应用实践_AI&大模型_爱奇艺技术产品团队_InfoQ精选文章