【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

构建用户安全评级,UGC 智能化审核应用实践

  • 2021-04-13
  • 本文字数:3640 字

    阅读完需:约 12 分钟

构建用户安全评级,UGC智能化审核应用实践

导言

将人工智能(AI, Artificial Intelligence)技术,用于审核互联网上用户生产内容(UGC,User Generated Content)日益广泛,能够提高人工审核的效率。AI 审核既要考虑单个内容的违规情况,也要延伸到发布该内容的用户维度上。本文将分享智能化审核在爱奇艺审核业务中的实践和应用:对用户的安全性进行建模和评级,同时结合 AI 内容安全检测,实现更智能化、更高效的 UGC 审核策略。

背景

互联网内容安全审核,即对用户生产的视频、音频、图片、文字等内容进行审查,合规的内容才能发布,以净化网络环境。


目前业界采用的审核策略是 AI+人工。其中 AI 策略主要是采用深度学习模型,从图片、文本、音频等内容维度,智能识别其中的涉政、涉黄、暴恐等违规信息,即 AI 内容安全检测。图 1 是当前主流的智能化审核解决方案。

图 1:主流的智能化审核解决方案


然而,搭建一套 AI 内容安全检测服务的成本较高:一方面,针对涉黄、暴恐等不同的违规类型,需要大量、分类别、高质量的标注数据,主要是人工标注;另一方面,为达到可用的准确率,普遍采用深度模型,训练和推理都依赖昂贵的 GPU 资源。


业界也考虑到,内容的安全不应只在单个内容上,还需要结合更高的维度,如上传内容的用户,主要有两个形式:1,建立用户黑、白名单;2,基于用户历史数据,定义运营规则,给用户打分。这种方案存在准确度低、误判高的问题。


为了优化上述问题,本文借鉴用户风控的思想,提出了用户安全评级:采用机器学习算法,对用户的信誉度、安全性进行建模,能够预测用户的未来表现。之后,再结合 AI 内容安全检测和人工审核,制定灵活的审核策略,实现了智能化审核,并在爱奇艺审核业务中落地。

UGC 智能化审核

方案设计

本文提出的 UGC 智能化审核方案,主要包含两个部分:


用户安全评级。评估用户的安全性,一方面,为了可量化、更客观,主要从用户上传内容的通过率、高危率等维度进行衡量。另一方面,为了具有前瞻性,采用 AI 算法,对其进行预测。


智能化审核策略。用户上传一条内容后,将优先调用其安全评级,对高等级用户的内容,可以不调用 AI 内容安全检测服务。并且可以影响审核优先级,用户等级越高,审核的耗时越短。


因此,该方案具有以下优势:

1.用户安全评级定义客观,并具有未来预见性,因此准确度高;

2.节约成本。用户安全评级不依赖人工标注,并且计算轻量。也减少了 AI 计算资源;

3.降低合规内容的审核耗时,提升用户体验;

4.辅助审核,提高人工审核效率。

用户安全评级

用户安全评级的建模,采用了自监督的机器学习方案。首先,收集用户历史上传和审核数据、用户画像、用户注册认证等业务方数据;然后,统计计算用户的特征,并自动化标注其安全等级,从而形成训练数据;之后,结合业务特点,进行提取、筛选、变换等特征工程;最后,选择合适的 AI 算法,进行模型训练,并评估效果。整体流程如图 2

图 2:用户安全评级的构建流程

——用户安全评级的无监督标注

用户安全评级,是以用户上传内容的审核结果表现为标准,划分为不同的安全等级。等级越高,其生产的 UGC 越安全,即审核通过的概率越高、违规的程度越低; 反之亦然。


用户安全等级的标注,同时要具有一定的预见性和前瞻性,所以主要参考用户在“未来”一段时间内的表现,历史的表现为辅。另外,如果采用人工标注的方式,一方面,评估标准不好确定,难度大;另一方面,用户的表现是变化的,需要经常标注一批用户等级,以保持模型更新迭代,很耗人力。


为此,本方案采用了无监督标注、客观直接的等级评估标准。不同时间区间(如未来 1 天,历史 1 天、7 天)设置不同的权重系数,加权计算每个用户的综合通过率 PassRate, 

其中,pi为一个用户在时间区间 i 内生产内容的审核通过量,ti为该时间区间内生产内容的总量,wi为相应时间区间的权重系数。


再结合置信度(如通过率方差、上传总量),定义各个安全等级的标准,从而将每个用户划分到对应的等级。比如,共划分 10 级。


——特征工程及模型训练

所需特征,主要是用户在审核业务中的历史行为,如在历史近 1 天、7 天、30 天等各时间区间内的通过率、上传量、高危量等维度的特征。同时,也可以尽可能从其他业务方收集用户的数据,例如,用户的注册信息、用户画像、被举报等数据,能从一定角度反应用户的安全性。


有了用户的特征数据,和上小节中的用户安全等级标注进行拼接,构造出训练数据,样本形式如表 1

表 1:用户安全等级模型的样本


构造完训练数据之后,便可以选择合适的算法,进行特征工程,和用户安全等级模型的训练。


用户安全等级模型,属于多分类问题。考虑到特征中连续值较多的特点,选用 GBDT 算法(Gradient Boosting Decison Tree,梯度提升决策树),并选用了 XGBoost 开源框架。XGBoost 是 GBDT 的高效实现,具备运行效率高、健壮性好等特点。


为减少特征工程,提高预测的准确度,也采用了 DeepFM 深度学习算法,并改进了网络结构,见图 3。比如,将通过率特征分桶转化为 one-hot 特征,支持 multi-hot 类型特征。最后,会将 GBDT 和 DeepFM 两个模型的预测结果进行融合。

图 3:用户安全等级的 DeepFM 网络结构


由于整体用户的表现会随时间有变动,为了保证模型效果的稳定性,模型会定期地自动化更新。因为是无监督标注,所以模型更新很简便:统计计算每天的用户特征和对应的等级标签,即当天的样本,再和历史样本合并,得到训练样本,随机划分训练集和测试集;然后分别训练 GBDT 和 DeepFM 模型;并在测试集上评估效果,若效果达到预设的阈值,即可发布到线上服务。


——模型优化

UGC 审核不通过的原因有很多种,有广告、灌水等普通违规类型,也有涉政、色情等高危违规类型。高危内容的影响恶劣,危害极大,为了识别这类内容,本文特别重点关注。用户安全等级模型,由于主要以用户通过率为标准,对于高危违规内容的预测能力较弱。为此,专门增加了一个高危用户的检测模型,用于预测用户在未来几天是否会发布高危违规类型的内容。


高危用户的标注,和用户安全等级的标注类似,但更简单,主要是看用户在未来几天是否发布了高危内容。用户特征也与用户安全等级模型的相似,构造出的训练数据形式如表 2


表 2:高危用户检测模型的样本


高危用户检测模型,属于二分类问题,主要在于召回高危用户,筛选出高危内容,以降低平台的风险。算法也选用了 GBDT 模型与改进的 DeepFM 模型。具体流程如图 4


增加高危用户检测模型后,大幅提升了对高危用户和内容的检测能力。

图 4:用户安全评级的综合流程


——模型推理

得益于公司完善的大数据处理平台和机器学习平台,训练数据的收集和计算,用户安全等级模型和高危用户检测模型的训练、评估和推理部署,能够很方便、高效地完成。


当某用户上传了一条内容,首先可能会经过用户风控等环节,决定用户能否上传内容。上传成功后,进入审核流程:基于用户 ID,先获取模型所需的用户特征,再实时请求用户等级模型和高危模型的线上推理服务,从而获得用户的安全等级和高危结果。


将两种预测结果融合,确定最终的用户安全类别。首先,对于十级的安全等级,根据各业务的实际情况,可将 1-10 安全等级灵活地划归为高、中、低三个等级,如 9~10 级为高等级用户;5~8 级为中等级;1~4 级为低等级。然后,结合是否高危,最终划分为三类用户:安全用户、一般用户、危险用户,如表 3

智能化审核策略

得到用户的安全类别后,可以灵活地配置不同的审核和发布策略,实现智能化的审核。例如,可以定制表 3 策略:

表 3:用户类别划分及智能化审核策略


无论是极速通道,还是普通通道,经审核后发布到线上的 UGC,还将监测其在线上的曝光量、曝光时长、举报等指标,当达到一定阈值时,将其召回,回流到监控审核流程。这种策略,使得所有的内容,都会经过交叉审核、人工审核,并且可能会经过多次人工审核,确保了内容的安全可控。


对于各个 UGC 在人工审核时的优先级,上传用户的安全等级将作为一项重要因子参与到优先级的计算,最终的优先级还会参考内容的上传时间、是否新用户上传等多种因素。安全评级越高,其上传的 UGC 越优先被审核,降低了合规 UGC 的审核时长。


综上所述,智能化的审核策略如图 5 所示:

图 5,智能化审核策略

总结

本方案构建了一套用户安全评级模型,定义了以通过率和高危违规与否为主要衡量指标的用户安全标准。无监督标注数据,基于各维度的历史行为和属性等特征,训练得到用户安全等级模型和高危用户检测模型;并融合两个模型的结果,准确地预测出用户的安全类型。之后,再结合 AI 内容安全检测的结果,筛选出安全的内容,极速通道审核发布。既降低了 AI 内容模型的计算资源和时间消耗;又大幅缩短了审核发布时间,提升了用户体验;并且,通过人工审核,确保了内容的安全可控。


该智能化审核方案在 UGC 视频审核业务上线后,AI 内容模型的计算资源减少了 25%;优质视频的平均审核时长缩短了 80%。


后续,将继续探索通过优化标注方案和改进算法模型,以提高用户安全类别的预测准确性;同时对于图文审核、直播审核等业务,分别训练模型,以赋能更多业务。从而持续提升审核的时效和效率,优化用户体验,保障爱奇艺的内容安全。


本文转载自:爱奇艺技术产品团队(ID:iQIYI-TP)

原文链接:构建用户安全评级,UGC智能化审核应用实践

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-04-13 07:001933

评论

发布
暂无评论
发现更多内容

麦聪软件为云上客户提供DaaS服务,入驻国内Top3云市场

雨果

公有云私有云 DaaS数据即服务

JDK1.6中String类的坑,快让我裂开了…

华为云开发者联盟

开发

阿里P8架构师汇总了史上101个最牛逼的Java技术点

钟奕礼

Java 编程 程序员 架构 java面试

Spring源码解析(五)Spring 加载bean 依赖注入

石臻臻的杂货铺

spring 源码 8月月更

MASA Stack 第四期社区例会

MASA技术团队

.net 云原生 dapr blazor MASA

软件测试 | 测试开发 | APK 逆向工程 - 解析 apk 基本信息和方法调用图

测吧(北京)科技有限公司

软件测试 测试 APK

Java:将Excel转换为XPS

Geek_249eec

Java Excel XPS

软件测试 | 测试开发 | app自动化测试之Appium 原理 与 JsonWP 协议分析

测吧(北京)科技有限公司

json

2022年无糖茶饮料发展洞察分析

易观分析

无糖茶 行业洞察

leetcode 409 Longest Palindrome 最长回文串(简单)

okokabcd

LeetCode 算法与数据结构

何止一个惨字形容,水滴Java面试一轮游,壮烈了,问啥啥不会,数据库血崩,我该怎么办?

钟奕礼

Java 编程 程序员 后端 java面试

云监控是什么意思?哪个软件好?

行云管家

云计算 云平台 云监控

软件测试 | 测试开发 | 利用 pytest 玩转数据驱动测试框架

测吧(北京)科技有限公司

pytest

全球首创!网易伏羲提出135种人脸表情划分标准,荣登IEEE官网

网易伏羲

人工智能 IEEE 网易伏羲

软件测试 | 测试开发 | RPC接口测试技术-Tcp 协议的接口测试

测吧(北京)科技有限公司

TCP/IP

软件测试 | 测试开发 | MockServer 服务框架设计

测吧(北京)科技有限公司

软件测试

数字藏品系统开发:详细功能介绍

开源直播系统源码

NFT 数字藏品 数字藏品系统软件开发 NFT数字藏品系统

Quick Tracking「全域采集与增长分析」,破局全域营销之道

瓴羊企业智能服务

企业应用现代化实用教程 | 微服务架构怎么选?Dubbo、Spring Cloud、Istio终极对决

York

微服务 云原生 Spring Cloud istio Service Mesh (ASM)

数字藏品系统开发:(开发NFT数字藏品源码)

开源直播系统源码

NFT 数字藏品 数字藏品系统

软件测试 | 测试开发 | 专项测试技术初识Hook

测吧(北京)科技有限公司

软件测试 hook

开源一夏 |为什么BigDecimal比较大小一定要用compareTo

六月的雨在InfoQ

开源 equals BigDecimal 8月月更 compareTo

授人为师,首期明道云零代码教练员研修班圆满结束

明道云

华为大数据开发平台 DataFactory 行业应用典型案例

宇宙之一粟

华为云 大数据技术 8月月更

佛山等保测评机构有哪些?怎么做?

行云管家

等保 等级测评 佛山

Spring源码分析(六)FactoryBean 接口解析

石臻臻的杂货铺

spring 源码 8月月更

长安链p2p-Liquid学习笔记

长安链

基于 LowCodeEngine 的调试能力建设与实践

阿里巴巴终端技术

前端 低代码

【算法实践】他山之石,可以攻玉--利用完全二叉树快速实现堆排序

迷彩

Python 数据结构 算法 二叉堆排序 8月月更

分布式协同AI基准测试项目Ianvs:工业场景提升5倍研发效率

华为云开发者联盟

云计算 云原生

华为初面+综合面试(Java技术面)附上面试题

钟奕礼

Java 编程 程序员 java面试 后端架构

构建用户安全评级,UGC智能化审核应用实践_AI&大模型_爱奇艺技术产品团队_InfoQ精选文章