点击围观!腾讯 TAPD 助力金融行业研发提效、敏捷转型最佳实践! 了解详情
写点什么

信息流内容算法

  • 2019-08-17
  • 本文字数:869 字

    阅读完需:约 3 分钟

信息流内容算法

ArchSummit深圳2019大会上,孙子荀讲师做了《信息流内容算法》主题演讲,主要内容如下。


演讲简介


随着深度学习技术的发展,个性化阅读领域的媒体内容有了更加丰富的处理手段。在过去主要是基于机器学习技术来进行内容分类、主题建模等。现在有了更加丰富的技术手段对于视频图片等富媒体内容进行建模处理。


如何应用深度学习技术帮助内容产品提高内容的质量、点击率,如何为新媒体内容运营提供帮助,如何使用算法提高内容处理效率节约人工审核成本,都是现在内容算法能力应用的场景和要解决的问题。


业内领先的内容产品公司随着业务的多元化,开始了中台系统的建设。把原来服务于推荐的内容理解,服务于审核的内容安全,服务于号主的内容处理工具进行了统一整合形成了内容 AI 体系。


演讲提纲


1、内容产品的主要算法问题


  • 人机结合的内容质量

  • 运营和推荐的内容理解

  • 实用的内容处理和内容生成


2、内容 AI 的基石-内容理解


  • 文本分类/主题

  • 文本标签/语义主题词

  • 图片分类

  • 图片标签/基于物体检测/基于语义分割/其他

  • 视频分类

  • 视频标签/多维度描述

  • 内容的向量描述

  • 多任务的内容算法框架


3、人机结合的内容质量


  • 图文去重

  • 视频去重

  • 图片/视频质量描述

  • 标题党/假新闻

  • 多模态内容质量问题


4、信息流场景的实用内容生成


  • 封面图的评价生成

  • 热点内容的自动创作

  • 创意素材制作


5、辅助算法工程系统


  • 模型测试

  • 模型组合拆分


听众收益


  1. 了解当前业内外主流内容产品的内容 AI 问题,对内容产品的内容算法有一个全面认知

  2. 收获内容质量问题场景下,相关算法的研究方向和应用情况

  3. 了解内容产品中对图像,视频,文本进行标签理解的算法选型实践经验


讲师介绍


孙子荀


腾讯科技 专家研究员


毕业后两年为高性能计算进行系统内核开发工作,11 年在百度从事并行化算法方面的研究落地。12 年加入腾讯从事数据下载分布式调度系统研发。15 年开始负责 QQ 公众号后台,从无到有带领团队构建了 QQ 信息流的内容中台,并一直从事负责内容处理,内容理解的算法研究和落地工作。个人在内核 数据挖掘 机器学习上有较好的落地经验和技术积累。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019-08-17 00:006031

评论

发布
暂无评论
发现更多内容

Go: 通过代码学习 Map 的设计 — Part II

陈思敏捷

map Go 语言

Redis系列(七):缓存只是读写回种这么简单吗?如果是,那么请你一定看看这篇文章!

z小赵

redis 分布式 高并发系统设计

国产开源流媒体SRS4.0对视频监控GB28181的支持

潇湘落木

音视频 云直播 短视频 流媒体

架构师训练营第八周作业

张明森

LeetCode 1052. Grumpy Bookstore Owner

liu_liu

算法 LeetCode

面试题:Java 中的 ==, equals 与 hashCode 的区别与联系

简爱W

浅析区块链如何改变生活

CECBC

数字银行 供应链 身体监测 资产管理

HTTPS详解

Bruce Duan

https 对称加密 非对称加密

week8 作业

Shawn

华为云FusionInsight MRS融合大数据平台进阶之路

数据湖洞见

大数据 新特性 FusionInsight 华为云 智能数据湖

职场求生攻略答疑篇之 1 —— 加班沉思录

臧萌

程序员 加班

应用程序研发之基础知识分层与进化

superman

区块链如何切入供应链金融市场?

CECBC

上海首批金融科技“监管沙盒”应用名单出炉 区块链技术备受青睐

CECBC

金融科技 金融监管 创新与安全 智能多元化

推荐一款技术人必备的接口测试神器:Apifox

狂师

测试 测试驱动开发实战营 接口测试 测试框架

安全系列之——RSA的前世今生

诸葛小猿

安全 加密解密 非对称加密 rsa

Golang新手常犯错误之【循环迭代篇】

卓丁

常见错误 引用迭代 Go 语言

一文带你了解Zookeeper所有核心概念

小隐乐乐

zookeeper 分布式 分布式架构

Spring Boot + Vue前后端分离项目,Maven自动打包整合

xcbeyond

maven 前后端分离 springboot 部署

一个好用的工作生活平衡方式

霍太稳@极客邦科技

ARTS WEEK6

紫枫

ARTS 打卡计划

Java架构-Java代码规范那些事

我是苞谷

Java

7个获取访问者真实IP的方法,速学!!!

华为云开发者联盟

nginx 大前端 网站 IP 服务器

实战案例丨ModelArts在数据标注、数据过滤上的应用技巧:自动分组

华为云开发者联盟

人工智能 数据 图像识别 图片 分类

【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏

华为云开发者联盟

容器 层次 API 网关 华为云

ARTS 第 5 周

乌拉里

正则表达式基础详解

懒猫

Java 正则表达式 大前端 正则

Kafka两个高性价比的参数调优

我是个bug

Java 大数据 kafka

[POJ 1002] 487-3279 C++解题报告

一直AC一直爽

POJ ACM

一文了解JDK12 13 14 GC调优秘籍-附PDF下载

程序那些事

GC JDK14 秘籍 JDK12 JDK13

如何去学好JS的8条小建议

华为云开发者联盟

html 编程 大前端 js 代码

信息流内容算法_ArchSummit_孙子荀_InfoQ精选文章