收录了 模态分析 频道下的 50 篇内容
本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。
随着移动互联网的普及,网络上每天产生大量的文本数据,蕴含着巨大的有价值信息。
每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。
本文是本系列文章的第二部分,将介绍我们的NLP即服务系统HAL的架构。
招商银行开发了招行智能审查系统,辅助人工开展具备较强专业性的合规审查工作。
百度近几年在视频领域做了一些基础技术的研究和积累,这些技术在百度内部有非常多的应用场景,其在面向C端和面向B端的诸多场景中得到广泛的使用,并取得不错的应用效果。
DingoDB提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。
为什么说虚拟主播是多模态研究领域的里程碑式突破?
亿级淘宝视频背后的多模态AI算法揭秘
后移动互联网时代资讯爆炸,用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容,实现千人千面精准推荐,通过精细化运营抢夺用户时长,是互联网公司当下最重要的命题之一。
微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。
在这个信息爆炸的时代,视频已经成为了我们获取信息、娱乐、学习的重要方式。然而,面对海量的视频内容,如何让用户快速找到他们感兴趣的内容,成为了每个视频平台和内容创作者的挑战。作为一家科技公司的技术负责人,我一直在寻找能够提升视频吸引力和浏览效
随着近年来深度学习、大算力、大数据快速发展,计算机视觉、语音识别等技术都取得了非常大的进展,综合了多种信息模态的多模态研究已成为一个新趋势。
摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。
摘要:本篇文章主要介绍了情感分析的一些基本任务,包括文本、语音、图像还有生成、识别,着重讲述华为云在细粒度情感分析方面两个工作。
本文介绍优酷的视频元素内容召回系统。
本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。
6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人气爆棚,参会者的激情正如夏日般火热。
在 AICon 北京 2019 大会上,徐易楠讲师做了《企业服务中智能交互机器人的实践与探索》主题演讲。