NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

模态分析

收录了 模态分析 频道下的 50 篇内容

优酷在多模态内容理解上的研究及应用
优酷在多模态内容理解上的研究及应用

本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。

华为云细粒度文本情感分析及应用
华为云细粒度文本情感分析及应用

随着移动互联网的普及,网络上每天产生大量的文本数据,蕴含着巨大的有价值信息。

结构化视频分析算法与应用 | QCon
结构化视频分析算法与应用 | QCon

每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。

国外知名杂志公司的系统架构是怎么构建的
国外知名杂志公司的系统架构是怎么构建的

本文是本系列文章的第二部分,将介绍我们的NLP即服务系统HAL的架构。

招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用
招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用

招商银行开发了招行智能审查系统,辅助人工开展具备较强专业性的合规审查工作。

视频基础技术在百度的应用
视频基础技术在百度的应用

百度近几年在视频领域做了一些基础技术的研究和积累,这些技术在百度内部有非常多的应用场景,其在面向C端和面向B端的诸多场景中得到广泛的使用,并取得不错的应用效果。

DingoDB多模向量数据库正式发布,支持多模态数据统一存储和联合分析
DingoDB 多模向量数据库正式发布,支持多模态数据统一存储和联合分析

DingoDB提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。

多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展,多模态大模型在文档图像智能分析与处理中的应用越来越广泛。多模态大模型通过融合不同模态的数据,能够更全面地理解文档图像内容,提高分析和处理的精度。

人工智能
图像识别
大模型
虚拟主播上线:多模态将改变人机交互的未来
虚拟主播上线:多模态将改变人机交互的未来

为什么说虚拟主播是多模态研究领域的里程碑式突破?

【AAAI 2024】M2Doc:文档版面分析的可插拔多模态融合方法

M2Doc是一种创新的多模态融合方法,设计用于增强文档版面分析任务中的纯视觉目标检测器。该方法包括Early-Fusion和Late-Fusion模块,前者通过门控机制融合视觉和文本特征,后者则在框级别合并这两种特征。

华为云视频封面 & 摘要服务:让视频内容更具吸引力

在这个信息爆炸的时代,视频已经成为了我们获取信息、娱乐、学习的重要方式。然而,面对海量的视频内容,如何让用户快速找到他们感兴趣的内容,成为了每个视频平台和内容创作者的挑战。作为一家科技公司的技术负责人,我一直在寻找能够提升视频吸引力和浏览效

5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

内容理解做不好,谈什么个性化推荐
内容理解做不好,谈什么个性化推荐

后移动互联网时代资讯爆炸,用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容,实现千人千面精准推荐,通过精细化运营抢夺用户时长,是互联网公司当下最重要的命题之一。

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(三)
让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(三)

亿级淘宝视频背后的多模态AI算法揭秘

深入解读华为云细粒度文本情感分析及其应用

摘要:本篇文章主要介绍了情感分析的一些基本任务,包括文本、语音、图像还有生成、识别,着重讲述华为云在细粒度情感分析方面两个工作。

AI
华为云
情感分析
语言语义
文本情感分析
AI 论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构 VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

语义
视觉
多模态信息
文档版式
VSR
语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?
语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?

随着近年来深度学习、大算力、大数据快速发展,计算机视觉、语音识别等技术都取得了非常大的进展,综合了多种信息模态的多模态研究已成为一个新趋势。

中文多模态医学大模型智能分析 X 光片,实现影像诊断,完成医生问诊多轮对话

中文多模态医学大模型智能分析X光片,实现影像诊断,完成医生问诊多轮对话

人工智能
自然语言处理
计算机视觉
多模态大模型
优酷视频元素内容召回系统:多级多模态引擎探索
优酷视频元素内容召回系统:多级多模态引擎探索

本文介绍优酷的视频元素内容召回系统。

技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享
技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享

6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人气爆棚,参会者的激情正如夏日般火热。

阿里云
AI
计算机视觉
经验分享
CVPR
模态分析专题_资料-InfoQ中文网