【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

多模态分析

收录了 多模态分析 频道下的 50 篇内容

优酷在多模态内容理解上的研究及应用
优酷在多模态内容理解上的研究及应用

本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。

华为云细粒度文本情感分析及应用
华为云细粒度文本情感分析及应用

随着移动互联网的普及,网络上每天产生大量的文本数据,蕴含着巨大的有价值信息。

DingoDB多模向量数据库正式发布,支持多模态数据统一存储和联合分析
DingoDB 多模向量数据库正式发布,支持多模态数据统一存储和联合分析

DingoDB提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。

结构化视频分析算法与应用 | QCon
结构化视频分析算法与应用 | QCon

每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。

国外知名杂志公司的系统架构是怎么构建的
国外知名杂志公司的系统架构是怎么构建的

本文是本系列文章的第二部分,将介绍我们的NLP即服务系统HAL的架构。

招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用
招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用

招商银行开发了招行智能审查系统,辅助人工开展具备较强专业性的合规审查工作。

多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展,多模态大模型在文档图像智能分析与处理中的应用越来越广泛。多模态大模型通过融合不同模态的数据,能够更全面地理解文档图像内容,提高分析和处理的精度。

人工智能
图像识别
大模型
新一代多模态合规分析平台,炼就服务洞察火眼金睛
新一代多模态合规分析平台,炼就服务洞察火眼金睛

中关村科金升级后的【多模态合规分析平台】能处理对话数据、图片、音频和视频等各种格式的信息,同时采用大小模型组合式AI合规检查机制,对各个渠道的客户互动数据进行聚合分析,实现大模型构成坐席和客户间全场景多模态数据检测与分析,以及客户体验升级。

人工智能
多模态
大模型
客户洞察
虚拟主播上线:多模态将改变人机交互的未来
虚拟主播上线:多模态将改变人机交互的未来

为什么说虚拟主播是多模态研究领域的里程碑式突破?

大模型+多模态合规分析平台,筑牢金融服务安全屏障
大模型 + 多模态合规分析平台,筑牢金融服务安全屏障

依托大量技术应用实践,中关村科金推出以用户为中心的“三位一体”消保管理体系,通过事前预防、事中监督、事后考核,全链路、全流程建设消保体制。

多模态
大模型
安全合规
5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

多模态合规分析平台,保障AIGC营销新时代对客服务高质合规
多模态合规分析平台,保障 AIGC 营销新时代对客服务高质合规

中关村科金深入业务场景,为企业量身打造了【多模态合规分析平台】,针对不同格式素材中的不同审核要素,进行混合规则的合规分析,避免夸大、误传、虚假宣传,确保各类外发内容合法合规,提前规避风险,人机协同更高效。

【AAAI 2024】M2Doc:文档版面分析的可插拔多模态融合方法

M2Doc是一种创新的多模态融合方法,设计用于增强文档版面分析任务中的纯视觉目标检测器。该方法包括Early-Fusion和Late-Fusion模块,前者通过门控机制融合视觉和文本特征,后者则在框级别合并这两种特征。

中文多模态医学大模型智能分析 X 光片,实现影像诊断,完成医生问诊多轮对话

中文多模态医学大模型智能分析X光片,实现影像诊断,完成医生问诊多轮对话

人工智能
自然语言处理
计算机视觉
多模态大模型
优酷视频元素内容召回系统:多级多模态引擎探索
优酷视频元素内容召回系统:多级多模态引擎探索

本文介绍优酷的视频元素内容召回系统。

语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?
语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?

随着近年来深度学习、大算力、大数据快速发展,计算机视觉、语音识别等技术都取得了非常大的进展,综合了多种信息模态的多模态研究已成为一个新趋势。

内容理解做不好,谈什么个性化推荐
内容理解做不好,谈什么个性化推荐

后移动互联网时代资讯爆炸,用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容,实现千人千面精准推荐,通过精细化运营抢夺用户时长,是互联网公司当下最重要的命题之一。

AI 论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构 VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

语义
视觉
多模态信息
文档版式
VSR
让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(三)
让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(三)

亿级淘宝视频背后的多模态AI算法揭秘

多模态分析专题_资料-InfoQ中文网