【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。了解详情 



 写点什么

多模态分析

收录了多模态分析频道下的 50 篇内容

优酷在多模态内容理解上的研究及应用

本文中，来自优酷算法中心负责人王晓博将为我们解析，优酷是如何利用多模态技术，最大限度地挖掘视频信息，创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢？让我们来一探究竟。

作者 : 王晓博

2019-04-01

3334

华为云细粒度文本情感分析及应用

随着移动互联网的普及，网络上每天产生大量的文本数据，蕴含着巨大的有价值信息。

作者 : DataFunTalk

2021-03-08

DingoDB 多模向量数据库正式发布，支持多模态数据统一存储和联合分析

DingoDB提供了同时处理结构化和非结构化数据的能力，其多模态特性使其在处理不同类型的数据时更加灵活和高效。

作者 : 凌敏

2023-08-30



结构化视频分析算法与应用 | QCon

每一个视频，不论长短，在拍摄时都是有故事线和逻辑结构的，以往的视频分析主要集中于视频分类打标，而对于视频的细粒度结构分析涉及较少。

演讲人: 王晓博

2020-10-09

国外知名杂志公司的系统架构是怎么构建的

本文是本系列文章的第二部分，将介绍我们的NLP即服务系统HAL的架构。

作者 : Antonino Rau 译者: 平川策划: 辛晓亮

2021-11-12

招商银行人工智能实验室研发工程师赵文婷确认出席 FCon，分享招商银行智能审查系统建设与应用

招商银行开发了招行智能审查系统，辅助人工开展具备较强专业性的合规审查工作。

作者 : 徐晓博

2023-10-11

多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展，多模态大模型在文档图像智能分析与处理中的应用越来越广泛。多模态大模型通过融合不同模态的数据，能够更全面地理解文档图像内容，提高分析和处理的精度。

人工智能

图像识别

大模型

百度开发者中心

01-11

新一代多模态合规分析平台，炼就服务洞察火眼金睛

中关村科金升级后的【多模态合规分析平台】能处理对话数据、图片、音频和视频等各种格式的信息，同时采用大小模型组合式AI合规检查机制，对各个渠道的客户互动数据进行聚合分析，实现大模型构成坐席和客户间全场景多模态数据检测与分析，以及客户体验升级。

人工智能

多模态

大模型

客户洞察

中关村科金

05-10

虚拟主播上线：多模态将改变人机交互的未来

为什么说虚拟主播是多模态研究领域的里程碑式突破？

作者 : 路香菊

2019-04-07

4125

大模型 + 多模态合规分析平台，筑牢金融服务安全屏障

依托大量技术应用实践，中关村科金推出以用户为中心的“三位一体”消保管理体系，通过事前预防、事中监督、事后考核，全链路、全流程建设消保体制。

多模态

大模型

安全合规

中关村科金

06-26

5G 时代下：多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式，且有自己的特点，微博博文内容形式多样，包含文字、图像和视频等媒体，且文本较短，大部分不超过140字，文本表述简洁，简称、不规范用语以及网络流行用语被广泛使用。

作者 : 梁清华

2019-04-14

4673

多模态合规分析平台，保障 AIGC 营销新时代对客服务高质合规

中关村科金深入业务场景，为企业量身打造了【多模态合规分析平台】，针对不同格式素材中的不同审核要素，进行混合规则的合规分析，避免夸大、误传、虚假宣传，确保各类外发内容合法合规，提前规避风险，人机协同更高效。

中关村科金

07-04

【AAAI 2024】M2Doc：文档版面分析的可插拔多模态融合方法

M2Doc是一种创新的多模态融合方法，设计用于增强文档版面分析任务中的纯视觉目标检测器。该方法包括Early-Fusion和Late-Fusion模块，前者通过门控机制融合视觉和文本特征，后者则在框级别合并这两种特征。

阿里云大数据AI技术

03-20

中文多模态医学大模型智能分析 X 光片，实现影像诊断，完成医生问诊多轮对话

中文多模态医学大模型智能分析X光片，实现影像诊断，完成医生问诊多轮对话

人工智能

自然语言处理

计算机视觉

多模态大模型

汀丶人工智能

2023-07-31

优酷视频元素内容召回系统：多级多模态引擎探索

本文介绍优酷的视频元素内容召回系统。

作者 : DataFunTalk

2020-07-19

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

随着近年来深度学习、大算力、大数据快速发展，计算机视觉、语音识别等技术都取得了非常大的进展，综合了多种信息模态的多模态研究已成为一个新趋势。

作者 : 李岩

2019-03-21

2460

内容理解做不好，谈什么个性化推荐

后移动互联网时代资讯爆炸，用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容，实现千人千面精准推荐，通过精细化运营抢夺用户时长，是互联网公司当下最重要的命题之一。

作者 : 邓艳琴

2019-10-12

1545

面壁智能发布最强端侧多模态模型：超越 Gemini Pro 、GPT-4V，图像编码快 150 倍！

支持 30+ 多种语言～

作者 : 褚杏娟

05-21

AI 论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构 VSR

摘要：文档版式分析任务中，文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

语义

视觉

多模态信息

文档版式

VSR

华为云开发者联盟

2021-07-30

让机器读懂视频：亿级淘宝视频背后的多模态 AI 算法揭秘（三）

亿级淘宝视频背后的多模态AI算法揭秘

作者 : 淘系技术

2020-01-09

创作场景

多模态分析

优酷在多模态内容理解上的研究及应用

华为云细粒度文本情感分析及应用

DingoDB 多模向量数据库正式发布，支持多模态数据统一存储和联合分析

结构化视频分析算法与应用 | QCon

国外知名杂志公司的系统架构是怎么构建的

招商银行人工智能实验室研发工程师赵文婷确认出席 FCon，分享招商银行智能审查系统建设与应用

多模态大模型时代下的文档图像智能分析与处理

新一代多模态合规分析平台，炼就服务洞察火眼金睛

虚拟主播上线：多模态将改变人机交互的未来

大模型 + 多模态合规分析平台，筑牢金融服务安全屏障

5G 时代下：多模态理解做不到位注定要掉队

多模态合规分析平台，保障 AIGC 营销新时代对客服务高质合规

【AAAI 2024】M2Doc：文档版面分析的可插拔多模态融合方法

中文多模态医学大模型智能分析 X 光片，实现影像诊断，完成医生问诊多轮对话

优酷视频元素内容召回系统：多级多模态引擎探索

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

内容理解做不好，谈什么个性化推荐

面壁智能发布最强端侧多模态模型：超越 Gemini Pro 、GPT-4V，图像编码快 150 倍！

AI 论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构 VSR

让机器读懂视频：亿级淘宝视频背后的多模态 AI 算法揭秘（三）

热点文章