「ArchSummit·深圳」人工智能如何促进工业和制造领域的智能化转型? >>> 了解详情
写点什么

多模态分析

收录了 多模态分析 频道下的 50 篇内容

优酷在多模态内容理解上的研究及应用
优酷在多模态内容理解上的研究及应用

本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。

华为云细粒度文本情感分析及应用
华为云细粒度文本情感分析及应用

随着移动互联网的普及,网络上每天产生大量的文本数据,蕴含着巨大的有价值信息。

DingoDB多模向量数据库正式发布,支持多模态数据统一存储和联合分析
DingoDB 多模向量数据库正式发布,支持多模态数据统一存储和联合分析

DingoDB提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。

结构化视频分析算法与应用 | QCon
结构化视频分析算法与应用 | QCon

每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。

国外知名杂志公司的系统架构是怎么构建的
国外知名杂志公司的系统架构是怎么构建的

本文是本系列文章的第二部分,将介绍我们的NLP即服务系统HAL的架构。

招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用
招商银行人工智能实验室研发工程师赵文婷确认出席 FCon,分享招商银行智能审查系统建设与应用

招商银行开发了招行智能审查系统,辅助人工开展具备较强专业性的合规审查工作。

多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展,多模态大模型在文档图像智能分析与处理中的应用越来越广泛。多模态大模型通过融合不同模态的数据,能够更全面地理解文档图像内容,提高分析和处理的精度。

人工智能
图像识别
大模型
虚拟主播上线:多模态将改变人机交互的未来
虚拟主播上线:多模态将改变人机交互的未来

为什么说虚拟主播是多模态研究领域的里程碑式突破?

5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

中文多模态医学大模型智能分析 X 光片,实现影像诊断,完成医生问诊多轮对话

中文多模态医学大模型智能分析X光片,实现影像诊断,完成医生问诊多轮对话

人工智能
自然语言处理
计算机视觉
多模态大模型
优酷视频元素内容召回系统:多级多模态引擎探索
优酷视频元素内容召回系统:多级多模态引擎探索

本文介绍优酷的视频元素内容召回系统。

语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?
语义鸿沟、异构鸿沟、数据缺失,多模态技术如何跨过这些坎?

随着近年来深度学习、大算力、大数据快速发展,计算机视觉、语音识别等技术都取得了非常大的进展,综合了多种信息模态的多模态研究已成为一个新趋势。

内容理解做不好,谈什么个性化推荐
内容理解做不好,谈什么个性化推荐

后移动互联网时代资讯爆炸,用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容,实现千人千面精准推荐,通过精细化运营抢夺用户时长,是互联网公司当下最重要的命题之一。

AI 论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构 VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

语义
视觉
多模态信息
文档版式
VSR
让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(三)
让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(三)

亿级淘宝视频背后的多模态AI算法揭秘

KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用
KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用

本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。

华为云视频封面 & 摘要服务:让视频内容更具吸引力

在这个信息爆炸的时代,视频已经成为了我们获取信息、娱乐、学习的重要方式。然而,面对海量的视频内容,如何让用户快速找到他们感兴趣的内容,成为了每个视频平台和内容创作者的挑战。作为一家科技公司的技术负责人,我一直在寻找能够提升视频吸引力和浏览效

企业服务中智能交互机器人的实践与探索
企业服务中智能交互机器人的实践与探索

在 AICon 北京 2019 大会上,徐易楠讲师做了《企业服务中智能交互机器人的实践与探索》主题演讲。

爱奇艺视频人物识别技术及应用
爱奇艺视频人物识别技术及应用

本次分享介绍爱奇艺视频人物识别技术。

多模态GPT-V出世!36种场景分析ChatGPT Vision能力,LMM将全面替代大语言模型? | 京东云技术团队
多模态 GPT-V 出世!36 种场景分析 ChatGPT Vision 能力,LMM 将全面替代大语言模型? | 京东云技术团队

LMM将会全面替代大语言模型?人工智能新里程碑GPT-V美国预先公测,医疗领域/OCR实践+166页GPT-V试用报告首发解读

人工智能
LLM模型
企业号10月PK榜
GPT-V
多模态分析专题_资料-InfoQ中文网