收录了 模态逻辑 频道下的 50 篇内容
最近在博客圈里进行的一次讨论提出了这样的问题,我们是否应该使用业务规则来动态地引导业务过程的执行。
优酷视频搜索团队设计并研发了多级多模态搜索引擎(MMS),可以提供分布式大规模多层级多模态索引能力,低延时跨模态级联检索能力,多层级检索、融合、排序能力。
微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。
支持 30+ 多种语言~
本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。
近年来,GPT 系列模型的演进,客观上验证了 Scaling Law 的有效性。模型参数量决定模型能力的上限。
多模态大模型技术的最新进展如何?这一波新技术,对于行业和消费者的体验会带来哪些变化?面对一波波快速、热闹的突破和变化,技术人员该如何适应多模态 + 大模型时代?
在2020年的Gartner报告中,人机对话的位置相比2019更加靠前。
每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。
随着媒体传播形式转向多媒体为主流,在多模态内容理解AI技术开始显示出重要的作用。然而,目前AI展示的诸多能力,还停留在图像、语音等感知层面,多媒体内容理解却是多方面的叠加,相对于单一图像、语音的理解来说更加困难。在多媒体内容理解方面,快手在技术和应用层面,有不少经验值得借鉴。
道题的评测。另外,本次研究特别关注了技术视角中大模型产品的编程能力,提高了问题的权重和比例;如方言测试、中文特色推理、对对联等题目。
优酷每年为用户提供大量优质视频资源,具备天然的“由长变短”优势,并通过算法研究在速看短视频的自动化生产方面取得突破。
6 月 14 日,第六届“北京智源大会”在中关村展示中心开幕。
华为兑现承诺开源MindSpore,四月可申请。
本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。
面对即将开始的 2020 年,AI 还有多少可能呢?
InfoQ注意到,由百度开发的大语言模型“文心一言”已经上架苹果App Store。
近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准API和定制化项目合作方案。
3月6日,备受瞩目的北大AI公开课第三讲如期开讲,京东AI研究院常务副院长、深度学习及语音和语言实验室主任何晓冬带来了《自然语言与多模态交互前沿技术》的分享,从技术的角度,为大家剖析NLP技术的发展与未来。