FCon 全球金融科技大会,半价早鸟票最后 5 张!30+ 行业专家确认出席! 了解详情
写点什么

模态测试

收录了 模态测试 频道下的 50 篇内容

智源研究院发布我国首个超大规模智能模型“悟道1.0”,人工智能迈向“炼大模型”阶段
智源研究院发布我国首个超大规模智能模型“悟道 1.0”,人工智能迈向“炼大模型”阶段

近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段。

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(三)
让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(三)

亿级淘宝视频背后的多模态AI算法揭秘

5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

通义千问能看图了!阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入
通义千问能看图了!阿里云开源视觉语言大模型 Qwen-VL ,支持图文双模态输入

继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。

KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用
KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用

本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。

全球最大规模中文跨模态生成模型文心ERNIE-ViLG来了!百度这次实现了图文双向生成
全球最大规模中文跨模态生成模型文心 ERNIE-ViLG 来了!百度这次实现了图文双向生成

前不久,百度产业级知识增强大模型“文心”全景图亮相,近日,其中的跨模态生成模型ERNIE-ViLG在百度文心官网开放体验入口,并放出了论文。

KDD Cup 2020多模态召回比赛季军方案与广告业务应用
KDD Cup 2020 多模态召回比赛季军方案与广告业务应用

本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。

[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

  近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。

paddle
engine-layout
电子文档
提取
大规模语言技术前瞻:跨语言与多模态有望短期突破
大规模语言技术前瞻:跨语言与多模态有望短期突破

随着大数据、算力和深度学习的浪潮,自然语言处理也进入了一个快速发展期。而大规模语言模型是自然语言处理取得突破的关键。

Google 推出 iOS 功能性 UI 测试框架 EarlGrey

经过了一段时间的酝酿后,Google很高兴地宣布了EarlGrey,一款针对于iOS的功能性UI测试框架。诸如YouTube、Google Calendar、Google Photos、Google Translate、Google Play Music等多款Google应用都成功地采用了EarlGrey框架来满足其功能性测试之所需。

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测
阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

继通义千问之后,阿里云通义大模型家族迎来新成员。

打造更聪明的猴子:开源云测框架Hydra Lab的智能化测试实战
打造更聪明的猴子:开源云测框架 Hydra Lab 的智能化测试实战

在软件测试领域,“猴子测试”一直是一种广受欢迎的方法,但其也存在着动作随机的局限性。如果引入大模型,创造一只更聪明的猴子,它可以真正理解应用并像人类一样与之互动,将会怎样?

阿里大模型亮相!“通义千问”开启企业邀测 | InfoQ快讯
阿里大模型亮相!“通义千问”开启企业邀测 | InfoQ 快讯

现阶段该模型主要定向邀请企业用户进行体验测试

GPU在微博多模态内容理解的应用
GPU 在微博多模态内容理解的应用

目前微博多模态内容理解服务支持了40多个业务集群,120多个深度模型在线推理,峰值QPS 2万+,覆盖大多数主流框架和NLP、CV算法。

超大模型工程应用难?快手给出短视频场景下的实战指南
超大模型工程应用难?快手给出短视频场景下的实战指南

大模型以及多模态模型的商业化应用将进一步加速!

GPT-4 即将亮相——聊聊我们已经知晓的一切
GPT-4 即将亮相——聊聊我们已经知晓的一切

时代变了,更大的模型不再等于更好。

弱网下的极限实时视频通信
弱网下的极限实时视频通信

实时视频通信已然成为当前互联网应用的亮点。特别在这疫情期间,全球都在“被隔离”,无法开展线下活动,更加迫切的需要以实时视频通信为技术支撑的各种虚拟线上交流。在可见的数年内,稳定高质量的互联网实时视频通信是各行各业的迫切需求,协同复工复产,帮助经济恢复;当用户习惯逐渐养成,实时视频通信又将成为生产生活的基本配置。

北大AI公开课2019 | 京东何晓冬:自然语言与多模态交互前沿技术
北大 AI 公开课 2019 | 京东何晓冬:自然语言与多模态交互前沿技术

3月6日,备受瞩目的北大AI公开课第三讲如期开讲,京东AI研究院常务副院长、深度学习及语音和语言实验室主任何晓冬带来了《自然语言与多模态交互前沿技术》的分享,从技术的角度,为大家剖析NLP技术的发展与未来。

国产大模型陆续发布和更新后,再看大模型产品评测
国产大模型陆续发布和更新后,再看大模型产品评测

道题的评测。另外,本次研究特别关注了技术视角中大模型产品的编程能力,提高了问题的权重和比例;如方言测试、中文特色推理、对对联等题目。

模态测试专题_资料-InfoQ中文网