【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

模态测试

收录了 模态测试 频道下的 50 篇内容

智源研究院发布我国首个超大规模智能模型“悟道1.0”,人工智能迈向“炼大模型”阶段
智源研究院发布我国首个超大规模智能模型“悟道 1.0”,人工智能迈向“炼大模型”阶段

近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段。

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(三)
让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(三)

亿级淘宝视频背后的多模态AI算法揭秘

5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

通义千问能看图了!阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入
通义千问能看图了!阿里云开源视觉语言大模型 Qwen-VL ,支持图文双模态输入

继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。

2024上海国际汽车噪声振动控制技术展览会
2024 上海国际汽车噪声振动控制技术展览会

2024上海国际汽车噪声振动控制技术展览会

KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用
KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用

本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。

RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要

Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。

大模型
Zilliz
向量数据库
rag
KDD Cup 2020多模态召回比赛季军方案与广告业务应用
KDD Cup 2020 多模态召回比赛季军方案与广告业务应用

本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。

Google 推出 iOS 功能性 UI 测试框架 EarlGrey

经过了一段时间的酝酿后,Google很高兴地宣布了EarlGrey,一款针对于iOS的功能性UI测试框架。诸如YouTube、Google Calendar、Google Photos、Google Translate、Google Play Music等多款Google应用都成功地采用了EarlGrey框架来满足其功能性测试之所需。

全球最大规模中文跨模态生成模型文心ERNIE-ViLG来了!百度这次实现了图文双向生成
全球最大规模中文跨模态生成模型文心 ERNIE-ViLG 来了!百度这次实现了图文双向生成

前不久,百度产业级知识增强大模型“文心”全景图亮相,近日,其中的跨模态生成模型ERNIE-ViLG在百度文心官网开放体验入口,并放出了论文。

[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

  近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。

paddle
engine-layout
电子文档
提取
打造更聪明的猴子:开源云测框架Hydra Lab的智能化测试实战
打造更聪明的猴子:开源云测框架 Hydra Lab 的智能化测试实战

在软件测试领域,“猴子测试”一直是一种广受欢迎的方法,但其也存在着动作随机的局限性。如果引入大模型,创造一只更聪明的猴子,它可以真正理解应用并像人类一样与之互动,将会怎样?

阿里大模型亮相!“通义千问”开启企业邀测 | InfoQ快讯
阿里大模型亮相!“通义千问”开启企业邀测 | InfoQ 快讯

现阶段该模型主要定向邀请企业用户进行体验测试

大规模语言技术前瞻:跨语言与多模态有望短期突破
大规模语言技术前瞻:跨语言与多模态有望短期突破

随着大数据、算力和深度学习的浪潮,自然语言处理也进入了一个快速发展期。而大规模语言模型是自然语言处理取得突破的关键。

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测
阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

继通义千问之后,阿里云通义大模型家族迎来新成员。

一文看懂人脸识别技术发展脉络
一文看懂人脸识别技术发展脉络

人脸识别问题可以描述为,给定某一场景下的静态图象或者动态序列,根据预先存储的人脸数据库识别或者认证场景中一个或者多个人的身份。

GPU在微博多模态内容理解的应用
GPU 在微博多模态内容理解的应用

目前微博多模态内容理解服务支持了40多个业务集群,120多个深度模型在线推理,峰值QPS 2万+,覆盖大多数主流框架和NLP、CV算法。

美国五百强公司高级数据科学家王元确认出席 QCon 上海,分享 LLM 的新技术与新实践
美国五百强公司高级数据科学家王元确认出席 QCon 上海,分享 LLM 的新技术与新实践

基于新一代 LLM 技术打造企业级智能问答机器人,涉及哪些新技术?有哪些新实践?

国产大模型陆续发布和更新后,再看大模型产品评测
国产大模型陆续发布和更新后,再看大模型产品评测

道题的评测。另外,本次研究特别关注了技术视角中大模型产品的编程能力,提高了问题的权重和比例;如方言测试、中文特色推理、对对联等题目。

模态测试专题_资料-InfoQ中文网