收录了 模态测试 频道下的 50 篇内容
近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段。
知识图谱是一种用图结构(Nodes-Entities & Edges-Relationships)表达现实世界关系的技术,在测试领域可理解为软件系统的"神经网络图谱"
近年来,人工智能技术迅猛发展,AI产品已广泛应用于金融、医疗、电商、工业等领域。作为测试从业者,如何有效测试AI产品?本文将从基本概念、核心维度、实战案例、工具推荐及未来趋势五个方面,带你全面掌握AI测试方法论。
当GPT-5开始理解物理世界运行规律,当Sora生成的视频通过图灵测试,当自动驾驶事故率首次低于人类驾驶员...2025年的AI技术正在挑战质量保障的终极命题:如何为持续进化的智能系统建立可信赖的质量护城河?
在新闻应用迭代过程中,自动化测试是保障质量的关键。HarmonyOS的Test Kit提供了完整的测试框架,我们利用它构建了新闻核心功能的自动化测试体系。以下是核心实现代码段(基于HarmonyOS 4.0):
亿级淘宝视频背后的多模态AI算法揭秘
预训练权重和推理代码完全开源。
随着 AI 应用进一步在国内落地,百度在大模型牌桌也占据着独特的生态位置
研究者提出了一种专门为大型视觉语言模型(VLMs)设计的红队框架 Arondight,以解决现有红队测试方法在 VLMs 应用中的不足。
微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。
腾讯多模态算法中心Tech Lead DUANGE已确认出席并发表题为《腾讯混元多模态大模型技术实践与思考》的主题分享。
继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。
本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。
Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。
近年来,GPT 系列模型的演进,客观上验证了 Scaling Law 的有效性。模型参数量决定模型能力的上限。
本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。
经过了一段时间的酝酿后,Google很高兴地宣布了EarlGrey,一款针对于iOS的功能性UI测试框架。诸如YouTube、Google Calendar、Google Photos、Google Translate、Google Play Music等多款Google应用都成功地采用了EarlGrey框架来满足其功能性测试之所需。
前不久,百度产业级知识增强大模型“文心”全景图亮相,近日,其中的跨模态生成模型ERNIE-ViLG在百度文心官网开放体验入口,并放出了论文。
探讨模型优化、成本控制及行业解决方案的创新应用。
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级。