收录了 模态测试 频道下的 50 篇内容
近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段。
亿级淘宝视频背后的多模态AI算法揭秘
微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。
继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。
2024上海国际汽车噪声振动控制技术展览会
本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。
Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。
本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。
经过了一段时间的酝酿后,Google很高兴地宣布了EarlGrey,一款针对于iOS的功能性UI测试框架。诸如YouTube、Google Calendar、Google Photos、Google Translate、Google Play Music等多款Google应用都成功地采用了EarlGrey框架来满足其功能性测试之所需。
前不久,百度产业级知识增强大模型“文心”全景图亮相,近日,其中的跨模态生成模型ERNIE-ViLG在百度文心官网开放体验入口,并放出了论文。
近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。
在软件测试领域,“猴子测试”一直是一种广受欢迎的方法,但其也存在着动作随机的局限性。如果引入大模型,创造一只更聪明的猴子,它可以真正理解应用并像人类一样与之互动,将会怎样?
现阶段该模型主要定向邀请企业用户进行体验测试
随着大数据、算力和深度学习的浪潮,自然语言处理也进入了一个快速发展期。而大规模语言模型是自然语言处理取得突破的关键。
继通义千问之后,阿里云通义大模型家族迎来新成员。
人脸识别问题可以描述为,给定某一场景下的静态图象或者动态序列,根据预先存储的人脸数据库识别或者认证场景中一个或者多个人的身份。
目前微博多模态内容理解服务支持了40多个业务集群,120多个深度模型在线推理,峰值QPS 2万+,覆盖大多数主流框架和NLP、CV算法。
基于新一代 LLM 技术打造企业级智能问答机器人,涉及哪些新技术?有哪些新实践?
道题的评测。另外,本次研究特别关注了技术视角中大模型产品的编程能力,提高了问题的权重和比例;如方言测试、中文特色推理、对对联等题目。