【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

依托数据、平台、知识增强等优势 ,夸克大模型大幅降低问答幻觉率

夸克

  • 2023-11-23
    北京
  • 本文字数:1634 字

    阅读完需:约 5 分钟

依托数据、平台、知识增强等优势 ,夸克大模型大幅降低问答幻觉率

“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11 月 22 日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶 C-Eval 和 CMMLU 两大权威榜单,夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。

 


凭借在搜索业务和智能技术上的长期积累,夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至 5%,处在行业领先水平。

夸克推进搜索革新,自研大模型打造技术新底座

 

在互联网高速发展的 30 余年中,搜索曾经高效地满足了用户主动获取信息的需求。但是随着移动互联网内容生产和供给模式的转变,传统搜索逐步变得封闭化、孤岛化。基于大模型的 AIGC 技术将会给搜索产品带来全新变化,推进搜索革新已经成为行业共识。

 

夸克技术负责人蒋冠军表示,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。在搜索应用中,将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。

 

(夸克技术负责人蒋冠军)


夸克大模型的优势源自于智能技术实力与搜索业务基础,蒋冠军认为,夸克大模型有四大优势:第一、最全面的通用知识数据和行业知识数据,以及知识理解和评估体系;第二、得益于搜索技术体系的积累,拥有千亿级参数平台的模型训练能力;第三、拥有长期智能化产品经验的智能技术产运团队。第四、拥有全行业的知识增强技术体系及能力。

 

面向未来,要解决大模型的应用问题,关键要解决知识正确性问题。据悉,基于强大的搜索产品和智能技术积累,夸克大模型在知识增强上的优势可以大幅提升知识正确性。同时,在医疗健康领域,夸克已经可以将问答内容的幻觉率降低至 5%,处在行业领先水平。夸克大模型也将是持续推动夸克 App 产品体验创新和迈向新一代搜索的技术底座。

夸克大模型性能评测夺冠  四大能力提升用户效率

 

日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克大模型的整体水平超越 GPT-3.5,在多语言翻译、写代码、安全合规、内容创作等方面处在国内行业头部水平。

 

针对 AIGC 技术与搜索产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈阳认为,依托搜索平台,夸克大模型拥有高质量的各类数据,在中文语境下,模型能力处在行业领先水平。在教育、医疗等垂直领域中,夸克在对话、解题上的能力取得了新的突破,是国产自研大模型的优秀代表之一。同时,在安全性能上,夸克经历了搜索场景下的长时间考验,累积了非常丰富的经验和能力。

 

数据显示,夸克大模型接连登顶 C-Eval 和 CMMLU 两大权威评测榜单,多项性能优于 GPT-4。在国内大模型赛道火热的当下,夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力,整体水平达到行业一流水平。

 

另外,在最新的百亿参数测试集中,夸克同样在法律、医疗、问答等多个领域中排名第一,夸克大模型在不同参数量级的对比中均表现优秀。

 

在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,支持外接专业知识增强,提升跨领域的知识和语言理解能力;对话能力,具备较强的上下文理解、语境推理、关键信息保持和记忆能力,更好地适应不断变化的语境,理解用户的意图和需求,确保对话回复准确、合理、连贯;创作能力,能够根据主题或关键词,生成连贯、有逻辑、有深度的文本内容,支持续写、润色、仿写、批改等多种不同写作需求;安全能力,具备较好的世界观、价值观,对于明显的虚假信息,均能做到准确识别、正确回答或者给出合理指引。


以用户需求出发,打造工作、学习、生活的 AI 助手,夸克 App 持续迭代进化。据悉,夸克大模型将全面升级夸克在搜、用、存上的智能化体验,帮助用户进一步提升效率。同时,基于多年累积的搜索优势,夸克将借助 AI 驱动推进搜索革新,加速迈向下一代搜索。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-23 10:265464

评论

发布
暂无评论
发现更多内容

零基础培训学习大数据课程怎么样

小谷哥

Java基本语法

代码的路

Java

我理解的金融级数据库

宫博

分布式数据库 金融行业 oceanbase 金融信创 金融科技创新

SpringBoot实例

代码的路

Java springboot

从数据到价值,DataOps精益数据运营概述

阿里技术

数字化 DataOps

Dubbo3 在同程旅行的实践

阿里巴巴中间件

阿里云 云原生 dubbo

华为云发布CodeArts Check代码检查服务 守护软件质量和安全

科技热闻

pip安装后仍有ImportError No module named XX问题解决

代码的路

Python

测试开发 | 跨平台设备管理方案 Selenium Grid

霍格沃兹测试开发学社

10分钟在 Rainbond 上部署 mall 电商项目

北京好雨科技有限公司

pip安装报错:Command python setup.py egg_info failed with error code 1

代码的路

Python

软件测试/测试开发 | Jenkins 如何参数化job ?

测试人

软件测试 持续集成 jenkins 测试开发 测试开发自动化测试

写作的“收益”超乎想象

王中阳Go

深度思考 学习方法 写作 写作技巧 写作感悟

Linux下OpenCV出现错误:ASSERT false in file qasciikey.cpp, line 501

代码的路

Linux OpenCV

MegCC 新版本来啦!新增 Benchmark 等工具,性能大幅提升!有奖征文活动同步启动

MegEngineBot

深度学习 benchmark MegEngine MegCC 模型编译器

小令观点 | 去中心化可没那么难,古代令牌就已经做到了

令牌云数字身份

身份 Web3.0

盘点16款跨平台应用程序开发框架

FN0

跨端框架 跨端运行 跨端发展

Kratos微服务框架实现IoT功能:设备实时地图

喵个咪

golang 微服务 物联网 IoT Kratos

Kratos微服务框架实现权鉴 - Casbin

喵个咪

golang 微服务 鉴权 rbac Kratos

Kratos微服务框架实现权鉴 - OPA

喵个咪

golang 微服务 鉴权 OPA Kratos

Java中Get和Post的使用

代码的路

Java

备份谷歌或其他浏览器插件

代码的路

浏览器 Google

软件测试/测试开发 | Jenkins 节点该如何管理?

测试人

软件测试 持续集成 jenkins 自动化测试 测试开发

一文搞懂Spring,堪称Spring源码终结者

小小怪下士

Java spring spring源码

走好这三步,不再掉进云上安全的沟里!

亚马逊云科技 (Amazon Web Services)

亚马逊云科技 Builder 专栏

使用 DataEase 制作动态轮播仪表板

搞大屏的小北

ModuleNotFoundError No module named 'PIL'问题解决

代码的路

Python

阿里内部面试手册,Github 上获赞 80K,按这个学,找工作没问题!

架构师之道

Java 程序员 面试

大银行数字化升级之后,火山引擎VeDI这次要把能力带给中小金融机构

字节跳动数据平台

大数据 金融 数字化 金融行业

WXSS 如何进行编译?

FN0

小程序 微信

透视华为云云原生数据库的演进,能给行业带来哪些启发?

华为云开发者联盟

数据库 云原生 后端 华为云 企业号 1 月 PK 榜

依托数据、平台、知识增强等优势 ,夸克大模型大幅降低问答幻觉率_生成式 AI_InfoQ精选文章