NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

发布自研大模型 夸克 App 将迎来全面升级

  • 2023-11-15
    北京
  • 本文字数:1556 字

    阅读完需:约 5 分钟

发布自研大模型  夸克App将迎来全面升级

国产大模型阵营再添新锐选手。11 月 14 日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克 App 将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的 AI 助手。


近期,在 CMMLU 权威大模型性能评测中,夸克大模型成绩位列榜首。最新评测显示,夸克大模型整体能力已经超过 GPT-3.5,在写作、考试等部分场景中优于 GPT-4。


国产自研大模型中的“学霸”


夸克大模型是基于 Transformer 架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供 AIGC、智能检索的专业服务。



性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在 CMMLU 权威榜单的最新评测结果中,取得排名第一的优异成绩。在国内专业考试测试中,夸克大模型高考成绩接近满分,并以 486 分的高水平通过临床执业医师资格考试,是名副其实的“学霸”。


同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面,夸克大模型拥有广泛的知识覆盖、上下文理解、创造性表达、信息搜集和整合、多语言支持等,同时具备外接专业知识增强、检索增强能力,进一步提升跨领域、时效性的知识和语言理解能力。此外,夸克大模型还具有撰写各类文本的强大文学创作能力,以及准确、合理、连贯的对话回复能力。


整体能力超过 GPT-3.5,部分场景优于 GPT-4,夸克大模型能力“爆表”源于数据、行业、知识正确性、平台等四方面优势。首先,夸克大模型拥有最全面的中文数据库,能更好地理解、评估、提炼中文知识体系;第二,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景;第三,在通用知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四,夸克组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。


据介绍,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克 App 在产品体验创新和迈向新一代搜索的技术底座。


夸克将借助自研大模型全面升级


今年以来,人工智能技术已经逐步融入到夸克 App 的产品迭代中。夸克扫描王能够在复杂场景下模仿人类思维,更精准地识别、分析和提取文字、公式及图片,实现更完美的扫描效果。夸克网盘上线的 AI 自然语言搜索功能,仅通过模糊词、形容词等关键信息,就能快速找到照片、文档等云端资料,进一步提升搜索效率。


作为最受年轻人青睐的智能产品,夸克 App 为数千万 95 后职场人和大学生提供了跨场景的智能效率工具。根据 QuestMobile 发布的《2023 年轻人群智能效率应用研究》报告显示,夸克 App 在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。



据悉,夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列 AI 原生应用将为年轻人工作、学习、生活提供更全面的服务。


今年 9 月,阿里集团宣布了用户为先、AI 驱动的两大战略重心,将加大对“技术驱动的互联网平台业务”、“AI 驱动的科技业务”等业务的战略性投入。近日举办的 2023 世界互联网大会上,阿里巴巴集团 CEO 吴泳铭预判,在可见的未来,会有更智能的下一代产品进入人们的生活,AI 助理会无处不在,成为每个人工作、生活、学习中的助手。


“AI 时代已经来临,大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的 AIGC 技术将会给搜索产品带来全新变化,加速迈向下一代搜索。夸克借助自研大模型将全面升级,全新的夸克很快会和大家见面。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-15 16:391100
用户头像
赵钰莹 InfoQ 主编

发布了 875 篇内容, 共 606.2 次阅读, 收获喜欢 2671 次。

关注

评论

发布
暂无评论
发现更多内容

用户体验至上时代,银行的“主动出击”

博睿数据

金融 博睿数据 数据链DNA IT运维

基于阿里云 ASK 的 Istio 微服务应用部署初探

阿里巴巴云原生

阿里云 容器 微服务 云原生 服务网格

大数据培训数仓实践 Kimball 维度建模

@零度

数仓 大数据开发

俄罗斯方块【附源码】

JavaPub

【等保测评】等保测评师怎么考,前景怎么样?

行云管家

网络安全 IT运维 等保测评 等保测评师

【等保测评】2022年北京正规等保测评机构新名单公布

行云管家

等保测评 北京

Java 实现 植物大战僵尸 小游戏【附源码】

JavaPub

Java

Java 实现 贪吃蛇 小游戏【附源码】

JavaPub

关于敏捷测试象限的“秘密”

BY林子

敏捷开发 敏捷测试 测试策略

给小白的 PG 容器化部署教程(上)

RadonDB

postgresql 容器化 数据库·

高危!Fastjson反序列化漏洞风险

源字节1号

软件开发

亚信安慧AntDB数据库斩获“最佳数据库品牌”大奖

亚信AntDB数据库

吃豆人游戏【附源码】

JavaPub

【技术干货】代码示例:使用 Apache Spark 连接 TDengine

TDengine

数据库 tdengine 开源 时序数据库

编程,不止有代码,还有艺术

华为云开发者联盟

数据库 倒排索引 GaussDB(for Influx) hint

固态硬盘和机械硬盘的区别(7大区别,简单易懂)

源字节1号

软件开发 前端开发 后端开发 小程序开发

深入解析 TiFlash丨多并发下线程创建、释放的阻塞问题

PingCAP

Java实现一个打飞机的小游戏【附源码】

JavaPub

中科大脑知识图谱平台建设及业务实践

NebulaGraph

图数据库 知识图谱

【LeetCode】最多单词数的发件人Java题解

Albert

LeetCode 5月月更

如何快速解决集群异常和机器性能波动

NebulaGraph

可视化 图数据库 知识图谱

小鸟飞行游戏【附源码】

JavaPub

上新了 亚麻云 | 远程办公有点上头?解锁云上应用现代化的奥秘

亚马逊云科技 (Amazon Web Services)

远程办公 应用

A New ETL Language -- Easy SQL

Bright

数据开发 ETL 大数据开发 EasySQL

java培训动态上传jar包热部署实战分享

@零度

JAVA开发

3D赛车【附源码】设计实现

JavaPub

常用的 Lambda 表达式案例解析,工作中都会用到!

CRMEB

超级马里奥【附源码】

JavaPub

Java 实现 捕鱼达人 小游戏【附源码】

JavaPub

Java实现一个坦克大战的小游戏【附源码】

JavaPub

Java 实现 1024 小游戏【附源码】

JavaPub

发布自研大模型  夸克App将迎来全面升级_云计算_赵钰莹_InfoQ精选文章