阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

网易有道自研 RAG 引擎 QAnything 正式开源,可增强大语言模型准确度及专业能力

  • 2024-01-17
    北京
  • 本文字数:750 字

    阅读完需:约 2 分钟

大小:371.61K时长:02:06
网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力

1 月 16 日,网易有道宣布自研的知识库问答引擎 QAnything 正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区 Github 内进行下载,一键部署即可使用。该系统目前支持 word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

 

据悉,QAnything 的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称 RAG),能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

 

QAnything 作为有道自研的 RAG 引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。


QAnything 系统架构图

 

值得一提的是,本次开源的 QAnything 是一套完整的 RAG 系统,包括专门优化的自研的 embedding 和 rerank 模型,微调后的 LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括 7B 大模型+embedding/rerank+OCR)占用显存不超过 16G。

 

如今,QAnything 已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。以子曰教育大模型最新发布的创新应用成果“有道速读”为例,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮用户更快更准地获得信息和对文档的理解。而该功能背后的驱动就是 QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现 1 分钟读完万字长文。

 

“目前,QAnything 项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-01-17 17:448225

评论 3 条评论

发布
用户头像
试用了一下,太垃圾了,完全不能用。给个Excel,一共200行数据,问它有几行数据,告诉我24,然后连问了5-6个问题,一个比一个简单,没有任何一个问题答对。
2024-02-02 18:04 · 福建
回复
用户头像
qanything开源代码怎么访问
2024-01-20 10:12 · 浙江
回复
2024-01-24 09:59 · 北京
回复
没有更多了
发现更多内容

太强了!三种方案优化 2000w 数据大表!

互联网工科生

数据库

从实时数据库转战时序数据库,他陪伴 TDengine 从 1.0 走到 3.0

TDengine

时序数据库 ​TDengine

2024北京国际光刻设备及光掩膜技术展览会

吹吹晚风

2024北京国际机器视觉展览会

吹吹晚风

专业CAD建模软件 BricsCAD 24激活最新版

胖墩儿不胖y

Mac软件 cad cad软件

财政部办公厅发布公立医院内控建设征求意见函 信息化成为内控建设重要抓手

用友BIP

数智医疗

DHorse v1.4.2 发布,基于 k8s 的发布平台

tiandizhiguai

2024北京国际光电传感技术应用展览会

吹吹晚风

城投行业融资迈向“筹融用管还评”卓越循环,用友Fast by BIP 很在行

用友BIP

Fast by BIP 城投行业

林旅强 | AI+开源时代 - 开发者与治理者的机遇与挑战

开源雨林

人工智能 开源 开发者 超级个体

对话在行人 | 微乘科技:升级数智底座,从管控向“管理+服务”转变

用友BIP

2023全球商业创新大会 对话在行人

用友Fast by BIP助力公交企业降本增效,数智运营!

用友BIP

2024北京国际激光技术及智能制造展览会

吹吹晚风

Vulkan 同步

江湖修行

android OpenGL ES 渲染 移动端开发 vulkan

叮!你有一份1024程序员节的通关秘籍待查收!

飞桨PaddlePaddle

1024程序员节

水务行业管理与服务数智化升级,用友Fast by BIP在行!

用友BIP

Fast by BIP 水务行业

QCN9274, QCN6274, QCN9074, QCN9024: Leading the intelligent revolution in the future

wifi6-yiyi

文件夹数据同步 Sync Folders Pro中文免激活版

mac大玩家j

Mac软件 同步工具 备份同步软件

浅谈东数西算战略中,发挥算网大脑作用的4个关键点

鲸品堂

东数西算 算力网络 企业号10月PK榜

Mobpush厂商通道回执配置指南

MobTech袤博科技

智能推送

EVE-NG安装设备组件

小魏写代码

2024北京国际测控技术与仪器展览会

吹吹晚风

2024北京国际光学镀膜技术及设备展览会

吹吹晚风

2024北京国际红外技术及应用展览会

吹吹晚风

如何使用GaussDB(DWS)的本地临时表进行数据处理

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 本地临时表

网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力_AI&大模型_凌敏_InfoQ精选文章