QCon 演讲火热征集中,快来分享技术实践与洞见!222222 了解详情
写点什么

网易有道自研 RAG 引擎 QAnything 正式开源,可增强大语言模型准确度及专业能力

  • 2024-01-17
    北京
  • 本文字数:750 字

    阅读完需:约 2 分钟

大小:371.61K时长:02:06
网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力

1 月 16 日,网易有道宣布自研的知识库问答引擎 QAnything 正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区 Github 内进行下载,一键部署即可使用。该系统目前支持 word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

 

据悉,QAnything 的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称 RAG),能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

 

QAnything 作为有道自研的 RAG 引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。


QAnything 系统架构图

 

值得一提的是,本次开源的 QAnything 是一套完整的 RAG 系统,包括专门优化的自研的 embedding 和 rerank 模型,微调后的 LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括 7B 大模型+embedding/rerank+OCR)占用显存不超过 16G。

 

如今,QAnything 已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。以子曰教育大模型最新发布的创新应用成果“有道速读”为例,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮用户更快更准地获得信息和对文档的理解。而该功能背后的驱动就是 QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现 1 分钟读完万字长文。

 

“目前,QAnything 项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

2024-01-17 17:4410023

评论 3 条评论

发布
用户头像
试用了一下,太垃圾了,完全不能用。给个Excel,一共200行数据,问它有几行数据,告诉我24,然后连问了5-6个问题,一个比一个简单,没有任何一个问题答对。
2024-02-02 18:04 · 福建
回复
用户头像
qanything开源代码怎么访问
2024-01-20 10:12 · 浙江
回复
2024-01-24 09:59 · 北京
回复
没有更多了
发现更多内容

week8--课后作业

Geek_165f3d

一条更新sql在mysql中是怎么执行的

简爱W

Spring系列第2篇:控制反转(IoC)与依赖注入(DI),晦涩难懂么?

老大哥

给技术同学的建议:人人都该懂的埋点知识

易观大数据

埋点 智能运营

Spring Boot+Redis+拦截器+自定义Annotation实现接口自动幂等

我是苞谷

实现扫码登陆的最简单方案与原理

Java小咖秀

Java 解决方案 经验总结

求组队,PK华为HMS全球应用创新大赛!

InfoQ_e92167c73263

android

刚坐下,一个面试官居然问了我 30个Spring Boot问题!

只喝纯牛奶

编程日课•理解学院

顿晓

学习 编程日课 理解学院

面经手册 · 第1篇《认知自己的技术栈盲区》

小傅哥

Java 面试 小傅哥 技术栈

实践录丨如何在鲲鹏服务器OpenEuler操作系统中快速部署OpenGauss数据库

华为云开发者联盟

数据库 鲲鹏920 操作系统 服务器 opengauss

骚操作!用 CPU 烤肉,这位程序员做到了!

程序员生活志

程序员 gpu 程序人生

秒懂云通信:如何用阿里云语音通知服务(小白指南)

阿里云Edge Plus

语音

策略模式解析

南方有乔木兮

LeetCode002-两数相加-medium

书旅

算法 数据结构与算法

JVM系列之:通过一个例子分析JIT的汇编代码

程序那些事

Java JVM JIT 汇编

创业公司技术体系建设-CI/CD

星际行者

CI/CD

Twitter高性能分布式日志系统架构解析

俊俊哥

pulsar bookKeeper 分布式文件存储

六字说出微服务的本质

看山

架构 微服务 签约计划第二季

新技术(区块链)--让游戏行业走的更远

CECBC

区块链技术 防篡改不可逆

新三板专家-程晓明:四板将是推动区块链技术与资本市场结合试验田

CECBC

区块链技术 推进落地应用

区块链+国防安全,科技是核心战斗力

CECBC

新技术 国防安全 科技信息

海华大赛第一名团队聊比赛经验和心得:AI在垃圾分类中的应用

华为云开发者联盟

AI 算法 数据分析 垃圾回收机制 华为云

java高并发系列 - 第11天:线程中断的几种方式

简爱W

架构师技术领导力成长之路

IT民工大叔

领导力 架构师

我天!xx.equals(null) 是什么骚操作??

导导

LeetCode题解:189. 旋转数组,pop+unshift一行,JavaScript,详细注释

Lee Chen

大前端 LeetCode

功能扎实的ERP模版已上架应用库(支持免费安装使用)

明道云

【华为云技术分享】DLI跨源|当DLI遇见MongoDB

华为云开发者联盟

数据库 mongodb dlib 数据集 华为云

架构师训练营第九周

Melo

智能的财务管理系统,来自某科技公司CEO亲手搭建

明道云

网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力_AI&大模型_凌敏_InfoQ精选文章