亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

  • 2024-04-12
    北京
  • 本文字数:1030 字

    阅读完需:约 3 分钟

大小:516.10K时长:02:56
网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

 

QAnything 系统架构图


QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。


GitHub 地址:

https://github.com/netease-youdao/QAnything


自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+个星标,这反映出了用户对其价值的高度评价。


QAnything登上GitHub trending榜单


此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。


值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。


据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。


目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。


与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-04-12 11:196439

评论

发布
暂无评论
发现更多内容

不断突破,稳中求进——我的移动端跨平台开发技术回顾与展望| 社区征文

No Silver Bullet

跨平台 移动端 新春征文 2月月更

百度APP视频播放中的解码优化

百度Geek说

百度 性能优化 视频

腾讯员工怒怼加班文化事件:大厂的内卷,小厂有什么资格?

菜根老谭

如何解决Python项目在VScode中跨文件夹导包问题

IT蜗壳-Tango

IT蜗壳教学 2月月更

Go 学习路线(2022)

AlwaysBeta

Go golang Go 语言

从原理到操作,让你在 APISIX 中代理 Dubbo 服务更便捷

API7.ai 技术团队

微服务网关

Java11特性-效能翻倍的HttpClient

蜜糖的代码注释

Java 后端技术 2月月更

在线标准程序员计算器

入门小站

工具

预约小程序开发笔记一:背景与技术方案的选型

CC同学

java开发之Spring集成MyBatis知识分享

@零度

Java spring mybatis

在阿里,我们如何管理代码分支?

阿里云云效

阿里云 DevOps 云原生 研发 分支管理

分配任务的人才是团队的核心成员

panda

管理 限界上下文 任务分配

面试突击20:进程和线程有什么区别?

王磊

永中软件加入龙蜥社区,共建开源新生态

OpenAnolis小助手

Linux 开源 永中

【高并发】一文解密诡异并发问题的第一个幕后黑手——可见性问题

冰河

Java 并发编程 多线程 异步编程 精通高并发系列

百度爱番番实时CDP建设实践

百度Geek说

后端

“1天一朵云”,这是如何做到的?

华为云开发者联盟

数字化转型 软件架构 华为云 华为云Stack 全栈云平台

Java 字符串常见的操作

编程江湖

7

Geek_59dec2

【架构实战营】模块七:命题作业

wgl

「架构实战营」

设备接入服务,看完这篇给你整的明明白白

华为云开发者联盟

物联网 IoT 华为云 设备接入服务 设备

鸿蒙轻内核源码分析:文件系统LittleFS

华为云开发者联盟

鸿蒙 文件系统 Flash LittleFS LiteOS-M内核

前端开发之js栈内存和堆内存的区别

@零度

JAVA开发 堆内存 栈内存

盘点冬奥会上的那些“黑科技”,你也可以掌握它!

博文视点Broadview

模块七作业

whoami

「架构实战营」

阿里巴巴DevOps文化浅谈

阿里云云效

阿里巴巴 阿里云 DevOps 云原生 研发

推荐学java——Spring与web项目

逆锋起笔

Spring web idea web web项目 idea spring

如何让代码代码管理变的更安全更高效 | 云效开发篇

阿里云云效

阿里云 DevOps 云原生 代码管理 Codeup

大数据开发之运维面试题汇总分享

@零度

面试题 大数据运维

Ceph核心概念解读

总想做点什么

分布式存储 Ceph 云存储 云计算,

探秘 k8e:极简 Kubernetes 发行版

张晓辉

Kubernetes 云原生

网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行_AI&大模型_凌敏_InfoQ精选文章