写点什么

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

  • 2024-04-12
    北京
  • 本文字数:1030 字

    阅读完需:约 3 分钟

大小:516.10K时长:02:56
网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

 

QAnything 系统架构图


QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。


GitHub 地址:

https://github.com/netease-youdao/QAnything


自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+个星标,这反映出了用户对其价值的高度评价。


QAnything登上GitHub trending榜单


此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。


值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。


据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。


目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。


与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

2024-04-12 11:197585

评论

发布
暂无评论
发现更多内容

架构实战营第 10 期-模块二作业:微信朋友圈高性能复杂度分析

kaizen

「架构实战营」

这里聊聊扫地机的 IOT 开发

eng八戒

IoT ROS 移动机器人 阿里云生活物联网平台 涂鸦

什么是MySQL插入意向锁?

江南一点雨

MySQL

Python 为什么如此设计?

Python猫

Python

【审计思路】如何快速定位SQLMS注入漏洞?

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

OpenTelemetry系列 (三)| 神秘的采集器 - Opentelemetry Collector

骑牛上青山

Java Go 调用链 微服务调用链

《绩效领导力:使用OKR成就超出期望的未来组织》读后感

Bruce Talk

OKR 敏捷

Verilog的多分支语句

芯动大师

Verilog Verilog语法 Verilog多分支语句

2022-12-17:订单最多的客户。以下数据,结果输出3。请问sql语句如何写? DROP TABLE IF EXISTS `orders`; CREATE TABLE `orders` ( `

福大大架构师每日一题

数据库 福大大

SpringBoot 整合 Redis,再也不用求别人了

@下一站

redis 程序设计 12月日更 12月月更 springboot整合redis

架构实战 2 - 微信朋友圈高性能复杂度分析

架构实战营 「架构实战营」

数据库原理及MySQL应用 | 视图

TiAmo

MySQL 数据库· 12月月更

跨平台应用开发进阶(二十三) :一文走近 testflight 上架

No Silver Bullet

uni-app testflight 12月月更 应用上架

房产|1-11月份全国房地产开发投资下降9.8%

前嗅大数据

架构训练营学习总结

Geek_b35d92

架构实战模块二

GeekMLS

#架构实战营

跨平台应用开发进阶(二十一) :uni-app 路由传参参数丢失问题解决方案探究

No Silver Bullet

uni-app 跨平台应用 参数传递 12月月更 参数丢失

模块三作业

Ryan

构架

工赋开发者社区 | 工业4.0时代,制造业企业发展智慧工厂之策略解析

工赋开发者社区

第二周作业

不爱学习的程序猿

作业

房产|11月全国70城房价出炉!你关心的城市房价有何变化

前嗅大数据

在 Windows 搭建 SVN 服务

eng八戒

svn DevOps 服务器 版本管理工具

ceph的组件及数据写入流程

好吃不贵

架构误区系列8:需求===架构设计

agnostic

架构实战营10期-作业2

炮仗

跨平台应用开发进阶(十九) :position:fixed 虚拟按键触发后无法生效问题分析及解决方案探究

No Silver Bullet

uni-app 跨平台 自定义组件 12月月更 虚拟按键

ABBYY FineReader PDF2023最新版下载

茶色酒

abbyy

CleanMyMac2023版本要不要更新下载?

茶色酒

CleanMyMac X CleanMyMac X2023

在局域网搭建一个带 web 操作页面的 git 版本服务器 - Gitlab

eng八戒

git DevOps gitlab 版本管理

中台之建模篇

涛哥 数字产品和业务架构

中台 建模

架构实战营模块2作业

程序员小张

「架构实战营」

网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行_AI&大模型_凌敏_InfoQ精选文章