写点什么

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

  • 2024-04-12
    北京
  • 本文字数:1030 字

    阅读完需:约 3 分钟

大小:516.10K时长:02:56
网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

 

QAnything 系统架构图


QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。


GitHub 地址:

https://github.com/netease-youdao/QAnything


自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+个星标,这反映出了用户对其价值的高度评价。


QAnything登上GitHub trending榜单


此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。


值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。


据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。


目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。


与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

2024-04-12 11:197825

评论

发布
暂无评论
发现更多内容

MyEMS 开源能源管理系统:赋能双碳目标的能源数字化基础设施

开源能源管理系统

开源 能源管理系统

通义灵码支持 Qwen3-Coder,带你玩转 Agentic Coding,免费不限量

阿里云云效

阿里云 云原生 通义灵码

点击解锁云端新视野:云监控(CES)2025年6月全新升级

华为云开发者联盟

sql优化谓词下推在join场景中的应用

天翼云开发者社区

数据库 sql

Vibecoding 新体验:实测 Qwen3 Coder 代码生成效果

阿里巴巴云原生

阿里云 云原生 agent Function AI

为什么选择 BeeWorks Meet?企业会议系统的私有化必要性

BeeWorks

即时通讯 IM 私有化部署

为什么上了ERP系统后,员工效率反而变得更低了呢?

优秀

ERP ERP系统

工程机械行业工具管理破局之战:揭秘RFID智能库房如何终结跨区流转困局

斯科信息

RFID解决方案 RFID工具库房 斯科信息 RFID技术

终结警报疲劳!告警分级通知配置实战指南!

华为云开发者联盟

深度拆解LLM的核心技术栈,助您掌握从模型选型到部署优化的全流程

聚客AI学院

人工智能 agent 大模型落地 AI 智能体 RAG应用

西门子 Smart ECX 与 MyEMS:智慧能碳管理平台的技术路径与生态差异深度解析

开源能源管理系统

开源 能源管理系统

Higress 入选《AI Cloud 大模型推理与交互典型案例》

阿里巴巴云原生

阿里云 云原生 Higress

高德开放平台全球LBS服务,MCP Server正式登陆阿里云云市场

高德开放平台

55款主流认证类SDK适配鸿蒙5,让数字签名、身份认证更安全更高效

新消费日报

【MySQL索引失效场景】索引失效原因及最左前缀原则详解

不在线第一只蜗牛

MySQL 数据库

双向闭环驱动精准决策,从战略到单店SKU的无缝链接

第七在线

通义灵码支持 Qwen3-Coder,带你玩转 Agentic Coding,免费不限量

阿里巴巴云原生

阿里云 AI 云原生 通义灵码

2025 WAIC 世界人工智能大会有哪些亮点?

GPU算力

英特尔的“变”与“稳”:在代工战局中寻找自己的节奏

科技热闻

Vercel 发布 AI SDK 5,引入语音 API;Ollama 新版本支持多模态交互 丨日报

声网

全新 MQTT 订阅、BLOB 类型、多级存储支持:TDengine 时序数据库最新版本亮点速览

TDengine

tdengine 时序数据库 tsdb 国产时序数据库

喜报!阿里云首批通过 Serverless 云服务能力要求 - 消息队列评估

阿里巴巴云原生

阿里云 Serverless 云原生

龙蜥受邀参加2025开放计算技术大会,解码基础模型驱动下的系统创新与生态共建

OpenAnolis小助手

开源 AI 操作系统 龙蜥社区

JUC并发—并发安全集合二

量贩潮汐·WholesaleTide

安全 JUC

Apache Flink 2.1.0: 面向实时 Data + AI 全面升级,开启智能流处理新纪元

Apache Flink

大数据 flink 实时计算 实时计算Flink

Agentic AI, 基于 Dify x OceanBase 的实践

老纪的技术唠嗑局

OceanBase 社区版 dify #工作流

五年磨一剑:Agent 时代追风不如造风

阿里巴巴云原生

阿里云 云原生 AI Agent

Django模型迁移指南:从命令用法到最佳实践

电子尖叫食人鱼

HGDD 荣耀开发者日丨荣耀小游戏线下沙龙圆满收官

荣耀开发者服务平台

荣耀开发者服务平台 荣耀HONOR 荣耀远航计划 HGDD 荣耀开发者日 荣耀小游戏

LoongCollector:构建智能时代的数据采集新范式

阿里巴巴云原生

阿里云 云原生 AI Agent

企业私有化即时通讯工具如何选?

BeeWorks

即时通讯 IM 私有化部署

网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行_AI&大模型_凌敏_InfoQ精选文章