写点什么

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

  • 2024-04-12
    北京
  • 本文字数:1030 字

    阅读完需:约 3 分钟

大小:516.10K时长:02:56
网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

 

QAnything 系统架构图


QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。


GitHub 地址:

https://github.com/netease-youdao/QAnything


自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+个星标,这反映出了用户对其价值的高度评价。


QAnything登上GitHub trending榜单


此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。


值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。


据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。


目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。


与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

2024-04-12 11:197468

评论

发布
暂无评论
发现更多内容

通证经济— 激励机制、社会生产、后资本主义

CECBC

5分钟速读之Rust权威指南(十三)

wzx

rust

唵嘛呢叭咪吽|靠谱点评

无量靠谱

IoT系列,树莓派监控开关状态

IT蜗壳-Tango

IT蜗壳 IT蜗壳教学 5月日更

深入剖析 MySQL 自增锁

leonsh

MySQL 数据库

iOS基础原理题目汇总

程序员 面试 iOS 知识体系

ModelArts的雪中送炭,让我拿下CCF BDCI华为Severless工作负载预测亚军

华为云开发者联盟

modelarts 工作负载 大赛 severless lstm架构

量化马丁策略系统搭建,网格策略交易系统

文本分析基本流程

Qien Z.

文本分析 5月日更

6000 字 |Redis 分布式锁|从青铜到钻石的演进方案

悟空聊架构

redis 缓存 分布式锁 redis分布式锁 6月日更

不愧是Alibaba技术官,Kafka的精髓全写这本“限量笔记”里,服了

Java 大数据 架构 面试

99% 的同学写不出好代码,都是因为这个问题!

程序员鱼皮

Java c++ Python 自学编程 经验分享

大数据采集和常见问题

数据社

大数据 数据采集 5月日更

不含敌意的坚决|靠谱点评

无量靠谱

网络攻防学习笔记 Day31

穿过生命散发芬芳

5月日更 网络攻防

架构之:软件架构漫谈

程序那些事

架构 系统架构 软件设计 程序那些事

Serverless Devs 的官网是如何通过 Serverless Devs 部署的

阿里巴巴云原生

Serverless 开发者 运维 云原生 存储

阿里云携手 VMware 共建云原生 IoT 生态,聚开源社区合力打造领域标准

阿里巴巴云原生

阿里云 容器 开发者 云原生 k8s

“四大模型”革新NLP技术应用,揭秘百度文心ERNIE最新开源预训练模型

百度大脑

开源 nlp

自制文件系统 —— 1 什么文件系统

奇伢云存储

Linux 文件系统 Go 语言

react源码解析2.react的设计理念

全栈潇晨

React React Hooks react源码

One-on-One Meeting

escray

学习 5月日更 朱赟的技术管理课

HTTP协议

IT视界

网络协议 HTTP 网络通信协议

暑期 2021 | Serverless Devs 最全项目申请攻略来啦!

阿里巴巴云原生

开源 Serverless 开发者 云原生 活动

公安重点人员情报研判分析系统,可视化大屏系统

人生算法:愿景,设计人生导航系统

石云升

读书笔记 愿景 5月日更

dubbo-go v3 版本 go module 踩坑记

阿里巴巴云原生

容器 开发者 云原生 中间件 dubbogo

从外包到拿下阿里offer,这2年5个月13天到底发生了什么?

Java 程序员 架构 面试

Logstash-数据流引擎

进击的梦清

大数据 Linux 运维 后端 Logstash

模块五作业

c

架构实战营

【Flutter 专题】116 图解 PhysicalModel & PhysicalShape 裁切小组件

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行_AI&大模型_凌敏_InfoQ精选文章