在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

文献搜索引擎

收录了 文献搜索引擎 频道下的 50 篇内容

纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?
纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?

在这篇文章中,我们将深入剖析向量数据库核心技术的争议点,解释其优势和局限性,为读者提供全面而清晰的了解。

阿里巴巴提出基于异构内容流的动态排序模型,提升用户点击和购买率

本文中,我们的目标是解决商品搜索引擎和内容搜索引擎中异构数据排序的问题,给用户推荐丰富的个性化的内容流。我们把算法分成了两部分:1)异构内容流类型排序,即决定每个坑位展示何种类型的内容流,文章、视频还是商品列表;2)同构的内容流内容排序,第二个步骤使用广为人知的DSSM模型,在这个内容流类型下,对内容流的内容进行排序,选择相似度最高的内容插入。

代码搜索引擎:基础篇
代码搜索引擎:基础篇

在调用链追踪系统中,我们不是已经获得了接口级别的依赖关系吗?为什么不能直接用那边的数据?

开源神器!向量、张量、全文搜索一网打尽,打造最强 RAG!
开源神器!向量、张量、全文搜索一网打尽,打造最强 RAG!

向量+稀疏向量+全文搜索+张量 = 最佳 RAG 搭配

95%向量资源节省,火山引擎云搜索RAG技术体系演进
95% 向量资源节省,火山引擎云搜索 RAG 技术体系演进

字节跳动如何在开源基础上实现一套RAG系统,并且还能节约95%的向量检索资源?

文献书籍下载管理工具 Bookends for Mac 激活版

Bookends Mac版是一款专业的文献管理和参考工具,专为学术研究人员、作家以及学生设计。通过强大的文献管理功能,Bookends能够帮助用户快速整理、标记和引用各种学术资源。

大模型 + 搜索:一盘跳棋和三位选手

初步探索,小有收获

AI
txtai:基于 Transformer 的人工智能搜索引擎
txtai:基于 Transformer 的人工智能搜索引擎

这是一个基于人工智能的搜索引擎,可以在任何应用程序中实现基于自然语言理解的搜索。

一小时内,构建出属于你自己的 Perplexity AI 搜索引擎
一小时内,构建出属于你自己的 Perplexity AI 搜索引擎

250 行 Python 代码构建功能完备的搜索工具。

开源
实操
Python 代码
Perplexity
AI 搜索引擎
从 RAG 到 Context:2025 年 RAG 技术年终总结
从 RAG 到 Context:2025 年 RAG 技术年终总结

过去的 2025 年,对于检索增强生成(RAG)技术而言,是经历深刻反思、激烈辩论与实质性演进的一年。

一篇文章讲清什么是消息引擎系统?
一篇文章讲清什么是消息引擎系统?

用一句话概括一下:Apache Kafka是一款开源的消息引擎系统。

GAIA开源榜第一:中兴通讯开源Co-Sight超级智能体
GAIA 开源榜第一:中兴通讯开源 Co-Sight 超级智能体

中兴开源Co-Sight超级智能体,登开源框架榜首,助力智能自动化。

美团餐饮娱乐知识图谱——美团大脑揭秘
美团餐饮娱乐知识图谱——美团大脑揭秘

本文来自美团点评技术文章系列。

Twitter 情感分析技术

微博是当前互联网中一种非常流行的社交平台,用户可以在平台上分享他们对于各种产品、新闻和事件的看法。在意见挖掘和预测系统中,情感分析预测发挥着越来越重要的作用。Twitter是目前最流行的一个微博平台,对于用户的每次分享,有一个140字的限制。这促使用户必须非常简洁地表达他们的意见,并有助于对用户的情感分析。Twitter还为开发者提供了非常友好的API接口,允许分析者搜索和获取各种用户的实时分享数据。本文将讨论当前Twitter上的主要的情感分析技术,包括词法分析方法、机器学习方法和混合方法等。

幻觉的状态空间解决方案:状态空间模型如何在竞争中脱颖而出
幻觉的状态空间解决方案:状态空间模型如何在竞争中脱颖而出

人工智能驱动的搜索工具经常产生幻觉,编造事实,错误引用来源,并重复过时的信息。造成这种情况的真正原因与大多数AI模型的架构有关:Transformer。在这篇文章中,作者Albert Lie解释了为什么Transformer会出现幻觉,状态空间模型(SSM)如何提供解决方案,以及这种转变对人工智能搜索的未来意味着什么。

Faiss:Facebook 开源的相似性搜索类库

Facebook开源的Faiss(Facebook AI Similarity Search)的项目, 提供了一个相似性搜索的类库,能够快速从多媒体文档中搜索出相似的条目。Facebook 人工智能实验室(FAIR)基于十亿级别的数据集构建了最近邻搜索算法的实现,这比已知的最快算法还快大约8.5倍,因此创造了新的记录,包括第一个基于十亿高维向量构建的k最近邻图。

ClickHouse 内部的全文搜索:快速、原生、列式架构
ClickHouse 内部的全文搜索:快速、原生、列式架构

我们在 ClickHouse 中彻底重构了全文搜索功能,性能更高、更轻量,并且与列式数据库架构深度融合。

KDD Cup 2020多模态召回比赛季军方案与广告业务应用
KDD Cup 2020 多模态召回比赛季军方案与广告业务应用

本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。

文献搜索引擎专题_资料-InfoQ中文网