写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 文献搜索引擎 频道下的 50 篇内容

在这篇文章中,我们将深入剖析向量数据库核心技术的争议点,解释其优势和局限性,为读者提供全面而清晰的了解。
本文中,我们的目标是解决商品搜索引擎和内容搜索引擎中异构数据排序的问题,给用户推荐丰富的个性化的内容流。我们把算法分成了两部分:1)异构内容流类型排序,即决定每个坑位展示何种类型的内容流,文章、视频还是商品列表;2)同构的内容流内容排序,第二个步骤使用广为人知的DSSM模型,在这个内容流类型下,对内容流的内容进行排序,选择相似度最高的内容插入。

在调用链追踪系统中,我们不是已经获得了接口级别的依赖关系吗?为什么不能直接用那边的数据?

向量+稀疏向量+全文搜索+张量 = 最佳 RAG 搭配

字节跳动如何在开源基础上实现一套RAG系统,并且还能节约95%的向量检索资源?
Bookends Mac版是一款专业的文献管理和参考工具,专为学术研究人员、作家以及学生设计。通过强大的文献管理功能,Bookends能够帮助用户快速整理、标记和引用各种学术资源。

这是一个基于人工智能的搜索引擎,可以在任何应用程序中实现基于自然语言理解的搜索。


过去的 2025 年,对于检索增强生成(RAG)技术而言,是经历深刻反思、激烈辩论与实质性演进的一年。

用一句话概括一下:Apache Kafka是一款开源的消息引擎系统。

中兴开源Co-Sight超级智能体,登开源框架榜首,助力智能自动化。

本文来自美团点评技术文章系列。
微博是当前互联网中一种非常流行的社交平台,用户可以在平台上分享他们对于各种产品、新闻和事件的看法。在意见挖掘和预测系统中,情感分析预测发挥着越来越重要的作用。Twitter是目前最流行的一个微博平台,对于用户的每次分享,有一个140字的限制。这促使用户必须非常简洁地表达他们的意见,并有助于对用户的情感分析。Twitter还为开发者提供了非常友好的API接口,允许分析者搜索和获取各种用户的实时分享数据。本文将讨论当前Twitter上的主要的情感分析技术,包括词法分析方法、机器学习方法和混合方法等。

人工智能驱动的搜索工具经常产生幻觉,编造事实,错误引用来源,并重复过时的信息。造成这种情况的真正原因与大多数AI模型的架构有关:Transformer。在这篇文章中,作者Albert Lie解释了为什么Transformer会出现幻觉,状态空间模型(SSM)如何提供解决方案,以及这种转变对人工智能搜索的未来意味着什么。
Facebook开源的Faiss(Facebook AI Similarity Search)的项目, 提供了一个相似性搜索的类库,能够快速从多媒体文档中搜索出相似的条目。Facebook 人工智能实验室(FAIR)基于十亿级别的数据集构建了最近邻搜索算法的实现,这比已知的最快算法还快大约8.5倍,因此创造了新的记录,包括第一个基于十亿高维向量构建的k最近邻图。

我们在 ClickHouse 中彻底重构了全文搜索功能,性能更高、更轻量,并且与列式数据库架构深度融合。

本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。