收录了 全文搜索引擎 频道下的 50 篇内容
最近Go语言1.5版正式发布,国内关于Go语言的学习和应用也逐渐火热,InfoQ也将关注并推动国内Go语言社区的发展。悟空开源项目是用Go语言编写的全文搜索引擎,InfoQ记者采访了它的作者陈辉,了解了这个项目背后的一些信息。
Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。Max认为,除了搜索引擎自身的搜索问题解决、人类使用方式等之外,也需要解决索引、分词、权限控制、国际化等等的技术点,看了他的文章,勾起了我多年前的想法。 很多年前,我曾经想过自己实现一个搜索引擎,作为自己的研究生论文课题,后来琢磨半天没有想出新的技术突破点(相较于已发表的文章),所以切换到了大数据相关的技术点。当时没有写出来,心中有点小遗憾,毕竟凭借搜索引擎崛起的谷歌是我内心渴望的公司。今天我就想结合自己的一些积累,聊聊作为一名软件工程师,您需要了解的搜索引擎知识。
对于写密集型应用,每天写入量巨大,数据增长量无法预估,且对性能和可靠性要求非常高,普通关系型数据库无法满足其需求。对于全文搜索和数据分析这类对查询性能要求极高的场景也是如此。
当一个系统业务数据量达到百亿条的时候,通常会引出一些问题:Elasticsearch,可能是这些问题下比较高效的一种解决方案。
京东商品搜索引擎是搜索推荐部自主研发的商品搜索引擎,主要功能是为海量京东用户提供精准、快速的购物体验。
Couchbase 作为一款能够被部署在本地集群的数据服务,其具备很强的一致性,是一个专注于服务、分布式以及灵活的 JSON 文档数据库,且 Couchbase Server支持异地跨数据中心复制,能够在各集群之间保持数据一致。
字节跳动如何在开源基础上实现一套RAG系统,并且还能节约95%的向量检索资源?
在这篇文章中,我们将探索全文搜索引擎的基本组件,并用它们来构建一个可以搜索数百万个文档、根据相关性对文档进行排名的搜索引擎
近日,JBoss发布了ModeShape 2.4.0 Final。感兴趣的读者可以从JBoss Maven仓库(位于“org.modeshape” group ID下)和下载页面上获取。同时ModeShape还更新了新手指南、参考指南以及Java Doc。
本文来自RancherLabs微信公众号
InfoQ与Mingle的开发工程师Jay Wallace一起,花了一些时间体验了Mingle的公测版本,向我们展示了Mingle作为一个真正的敏捷项目管理工具与其它工具的不同之处。
将会话数据从ES切换到Clickhouse,总体运维成本更低,而且提升了写入和查询效率,在用户进行会话数据统计分析和明细时,查询稳定性提升明显,用户体验得到大幅改善。
本文列举了大数据相关的部分热门项目,盘点了该生态圈目前流行的一些开源产品和工具,并用google热度趋势图体现了它们的受关注程度。从不同的热度趋势,可以了解到每一个产品在近5年来全球受关注的走势,是越来越受重视还是渐渐淡出。
说到现代 Web 应用程序开发,不得不提 MongoDB。MongoDB 的故事很有趣,本文带你一起探索 它的发展之旅。
截止到 2021年,Rust 连续五年成为 StackOverflow 语言榜上最受欢迎的语言。
作为一名工程师,我可以理解大家的心情,我们都是热爱尝试新技术、抛弃过时技术的人。但是首先得明确,到底技术是不是过时的,还是仅仅是你认为它过时了。这篇文章我想谈谈我对技术选型的理解。 这篇文章不仅仅是写给工程师,更多是写给技术团队负责人(大多数也是从工程师升职上去的,起初思维和工程师差距不大),因为你们具体负责技术选型的方向、方法、过程、结论明确。
本文是介绍使用DDD、事件溯源和CQRS开发微服务系列文章的第二部分。如何使用事件维护服务间的数据一致性,以及如何实现查询,是使用微服务架构中两个主要挑战。对于前者,使用事件溯源是一种更好的方法;对于后者,解决方案是CQRS。文中介绍了与现有实现方法的比较情况,并给出了方法实现中的实际考虑。
本文转载自公众号携程技术(ID:ctriptech)。