NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

全文搜索引擎

收录了 全文搜索引擎 频道下的 50 篇内容

悟空:用 Go 语言编写的全文搜索引擎

最近Go语言1.5版正式发布,国内关于Go语言的学习和应用也逐渐火热,InfoQ也将关注并推动国内Go语言社区的发展。悟空开源项目是用Go语言编写的全文搜索引擎,InfoQ记者采访了它的作者陈辉,了解了这个项目背后的一些信息。

软件工程师需要了解的搜索引擎知识

Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。Max认为,除了搜索引擎自身的搜索问题解决、人类使用方式等之外,也需要解决索引、分词、权限控制、国际化等等的技术点,看了他的文章,勾起了我多年前的想法。 很多年前,我曾经想过自己实现一个搜索引擎,作为自己的研究生论文课题,后来琢磨半天没有想出新的技术突破点(相较于已发表的文章),所以切换到了大数据相关的技术点。当时没有写出来,心中有点小遗憾,毕竟凭借搜索引擎崛起的谷歌是我内心渴望的公司。今天我就想结合自己的一些积累,聊聊作为一名软件工程师,您需要了解的搜索引擎知识。

Nebula 基于 ElasticSearch 的全文搜索引擎的文本搜索

了解下全文索引的原理和实践吧

elasticsearch
索引
图数据库
分布式存储技术(下):宽表存储与全文搜索引擎的架构原理、特性、优缺点解析

对于写密集型应用,每天写入量巨大,数据增长量无法预估,且对性能和可靠性要求非常高,普通关系型数据库无法满足其需求。对于全文搜索和数据分析这类对查询性能要求极高的场景也是如此。

分布式
全文搜索
UCloud Elasticsearch服务UES应用场景分析
UCloud Elasticsearch 服务 UES 应用场景分析

当一个系统业务数据量达到百亿条的时候,通常会引出一些问题:Elasticsearch,可能是这些问题下比较高效的一种解决方案。

京东 11.11:商品搜索系统架构设计

京东商品搜索引擎是搜索推荐部自主研发的商品搜索引擎,主要功能是为海量京东用户提供精准、快速的购物体验。

一文读懂智能 NoSQL 数据库 Couchbase
一文读懂智能 NoSQL 数据库 Couchbase

Couchbase 作为一款能够被部署在本地集群的数据服务,其具备很强的一致性,是一个专注于服务、分布式以及灵活的 JSON 文档数据库,且 Couchbase Server支持异地跨数据中心复制,能够在各集群之间保持数据一致。

仅用不到150行代码,我开发出了一个搜索引擎
仅用不到 150 行代码,我开发出了一个搜索引擎

在这篇文章中,我们将探索全文搜索引擎的基本组件,并用它们来构建一个可以搜索数百万个文档、根据相关性对文档进行排名的搜索引擎

ModeShape 2.4 发布了

近日,JBoss发布了ModeShape 2.4.0 Final。感兴趣的读者可以从JBoss Maven仓库(位于“org.modeshape” group ID下)和下载页面上获取。同时ModeShape还更新了新手指南、参考指南以及Java Doc。

7款你不得不了解的开源云监控工具
7 款你不得不了解的开源云监控工具

本文来自RancherLabs微信公众号

使用 Mingle

InfoQ与Mingle的开发工程师Jay Wallace一起,花了一些时间体验了Mingle的公测版本,向我们展示了Mingle作为一个真正的敏捷项目管理工具与其它工具的不同之处。

从ES到CK:信息技术发展的新浪潮
从 ES 到 CK:信息技术发展的新浪潮

将会话数据从ES切换到Clickhouse,总体运维成本更低,而且提升了写入和查询效率,在用户进行会话数据统计分析和明细时,查询稳定性提升明显,用户体验得到大幅改善。

盘点大数据开源软件 Google Trends 指数

本文列举了大数据相关的部分热门项目,盘点了该生态圈目前流行的一些开源产品和工具,并用google热度趋势图体现了它们的受关注程度。从不同的热度趋势,可以了解到每一个产品在近5年来全球受关注的走势,是越来越受重视还是渐渐淡出。

MongoDB简史
MongoDB 简史

说到现代 Web 应用程序开发,不得不提 MongoDB。MongoDB 的故事很有趣,本文带你一起探索 它的发展之旅。

2021年 Rust 行业调研报告
2021 年 Rust 行业调研报告

截止到 2021年,Rust 连续五年成为 StackOverflow 语言榜上最受欢迎的语言。

谈谈技术选型的注意事项

作为一名工程师,我可以理解大家的心情,我们都是热爱尝试新技术、抛弃过时技术的人。但是首先得明确,到底技术是不是过时的,还是仅仅是你认为它过时了。这篇文章我想谈谈我对技术选型的理解。 这篇文章不仅仅是写给工程师,更多是写给技术团队负责人(大多数也是从工程师升职上去的,起初思维和工程师差距不大),因为你们具体负责技术选型的方向、方法、过程、结论明确。

使用聚合、事件溯源和 CQRS 开发事务型微服务(第二部分)

本文是介绍使用DDD、事件溯源和CQRS开发微服务系列文章的第二部分。如何使用事件维护服务间的数据一致性,以及如何实现查询,是使用微服务架构中两个主要挑战。对于前者,使用事件溯源是一种更好的方法;对于后者,解决方案是CQRS。文中介绍了与现有实现方法的比较情况,并给出了方法实现中的实际考虑。

携程ClickHouse日志分析实践
携程 ClickHouse 日志分析实践

本文转载自公众号携程技术(ID:ctriptech)。

Rust 语言 2022 年度回顾:开源生态发展
Rust 语言 2022 年度回顾:开源生态发展

Rust 开源生态发展

全文搜索引擎专题_资料-InfoQ中文网