写点什么

Hibernate Search 3.1 支持动态搜索分析器及查询时间的性能改进

  • 2008-12-25
  • 本文字数:1077 字

    阅读完需:约 4 分钟

Hibernate Search (来自 Hibernate 的一个开源的领域模型搜索框架)的最新版支持一个声明式及动态的搜索分析器模型,同时索引和查询时间的性能也得到了改进。Hibernate Search 开发团队最近发布了该框架的 3.1 版。该新版本还包含了索引和查询的一些特性,包括对 term vector 的支持、在查询期内可以访问范围内的分析器及 Results Explanation 对象。

分析器模型:

  • 我们可以使用声明的方式来配置该新的分析器模型,它具有如下特性:语音近似、语法近似、根据同义词搜索、停止单词过滤、元音省略纠正以及无重音搜索。
  • 我们可以通过 Apache Solr 搜索库将分析器分解为一个标识符和一套过滤器。
  • 动态分析器:它可以对一个给定的实体定义运行时可用的分析器,这对于具有多语言支持的应用来说非常有用(不同的实体对应不同的语言)。

索引:

索引性能的改进包括:

  • 更好的控制手工索引和索引编写(RAM 使用、非混合的文件格式标志等等)。
  • 支持 term vector 和客户化相似。
  • 更好的支持大索引的复制。
  • 在索引期间对竞争和锁窗口的改进,同时降低了索引打开 / 关闭的次数。
  • 在每个目录下可以并行完成索引。

查询:

查询中增加的新特性列举如下:

  • 为了更简单的重用而在查询期暴露实体范围和命名查询器。
  • 可以使用声明的方式来缓存过滤结果(DocIdSet)。
  • 暴露出查询结果 Explanation 以便提供更好的调试信息。
  • 在搜索多个实体时减少了数据库中不必要的数据传输次数。
  • 更快的 Lucene 索引查询,包含了一个单独的实体类型并减少了 Lucene 上的 I/O 操作,这是通过只读取必要的文档字段(如果可能的话)来实现的。
  • 对受保护的属性的更好的性能(相比于原生的 Lucene 调用并没有明显的代价)。
  • 文档读取次数的减少(在分页和调用 getResultSize() 时)。
  • 重新生成索引的速度更快(让未改变的部分保持打开)并且读取索引时的并发性更好(使用了只读标志)。

Emmanuel Bernard 撰写博文谈到了该新发布及其特性:使用 SLF4J 作为日志框架并将 Lucene 迁移到 2.4 版,将 Hibernate Core 迁移到 3.3 版,同时还使用了 JDK 5.0 。Hibernate Search 可以非集群和集群的方式运行、提供了同步和异步索引更新,同时还可在响应时间、吞吐量和索引更新之间进行选择。它还可以运行在所有传统的 Hibernate 模式下,尤其是 JBoss Seam 所使用的长会话(原子性)模式下。

可以从其站点上下载最新的发布,同时 JIRA 上有其更新日志。我们建议所有用户都迁移到该版本上(查看迁移指南)。其路线图文档展示了Hibernate Search 团队打算为该框架的下一个版本增加的新特性。

查看英文原文: Hibernate Search 3.1 Supports Dynamic Search Analyzer and Query Time Performance Improvements

2008-12-25 09:561147
用户头像

发布了 88 篇内容, 共 270.9 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

通信系统仿真:飞行器集群协同控制纽带

DevOps和数字孪生

【YashanDB知识库】YashanDB-OCI-快速上手

YashanDB

yashandb 崖山数据库 yashandb知识库

ETLCloud携手ClickHouse:高效的数据查询效率

谷云科技RestCloud

数据库 数据处理 ETL 数据集成 Click house

环保行业怎么定义?需要用到堡垒机吗?

行云管家

等保 堡垒机 环保

AI与大数据的结合:如何从海量数据中提取价值

天津汇柏科技有限公司

大数据‘’ AI 人工智能

防御性编程:让系统坚不可摧

京东科技开发者

Spark SQL分析层优化

数新网络官方账号

百度输入法AI请求次数累计超4亿,「超会写」全新升级

极客天地

Flink CDC:新一代实时数据集成框架

Apache Flink

大数据 flink 数据集成 Flink CDC 实时处理

给Java同仁单点的AI"开胃菜"--搭建一个自己的本地问答系统

京东科技开发者

获取淘宝商品详情API返回值的技术实现方案

代码忍者

API 测试 pinduoduo API

目前东莞等保测评机构有哪些?电话多少?

行云管家

等保测评 过等保 东莞

数字货币交易所开发与智能合约交易系统

区块链软件开发推广运营

交易所开发 链游开发 NFT开发 公链开发 代币开发

Kubernetes存储新动力:CSD3000与Portworx的协同效应

ScaleFlux

Kubernetes Serverless 云原生容器 应用容器化

技术干货|热门仿真平台HyperMesh CFD功能详解:几何和网格(Part 1)

Altair RapidMiner

人工智能 智能制造 altair Hypermesh 仿真设计

快速实现AI搜索!Fivetran 支持 Milvus 作为数据迁移目标

Zilliz

Milvus Zilliz 向量数据库 rag AI搜索

构建未来电商体验:深度解析京东商品详情API的核心价值与应用

代码忍者

API 测试 pinduoduo API

DDD建模 vs 传统开发

Bruce Talk

DDD 领域驱动设计DDD

云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展

阿里云大数据AI技术

大数据 阿里云 Serverless 云栖大会 EMR

打造未来社交:区块链社交DAO的颠覆性开发之路

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

百度ARM云全栈自研方案全新升级,普惠智算助力行业数智化转型

科技大数据

基于 LangChain 的自动化测试用例的生成与执行

测试人

软件测试

人人都能手写的chrome插件,帮我省了1000多块钱

京东科技开发者

如何让Android的前端页面像iOS一样“优雅”?

阿里技术

ios 前端 异形屏 前端适配

大模型还能产生幻觉?一文讲清楚原理和解决方法

敏捷开发

AI AIGC GPT LLM 大模型幻觉

Mac苹果电脑视频下载软件推荐:Downie 4 for Mac 激活版

你的猪会飞吗

Downie 4 下载 Downie 4 Mac版 Downie 4 for mac

仅需6步,实现虚拟物体在现实世界的精准放置

不在线第一只蜗牛

人工智能 HarmonyOS

《阿凡达》导演卡梅隆加入 Stability AI 董事会;Molmo 横空出世,开源多模态模型王座易位丨 RTE 开发者日报

声网

想要激活孩子潜在力量,家长必做的一件事

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

Hibernate Search 3.1支持动态搜索分析器及查询时间的性能改进_Java_Srini Penchikala_InfoQ精选文章