硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

LinkedIn 已将可自定义的索引引擎 IndexTank 开源

  • 2012-01-04
  • 本文字数:701 字

    阅读完需:约 2 分钟

LinkedIn 已将 IndexTank 开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank 是在一年之前发布的,在十月份被LinkedIn 收购,并在最近开放了源代码。IndexTank 是与 Google 自定义搜索类似的云服务,它基于 Amazon Web Services 运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank 声称他们的用户拥有完全的控制权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google 的搜索算法。

和很多站点不同,IndexTank 不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank 包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而 PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API ——可以通过 Java、Python、.NET、Ruby 和 PHP 客户端访问的 RESTful 的接口。
  • Nebulizer ——一种多租户框架,其中存放不限数量、运行在 IaaS 基础架构上的索引引擎。

IndexTank 加入了 Zoie ,那是一种基于 Apache Lucene 构建的实时搜索引擎,并由 LinkedIn 于 2008 年开源。

IndexTank 声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是 Reddit ,但这家公司在被 LinkedIn 收购的时候还没有盈利。

IndexTank 的源代码可以在 GitHub: Index Engine API plus Nebulizer 处下载。

查看英文原文: LinkedIn Open Sources IndexTank, a Customizable Indexing Engine

2012-01-04 07:233284
用户头像

发布了 340 篇内容, 共 143.2 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

工具产业推广级!腾讯云 CODING 度量平台获得业内权威机构高度认可

CODING DevOps

Unity 发布《2023 移动游戏增长与变现报告》,聚焦游戏行业高效增长策略

极客天地

AITO问界,先经沧海而后造船

脑极体

智能汽车

C语言 typedef的用法示例讲解

芯动大师

掌控MySQL并发:深度解析锁机制与并发控制

砖业洋__

表锁 MySQL并发控制 隐式锁 插入意向锁 行锁

Spring高手之路1——深入理解与实现IOC依赖查找与依赖注入

砖业洋__

ioc 依赖注入 spring框架 依赖查找 IOC面试题

Linux中ARP学习和老化机制

天翼云开发者社区

Linux ARP

高性能存储 SIG 月度动态:DSMS 完成 Anolis 23 预览版发布,欢迎体验和反馈

OpenAnolis小助手

高性能存储 龙蜥社区 sig Anolis 23 DSMS

Spring高手之路2——深入理解注解驱动配置与XML配置的融合与区别

砖业洋__

XML配置 spring框架 注解驱动配置 组件注册 组件扫描

Nautilus Chain 主网上线,创世 ZBC 质押即将开启

股市老人

浅说TCP状态机制

天翼云开发者社区

TCP 数据传输

数字先锋|少跑多办!天翼云助力安徽政务跑出便民利企“加速度”

天翼云开发者社区

云计算 云平台

软件测试 / 测试开发丨 Linux 三剑客与管道使用

测试人

Python 程序员 软件测试 装饰器

敏捷产品经理企业培训内容要点

顿顿顿

Scrum 敏捷 Scrum Master 敏捷开发管理工具

新兴技术对中药学的革命|社区征文

爱技术的药学生

AI AIGC 年中技术盘点

顺丰基于 Flink CDC + Hudi 推进实时业务落地

Apache Flink

大数据 flink 实时计算

【7.14-7.21】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

单线程 Redis 如此快的 4 个原因

越长大越悲伤

redis redis为什么如此快

AI与HPC融合,未来会朝什么方向发展 | 社区征文

瓜瓜猪

年中技术盘点

2023-07-20:假设一共有M个车库,编号1~M,时间点从早到晚是从1~T, 一共有N个记录,每一条记录如下{a, b, c}, 表示一辆车在b时间点进入a车库,在c时间点从a车库出去, 一共有K

福大大架构师每日一题

福大大架构师每日一题

6位字节跳动资深技术人,给校招生的10个成长建议

字节跳动技术范儿

字节跳动 校园招聘

[Huggingface]系列文章(1)-认识Transformers

alexgaoyh

文本分类 文本生成 huggingface sentiment-analysis text-generation

Docker 镜像的导出与导入

陈皮

Docker save load

AI 改变我们的工作方式 | 社区征文

宇宙之一粟

年中技术盘点

什么是供应链(Supply chain)?

优秀

#供应链 供应链管理

叮!你有一份夏日福利待签收

KaiwuDB

时序数据库 大促 KaiwuDB

PaddleSlim +​OpenVINO助力开发者实现Al模型量化与部署

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

喜报| 无限极入选信通院 2023 XOps“领新杯”业技融合攻坚先锋案例

CODING DevOps

HTTP接口性能压力测试

javalover123

性能测试 压测 API 压力测试 HTTP API

LinkedIn已将可自定义的索引引擎IndexTank开源_开源_Abel Avram_InfoQ精选文章