写点什么

LinkedIn 已将可自定义的索引引擎 IndexTank 开源

  • 2012-01-04
  • 本文字数:701 字

    阅读完需:约 2 分钟

LinkedIn 已将 IndexTank 开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank 是在一年之前发布的,在十月份被LinkedIn 收购,并在最近开放了源代码。IndexTank 是与 Google 自定义搜索类似的云服务,它基于 Amazon Web Services 运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank 声称他们的用户拥有完全的控制权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google 的搜索算法。

和很多站点不同,IndexTank 不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank 包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而 PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API ——可以通过 Java、Python、.NET、Ruby 和 PHP 客户端访问的 RESTful 的接口。
  • Nebulizer ——一种多租户框架,其中存放不限数量、运行在 IaaS 基础架构上的索引引擎。

IndexTank 加入了 Zoie ,那是一种基于 Apache Lucene 构建的实时搜索引擎,并由 LinkedIn 于 2008 年开源。

IndexTank 声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是 Reddit ,但这家公司在被 LinkedIn 收购的时候还没有盈利。

IndexTank 的源代码可以在 GitHub: Index Engine API plus Nebulizer 处下载。

查看英文原文: LinkedIn Open Sources IndexTank, a Customizable Indexing Engine

2012-01-04 07:232919
用户头像

发布了 340 篇内容, 共 129.7 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

Python 为什么能支持任意的真值判断?

Python猫

Python 编程

【MySQL】我这样分析MySQL中的事务,面试官对我刮目相看!!

冰河

MySQL 面试 事务 隔离级别 冰河

为什么Java二维数组不用指定列的长度

Rayjun

Java 数组

2020-09-03-第十三周作业

路易斯李李李

持续集成有什么好处?快来看鸭

清菡软件测试

jenkins

区块链技术应用于链接智慧医疗

CECBC

区块链 社会保险 智能医疗

职场求生攻略答疑篇之 3 —— 数据是土地

臧萌

数据 职场成长

SpringBoot 缓存之常用注解

hepingfly

Java 缓存 springboot 注解

oeasy教您玩转linux010206toilet

o

Flink从保存点启动应用-18

小知识点

scala 大数据 flink

怎么向女朋友解释什么叫区块链?

艾小仙

比特币 区块链 以太坊 defi

一个在交流群里讨论过两轮的问题,答案竟然跟一个 PEP 有关

Python猫

Python 编程

Python 中的数字到底是什么?

Python猫

Python 翻译 PEP

Python 为什么要在 18 年前引入布尔类型?且与 C、C++ 和 Java 都不同?

Python猫

Python 编程

商业通识 : 商业到底是什么?

Walker

学习 得到 个人成长 商业

智能商业时代的思考(一)从在线化到网络化

刘旭东

拼多多 淘宝 智能商业 网络协同

为稳外贸保驾护航 区块链交易平台显身手

CECBC

区块链 银行 福费廷

[翻译]Defer,Panic,and Recover

卓丁

defer panic recover Go 语言

JavaScript 深拷贝与浅拷贝

梁凤波

妈妈,今天您几点下班?

脑极体

java安全编码指南之:声明和初始化

程序那些事

安全编码 java安全编码 编码指南 对象初始化

宁波新基建之路 基于制造优势破题智慧发展

CECBC

新基建

Python 为什么没有 void 关键字?

Python猫

Python 编程

首个数字银行卡明年发行,广州出台区块链措施支持大湾区

CECBC

区块链 金融科技 社会

Elasticsearch之mapping

北漂码农有话说

人生革命由自律发起

胡迪伦

自学编程 拖延症 懒惰 死循环

拥抱K8S系列-04-基于docker部署更多应用

张无忌

Docker 标准化 vsftpd

Python 函数为什么会默认返回 None?

Python猫

Python 编程

区块链技术破解数字版权保护难题

CECBC

区块链 版权保护 数字技术

Google鼓励的13条代码审查标准 [建议收藏]

简爱W

如何将VSCode变成绿色版本

lmymirror

vscode 教程

LinkedIn已将可自定义的索引引擎IndexTank开源_开源_Abel Avram_InfoQ精选文章