收录了 快速搜索引擎排名 频道下的 50 篇内容
Neeva 更快、更简单且无广告。但做出比谷歌更好的东西,却并不足以击败谷歌。
如何在不影响用户产品体验的情况下,更精准地推荐用户可能感兴趣的广告,是每个算法工程师长期思考的问题。
本文会向大家讲述搜索引擎的基本知识以及中文分词的一些方法、然后会做一个小的demo去尝试一下数据检索。
从信息获取的角度来看,搜索和推荐是用户获取信息的两种主要手段。无论在互联网上,还是在线下的场景里,搜索和推荐这两种方式都大量并存,那么推荐系统和搜索引擎这两个系统到底有什么关系?区别和相似的地方有哪些?本文作者有幸同时具有搜索引擎和推荐系统一线的技术产品开发经验,结合自己的实践经验来为大家阐述两者之间的关系、分享自己的体会。
Elasticsearch挺进中国市场面临的机遇和挑战如何?阿里云 Elasticsearch 为中国用户提供了哪些新服务?为此,InfoQ 采访了 Elasticsearch 的创始人兼首席执行官 Shay Banon。
滴滴基于开源引擎搭建大数据基础设施,始于数据驱动业务运营与商业决策的BI需求,随着实时数据流量达到百MB/S,存储达到PB级,开源数据引擎的服务运营会遇到各种各样的稳定性、易用性、运维友好性挑战。
许多应用都有关于搜索领域实体的用户需求。SQL实现随着字段的增多,复杂度逐渐增大。Java应用可以采用Lucene索引API,但是事实证明这个功能会带来时间的消耗。这篇文章带你领略如何轻松地在你的应用中使用Compass API。
3月27日,豌豆荚正式发布“应用内搜索技术协议”,它提供了一套开放的应用内内容检索、收录和调起的标准,并且兼容Google App Indexing 协议与Quixey的AppURL,开发者通过描述应用内内容、想豌豆荚提交内容信息以及使应用支持外部调用三个步骤即可完成接入。
Reddit的CTO Chris Slowe、工程副总裁Nick Caldwell和工程总监Luis Bitencourt-Emilio在Reddit网站上披露了Reddit搜索模块的发展史。
本文将介绍 QQ 邮箱全文检索的架构、实现细节与搜索调优。
eBay在Hadoop世界(Hadoop World)大会的主题演讲中展示了一种全新搜索引擎Cassini的架构,该引擎预计在2012年上线。它对所有的内容和用户的元数据进行索引来得到更好的排名,并每小时刷新索引。它使用Hadoop来支持每小时进行的索引更新,使用HBase对随机存取信息提供支持。
Yelp工程团队成员通过本文介绍了将原本基于Lucene的商家搜索功能迁移至Elasticsearch的整个过程,老系统的局限,新系统需要解决的问题,以及在整个过程中获得的经验。
本文将使用 TPC-DS 基准测试的 99 个查询语句来对比开源的 ClickHouse、Doris、Presto 以及 ByConity 这 4 个 OLAP 引擎的性能表现,以便为企业选择合适的 OLAP 引擎提供参考。
作为开源搜索引擎领域排名第一的 Elasticsearch,能够让我们无需深入了解背后复杂的信息检索原理,就可实现基本的全文检索功能,在数据量达到十亿,百亿规模仍然可以秒级返回检索结果。
在改善Google对你的网站做句法分析和索引这件事上,你不该完全依赖单一种策略。一个清晰的、仔细斟酌过的网站等级制度,加上所有页面至少有一次内部连接,这些非常重要。
最近一两年是人工智能的启动元年,人工智能领域已经推动计算机视觉技术进入到了一个新的高度。在这个高度,业界的目标是在像素级理解图像,而不是之前的需要文字描述、分类等方式协助。这种进步帮助我们的系统认识图像里面是什么,图像里面是什么场景,例如是不是一个有名的旅游胜地。反过来看,这种技术可以更好地为视力有障碍的人士提供帮助,帮助他们更好地使用搜索引擎搜索图像和视频。通过Joaquin Quiñonero Candela的文章[《Building scalable systems to understand content》][1],我们可以大概了解一下。
近期,Brand Finance在达沃斯世界经济论坛上发布了最新全球品牌500强报告。亚马逊,苹果和谷歌排名前三。
人工智能最近几年发展得如火如荼,学术界、工业界、投资界各方一起发力,本文将深度解析最新AI发展趋势,欢迎讨论。