NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

数据搜索引擎

收录了 数据搜索引擎 频道下的 50 篇内容

搜索引擎中的 web 数据挖掘
搜索引擎中的 web 数据挖掘

本文介绍搜索引擎中的 web 数据挖掘。

搜索引擎中的 web 数据挖掘
搜索引擎中的 web 数据挖掘

本文介绍全网搜索引擎中的数据挖掘系统的设计方案与核心算法。

ES既是搜索引擎又是数据库?真的有那么全能吗?
ES 既是搜索引擎又是数据库?真的有那么全能吗?

本文介绍如何正确的拥抱Elasticsearch。

阿里巴巴复杂搜索系统的可靠性优化之路
阿里巴巴复杂搜索系统的可靠性优化之路

本文介绍了闲鱼搜索引擎系统的稳定性保障方案是如何设计的。

纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?
纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?

在这篇文章中,我们将深入剖析向量数据库核心技术的争议点,解释其优势和局限性,为读者提供全面而清晰的了解。

6 月《中国数据库行业分析报告》已发布,首发空间、搜索引擎数据库【全球产业图谱】

本月墨天轮发布的《中国数据库行业分析报告》聚焦两类新型数据库,从产品特性、发展历程/趋势与产业图谱带你详尽了解空间数据库&搜索数据库!欢迎查看本文精彩概览!

数据库
国产数据库
空间数据库
搜索引擎数据库
四年又四年,苹果搜索引擎要“胎死腹中”?
四年又四年,苹果搜索引擎要“胎死腹中”?

苹果做搜索引擎,一波三折。

几张图带你看懂今日头条推荐系统
几张图带你看懂今日头条推荐系统

本文将用几张图,来带你看懂今日头条的推荐系统。

天猫 11.11:搜索引擎实时秒级更新

搜索是很多用户在天猫购物时的第一入口,搜索结果会根据销量、库存、人气对商品进行排序,而商品的显示顺序往往会决定用户的选择,所以保证搜索结果的实时性和准确性非常重要。在电商系统中,特别是在“双十一”这样的高并发场景下,如何准确展示搜索结果显得尤为重要。在今年的“双十一”活动中,InfoQ有幸采访到了阿里巴巴集团搜索引擎的三位负责人仁基、桂南和悾傅,与他们共同探讨了搜索引擎背后的细节。以下内容根据本次采访整理而成。

分布式数据库,NOSQL,搜索引擎
分布式数据库,NOSQL,搜索引擎

CAP原理

极客大学架构师训练营
使用矢量数据库打造全新的搜索引擎
使用矢量数据库打造全新的搜索引擎

在技术层面上,矢量数据库采用了一种名为“矢量索引”的技术,这是一种组织和搜索矢量数据的方法,可以快速找到相似矢量。其中关键的一环是“距离函数”的概念,它可以衡量两个矢量的相似程度。

数据库
搜索引擎
矢量
矢量索引
软件工程师需要了解的搜索引擎知识

Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。Max认为,除了搜索引擎自身的搜索问题解决、人类使用方式等之外,也需要解决索引、分词、权限控制、国际化等等的技术点,看了他的文章,勾起了我多年前的想法。 很多年前,我曾经想过自己实现一个搜索引擎,作为自己的研究生论文课题,后来琢磨半天没有想出新的技术突破点(相较于已发表的文章),所以切换到了大数据相关的技术点。当时没有写出来,心中有点小遗憾,毕竟凭借搜索引擎崛起的谷歌是我内心渴望的公司。今天我就想结合自己的一些积累,聊聊作为一名软件工程师,您需要了解的搜索引擎知识。

比Bing更早将LLM集成到搜索引擎中,这家由谷歌前高管创立的公司为什么还是失败了?
比 Bing 更早将 LLM 集成到搜索引擎中,这家由谷歌前高管创立的公司为什么还是失败了?

Neeva 更快、更简单且无广告。但做出比谷歌更好的东西,却并不足以击败谷歌。

与被捧上天的AI相比,元数据可能更重要
与被捧上天的 AI 相比,元数据可能更重要

在网络搜索领域,元数据或将逐步取代 AI。

数据中台之结构化大数据存储设计
数据中台之结构化大数据存储设计

本文介绍阿里云Tablestore选择哪种设计理念来更好的满足数据系统中对结构化数据存储的需求。

Magi搜索引擎红了:我们只是需要一个比百度更好的引擎
Magi 搜索引擎红了:我们只是需要一个比百度更好的引擎

大家期望出现一个更好的搜索引擎,AI时代的引擎。

百度万亿量级数据库 Tera 架构应用、设计与实践全攻略

信息技术发展突飞猛进,网络数据呈现爆炸之势,搜索引擎的实时性面临巨大挑战。百度搜索引擎每天处理着数万亿次的链接分析和数百亿次的互联网资源采集。作为百度搜索引擎的核心数据库Tera,是如何支撑万亿量级的实时数据处理呢?

在搜索引擎广告关键词生成上,算法可以做什么?
在搜索引擎广告关键词生成上,算法可以做什么?

本文介绍如何利用算法改进搜索引擎广告关键词的生成。

Uber数据可视化实践
Uber 数据可视化实践

随着 Uber 的扩张,我们的系统在技术上变得越来越复杂,数据系统的广度也成倍增长。

数据搜索引擎专题_资料-InfoQ中文网