NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

图数据库在企业的应用:基于图的搜索

  • 2015-11-19
  • 本文字数:1110 字

    阅读完需:约 4 分钟

基于图的搜索是一种新的数据和数字资产管理方法,最初由Facebook 和谷歌所倡导。对于每个查询,基于图的搜索引擎会考虑所有可用的“连通数据(connected data)”的整体结构。由于图系统清楚数据之间的关联关系,所以能够返回更丰富、更准确的结果。近日,Neo4j 首席科学家& 高级工程师 Jim Webber&Ian Robinson 探讨了图数据库在企业搜索中的应用。

作为一项前沿技术,基于图的搜索面临许多挑战,以下是其中部分最大的挑战:

  • 数字资产元数据的规模和连通性:元数据越丰富,连通性越高,数字资产的可用性就越好。但元数据越多,数字资产的管理和搜索也越复杂。
  • 实时查询的性能:对于基于图的搜索应用而言,其强大之处在于实时查询和检索数据。然而,实时遍历如此复杂且高连通性的数据是个巨大的挑战。
  • 不断增加的数据节点数量:数字资产及其元数据的规模增长迅速,搜索应用需要能够适应当前及未来的需求。

与传统的、基于关键词的搜索不同,基于图的搜索更智能,允许用户提出更准确、更有用的问题,并返回更重要、更有意义的信息。借助基于图的搜索,用户可以实时查询所有连通数据,并根据返回结果中的信息发起新的实时搜索。图数据库使基于图的搜索成为可能,这主要是因为:

  • 图数据库提供了支持数据自然结构的模型和查询语言,使企业可以在数据生成时准确地将其结构化,并基于它们固有的结构进行查询;
  • 图数据库中的所有内容都具有丰富的元数据,使用户可以实时地快速搜索和发现;
  • 图数据库的内置模型非常灵活,使数据架构师和开发人员可以轻松修改数据及其结构。

与关系型数据库相比,图模型更容易扩展,而且在操作连通数据时速度要快超过 1000 倍。起初,Facebook 和谷歌都提供了基于“关键词”的搜索。用户输入一个词或短语,然后得到一个包含关键词的结果列表。通常,用户需要反复定义搜索关键词,才能找到正确的结果。在认识到了关键词搜索的局限性之后,谷歌于 2012 年推出了“知识图”,而Facebook 随后于2013 年推出了“图搜索”服务。两者均在搜索中向用户提供了更多的上下文信息。紧跟这些巨头的步伐,一些新兴的初创公司(如 Glowbl )也创建了基于图的搜索工具。

谷歌、Facebook、 adidas 等公司的实践表明,对于拥有大量产品、内容或数字资产的企业,基于图的搜索是一种更好的、向用户提供数据的方法。基于图的搜索可以提供巨大的竞争优势,包括更好的客户体验、更有针对性的内容、更多的创收机会。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-11-19 18:002845
用户头像

发布了 1008 篇内容, 共 374.7 次阅读, 收获喜欢 341 次。

关注

评论

发布
暂无评论
发现更多内容

SparK 用稀疏掩码为卷积设计 Bert 预训练

Zilliz

计算机视觉

单线程架构的Redis如此之快的 4 个原因

JAVA旭阳

redis 缓存

泰山众筹sun4.0矩阵合约系统开发搭建

开发微hkkf5566

RocketMQ Streams拓扑构建与数据处理过程

Apache RocketMQ

RocketMQ 消息列队

浪潮云:以数据云IBP释放数据要素力量

浪潮云

云计算 数据云

全球化安全生产 & 质量保障体系建设探索

阿里技术

质量保障 安全生产 全球化技术能力

NFTScan 正式上线 Fantom 网络 NFTScan 浏览器和 NFT API 数据服务

NFT Research

NFT 数据基础设施

实战分享 | 金融数据采集报送平台实践

葡萄城技术团队

基于GIS+WebGL智慧消防3D可视化云控系统

2D3D前端可视化开发

智慧消防 消防物联网云平台 消防三维可视化 智慧消防系统 消防云控平台

新年新气象,老兵开新坑

致知Fighting

Java Go 服务器

如何通过jstat命令进行查看堆内存使用情况

华为云开发者联盟

后端 开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

MySQL中的distinct和group by哪个效率更高?

Steven

如何用Apipost校验响应结果

爱研究代码的极客人

APi设计 JSON Schema apipost

简单概述Serverless

天翼云开发者社区

OpenHarmony标准系统内核学习【2】CPU轻量级隔离特性

离北况归

OpenHarmony

10大知识管理软件厂商有对比

PingCode

项目管理 知识管理软件

单线程 Redis 如此之快的 4 个原因

C++后台开发

redis 中间件 后端开发 单线程 C++开发

全景剖析阿里云容器网络数据链路(三):Terway ENIIP

阿里巴巴云原生

阿里云 云原生 云原生容器

聊聊Docker镜像

天翼云开发者社区

Docker 镜像

行云洞见|为何行业权威都预测“云原生IDE 将成为常态”?

行云创新

ide 云原生 云端IDE Cloud IDE TitanIDE

谈谈我工作中的23个设计模式

阿里巴巴中间件

阿里云 云原生

9种跨域方式实现原理

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

理论+实践,教你如何使用Nginx实现限流

华为云开发者联盟

后端 开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

线上网络丢包引起的接口响应时间过慢,快速排查案例

KINDLING

Java 运维 网络 丢包 eBPF&Linux

使用Jira盗版会存在的6大风险

PingCode

项目管理 软件开发 软件管理

LeaRun快速开发平台:自由搭建个性化门户

力软低代码开发平台

一文教你如何重新认识用户

蔡农曰

互联网 产品经理 消费者 需求设计

易观千帆 | 12月用户体验GX评测:国有行及股份行持续领跑,农信社用户体验关注提升

易观分析

金融 手机银行

如何让OpenHarmony编译速度“狂飙”

离北况归

OpenHarmony

工业生产环境下,时序数据库 TDengine 如何打造全面有效的数字化监控?

TDengine

数据库 tdengine 时序数据库

APISIX Ingress 如何使用 Cert Manager 管理证书

API7.ai 技术团队

证书 api 网关 APISIX Ingress Controller

图数据库在企业的应用:基于图的搜索_数据库_谢丽_InfoQ精选文章