在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

Neo4j:基于 Java 的 NoSQL 图形数据库

  • 2010-02-28
  • 本文字数:1454 字

    阅读完需:约 5 分钟

在经过几年的开发后,近日 NeoTechnology 发布了基于 Java 的图形数据库 Neo4j 1.0 ,它遵循着属性图形数据模型。InfoQ 有幸采访了NeoTechnology 的COO Peter Neubauer 以深入了解此次发布的 Neo4j 及其向开发者所提供的功能。

Neo4j 的核心 JAR 文件大约有 440k,既有基于 AGPLv3 的开源版本,也有商业版本。如果在闭源软件中使用 Neo4j 则需要商业协议。Neo4j 中的信息主要通过如下 3 个基本的构建块表示:

  • Node (又叫做vertex)——从概念上来说,这类似于对象实例,拥有唯一的 ID。
  • Relationship (又叫做edge)——它连接了两个 Node,此外还有方向和 RelationshipType
  • Property(又叫做attribute)——他们是字符串类型的 key/Object 值对,Node 与 Relationship 都有 Property。

相对于关系数据库来说,图形数据库善于处理大量复杂、互连接、低结构化的数据,这些数据变化迅速,需要频繁的查询——在关系数据库中,这些查询会导致大量的表连接,因此会产生性能上的问题。Neubauer 详细解释了这一点:

Neo4j 重点解决了拥有大量连接的传统 RDBMS 在查询时出现的性能衰退问题。通过围绕图形进行数据建模,Neo4j 会以相同的速度遍历节点与边,其遍历速度与构成图形的数据量没有任何关系。此外,Neo4j 还提供了非常快的图形算法、推荐系统和 OLAP 风格的分析,而这一切在目前的 RDBMS 系统中都是无法实现的。

由于 Neo4j 是个数据库,因此对图形结构的访问——读、写及遍历都是通过 ACID 事务系统进行管理的。图形遍历是通过 Traverser API 进行管理的,此外还借助于 Lucene 提供了对索引的支持,与 Solr 的集成也仍在开发当中。大家可以查看NeoTechnology CEO Emil Eifrem 讲座以深入了解 Neo4j,此外还可以观看对 Peter Neubauer 的采访

在被问到关于 NoSQL 运动的立场时,Neubauer 说到:

当然支持 NoSQL 运动了,因为我们正在解决 RDBMS 目前所没有解决的问题。这就是说,我们首先关注的是数据、深度查询和分析的复杂性以及 RDBMS 中需要很多连接和稀疏表才能完成的操作;此外,很多其他的 NoSQL 项目正在努力解决可伸缩性和分片(sharding)等问题。

Neubauer 说到:虽然 Neo4j 1.0 最近才发布,但在某些领域的产品中已经使用 7 年多了,此次发布的 1.0 版的重点并非代码基的稳定性而是 API 的稳定性。Neo4j 的性能也得到了极大的提升,无须修改代码就能够处理拥有数十亿对象的图形;正常来说,Neo4j 每秒能够读取 200 万个关系,同时最短路径计算的可伸缩性要远远好于关系数据库,如 MySQL 等(虽然使用了相同的性能基准,但众多的因素如硬件和数据集等都会对结果产生比较大的影响)。

除了主要的 Neo4j 代码基以外,还有一个贡献者与用户所构成的社区和一个庞大的生态圈,这里列举出几个:

关于 Neo4j 的未来计划,最近一轮的资金将有助于未来的进一步开发,包括对现有的主/从复制的增强、在线的备份支持以通过最终的一致性和write-master 重选来提供无缝的高可用性、更棒的全局操作支持以及完整的REST 支持(包括基于JavaScript 的动态遍历和用于数据发布的只读模式)等等。长远计划包括对分片(sharding)的支持(这会给Neo4j 代码基带来全新的挑战),Emil Eifrem 还表示用户与开发者所构成的庞大且快速增长的社区(已经创建了数百个Neo4j 项目)是非常重要的。

查看英文原文: Neo4j: Java-based NoSQL Graph Database

2010-02-28 06:0312936
用户头像

发布了 88 篇内容, 共 274.2 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

启信宝《2025全国采购地图》:藏在县城的“隐形冠军”,撑起你的购物车

合合技术团队

人工智能 大数据 算法

SOLID原则在React中的应用实践

qife122

前端架构 React

揭秘专业海外网红营销服务公司的标准化服务流程(SOP)

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

达索系统合作认准思茂信息:全流程服务覆盖哪些场景?

思茂信息

abaqus 达索 达索代理商

StarRocks 性能实测:在 Coffee-shop Benchmark 中快 10 倍!

StarRocks

数据库 数据分析 StarRocks 数据测试 Coffee-shop Benchmark

东软在福州新区布局数据价值化研发中心

先锋IT

【从 0 到 1】AI 应用快速落地的核心 tips

OpenTiny社区

开源 前端 低代码 组件库 OpenTiny

英特尔和生态伙伴联合发布双路冷板式全域液冷服务器

科技经济

突破创意瓶颈:社交媒体营销的“创意流水线”搭建指南

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

数据血缘(上):企业数据管理深陷 “黑盒”?数据血缘是破局关键!

数造万象

人工智能 数据 数据管理 数据血缘 #大数据

零代码|基于扣子(Coze)使用 MemOS 插件

记忆张量MemTensor

大模型 记忆 人工智能、 coze Coze开源

对大模型微调的重新关注

AI数据云Relyt

强化学习 智能体 LLM

区块链 Web3 项目的主要类型

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

用一本小红书,陪你搭建 AI 时代研发效能的脚手架|《研发效能红宝书 2.0》开启下载

思码逸研发效能

人工智能 AI 研发管理 研发效能 智能编程

区块链 Web3 系统的上线

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

ManageEngine卓豪-cmdb是什么意思

ServiceDesk_Plus

CMDB ManageEngine卓豪

英特尔和生态伙伴联合发布双路冷板式全域液冷服务器

极客天地

海外网红推广执行全流程:从策划到落地的完整操作指南

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

海外平台推广案例解密:成功品牌的推广策略剖析

Wolink

跨境电商 海外营销推广 海外社媒推广 品牌出海 海外红人营销

Agent Dart证书验证漏洞深度解析

qife122

网络安全 证书验证

火山引擎多模态数据湖,破解智能驾驶数据处理瓶颈

字节跳动数据平台

基于华为开发者空间Notebook,Tensorflow + Fashion MNIST构建CNN实现智能衣柜服装分类系统

华为云开发者联盟

人工智能 华为 华为开发者空间

使用Playwright MCP实现UI自动化测试:从环境搭建到实战案例

测试人

论文解读-对话中的多模态情感识别综述

合合技术团队

人工智能 大数据 算法

品牌出海渠道矩阵构建:线上线下融合的渠道策略

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

火山引擎Data Agent赋能金融行业,打造智能投顾与精准营销新范式

字节跳动数据平台

Oracle 2025年1月关键补丁更新深度解析

qife122

网络安全 补丁管理

淘宝评论接口深度应用:用用户反馈数据拆解竞品增长密码

Noah

火山引擎多模态数据湖,破解智能驾驶数据处理瓶颈

科技新消息

《浙商》杂志|协作方能共赢,湘湖论剑网易专场对接会描绘AI人机共生新蓝图

网易伏羲

人机协作 网易伏羲 网易灵动 智能货柜 网易有灵智能体

Neo4j:基于Java的NoSQL图形数据库_Java_Michael Hunger_InfoQ精选文章