阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

多模块进行时: 同时使用 RedisGraph 和 RediSearch 模块

  • 2020-03-01
  • 本文字数:2713 字

    阅读完需:约 9 分钟

多模块进行时:同时使用 RedisGraph 和 RediSearch 模块

在 2019 年的 RedisConf 会议上,我演示了一个在 RedisGraph 节点上进行全文 RediSearch 的解决方案。当时讲的有点模糊,但现在,我意识到我们应该解释一下我们是如何做到这一点并发布源代码。



在这个演示中我展示了一个小界面,它支持搜索动物并通过生物分类系统(界、门、类、目等)查看它们之间的关系。全文部分基于维基百科的第一段英文。例如,搜索“宠物猫”和“蓝鲸”,会发现他们都是哺乳动物,而如果搜索“宠物猫”和“雪豹”,则会发现他们都属于同一个科:猫科。


这个演示项目出乎意料地简单,但我应该指出 RediSearch 和 RedisGraph 之间的集成仍处于早期阶段,在编写本文时还没有准备好应用于生产环境。所以,我建议您在了解 RediSearch 和 RedisGraph 的集成将在未来几个月逐渐成熟的前提下,确定此方法是否能够满足您的需求。


让我们再讨论一下如何从源码构建。要完成的第一件事是基于代码库中正确的分支构建 RediSearch 和 RedisGraph。RediSearch 使用的是当前的主分支,而 RedisGraph 是 redisconf 分支。如果您想根据自己的需要构建解决方案,可以从源代码构建这两个模块。RedisGraph 和 RediSearch 的网站上都有关于如何构建的详细说明,这并不困难,只是需要一点时间。


配置模块的位置在 redis.conf 文件中,为了确保在 RediSearch 之前加载 RedisGraph,需要在 redis.conf 文件的模块部分将 RediSearch 的 loadmodule 配置项放在 RedisGraph 的 loadmodule 配置项之前。在完成编辑 redis.conf 之后,需要重启 Redis 服务器让配置生效。


在之前演示的 demo 中,我使用 RedisGraph-bulk-loader 脚本将以下内容从 CSV 加载到 RedisGraph,从而包括了我们收集的数据集。这个数据集只包括哺乳动物,因为其他动物的数据质量较低(非哺乳动物物种很少有好的维基百科描述)。


下面是加载数据的例子:


$ cd redisgraph-bulk-loader/$ python3 bulk_insert.py MAMMALS -q -n /path/to/demo/dataload/Class.csv -n/path/to/demo/dataload/Family.csv -n /path/to/demo/dataload/Genus.csv -n/path/to/demo/dataload/Order.csv -n /path/to/demo/dataload/Species.csv -r/path/to/demo/dataload/IN_CLASS.csv -r /path/to/demo/dataload/IN_FAMILY.csv -r/path/to/demo/dataload/IN_GENUS.csv -r /path/to/demo/dataload/IN_ORDER.csv -ayourpassword1 nodes created with label 'Class'157 nodes created with label 'Family'1272 nodes created with label 'Genus'29 nodes created with label 'Order'5616 nodes created with label 'Species'29 relations created for type 'IN_CLASS'1272 relations created for type 'IN_FAMILY'5616 relations created for type 'IN_GENUS'157 relations created for type 'IN_ORDER'Construction of graph 'MAMMALS' complete: 7075 nodes created, 7074 relationscreated in 0.443749 seconds$ redis-cli -a yourpassword GRAPH.QUERY MAMMALS "CALLdb.idx.fulltext.createNodeIndex('Species','description')"Warning: Using a password with '-a' or '-u' option on the command lineinterface may not be safe.1) (empty list or set)2) (empty list or set)3) 1) "Query internal execution time: 324.970000 milliseconds"
复制代码


(gist:https://gist.github.com/stockholmux/0727a4a784a46f8cb9e8329d393a513a)


在这里,key MAMMALS 包含了我们的整个图表。一些重要的注意事项:


•bulk_insert.py 上的-q 开关非常重要,因为它允许在读取 CSV 时进行智能引用。


•调用一次 redis-cli 对所有节点进行批量索引,从而为全文搜索摄取了 7000 多个文档。


现在让我们启动并运行一个 UI。和几乎所有 Node.js 应用程序一样,我们先安装 npm。安装大概需要几秒钟,因为我们不仅要管理 Node 的服务器端文件。还有前端的 Vue.js 组件。如果你最近没有花很多时间在前端 JavaScript 上,那你大概不能使用一个 FTP 和 HTML 文件来实现这些功能。所幸现代前端确实重视工具,所以我们可以安装 VueCLI(我建议遵循 Vue CLI 入门指南)。


在你的前端工具准备好过后,让我们继续来讲 npm 安装和启动运行前端上:


$ npm run build
复制代码


这将创建我们所有前端文件的 dist 目录。现在我们有数据在 Redis 里,我们的前端文件也准备好启动服务,所以我们可以连接 Redis 服务器:


$ node server.js -p 6379 -a yourpassword -hyourhostOrlocalhost
复制代码


让我们先讨论一下关于我们刚刚打开的这个服务器的一些问题。它构建在 Express.js 上,主要使用 WebSocket 进行通信。我还集成了可视化引擎调试工具,它允许您在单独的浏览器窗口中查看正在执行的命令。你可以把浏览器指向地址:http://localhost:4444


总之,相对于它所实现的功能来说,它非常的简短——只有 75 行代码。我们的解决方案不需要那么长,因为我们实际上所做的就是接受 WebSocket 连接,根据传递的消息运行 Redis 命令,然后将这些消息与结果一起传递回来。Redis(Graph)做了所有复杂的工作。让我们看看正在执行的命令。


为了搜索关键字,我们运行这个命令:


> GRAPH.QUERY MAMMALS"CALL db.idx.fulltext.queryNodes('Species','cat house pet')"
复制代码


这很简单。我们的键是哺乳动物,我们使用一个特殊的语法调用了一个特定的函数,它的第一个参数是我们要查找的节点的标签,另一个参数是实际要搜索的字符串。您可以传递有效的 RediSearch 参数进行查询,但请记住,目前这只是全文本搜索,因此不要使用地理空间、标记或数字子句。


一旦我们确定了我们要比较的两种动物,我们就可以使用一个简单的命令进行查询:


GRAPH.QUERY MAMMALS"MATCH (s:Species)-[]->(x)<-[]-(c:Species) WHERE c.fullname =‘Felis catus’ AND s.fullname = ‘Balaenoptera borealis’ RETURN x.name,labels(x) LIMIT 1"

在 server.js 文件中,这些查询被表示为 JavaScript 模板字符串,没有对用户隐藏,用户输入的字符串被直接插入到输入中进行查询。但如果在生产环境中部署类似这样的东西,就需要小心接收和校验用户输入。

如果打算修改前端代码,请确保编辑的是/src 目录,而不是/dist。编辑之后,您需要再次运行 npmrun build 或使用开发服务器(npmrun serve),该服务器自动编译对前端代码的更改,并将其提供给另一个端口。这是一个非常标准的 Vue.js 和 Bootstrap 应用。唯一真正相关的文件是:

/src/App.js, /src/components/panels.vue and /src/components/search.vue.

以上就是一个简单的功能强大的 demo,集成了两个不同的 Redismodule:RediSearch 和 RedisGraph。我鼓励你使用你自己数据集来体验这个 demo。


本文转载自 中间件小哥 公众号。


原文链接:https://mp.weixin.qq.com/s/dbqatouGwg0P_L9_SR5v_Q


2020-03-01 21:42949

评论

发布
暂无评论
发现更多内容

智算中心发展趋势浅析

天翼云开发者社区

云计算 算力 智算中心

a16z:关于 NFT 版税的设计、挑战和新想法

TechubNews

低代码平台技术及其在CRM系统中的应用

不在线第一只蜗牛

低代码 CRM

2024年6月,Altair被Gartner魔力象限评为数据科学与机器学习平台领导者

Altair RapidMiner

人工智能 机器学习 AI 数据分析 数据科学

多模态GPT-V出世!36种场景分析ChatGPT Vision能力,LMM将全面替代语言大模型?

京东科技开发者

ITSM流程落地经验之变更管理

嘉为蓝鲸

ITSM 流程管理 变更

Parallels Toolbox for mac(pd工具箱) 6.0.2激活版

你的猪会飞吗

mac破解软件下载

大模型时代,程序员当下如何应对 AI 的挑战

京东科技开发者

Apache IoTDB 监控详解 | 分布式系统监控基础

Apache IoTDB

Vision Pro国行今日发售   价格PK未来,真爱PK理性

AR玩家

AR AR眼镜 Rokid Vision pro 炬目AR

基础模型应用概述

天翼云开发者社区

人工智能 云计算 大模型 基础模型

DevOps高效研发,支撑百万级车辆的软件交付

嘉为蓝鲸

DevOps 研发效能 汽车产业 汽车行业数字化转型

天翼云弹性高性能计算Portal简介

天翼云开发者社区

云计算 云平台 高性能计算 天翼云

煤都鄂尔多斯的“模”变

脑极体

AI 大模型

重塑客户体验!VoLTE、VoNR引领新时代企业服务变革

中关村科金

人工智能 实时音视频

重磅!UOSDN焕新,开启创新之旅!

统信软件

传统企业可观测建设之路

嘉为蓝鲸

可观测 可观测平台 IT 运维

构建有效的财务规划合作伙伴关系

智达方通

企业管理 全面预算管理 企业绩效管理 财务管理

OpenStack基本介绍

天翼云开发者社区

云计算 OpenStack

etl engine 实现 redis与mysql之间的数据同步

weigeonlyyou

Go MySQL oracle redis ETL

业务合作指南:发挥特性,冲破传统财务禁锢

智达方通

企业管理 合作伙伴 全面预算管理 财务管理

多模块进行时:同时使用 RedisGraph 和 RediSearch 模块_行业深度_翻译自redis.io_InfoQ精选文章