【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

如何离线分析 Kafka 海量业务消息?

  • 2019-10-23
  • 本文字数:1014 字

    阅读完需:约 3 分钟

如何离线分析Kafka海量业务消息?

场景介绍

说起 Kafka,许多使用者对它是又爱又恨。Kafka 是一种分布式的、基于发布/订阅的消息系统,其极致体验让人欲罢不能,但操心的运维、复杂的安全策略、可靠性易用性的缺失等,仍需要使用者付出诸多的背后工作。即使你是 Kafka 老手,也难免会有上述同样的烦恼。


与其整日操心 Kafka 的部署,不如试试云上 Kafka 带给你的惊喜?目前国内主流的云服务厂商均提供了云上的 Kafka 服务,为应用系统提供异步的消息队列服务。通过高可用的消息缓冲队列,实现应用解耦、突发流量处理及与第三方的互通和集成,具有大规模、高可靠、高并发访问、可扩展且完全托管的特点。比如华为云分布式消息服务 DMS,帮助云端的应用程序组件去耦合,具有很高的成本效益。DMS 拥抱开源,提供支持兼容开源 Kafka 接口,用户可无缝迁移,按需使用。


分布式消息服务(Data Message Service,简称 DMS)Kafka 专享版支持采集增量的交易消息数据并上传到华为云对象存储服务(Object Storage Service,简称 OBS),通过实时流计算框架(例如 Flick)或者华为云实时流计算服务(Cloud Stream Service, 简称 CS)分析上传的交易数据,能够分析出最近交易指标等信息,以支持用户交易做决策。

申请环境与资源

1.开启转储


在更多列中点击开启转储即可开启消息转储功能

2.创建转储任务

等待开启转储任务完成后,即可以添加转储任务进行转储,点击实例链接进入实例管理里有转储管理页签,通过点击创建转储任务即可创建消息转储任务进行消息的转储,如下:



点击后,会弹出创建转储任务的详情:



需要填入打星号的必填参数。这里主要关注要填入的参数 Topics,即需要转储的 Topic 名称,支持多个 Topic 的输入或者正则表示的方式去订阅 Topic 消息,并把消息内容上传到 OBS 桶中。点击转储地址行中的选择按钮,弹出选择数据转储地址,会列出那些 OBS 桶可以被转储。



需要一提的是,如果没有 OBS 桶,则需要创建一个 OBS 桶用来存放 DIS 转储的数据。

3.查看转储任务

创建转储任务后,可以在转储管理页中看到这个任务信息,点击查看转储信息,可以实时查看转储 Topic 的消息转储进度。


查看 OBS 信息与分析数据

登录华为云 OBS 可以查看到转储地址桶的中存在分区的文件,已经按照转储时设定的时间格式上传到 dms-obs 桶中。



可以使用 Flink 等实时数据对上传目录的文件内容进行分析,得到分析后汇总结果展示即可。


本文转载自公众号中间件小哥(ID:huawei_kevin)。


原文链接:


https://mp.weixin.qq.com/s/nf_TAA6wTCUAuIQmZdow2w


2019-10-23 18:04843

评论

发布
暂无评论
发现更多内容

用低代码开发平台构建高效敏捷工作流

力软低代码开发平台

Windows上值得推荐的6款冷门软件

这我可不懂

工具 windows 高效率

使用 RKE 方式搭建 K8s 集群并部署 NebulaGraph

NebulaGraph

k8s

Zebec Protocol ,不止于 Web3 世界的 “Paypal”

股市老人

AREX 如何支持 Dubbo 自定义私有协议的录制回放

AREX 中文社区

dubbo 自动化测试 流量回放 流量录制

JMeter源码解析之结果收集器

优测云服务平台

Jmeter 性能测试 压力测试 #性能测试

适合自己企业的erp系统怎么选?这8条关键因素缺一不可!

优秀

ERP系统

数据分析管理:Splunk Enterprise苹果Mac版安装详解

晴雯哥

中国电信与国家信息中心共同发布国信政务云

天翼云开发者社区

云计算 政务云

那些 MySQL 8.0 中的隐藏特性

爱可生开源社区

MySQL 8.0

不容错过的MSBuild技巧,必备用法详解和实践指南

这我可不懂

自动化构建工具 MSBuild Visual Studio

基于PINN的传播动力学研究

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

企业选择大文件传输软件的真正原因

镭速

大文件传输软件

斩获可信云最佳实践,天翼云存储资源盘活系统助力“一云多芯”!

天翼云开发者社区

云计算 存储

Llama2 评测大公开!知识库场景下能否赶超 ChatGPT?

Zilliz

Zilliz Towhee ChatGPT llama llama2

吴声年度演讲,关于Notion 的“模版”和 CLG |highlight

B Impact

拓展知识 启望未来 | 记内蒙古移动《AntDB ACA初级认证培训》活动

亚信AntDB数据库

数据库 AntDB AntDB数据库

NFTScan | 07.31~08.06 NFT 市场热点汇总

NFT Research

NFT\

erp系统都有哪几家,如何选择适合自己企业的erp系统?

优秀

ERP系统

为什么要选择文件传输软件?有哪些最佳高速文件传输软件?

镭速

文件传输软件

EndNote 21 for Mac(文献管理软件) v21.0.1激活版

mac

苹果mac Windows软件 EndNoter 参考文献管理软件

拨开迷雾:利用全链路消息跟踪揭示系统奥秘

鲸品堂

数据库 分布式 全链路 企业号 8 月 PK 榜

中小企业都用哪些工具进行项目管理?

PingCode

项目管理 PingCode 项目管理软件

使用appuploader工具流程(Windows版本)

大文件传输软件| 生命科学中的关键因素

镭速

大文件传输快速

10. 数据类型 - 元组详解

茶桁

Python 数据类型 tuple

一文读懂快速开发平台

互联网工科生

低代码 开发平台 JNPF

HTML5 Canvas 和 SVG哪个简单好用

2D3D前端可视化开发

html5 SVG 数据可视化 canvas 前端设计

三言两语说透webpack对vue的编译

互联网工科生

源码 Vue webpack

AI融入管理软件,是否会是下一个“ERP时代”的前奏?

B Impact

Zebec Protocol ,不止于 Web3 世界的 “Paypal”

大瞿科技

如何离线分析Kafka海量业务消息?_文化 & 方法_中间件小伟_InfoQ精选文章