写点什么

如何离线分析 Kafka 海量业务消息?

  • 2019-10-23
  • 本文字数:1014 字

    阅读完需:约 3 分钟

如何离线分析Kafka海量业务消息?

场景介绍

说起 Kafka,许多使用者对它是又爱又恨。Kafka 是一种分布式的、基于发布/订阅的消息系统,其极致体验让人欲罢不能,但操心的运维、复杂的安全策略、可靠性易用性的缺失等,仍需要使用者付出诸多的背后工作。即使你是 Kafka 老手,也难免会有上述同样的烦恼。


与其整日操心 Kafka 的部署,不如试试云上 Kafka 带给你的惊喜?目前国内主流的云服务厂商均提供了云上的 Kafka 服务,为应用系统提供异步的消息队列服务。通过高可用的消息缓冲队列,实现应用解耦、突发流量处理及与第三方的互通和集成,具有大规模、高可靠、高并发访问、可扩展且完全托管的特点。比如华为云分布式消息服务 DMS,帮助云端的应用程序组件去耦合,具有很高的成本效益。DMS 拥抱开源,提供支持兼容开源 Kafka 接口,用户可无缝迁移,按需使用。


分布式消息服务(Data Message Service,简称 DMS)Kafka 专享版支持采集增量的交易消息数据并上传到华为云对象存储服务(Object Storage Service,简称 OBS),通过实时流计算框架(例如 Flick)或者华为云实时流计算服务(Cloud Stream Service, 简称 CS)分析上传的交易数据,能够分析出最近交易指标等信息,以支持用户交易做决策。

申请环境与资源

1.开启转储


在更多列中点击开启转储即可开启消息转储功能

2.创建转储任务

等待开启转储任务完成后,即可以添加转储任务进行转储,点击实例链接进入实例管理里有转储管理页签,通过点击创建转储任务即可创建消息转储任务进行消息的转储,如下:



点击后,会弹出创建转储任务的详情:



需要填入打星号的必填参数。这里主要关注要填入的参数 Topics,即需要转储的 Topic 名称,支持多个 Topic 的输入或者正则表示的方式去订阅 Topic 消息,并把消息内容上传到 OBS 桶中。点击转储地址行中的选择按钮,弹出选择数据转储地址,会列出那些 OBS 桶可以被转储。



需要一提的是,如果没有 OBS 桶,则需要创建一个 OBS 桶用来存放 DIS 转储的数据。

3.查看转储任务

创建转储任务后,可以在转储管理页中看到这个任务信息,点击查看转储信息,可以实时查看转储 Topic 的消息转储进度。


查看 OBS 信息与分析数据

登录华为云 OBS 可以查看到转储地址桶的中存在分区的文件,已经按照转储时设定的时间格式上传到 dms-obs 桶中。



可以使用 Flink 等实时数据对上传目录的文件内容进行分析,得到分析后汇总结果展示即可。


本文转载自公众号中间件小哥(ID:huawei_kevin)。


原文链接:


https://mp.weixin.qq.com/s/nf_TAA6wTCUAuIQmZdow2w


2019-10-23 18:04835

评论

发布
暂无评论
发现更多内容

【致地图开发者】地图开放平台假期服务公告

百度开发者中心

百度地图

服务器通用背板管理(UBM)实现

天翼云开发者社区

[ChatGPT 勘误] 关于 CL_WB_PGEDITOR 的用途

Jerry Wang

编程 abap Netweaver 思爱普 三周年连更

详解GaussDB(DWS)的query_band负载识别与应用

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

为什么众多大型国企都在升级企业数智化底座?

用友BIP

技术大会 用友iuap 用友技术大会 升级企业数智化底座 央国企数智化转型

AI+算力,赋予天翼云数字人“最强大脑”!

天翼云开发者社区

轻松比较文件和文件夹:Beyond Compare 4 Mac中文

真大的脸盆

Mac Mac 软件 对比工具 比较文件 对比软件

成功实践丨基于昇腾,安擎助力深圳某法院司法提效

科技热闻

MegEngine 使用小技巧:使用 Optimizer 优化参数

MegEngineBot

神经网络 深度学习 开源框架 MegEngine 参数优化

全国计算机等级二级考试新科目—openGauss数据库程序设计

openGauss

三分钟完成静态网站托管

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜 静态网站托管

惠普聚焦资源再利用、森林保护和碳排放,理念贯穿电脑全生命周期

叶落便知秋

高性能网络SIG月度动态:virtio-net 支持动态中断调节,SMC v2 协议增加新扩展

OpenAnolis小助手

ebpf 高性能网络 龙蜥社区 sig 月度动态

数字先锋| “智慧旅游”新模式,天翼云助力张家界旅游产业创新发展!

天翼云开发者社区

“天翼云出海友好客户启航会”圆满收官!

天翼云开发者社区

【Linux】之【内存】相关的命令&&解析以及内存相关的问题[free、meminfo、内存泄漏、内存溢出、Overcommit]

A-刘晨阳

Linux cpu 三周年连更

如何在 Postman 中进行 HTTPS 请求

Liam

Java 程序员 后端 Postman API 调试

PaddleSeg 2.8版本正式发布啦!

飞桨PaddlePaddle

飞桨

亚信科技AntDB数据库荣膺第十二届数据技术嘉年华(DTC 2023)“最具潜力数据库”大奖

亚信AntDB数据库

AntDB AntDB数据库 企业号 4 月 PK 榜

北京 Meetup 邀你来|云上 StarRocks 极速湖仓

阿里云大数据AI技术

大数据

前端开发会被AI替代吗? | 社区征文

--linshuai

三周年征文

LED显示屏室内改为户外为何不可取?

Dylan

LED显示屏 户外LED显示屏 户内led显示屏

天翼云赋能芦山县医共体建设,为群众铺就便捷顺畅就医路

天翼云开发者社区

MobTech MobPush|不同手机厂商推送问题

MobTech袤博科技

字节跳动的开源历程与价值思考

字节跳动开源

开源 云原生 演讲 字节

【转载】“一中心四辅助” | 亚信安慧产品与解决方案全栈图谱发布

亚信AntDB数据库

AntDB AntDB数据库 企业号 4 月 PK 榜

全栈混合云综合架构方案研究和落地

天翼云开发者社区

宇信科技加入正式openGauss社区

openGauss

原生开发能不能动态化?如何选择动态能力建设流派

没有用户名丶

Fabarta 图增强数据血缘治理解决方案

Fabarta

数据治理 图数据库 图智能 血缘治理

golang-GMP模型

如何离线分析Kafka海量业务消息?_文化 & 方法_中间件小伟_InfoQ精选文章