• 技术大会
  • 极客时间
  • 极客大学
  • 团队学习
  • 高端会员
  • 研究报告
  • 案例研习社
logo
  • 首页
  • 直播
  • 专题
  • 电子书
  • 话题
  • 免费视频
  • 技术博客

 成为作者
登录/注册
  • 架构
  • 前端
  • 编程语言
  • 云计算
  • AI
  • 开源
  • 技术管理
  • 运维
  • 区块链
  • 新基建
  • 云原生
  • 产品
  • 热点推荐
  • Google Cloud
用户头像

数据社

2018 年 04 月 26 日加入
微信公众号:数据社
专注大数据架构,数据仓库,MPP数据库分享,微信公众号数据社
 关注
  • 19

    发布数

  • 86

    关注者

  • 116

    关注了

  • 发布
  • 评论
  • 划线
  • 收藏
  • 关注
  • 全部分类 
浅谈程序员的“内卷化”
浅谈程序员的“内卷化”

用户头像
数据社

11 月 12 日

最近开始了解到一个很有意思的词——“内卷化”,如果你还不知道这个词,那就非常建议往下看。

基于Ambari的大数据平台搭建
基于 Ambari 的大数据平台搭建

用户头像
数据社

8 月 20 日

同 CDH 部署类似,步骤分为 ambari 的部署和 hdp 的部署,先以 1 台为例 (内存>6G,磁盘划分 / 至少 40G,/data/10G),后续节点可以通过扩容方式加入集群,可参考:https://blog.csdn.net/qq_32593713/article/details/81429573

推荐一款可视化+NoteBook工具
推荐一款可视化 +NoteBook 工具

用户头像
数据社

8 月 17 日

大数据平台搭建好后,我们要做的就是探索数据,探索数据就需要查询,做可视化,那么一款好用自助查询可视化工具,你值得拥有!

Kafka 实战宝典:一文带解决 Kafka 常见故障处理

用户头像
数据社

8 月 12 日

Kafka 的 bin 目录下 shell 脚本是 kafka 自带的管理工具,提供 topic 的创建 / 删除 / 配置修改、消费者的监控、分区重载、集群健康监控、收发端 TPS 压测、跨机房同步等能力,Kafka 运维者可以使用这些工具进行集群的管理。

Kafka 实战宝典:如何跨机房传输数据

用户头像
数据社

8 月 12 日

工作中遇到 Kafka 跨机房传输到远程机房的场景,之前的方案是使用 Flume 消费后转发到目标 kafka,当 topic 增多并且数据量变大后,维护性较差且 Flume 较耗费资源。

CDH部署指南
CDH 部署指南

用户头像
数据社

8 月 11 日

Apache Hadoop 存在版本管理混乱、部署过程繁琐、升级过程复杂、兼容性差、安全性低等问题,CDH 是 Hadoop 商业发行版之一,本文介绍基于 Cloudera Manager 的 Cloudera  Hadoop 6.1.0 大数据平台搭建,简单易上手 

数据中台建设方法论

用户头像
数据社

8 月 11 日

数据中台建设方针:横向规划,各个击破。

聊聊数据库

用户头像
数据社

8 月 11 日

数据库的发展基本上也是伴随着计算机技术经历了 40 年的历史,从最初的文件系统上的文件,到有结构的层次和网状数据库,一直到今天被广泛使用的关系型数据库。随着互联网和物联网行业的兴起,数据量飞速增长,对大数据的采集、存储和应用是每个数据库必备的技能

一文了解 greenplum

用户头像
数据社

8 月 11 日

​GP 的那些事

数据库的那些事
数据库的那些事

用户头像
数据社

8 月 11 日

对于很多程序员来说,公司选择什么样的数据库,基本不需要你来决定。当你加入一个公司的时候,公司的大部分技术选型已经确认,特别是数据库选型,因为数据库一旦选择,后期迁移的代价还是很大的。

从 0 到 1 搭建大数据平台之计算存储系统

用户头像
数据社

8 月 4 日

前面已经给大家讲了《从 0 到 1 搭建大数据平台之数据采集系统》、《从 0 到 1 搭建大数据平台之调度系统》,今天给大家讲一下大数据平台计算存储系统。大数据计算平台目前主要都是围绕着 hadoop 生态发展的,运用 HDFS 作为数据存储,计算框架分为批处理、流处理。

从 0 到 1 搭建大数据平台之调度系统

用户头像
数据社

8 月 4 日

目前大数据平台经常会用来跑一些批任务,跑批处理当然就离不开定时任务。比如定时抽取业务数据库的数据,定时跑 hive/spark 任务,定时推送日报、月报指标数据。任务调度系统已经俨然成为了大数据处理平台不可或缺的一部分。

个人成就
  • 发布了 19 篇内容

    共 50675字, 被阅读 3163次

  • 获得了 23 次赞同

    获得了 10次喜欢, 获得了 13 次收藏

  • 参与了 15 次互动

    互动包含发布评论、点赞评论、参与投票等

TA 关注的
频道
  • 机器学习
  • 数据库
  • 方法论
  • 大数据
标签
  • 大数据
最新评论
  • 数据社等待编辑转发朋友圈哦,^_^

     数据库的那些事

  • InfoQ写作平台文章被推荐,请添加封面图~

     CDH 部署指南

  • InfoQ写作平台文章被推荐,请添加封面图~

     数据库的那些事

  • 虚拟世界的懒猫可以

     数据分析师应该了解的数据湖

  • logo

    促进软件开发及相关领域知识与创新的传播

    活动大本营
    • 更多精彩活动持续更新
  • InfoQ
    关于我们
    我要投稿
    合作伙伴
    加入我们
    关注我们
  • 联系我们
    内容投稿:editors@geekbang.com
    业务合作:hezuo@geekbang.com
    反馈投诉:feedback@geekbang.com
    加入我们:zhaopin@geekbang.com
    联系电话:010-64738142
    地址:北京市朝阳区叶青大厦北园
  • InfoQ 近期会议
    会议图片全球架构师峰会 09月11-12日
    会议图片全球人工智能与机器学习技术大会 09月24-25日
    会议图片全球软件开发大会 10月15-17日
    会议图片全球大前端技术大会 11月24-25日
  • 全球 InfoQ
    会议图片InfoQ En
    会议图片InfoQ Jp
    会议图片InfoQ Fr
    会议图片InfoQ Br
Copyright © 2020, Geekbang Technology Ltd. All rights reserved. 极客邦控股(北京)有限公司 | 京 ICP 备 16027448 号 - 5京公网安备京公网安备 11010502039052号
数据社