



英雄惜英雄 - 当 Spark 遇上 Zeppelin 之实战案例
我们在之前的文章中提到过《大数据可视化从未如此简单 - Apache Zepplien 全面介绍》一文中介绍了 Zeppelin 的主要功能和特点,并且最后还用一个案例介绍了这个框架的使用。这节课我们用两个直观的小案例来介绍 Zepplin 和 Spark 如何配合使用。

你不可不知的任务调度神器 -AirFlow
Airflow 是一个编排、调度和监控 workflow 的平台,由 Airbnb 开源,现在在 Apache Software Foundation 孵化。AirFlow 将 workflow 编排为 tasks 组成的 DAGs,调度器在一组 workers 上按照指定的依赖关系执行 tasks。

- 664 次围观
- 551 次围观
- 1466 次围观

ClickHouse 在大数据领域企业级应用实践和探索总结
2020 年下半年在 OLAP 领域有一匹黑马以席卷之势进入大数据开发者的领域,它就是 ClickHouse。在 2019 年小编也曾介绍过 ClickHouse,大家可以参考这里进行入门:





金融高频数据管理:DolphinDB 与 pickle 的性能对比测试和分析
本文测试 DolphinDB 和 pickle 在数据读取方面的性能。与使用 pickle 文件存储相比,直接使用 DolphinDB 数据库,数据读取速度可最多可提升 10 倍以上;若为了考虑与现有 Python 系统的集成,使用 DolphinDB 提供的 Python API 读取数据,速度最多有 2~3 倍的提升。










全面解析腾讯会议的视频前处理算法
在视频通话中,视频前处理模块可以有效提升用户参与实时视频时的体验,并保护用户隐私,主要包括虚拟背景、美颜和视频降噪等。腾讯会议在视频前处理场景下,遇到哪些技术难点,如何进行优化?


国内酒店稳定性治理实践之系统间依赖治理
之前介绍了缓存治理的实践,具体参考:国内酒店稳定性治理实践之缓存治理 。在做完缓存治理后,我们并没有止步。我们的应用还依赖了很多外部组件、接口,也同时对外提供了一些接口,所有这些依赖都有出现故障的可能,而且个别场景在故障时影响可能很大。

如何用 typescript 写一个处理 console 的 babel 插件
console 对象对前端工程师来说是必不可少的 api,开发时我们经常通过它来打印一些信息来调试。但生产环境下 console 有时会引起一些问题。

Android 面试总结(一)
上周开始面试,突然决定的,结果很仓促。没想到还剩三周过年的情况下,面试机会很多,就一天接到了 3 个电话面试和一个视频面试。结果都不理想,乘着周末,先好好总结下。把这几天答得不好的问题好好总结下。

Elasticsearch 的基础分布式架构
Elasticsearch 分布式架构,Prime shard 和 Replica shard,内容来自 B 站中华石衫的 Elasticsearch 顶尖高手系列课程核心知识篇;后面还讲了一点蜂窝自习室的体验。

使用 DevSecOps 保护 CI / CD 管道
持续集成和持续交付(CI / CD)可以为软件开发和部署过程提供端到端的无缝集成。 通过这样做,CI / CD 使开发人员可以将更多的时间用于开发代码以改善软件功能,而不必担心部署。























