

 写点什么

structured

收录了 structured 频道下的 50 篇内容

是时候放弃 Spark Streaming，转向 Structured Streaming 了

Spark团队对Spark Streaming的维护将会越来越少

作者 : legendtkl

2019-05-24

18932

专访朱诗雄：Apache Spark 中的全新流式引擎 Structured Streaming

Apache Spark在2016年的时候启动了Structured Streaming项目，一个基于Spark SQL的全新流计算引擎Structured Streaming，让用户像编写批处理程序一样简单地编写高性能的流处理程序。经过一年多的改进和完善，目前Structured Streaming已经在Databricks内部和客户广泛使用，InfoQ采访了Structured Streaming的核心开发朱诗雄来具体了解这个项目。

作者 : Tina

2018-01-31

10756

Spark、Flink、CarbonData 技术实践最佳案例解析

为帮助开发者更深入的了解这三个大数据开源技术及其实际应用场景，9月8日，InfoQ联合华为云举办了一场实时大数据Meetup，集结了来自Databricks、华为及美团点评的大咖级嘉宾前来分享。本文整理了其中的部分精彩内容，同时，作为本次活动的承办方，InfoQ整理上传了所有讲师的演讲PPT，感兴趣的同学可以下载讲师PPT获取完整资料。

作者 : 杨雷

2018-09-19

6971

Delta Lake，让你从复杂的 Lambda 架构中解放出来

Lake（Delta.io）是一个给数据湖提供可靠性的开源存储层软件。在实际生产中的应用与实践以及未来项目规划，本文便整理自此次演讲。

作者 : 李潇

2020-05-26

阿里云储道深度解析存储系统设计——NVMe SSD 性能影响因素一探究竟

NVMe SSD的性能时常捉摸不定，为此我们需要打开SSD的神秘盒子，从各个视角分析SSD性能影响因素，并思考从存储软件的角度如何最优化使用NVMe SSD，推进数据中心闪存化进程。本文从NVMe SSD的性能影响因素进行分析，并给出存储系统设计方面的一些思考。

作者 : 吴忠杰

2018-12-14

1712

使用 Redis 流和 Apache Spark 处理实时数据

将Redis流作为流数据库，Apache Spark作为数据处理引擎，两者怎样共同部署才能做到最佳搭配？

作者 : Roshan Kumar 译者: 王强

2019-05-31

16826

Structured Concurrency for C

今天给大家介绍一个开源组件libdill，用C编写，实现了Structured Concurrency。

实力程序员

2021-07-13

如何基于 Apache Pulsar 和 Spark 进行批流一体的弹性数据处理？

本文介绍了以 Pulsar 做流数据平台，使用 Spark 进行批流一体数据处理的编程实践。

作者 : yjshenAnonymitaet

2019-06-20

4832

使用 OpenCV、Kafka 和 Spark 技术进行视频流分析

在本文中，作者Amit Baghel讨论了在数据科学领域中，视频流数据分析的角色。他还展现了如何基于OpenCV、Kafka和Spark技术实现一个动作感应示例应用场景。

作者 : Amit Baghel 译者: 张卫滨

2017-10-15

6657

字节跳动在 RocksDB 存储引擎上的改进实践

本文介绍字节跳动对 RocksDB 存储引擎的几方面改进。

作者 : 字节跳动技术团队

2020-03-30

1236

解读 2018：13 家开源框架谁能统一流计算？

本文是实时流计算 2018 年终盘点，作者对实时流计算技术的发展现状进行了深入剖析，并对当前大火的各个主流实时流计算框架做了全面、客观的对比，同时对未来流计算可能的发展方向进行预测和展望。

作者 : 时金魁

2018-12-18

7096

明略科技的核心技术：知识图谱的自动构建

知识图谱的构建包括逻辑建模、隐含空间分析、人机交互和本体模型支撑等多种方法。本文将分析各种构建方法的问题和挑战，指出自动构建的要素和应用场景。

作者 : DataFunTalk

2019-12-16

1731

如何整合复杂技术打造数据分析平台？

随着企业安全边界的扩大化模糊化、各类威胁新出速度越来越快、影响越来越广，视企业安全边界为静态、仍然依赖各种特征码技术的传统安全思路早已落后，无法实际解决安全问题。必须通过各种创新，整合大数据、人工智能、可视化等领域的最新技术进展，安全产品才能解决目前和将来的企业安全难题。但如何选择并整合各种技术是复杂系统工程，比常规企业安全软件开发需要考虑更多因素。本次分享中对大数据、人工智能、可视化的最新进展和应用案例做个总结，重点讨论大数据平台云部署运维、交互批处理与实时流处理的关系、有监督学习解决的安全问题和大数据可视化这四个细分领域。

作者 : 万晓川

2017-11-28

4675