写点什么

William McKnight 关于数据平台和创建现代数据架构的见解

  • 2018-10-28
  • 本文字数:999 字

    阅读完需:约 3 分钟

在上周举行的数据架构 2018 年峰会上,William McKnight 就使用不同的数据平台创建现代数据架构做了主旨演讲

他以讨论组织的数据成熟度和业务成功之间的高度相关性开始了他的演讲。组织的数据架构越成熟,业务就越成功。成熟度较低的组织往往会把数据分散于不同的信息孤岛中。他分享了一些来自 2018 年“互联网分钟(Internet Minute)”中所发生的事情的统计数据,在互联网上每分钟发送 1 亿 8700 万封电子邮件和 1800 万条短信,进行 370 万次搜索查询等等。

人工智能(AI)是一股颠覆性的力量,而数据则是这场革命的基石。行业中出现了新的数据集:生物数据(Bio Data)。如果将生物数据和环境数据(如位置等)结合在一起,那么你将拥有进行数据分析的所有信息。

他谈到了数据培养和像数据仓库(data warehouse)和数据湖(Data Lake)这样的解决方案如何帮助完成数据工作。数据架构师也需要在 HDFS 和云存储之间做出选择。HDFS 具有更好的查询性能,而云存储的扩展性、持久性和可用性更好,并且成本更低。

通过比较关系数据库和 nosql 数据库的数据大小和工作负载复杂性,McKnight 讨论了即可使用的大数据平台的选择。

另外,他也谈到了 NewSQL 数据库,该数据库可扩展、兼容 ACID 并支持分片。这些数据库正被用于资本市场数据输入、金融交易、电信记录流和欺诈检测。

数据库的云部署提供了一些好处,包括按需和自助服务数据管理、广泛的网络访问、资源汇集、快速弹性和可测量的服务。

传统的 ETL 技术不足以用于企业范围内运行的数据平台。有各种各样的数据源,并且数据是实时流式传输的。数据架构应该考虑这些需求的流处理

企业数据虚拟化提供了对所有结构化和半结构化数据持续及时的访问,这些数据来自组织内不同的数据源,如数据仓库、市场、多维数据集、操作数据存储(operational data stores,简称 ODS)、事务源和文件系统。

他建议,数据专业人员在这次数据架构转型旅程中进行他们的挑战,应该做好进行长期战役的准备,可能会失败几次才能最终获得成功。将您的数据体系结构工作与应用程序预算和路线图项目结合起来,以便在数据架构实施方面取得进展。

McKnight 对其演讲进行了总结,建议数据专业人员在需要高性能的数据管理解决方案的地方考虑使用内存数据库,并考虑未来使用 GPU 数据库和混合数据库。

阅读英文原文: William McKnight on Data Platforms and Creating a Modern Data Architecture

感谢冬雨对本文的审校。

2018-10-28 04:081295
用户头像

发布了 199 篇内容, 共 88.6 次阅读, 收获喜欢 295 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

智源研究院与浪潮信息、北京开源芯片研究院达成战略合作,共筑多元AI芯片开源生态

智源研究院

手把手教你如何用华为云Flexus X实例部署之前爆火的“人生重启“游戏

轶天下事

Flexus云服务器X,云上性能新飞跃,开启业务增长新纪元

轶天下事

Flexus云服务器X实例赋能,用Python将微信公众号秒变智能聊天机器人

轶天下事

如何找到可靠的海外云服务器租用商

Ogcloud

云服务器 香港云服务器 美国云服务器 海外云服务器 云服务器租用

出海电商如何解决网络问题

Ogcloud

SD-WAN 跨境电商网络 外贸网络 SD-WAN国际专线 国际网络专线

低代码平台有哪些,以及低代码平台哪家强?

优秀

低代码 低代码开发平台 低代码平台 java低代码开发平台

向量更新的3种方式

DashVector

人工智能 数据库 大模型

探索Flink动态CEP:杭州银行的实战案例

Apache Flink

大数据 flink 数据分析 CEP 实时处理

火山引擎边缘云全面升级智能边缘,推动 AI 应用场景拓展与技术创新

火山引擎边缘云

火山引擎 AI 大底座 大模型、 边缘智能

华为云Flexus X实例Redis性能加速评测及对比

轶天下事

基于华为云Flexus云服务器X实例部搭建Halo博客平台

轶天下事

华为云Flexus X实例云服务器部署即时通讯IM项目

轶天下事

华为云Flexus X实例使用教学——完整的配置选择与实操步骤讲解

轶天下事

轻至986g,续航18小时、120TOPS算力!ThinkPad X1 Carbon Aura AI元启版刷新商务AI PC巅峰体验

科技范儿

Gate.io 平台通证 GT:持续赋能与销毁、财富效应显著

股市老人

核心大应用发布效率提升70%,宿主机容器先缩后扩模型分享

Qunar技术沙龙

后端

部署有声读物和播客的自托管媒体服务器Audiobookshelf

轶天下事

向量检索的3种方式

DashVector

人工智能 数据库 向量检索 大模型

华为云Flexus X实例docker部署Jitsi构建属于自己的音视频会议系统

轶天下事

基于Flexus X加速MySQL镜像搭建XXL-JOB任务调度平台

轶天下事

智源研究院与安谋科技达成战略合作,共建开源AI“芯”生态

智源研究院

Altair RapidMiner 解锁更高级别的功能,支持用户无缝构建和部署高级 AI agent

Altair RapidMiner

机器学习 #人工智能 altair #数据分析 RapidMiner

优化大宽表查询性能,揭秘GaussDB(DWS) 谓词列analyze

华为云开发者联盟

GaussDB #数据库 analyze

如何使用华为云Flexus X实例搭建私人博客:从配置到发布全指南

轶天下事

Redis-十大数据类型

不在线第一只蜗牛

数据库 redis 缓存

华为云Flexus云服务器X实例之openEuler系统下部署GitLab服务器

轶天下事

指标管理+AI大模型深度融合,开启智能数据分析管理新时代

袋鼠云数栈

William McKnight关于数据平台和创建现代数据架构的见解_服务革新_Srini Penchikala_InfoQ精选文章