写点什么

data

收录了 data 频道下的 50 篇内容

Blaze Data Services 还是 LiveCycle Data Services?

Ryan Knight撰写的这篇文章对两个类似的产品(Adobe的LiveCycle Data Services和开源的Blaze Data Services)进行了比较。该比较有助于用户了解这两个产品之间的差异以在特定的情况下选择合适的产品。

Dojo Data Store——统一数据访问接口

Dojo 定义了一套API用于统一数据访问,并且提供了针对不同数据源的多种实现,统称Dojo Data Store。作为一种异步的Data Store,尤其适合于Web应用,为实现数据层与表现层的分离提供稳定的基础架构。Dojo中几乎所有的控件都以此为基础,因此,要能熟练使用各种控件,或是开发自定义控件,都需要对这个机制有深入的了解。

Data Mesh的原则和逻辑架构
Data Mesh 的原则和逻辑架构

我们渴望通过数据来增强和改善商业和生活的各个方面,这驱使我们在大规模管理数据方面进行范式转变。

Data Mesh,数据架构的下一个变革!
Data Mesh,数据架构的下一个变革!

Data Mesh 的潜力既令人兴奋又令人生畏,就像从前的微服务架构一样。

使用 Amazon Kinesis Data Firehose 和 Amazon EMR 中的 Apache Spark 优化流式数据处理
使用 Amazon Kinesis Data Firehose 和 Amazon EMR 中的 Apache Spark 优化流式数据处理

对于大多数公司而言,处理不断增加的数据量并整合新数据源充满挑战。

文章:Blaze Data Services 还是 LiveCycle Data Services?

本文作者Ryan Knight对Adobe的LiveCycle Data Services和开源的Blaze Data Services进行了详尽而又细致的分析与比较,从而帮助用户从中选择适合自己项目的产品。直接点击阅读完整文章

使用 AWS Data Exchange 和 Amazon SageMaker 构建机器学习工作流
使用 AWS Data Exchange 和 Amazon SageMaker 构建机器学习工作流

得益于诸如 Amazon SageMaker 和 AWS Data Exchange 等云服务,现在实施机器学习 (ML) 比以往更加容易。

Spring Data —— 完全统一的 API?

Tobias Trelle 对Spring Data项目做了一个介绍,那是一个高级别的SpringSource项目,旨在统一包括数据库系统和NoSQL数据存储在内不同持久化存储的访问方式

实现标记自动化:将海量元数据引入 Data Catalog
实现标记自动化:将海量元数据引入 Data Catalog

让您能够通过交互式接口摄取和编辑业务元数据。它包括可用于实现常见任务自动化的编程接口。定义和采集一组元数据,因此,我们将在这里提供一些关于如何从长期角度声明、创建和维护这类元数据的最佳实践。

小米在Open Data Catalog For AI的实践
小米在 Open Data Catalog For AI 的实践

如何使用 Gravitino 和 Fileset 来管理 AI 数据资产?

数据流动方式迭代:Netflix Studio的Data Mesh实践
数据流动方式迭代:Netflix Studio 的 Data Mesh 实践

在过去的几年里,Netflix Studio经历了几次数据移动方式的迭代。

微软推出Microsoft.Data.SqlClient,替代System.Data.SqlClient
微软推出 Microsoft.Data.SqlClient,替代 System.Data.SqlClient

微软继续努力将微软产品从.NET Core中分离出来,并将SQL Server驱动程序分离到了一个单独的部署流中。

Dynamo Data Transform开源:从手动走向自动化
Dynamo Data Transform 开源:从手动走向自动化

简化基于DynamoDB的系统的数据转换。

AWS Data Exchange
AWS Data Exchange

我们生活在一个数据驱动的数据密集世界!

LinkedIn Derived Data Platform
LinkedIn Derived Data Platform

本次分享介绍Linkedin derived data platform以及其如何帮助Linkedin更好的管理机器学习的结果数据集。

Spring Data Neo4j 简介

Neo4j是一款非常流行的开源图型NoSQL数据库。它完全支持ACID数据库事务属性,由于其良好的图数据模型设计,Neo4j的速度非常快。对于连接的数据操作,Neo4j的速度要比传统的关系型数据库快1000倍。Spring Data是Spring的一个核心项目,其下涵盖了如Spring Data JPA、Spring Data MongoDB、Spring Data Redis、Spring for Hadoop等子项目,而Spring Data Neo4j也是Spring Data下的一个重要子项目,它提供了高级的特性以将注解的实体类映射到Neo4j图型数据库上。其模板编程模型类似于我们熟知的Spring模板,为与图的交互提供了基础,此外也用于高级的仓库支持。该项目旨在为NoSQL数据库操作提供便捷的支持。

Data Link:jQuery 的数据绑定插件

作为微软贡献的jQuery程序库之一,Data Link让双向数据绑定成为可能。尽管目的相同,Data Link的实现和WPF或者Silverlight则是完全不同的。

使用适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK 自动执行模型重新训练和部署
使用适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK 自动执行模型重新训练和部署

随着机器学习 (ML) 在公司核心业务中占据的份量越来越重,缩短从模型创建到部署的时间就变得越来越重要。

Netflix Data Benchmark:云数据存储基准测试

Netflix 已经拥有了超过 83000000 名遍布全球的会员,他们使用着数千个多样的微服务。这些服务由多个团队分别负责,每个服务有自己的构建和发布周期,服务产生的复杂多样的数据被存储在不同类型的数据存储系统中。云数据工程团队负责管理数据存储系统,他们通过运行基准测试来验证这些系统的更新、进行容量规划,还会在不同的失败场景下和多种工作负载下测试我们的云实例。我们希望有这样一个工具,它可以评估和比较在市场上或开源领域出现的新的数据存储系统的性能特征和缺陷,可以预估它们是否可以用在相关的产品中。有了以上需求,创作了 Netflix Data Benchmark,一个用于各种数据存储系统的可插拔云端基准测试工具。NDBench 为我们使用的各种主要的数据存储系统提供了插件支持,包括 Cassandra、Dynomite和 Elasticsearch。它也可以被扩展连接其他客户端的 API。

data专题_资料-InfoQ中文网