写点什么

十大最热门的大数据技术

  • 2016-03-18
  • 本文字数:707 字

    阅读完需:约 2 分钟

随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值?

根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术:

  1. 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险;
  2. NoSQL 数据库:非关系型数据库包括 Key-value 型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库;
  3. 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据;
  4. 流式分析:软件可以对多个高吞吐量的数据源进行实时的清洗、聚合和分析;
  5. 内存数据结构:通过动态随机内存访问(DRAM)、Flash 和 SSD 等分布式存储系统提供海量数据的低延时访问和处理;
  6. 分布式存储系统:分布式存储是指存储节点大于一个、数据保存多副本以及高性能的计算网络;
  7. 数据可视化:数据可视化技术是指对各类型数据源(包括 Hadoop 上的海量数据以及实时和接近实时的分布式数据)进行显示;
  8. 数据整合:通过亚马逊弹性 MR(EMR)、Hive、Pig、Spark、MapReduce、Couchbase、Hadoop 和 MongoDB 等软件进行业务数据整合;
  9. 数据预处理:数据整合是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析;
  10. 数据校验:对分布式存储系统和数据库上的海量、高频率数据集进行数据校验,去除非法数据,补全缺失。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2016-03-18 19:0013021
用户头像

发布了 43 篇内容, 共 31.2 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

kubelet 的主动驱逐POD

Geek_f24c45

Kubernetes kubelet

error: ‘slots_reference’ was not declared in this scope

Ayosh

OpenCV

Apache APISIX 结合 Authing 实现集中式身份认证管理

API7.ai 技术团队

api 网关 Apache APISIX Authing 身份验证

AWS 上传的 S3 文件重新载入的时候简体中文显示乱码

HoneyMoose

【LeetCode】 替换所有的问号Java题解

Albert

算法 LeetCode 1月月更

一篇从购买服务器到部署博客代码的详细教程

冴羽

nginx 前端 后端 博客 博客搭建

数据分析人员需要掌握SQL到什么程度?3个常考题目刷一刷

博文视点Broadview

Spring Boot工程中如何优雅地处理异常

sean77

spring 整洁代码

Java Jackson 中的 mapper

HoneyMoose

Java Jackson 中的 JsonNode 和 ObjectNode

HoneyMoose

面试突击13:方法优先调用可选参数还是固定参数?

王磊

java面试 2022

盘点 2021| 不忘初心,未来之路,与君共勉

法医

前端 盘点 2021

服务发现与配置管理高可用最佳实践

阿里巴巴云原生

阿里云 微服务 高可用 云原生 MSE

《LeetCode刷题》数组与队列

IT蜗壳-Tango

IT蜗壳教学 1月月更

一个cpp协程库的前世今生(十一)等待与返回值

SkyFire

c++ cocpp

设计模式【8】-- 手工耿教我写装饰器模式

秦怀杂货店

Java 设计模式 装饰器

ReactNative进阶(四):ReactNative 原理剖析之JS 层渲染 diff 算法

No Silver Bullet

React Native 渲染性能 1月月更

Kafka往事——揭露Kafka推出Kafka Streams背后原因

Kafka中文社区

Kubernetes生态,从繁荣走向碎片化

巨子嘉

容器 云原生

明道云虹桥演示中心,欢迎进店!

明道云

阿里云万郁香:多样付费选择构筑成本最优的弹性体验

阿里云弹性计算

阿里云 年度峰会 付费方式

一键抠除路人甲,昇腾CANN带你识破神秘的“AI消除术”

华为云开发者联盟

CANN 昇腾 图像消除 智能实例分割 CRA算法

杜甫草堂

wood

300天创作

工作中遇到的50个JavaScript的基础知识点

Sunshine_Lin

面试 前端 进阶 基础

【LeetCode】奇偶树Java题解

Albert

算法 LeetCode 1月月更

倒计时1天 | 超百位技术大咖齐聚开发者大会,与全球开发者一起“数聚未来”

OceanBase 数据库

OceanBase 开源 开发者大会

使用LNMP环境部署码云测试项目

咿呀呀

lnmp

关于ant design pro的权限方案设计

袋鼠云数栈

大数据

开源实践 | 携程在 OceanBase 的探索与实践

OceanBase 数据库

OceanBase 开源 客户案例 携程

netty系列之:真正的平等–UDT中的Rendezvous

程序那些事

Java Netty 程序那些事 1月月更

教你实现一个 iOS 重签名工具

37手游iOS技术运营团队

ios xcode

十大最热门的大数据技术_大数据_侠天_InfoQ精选文章