把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

十大最热门的大数据技术

  • 2016-03-18
  • 本文字数:707 字

    阅读完需:约 2 分钟

随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值?

根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术:

  1. 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险;
  2. NoSQL 数据库:非关系型数据库包括 Key-value 型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库;
  3. 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据;
  4. 流式分析:软件可以对多个高吞吐量的数据源进行实时的清洗、聚合和分析;
  5. 内存数据结构:通过动态随机内存访问(DRAM)、Flash 和 SSD 等分布式存储系统提供海量数据的低延时访问和处理;
  6. 分布式存储系统:分布式存储是指存储节点大于一个、数据保存多副本以及高性能的计算网络;
  7. 数据可视化:数据可视化技术是指对各类型数据源(包括 Hadoop 上的海量数据以及实时和接近实时的分布式数据)进行显示;
  8. 数据整合:通过亚马逊弹性 MR(EMR)、Hive、Pig、Spark、MapReduce、Couchbase、Hadoop 和 MongoDB 等软件进行业务数据整合;
  9. 数据预处理:数据整合是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析;
  10. 数据校验:对分布式存储系统和数据库上的海量、高频率数据集进行数据校验,去除非法数据,补全缺失。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2016-03-18 19:0013030
用户头像

发布了 43 篇内容, 共 31.3 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

基于Netty的自研流系统缓存实现挑战: 内存碎片与OOM困境

AutoMQ

Java 云原生 Netty AutoMQ

淘宝商品详情API接口:实时追踪商品库存情况,优化供应链管理

技术冰糖葫芦

API Explorer API 调试 API 文档

Java ZGC 深度剖析及其在构建低延迟流系统中的实践心得

AutoMQ

Java 云计算 AutoMQ

AutoMQ vs Kafka: 来自小红书的独立深度评测与对比

AutoMQ

Java kafka 云原生 小红书 AutoMQ

5 分钟读懂API技术架构

幂简集成

API API架构

软件测试学习笔记丨Allure2报告中添加附件-图片

测试人

软件测试

行业智能化,让千行万业在珠峰相见

白洞计划

AI

「布道师系列文章」宝兰德徐清康解析 Kafka 和 AutoMQ 的监控

AutoMQ

云计算 kafka Java’ AutoMQ

AutoMQ 生态集成 Kafdrop-ui

AutoMQ

Java kafka 云原生 AutoMQ kafdrop

文献解读-基准与方法研究-第十六期|《GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试》

INSVAST

基因数据分析 生信服务

YAML 简介:易懂的配置语言

Liam

程序员 前端 后端 yaml

Nginx性能调优5招35式不可不知的策略实战

不在线第一只蜗牛

nginx 性能优化 运维

AutoMQ 与蚂蚁数科达成战略合作

AutoMQ

Java kafka 云原生 AutoMQ 蚂蚁数科

电竞玩家的云端盛宴!四大云电脑平台:ToDesk、顺网云、青椒云、极云普惠实测大比拼

小喵子

云电脑 ToDesk ToDesk云电脑

AutoMQ 产品动态 | 发布 1.1.0,兼容至 Apache Kafka 3.7,支持 Kaf

AutoMQ

Java 云计算 kafka AutoMQ

十大最热门的大数据技术_大数据_侠天_InfoQ精选文章