NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

十大最热门的大数据技术

  • 2016-03-18
  • 本文字数:707 字

    阅读完需:约 2 分钟

随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值?

根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术:

  1. 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险;
  2. NoSQL 数据库:非关系型数据库包括 Key-value 型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库;
  3. 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据;
  4. 流式分析:软件可以对多个高吞吐量的数据源进行实时的清洗、聚合和分析;
  5. 内存数据结构:通过动态随机内存访问(DRAM)、Flash 和 SSD 等分布式存储系统提供海量数据的低延时访问和处理;
  6. 分布式存储系统:分布式存储是指存储节点大于一个、数据保存多副本以及高性能的计算网络;
  7. 数据可视化:数据可视化技术是指对各类型数据源(包括 Hadoop 上的海量数据以及实时和接近实时的分布式数据)进行显示;
  8. 数据整合:通过亚马逊弹性 MR(EMR)、Hive、Pig、Spark、MapReduce、Couchbase、Hadoop 和 MongoDB 等软件进行业务数据整合;
  9. 数据预处理:数据整合是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析;
  10. 数据校验:对分布式存储系统和数据库上的海量、高频率数据集进行数据校验,去除非法数据,补全缺失。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2016-03-18 19:0012466
用户头像

发布了 43 篇内容, 共 27.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

从零开始的 dbt 入门教程 (dbt core 开发进阶篇)

不在线第一只蜗牛

软件开发 项目开发 dbt

极速提升软件测试效率:揭秘Web自动化三大等待技巧

测试人

软件测试 自动化测试 测试开发

跨界协作:借助gRPC实现Python数据分析能力的共享

不在线第一只蜗牛

Python gRPC RPC

扫码即可快速协作:草料二维码底部协作面板功能详解

草料二维码

适合tiktok运营的云手机需要满足什么条件?

Ogcloud

云手机 海外云手机 tiktok云手机 Tik Tok

Web自动化三种等待方式,一篇文章教会你

霍格沃兹测试开发学社

运维工作新时代:自主编码实现运维自动化的转型之旅

京东零售技术

运维 自动化运维

淘宝商品详情API接口封装和解析

tbapi

淘宝商品详情数据接口 淘宝商品详情解析

编写高效的代码,你应该了解Array、Memory、ReadOnlySequence

EquatorCoco

编程语言 代码 编程技巧

鸿蒙5.0发布时间已定!移动开发加速器如何寻得?

Geek_2305a8

下一代Edge AI的应用初探

这我可不懂

人工智能 AI

一条龙服务利润新“玩”法

IoTOS

物联网 IoT eSIM安全 java 技术提升

小程序技术实践:如何快速开发适配鸿蒙的App

Geek_2305a8

服务运行时动态挂载JavaAgent和插件——Sermant热插拔能力解析

华为云开源

开源 微服务治理 字节码增强

为什么老有人想让我们“程序员”失业?

互联网工科生

程序员 开发工具

多线程系列(一) -线程技术入门知识讲解

快乐非自愿限量之名

Java 多线程 编程开发

项目开发常用的技术栈有哪些?

这我可不懂

软件开发 低代码 前端框架

揭开华为云ADN提高网络质量的秘密

华为云开发者联盟

开发 网络 华为云 华为云开发者联盟 华为云DTSE

PolarDB-X的XPlan索引选择

阿里云数据库开源

数据库 阿里云 索引 polarDB PolarDB-X

探索AI视频生成新纪元:文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来

汀丶人工智能

大模型 Pika sora 文生视频 Runway

RRAM机制、材料及其在神经形态计算中的应用

申公豹

存内计算

re:invent 2023 Amazon Q 初体验

亚马逊云科技 (Amazon Web Services)

re:Invent 亚马逊云科技 Amazon Q

聊聊几个最热门的前端框架

伤感汤姆布利柏

低代码,提高软件开发效率,协同办公更高效

高端章鱼哥

低代码

如何正确编写代码注释:简易指南

Liam

程序员 前端 后端 代码 代码注释

十大最热门的大数据技术_大数据_侠天_InfoQ精选文章