写点什么

十大最热门的大数据技术

  • 2016-03-18
  • 本文字数:707 字

    阅读完需:约 2 分钟

随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值?

根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术:

  1. 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险;
  2. NoSQL 数据库:非关系型数据库包括 Key-value 型(Redis)数据库、文档型(MonogoDB)数据库、图型(Neo4j)数据库;
  3. 搜索和知识发现:支持信息的自动抽取,可以从多数据源洞察结构化数据和非结构化数据;
  4. 流式分析:软件可以对多个高吞吐量的数据源进行实时的清洗、聚合和分析;
  5. 内存数据结构:通过动态随机内存访问(DRAM)、Flash 和 SSD 等分布式存储系统提供海量数据的低延时访问和处理;
  6. 分布式存储系统:分布式存储是指存储节点大于一个、数据保存多副本以及高性能的计算网络;
  7. 数据可视化:数据可视化技术是指对各类型数据源(包括 Hadoop 上的海量数据以及实时和接近实时的分布式数据)进行显示;
  8. 数据整合:通过亚马逊弹性 MR(EMR)、Hive、Pig、Spark、MapReduce、Couchbase、Hadoop 和 MongoDB 等软件进行业务数据整合;
  9. 数据预处理:数据整合是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析;
  10. 数据校验:对分布式存储系统和数据库上的海量、高频率数据集进行数据校验,去除非法数据,补全缺失。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2016-03-18 19:0013054
用户头像

发布了 43 篇内容, 共 31.5 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

除了deadline,我们还能用什么驱动开发?

思码逸研发效能

程序员 DevOps 软件开发 编码 IT 运维

TikTok养号推荐:海外独享原生IP

Ogcloud

TikTok tiktok运营 海外原生IP TikTok养号 tiktok矩阵

谈JVM xmx, xms等内存相关参数合理性设置

京东科技开发者

Rust 与生成式 AI:从语言选择到开发工具的演进

亚马逊云科技 (Amazon Web Services)

机器学习 深度学习 rust 生成式人工智能

开源大模型的私有部署:Llama与千问的比较研究

测吧(北京)科技有限公司

测试

智能体Agent应用的前沿:图文、短视频与流程图的生成技术

测吧(北京)科技有限公司

测试

大模型在商业领域的应用:如何提升决策效率与用户体验

测吧(北京)科技有限公司

测试

【免费可视化仪表盘】轻松实现静态/动态数据可视化图表—积木仪表盘

JEECG低代码

数据分析 数据可视化 BI 报表 数据仪表盘

浅谈kafka

京东科技开发者

OASA 年中研讨会成功举办,新增 8 家厂商加入联盟,推进 3 个合作方向

OpenAnolis小助手

安全 操作系统 龙蜥社区 龙蜥社区安全联盟 OASA

知识图谱融入向量数据库,带来RAG效果飞升

Zilliz

知识图谱 向量数据库 LLMs rag

制造已然走出国门,数据如何走向全球?

奇点云

人工智能 AI 互联网 软件 制造业

SD-WAN帮助跨国企业实现网络加速

Ogcloud

网络加速 SD-WAN SD-WAN组网 SDWAN SD-WAN国际专线

《Programming from the Ground Up》阅读笔记:p217-p238

codists

汇编 编程人

实现MySQL异地多活场景

NineData

数据一致性 数据同步 异地多活 NineData 单元节点

深度学习在视觉识别中的突破:从理论到实践

测吧(北京)科技有限公司

测试

联手豆包大模型,容联七陌打造更懂客户的智能客服

新消费日报

SIGGRAPH Asia 2024 | 网易伏羲研究成果入选,3D面部动画技术再获新突破

网易伏羲

论文 网易伏羲

AIGC技术的变革:语音识别与视觉识别的深度融合

测吧(北京)科技有限公司

测试

检索增强生成(RAG)技术在知识图谱中的应用:Neo4j的探索

测吧(北京)科技有限公司

测试

2024年第3届海南跨博会及低空经济产业博览会

秋硕展览

2025包装展-2025年广州国际包装供应链博览会

秋硕展览

文生图与文生视频:从文本到视觉的创作革命

测吧(北京)科技有限公司

测试

智能合约与大语言模型的结合:未来的应用场景探索

测吧(北京)科技有限公司

测试

【论文速读】|用于安全代码评估的大语言模型:一项多语言实证研究

云起无垠

全局视角看技术-Java多线程演进史

京东科技开发者

安全基础设施如何形成统一生态标准?OASA 硬件安全合作计划启动 | 2024 龙蜥大会

OpenAnolis小助手

安全 操作系统 龙蜥社区 龙蜥操作系统大会 龙蜥社区安全联盟

国内外大模型应用的现状与未来:以ChatGPT、Mixtral和Llama为例

测吧(北京)科技有限公司

测试

AI时代,2024火山引擎飞连新品发布会盛大开启

新消费日报

十大最热门的大数据技术_大数据_侠天_InfoQ精选文章