【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

【QCon 上海 2015】数据分析与移动开发工具专场重点回顾

  • 2015-10-20
  • 本文字数:2537 字

    阅读完需:约 8 分钟

QCon 上海 2015全球软件开发大会已经圆满结束了。15 日上午的Solution Track 专场以“数据分析与移动开发工具”为主题,干货连连不虚此行。参加技术分享的厂商有:TalkingData SDK、IBM、汽车之家、明略数据、容联云通讯、亲加通讯云等等。具体内容一起来看!

高性能数据分析平台架构实践

大数据时代来临,传统关系型数据库一直是业界的主流解决方案,但是最近这些年互联网发展非常快,数据量也是爆炸式的增长,优化传统型的数据库很难满足大数据的需求的。因此一个非关系性数据库NoSQL 的全新解决方案就出来了。IBM 资深售前工程师孔皓介绍说,这种解决方案的特点一是存储模式灵活简单,不需要一些表的结构和存储模式。二是它面对大数据的需求性能可以有扩展,为新的数据扩张节约了一些成本,而且架构也非常的灵活,对于主流的大数据引擎支持性能也很好。

SepuqiaDB 目前用的是传统的一些典型的 MPP 大规模的混合型架构,应用节点负责分布式系统的任务分发,进行数据的存储和操作。节点上可以做一个动态的扩容。文档内容可以存储结构化、非结构化和半结构化的数据,而且可以统一存储。对于上层的一些大数据架构也非常好,有一些组建,可以直接连接过来进行查询和计算以及存储数据。

在 SepuqiaDB 这样的高性能数据分析平台架构上,还涉及到一些硬件层面的考虑——Power Linux 服务器。Power Linux 是基于 Power 架构的 Linux 服务器。其技术特色首先是一个 CP 并发多线程技术。线程有一些等待和考虑的时候,它同步的这个技术同意另外一个线程调动指令里面的单元,在此基础上,最新一代数据芯片 Power 8 做的是 8 线程,当它单个 CPU 支持 12 核的时候单核可以做到 96 线程的海量资源。

在实际应用中,SepuqiaDB+PowerLinux 的架构给客户实现了 50 个物理节点,用了 1PB 的空间,存了用户 15 年的历史数据。这样的一个系统能让用户最后得以很方便通过移动端、网页端查询一些交易地址。

Hadoop安全体系以及IT**** 系统风险的解决方案

作为一个 IT 系统来说,面对的风险分为外部风险和内部风险,外部风险是指恶意用户的入侵,但是对于大平台来说,外部风险不是那么的严峻。可是内部风险确实是 Hadoop 面临的一个很大的问题,这不仅仅是 Hadoop 的平台,所有其他的 IT 系统都有这样的风险。

明略数据 BDP 产品经理杨威在演讲中就说到,站在数据安全的角度来说,缺乏 Hadoop 平台的数据是有很多隐患的,这里面有四点,第一就是它的 Simple 的身份验证机制,这是一个非常天真的验证机制,会造成非常严重的后果。另外文件默认情况下是基于本地 Linux 的用户组信息的。第三就是这个平台上的数据很多时候大家都是没有做授权访问控制的,或是没有做这种相对细粒度的访问控制,因此用户可以通过一些不经授权的手段获取一些数据。最后一点也是最关键的,即使我们前面做了这些授权认证等等,而 Hadoop 本身是一个开源的软件,它低层文件的格式都是公开的,如果被偷走了就很容易获得内部信息。

Simple 身份验证机制一是认为所有的系统内的节点都是可信赖的,二是在文件系统的权限上缺乏有权限的控制,这两点都是造成信息泄露的主要诱因。

解决安全问题可以考虑以下几个方案:

  1. 身份系统授权访问
  2. 服务的授权访问
  3. 文件的授权访问
  4. 开放数据的访问
  5. 行为的审计
  6. 数据加密
  7. 传输加密
  8. 安全通讯加密
  9. REST 加密与认证

社交大数据挑战实践

环信大数据技术总监、首席科学家黄智的演讲内容包括四部分:第一是系统功能和逻辑架构的介绍。第二是环信的大数据社交模型,从技术和实践角度讲解社交大数据模型能给用户带来什么样的价值。第三是性能和扩展性的分析。第四是分享一些比较重要的坑点和难点,以及解决方案。

环信系统首先是基于云计算的社交大数据分析工具,工具本身就是一个中性的、没有用户许可不会接触一些数据的工具,在用户的许可下用户可以使用这套工具,提供一些分析功能。

环信提供一些功能来帮助实现一些模式,面临的下一个技术挑战就是要支持过亿的数据分析,也要做深度的趋势挖掘。这意味着系统要从性能和功能两方面同时满足要求,达到这种目的这个系统要有一个比较完美的水平扩展性。环信的时时响应速度达到秒级,我们有一个快速的准确度,我们的用户有不同的需求,这个系统要求我们同时满足不同的需求,在分析的基础上,用户还可以做一些采取的决策行动,比如发起一个警报,触发业务系统的其他响应,在这些指标分析的基础上,我们可以定制不同的机器学习算法,利用已经计算的学习指标和用户提供的相关数据,我们可以建立相关模型进行预测和预警。

环信大数据分析系统架构从下到上可以分成四个层次:数据、分析、基层、决策。分析的数据都存在数据库里面,使用 Cassandra 和 MySCL,上面是分析层,使用的是数据分析计算和 Spark 计算平台。分析层之上是集成层,这个就像一个黏合剂把各个组成部分粘结在一起。根据建模的规则计算各种类型的社交指标,任务调度根据分析任务和执行逻辑的优先秩序和依赖关系完成这个结果。

Java Instrumentation**** 技术实践应用性能监测

听云研发副总裁、架构师 廖雄杰分享的主体是 Java Instrumentation 的技术实践的性能监测,也就是如何用这个 Java Instrumentation 的技术来为应用做检测。

应用系统中常见的一些组件包括:RDB、NoSQL(Redis、Memcached、MongoDB)、API/RPC、云服务和 MQ。使用这么多的组件,一旦系统出现问题,就会出现页面打不开。所以对于这么多的组件,还是要一个监控手段的。

传统的监控手段已经落后了,下一代监控技术就是 APM(Application as Monitoring),这个东西就是一个深入应用代码的性能监控。这个自动化 APM 监控,只有在必要的位置嵌入监控代码——数据库、NoSQL、HTTP、MQ 和可能存在性能瓶颈的业务代码。

讲到监控的原理,肯定会有人认为嵌入代码是在增加原代码的负荷,性能肯定有一点损失,如何使这个性能不受这个监控代码影响太多。理论来说,嵌码的时候会嵌入几个最不容易影响性能的标准位置,比如说标准组建,NOSQL、HTTP、CPI,当然也可能通过其他手段来调动,这些才能减少对性能瓶颈的影响。

本次 QCon 上海 2015 大会“数据分析与移动开发工具”专场的分享内容主要是围绕分析系统和开发工具的技术讨论,涉及到了目前开发市场上的最新趋势和方向,Q&A 环节讲师为在场的参会者们答疑解惑,实现了 QCon 大会的办会主旨。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-10-20 04:111380
用户头像

发布了 164 篇内容, 共 73.0 次阅读, 收获喜欢 198 次。

关注

评论

发布
暂无评论
发现更多内容

GitHub险崩盘,竟是因网易大牛「Redis应用与深度实践笔记」泄露

做梦都在改BUG

Java 数据库 redis 缓存 面试

通过TiDB Operator为已有TiDB集群部署异构集群

TiDB 社区干货传送门

集群管理 管理与运维 故障排查/诊断 安装 & 部署 扩/缩容

GitHub上线重量级分布式事务笔记,再也不怕面试官问分布式了

小小怪下士

Java 程序员 分布式 分布式事务 后端

增强认证--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 增强认证

买了等保安全设备就一定安全吗?就一定能抵御网络风险呢?

行云管家

网络安全 等保 等级保护

【征文大赛】TiDB 社区第二届征文大赛,一次性带走社区全部新周边,还有bose 降噪耳机、倍轻松按摩仪等你拿!

TiDB 社区干货传送门

通过Chaos-Mesh打造更稳定TiDB数据库高可用架构(二)

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 故障排查/诊断 安装 & 部署

AI+人类,实现高效网络安全

HummerCloud

人工智能 网络安全

PCB焊盘设计应掌握哪些要素?

华秋电子

手把手教你改 sysbench 代码

TiDB 社区干货传送门

开发语言 管理与运维

物理机安装 TiKV 时 RAID 卡在线配置方式

TiDB 社区干货传送门

实践案例 集群管理 安装 & 部署

Stable Diffusion原理详解

jarodyv

人工智能 机器学习 计算机视觉 Stable Diffusion 生成式AI

课程作业及比赛任务,已支持 Notebook 内直接提交|ModelWhale 版本更新

ModelWhale

人工智能 机器学习 数据分析 canvas 模型管理

坚如磐石:TiDB 基于时间点的恢复(PiTR)特性优化之路丨6.5 新特性解析

TiDB 社区干货传送门

新版本/特性解读

代码质量与安全 | SAST与DAST有什么区别?

龙智—DevSecOps解决方案

klocwork SAST DAST 静态应用程序安全测试 动态应用程序安全测试

研讨会回顾 | Perforce发布数字资产管理工具Helix DAM,帮助您按时按预算交付虚拟产品

龙智—DevSecOps解决方案

版本控制 数字资产 游戏开发 数字资产管理 芯片研发

国家基础学科公共科学数据中心与和鲸科技共建数据社区

ModelWhale

数据 科学分析 社区 合作

通过Chaos-Mesh打造更稳定TiDB数据库高可用架构(一)

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 扩/缩容 数据库架构设计

Region is unavailable的排查总结

TiDB 社区干货传送门

管理与运维 故障排查/诊断 扩/缩容

详解命令模式本质及其在高复杂调用中的实践案例

阿里技术

设计模式 命令模式

从代理机制到Spring AOP,这篇给你安排得明明白白的

做梦都在改BUG

Java spring aop 代理机制

关于加解密、加签验签的那些事 | 得物技术

得物技术

java

FinOps首次超越安全成为企业头等大事|云计算趋势报告

SEAL安全

云计算 云成本 FinOps 企业号 3 月 PK 榜

基于 Istio 的灰度发布架构方案实践之路

京东科技开发者

微服务 istio 灰度发布 企业号 3 月 PK 榜

软件测试/测试开发丨后端Web开发框架(Java)

测试人

软件测试 springboot 测试开发

TIDB升级发生故障时,快速强行回退方案

TiDB 社区干货传送门

实践案例

对TiDB监控方式的一点点研究

TiDB 社区干货传送门

监控 TiDB 源码解读

TiDB 的事务和一致性校验工具 BANK

TiDB 社区干货传送门

实践案例 故障排查/诊断 数据库架构选型

MQTT 5.0连接属性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 连接属性

Atlassian Server用户新选择 | 云版和本地部署的数据中心版,总有一个适合您

龙智—DevSecOps解决方案

迁移 Server Atlassian

【信创小知识】国产化和信创是一回事吗?怎么理解?

行云管家

信创 国产化

【QCon上海2015】数据分析与移动开发工具专场重点回顾_数据库_Lucien_InfoQ精选文章