HANA 为大数据应用做好准备

阅读数:1450 2013 年 11 月 12 日

话题:DevOps大数据语言 & 开发架构AI

HANA 是 SAP 发布的一套与数据源无关的、软硬件结合的、基于内存计算的平台,在最近的年度开发者技术会议上,SAP 公司详细公布了其在 HANA 数据平台编程方面取得的显著进步。HANA 已经为大数据应用开发做好准备。

在会上,开发者关系负责人 Thomas Grassl 表示最近在加利福尼亚州举办的 Code Jam 编程大赛中,已经看到各种各样不同水平的程序员开始尝试基于 SAP HANA 的应用程序和代码库。Grassl 说:“SAP HANA 为开发人员提供了新的机遇,从而改变了我们对大数据应用的设计、构建和使用的方式。”

SAP 公司揭示了它们的编程计划为“实时企业应用程序”主要基于三个关键的要素:

SAP Fiori 应用在视觉上吸引人、直观并且拥有智能的用户体验,简化了 SAP HANA 基础设施的云部署选项,还有 SAP HANA 在 service pack 7(SP7)中提供的强大的新功能。SAP Fiori 是公司提供的用户体验产品。它是一个应用程序的集合,支持最广泛和最常用的 SAP 软件功能,并且其作为一个技术层,作用在类似于 ERP、CRM、采购与供应链管理(SCM)以及人才管理等机制 (能被 HANA 平台本身所支持的机制) 之上。

基于 SAP Fiori 的成功以及旺盛的市场需求,SAP 现在正开始着手于用户体验(UX)设计服务来帮助开发者充分利用“设计思维(Design thinking)”这种方式编程。这种服务将促使专业设计师团队与用户并肩协作,并与真实终端的用户在协作模型下合作,开发出跨越任何应用程序或解决方案的引人注目的用户体验。

Grassl 解释说整套“数据开发者工具”现在正因为一个直接的任务联系在一起,即让实时企业应用能够被 River 定义语言(RDL)所驱动。RDL 是一种可执行的规范语言,并允许许多开发团队协作并细化应用程序要做什么(有什么功能),然而却可以不必知道这些应用程序的需求是怎样实现。就 SAP 而言,在 HANA 基础之上的所有的一切将不影响应用程序的表现和健壮性。

开发者通过访问 SAP HANA 智能数据,可以从 Hadoop 获取集成数据,并通过合成数据构建实时应用程序。除此之外,通过和 HANA SP7 一起可用的 River 定义语言,开发者可以很轻松的了解 SAP HANA 并直接对其进行开发。

SAP HANA 平台及应用程序副总裁 Jacob Klein 解释说:“据我们所了解,在 River 定义语言中最关键的要素是可读性以及简单的语言结构,从而能容易实现更高层次的概念。其声明的性质有助于开发者将注意力集中到捕捉应用程序的功能,而不是它的执行机制。从概念上讲,它类似于标准的 SQL 的思路,只是适用于更广泛和更复杂的领域中。”

该公司的技术发言人 Vishal Sikka 博士指出,SAP 的技术现在实现了其所谓的“前所未有的能力”,即在多达 10000 个 CPU 核心上实时的计算原本无法想象的任务。

随着 SAP HANA 的 SP7 的推出,开放应用程序的开发体验将会更加广泛并且可能变得与语言类型无关。

开发者应该能够利用核心数据服务(CDS)并且通过预先打包好的数据质量库来促成代码重用和快速开发。

此外,SAP HANA 智能数据访问技术已经通过写入能力而得到了增强,并且数据已经被扩展到包括如 Oracle 和微软 SQL Server 等数据源的支持。

智能数据的访问也通过 Hortonworks 提供了与 Hadoop 更加紧密的结合。为了进一步扩展数据利用的范围,SAP 还增加了一项新的能力,即创建自定义文本分析字典来以商业应用程序需要的方式处理非结构化数据。

通过 SAP HANA SP7,SAP 计划继续增加新的功能来支持高可用性 / 灾难恢复(HA/DR)的功能部署,例如用于回放的快照和日志,还有为复杂的多主机体系和延伸集群配置准备的级联系统副本。新的统一化的安装 / 补丁工具和经过增强的操作监督机制也将继续简化管理体验。

对于 SAP 公司来说,还有一个好消息,那就是即将正式发布的 RHEL 6.5 将通过实现通用 SAP 部署的最优配置的自动化来简化“关键任务 SAP 应用程序”的操作。

红帽已经公开地发布了 Red Hat Enterprise Linux 6.5(RHEL)的 beta 发行版,这次对“Red Hat Enterprise Linux 6.5”内核的修改,提高了红帽在操作管理水平上的可扩展性。

在大型系统的内核转储文件现在可以扩展到多 TB 的数据级别,并且一种新的压缩算法(LZO)能够加快创建转储文件的速度,这直接缩短了在崩溃转储过程中的停机时间,同时实现了更快的排除故障的功能。性能工具跟踪能力的提升和测试命令还提供了额外的基础设施事件的监测能力。

网络增强功能包括:通过检查 Internet 组管理协议(IGMP)的数据来列出路由端口和活跃用户组,进而实现对组播业务更好的分析。

Beta 版本的红帽企业版 6.5 增强了存储特性,这使得它具有了更高的稳定性、高效性和易用性。

在 iSCSI 和光纤通道存储区域网络(SAN)的环境下,企业级的存储用户将受益于改进的控制和恢复功能。多路径 IO 的性能和高可用性功能可以对更广泛的设备适用,同时,多路径自动命名功能的增强提供了更短、更方便的设备名称。

红帽企业 Linux6.5 的 beta 版本还支持英特尔的 NVM Express 的驱动程序,它访问基于 PCI Express 总线的固态硬盘的行业标准规范。此外,基于 FUSE 文件系统,如 GlusterFS,现在也可以使用异步 IO 来提高性能。

另外,红帽 guests 账户的最大内存已增至 4TB,这一特性允许 guests 在虚拟 CUP 上运行大规模的工作负载和动态的热加载功能,进而使得安装 guests 来计算资源这一过程自动、简单,同时减少停机时间。

要想了解更多大数据方面的新闻和文章,读者朋友可以关注 InfoQ 中文站的“大数据”专题。