云计算大数据时代创业模式新型框架——集中精力做算法及模型

  • 管祥青

2014 年 10 月 20 日

话题:云计算大数据语言 & 开发算法AI

在 2014 年 10 月 16 日阿里云开发者大会上,InfoQ 中文站采访了健康宝首席执行官兼框架师沈英桓及首席市场官、互联网医院事业部总经理叶德佑,双方探讨了在云计算大数据时代做创业的一些思路,其中最重点的一条就是:要充分利用现有的技术,比如说云计算存储平台,自己没有必要再造个同样的轮子,而要有的放矢,其中精力做算法或者业务。

InfoQ:能不能介绍一下贵公司的整体架构?

叶德佑:我们整体包含两个部分:移动互联网医院(面向医院的客户)、移动互联网医生(面向我们的工作,也叫掌上医生);其中移动互联网医院主要的模块有帮助医院的在线挂号、账号查询、查报告单、手机支付,也包含医院的导航、健康咨询、健康的推送、医院专家在线咨询。另外一个模块是移动互联网医生,这个部分可以继续分为 3 个小的模块:掌医院、掌医生、掌健康;他们各有自己的功能,下面我们详细介绍如下: 掌医院:将医院放在整合的平台上面,可以搜索所有的医疗资源,包括医院的介绍、导航,包括所有的医院信息,都集成在掌上医院。 掌医生:通过平台,可以进行疾病搜索,搜索自己需要的药物、按照自己的病症进行搜索、按自己想去的医院进行搜索、按自己所在的位置进行搜索,把各种搜索模式都能集成进去,还能够对医生资源和医疗资源进行搜索,这样可以使每个患者可以找到自己适合的医生,也能通过自己病症,搜索发现自己患什么病,实现智能分诊的效果,找到这个医生之后可以跟医生进行互动,跟医生进行图文交流,通过语音跟他进行交流,而且能够预约医生的电话服务,私人服务,预约医生增加一个号源。 掌健康:这块不是简单的把资讯推送一下,我们跟浙江医院合作,有一个慢性病管理平台,能够把一些专家资源放进来,对这些病人进行一些在线监测,我们做了一些可穿戴的设备,通过这些专家把数据采集好之后传到平台上,也代表已近传到我们的云端上,传到云端之后我们就可以对这些数据进行有效的管理,长期的跟踪服务,把一些医生资源,跟踪服务的资源,护理资源都可以结合起来,而且我们现在是把药商的资源,保险公司的资源都整合在这个平台上,这个患者找健康的位置实现各类服务的打通,这是我们目前做的一些主要业务。

InfoQ:传感器收集数据,云平台收集数据,后端处理数据,你们自己的算法分析数据,之后将结果回馈给信息用户,你们用了阿里云的哪些服务?

沈英桓:主要用到了阿里云的云主机、负载均衡(SLB)、关系型数据库(RDS)、开放存储服务(OSS)这几个部分,其中负载均衡(SLB):当负载很大的时候,可以转接到不同的主机上,可以做一个云转接,进行弹性运算和分发运算;而关系型数据库(RDS):数据量很大时,数据很容易崩溃的,阿里最近推出的去 IOE,很好得解决了这个问题;开放存储服务(OSS):比如图片、语言聊天、碎片化处理,放在虚拟机上面,会出现多级共存的问题,但是 OSS 有效地解决了这个问题。

InfoQ:贵公司是将所有的数据都放在阿里云平台吗?

沈英桓:我们公司叫健康宝互联网技术有限公司,我们跟别的 IT 公司不大一样,我们没有卖任何一台机器给我们的用户,我们所有的要求都放在云上。对于现代社会来讲,云已经是触手可及,网络随时都有,第二个我们碰到很多医院都碰到问题,经常瘫痪掉,由于空调的问题,由于病毒的问题系统瘫痪掉了,我们以前做 IT 系统的,经常碰到这个问题我们的系统就跑到远程去做服务,但是地理位置不是一夜之间一天之间可以解决的,但是放在阿里云上面就可以很好,有很多地方存储。

InfoQ:你们的核心技术在哪里,核心竞争点在哪里呢?为什么?

沈英桓:阿里云提供的 IAAS,但是我们的数据处理连接运算这些开发都是我们的,程序都是我们的,SAAS 是我们的,部分是 PAAS 是我们的,因为里面的部分算法及接口是我们的。还有我们的核心就是医学知识,因为这是我们跟医院一起合作,拿医院的大数据来做出来的。然后我们的核心竞争力除了技术之外,就像刚才说的,我们有医院有医生,我们自己都懂,我们公司自己也有医生。我们为什么做这套系统呢,因为我们跟很多公司不一样,我们做医学联合体,我们梦想的医院并不是医院的本身有多大,而是创造一种模式,所有医院绑在一起共享他们的病患资源,然后利用阿里云上面的开发的系统,来共享这写数据,同时我们公司还提供支付宝网络,因为我们是跟阿里开发的支付宝合作,我们院内实时结算也结合进去了。实际上,通过支付宝把钱存在病患的虚拟卡上面去,一个医院有几十万的病人是正常的,十万人每人存 1000 块钱,一年就是一个亿,然后把这个钱放在余额宝一年的利息也是可观的收入。

InfoQ:云计算最大的问是数据安全、容灾问题,你们把数据放在阿里云上面,由于客观原因,假如有一天集群崩溃的,数据全没有了,或者集群的数据被盗,是否考虑过这些问题?有没有进行过实时数据同步?

沈英桓:其实这方面我们做过分析,阿里云有 9 份备份,所以我们不担心,再说我们现在也不推荐医院把核心业务系统放到云上去,因为我们做的是通用这块,通道嘛,我们医院也很清楚,天猫每天都在跑业务都没出问题,我们这个就挂挂号是不会出问题的,就一些诊疗数据,而且有 9 份备份。

叶德佑:而且所有的数据都是经过加密的,不仅我们做了加密,传到阿里云上面阿里云也进行了一层加密,阿里自己也看不到,我们也看不到,没有授权是看不到的,是安全可靠的。

沈英桓:另外对已实时同步的问题,我们提供一个叫混合医疗方案,这个方案能够把这个数据跟内部私有云数据同步,这些主要依靠我们开发的一个实时同步程序。比如说,假设医院的带宽是 10M,这个程序可以固定其中的 1M 专门做数据同步,再说,对于医院来讲同步的数据不多,这个程序用起来还是比较方便。

InfoQ:现在做云计算这一块,除了阿里云之外,还有其他的云存储的和云处理的公司,为什么你们选择阿里云不选择其他的公司?

沈英桓:因为我本人也是做云计算的,我以前是做军工产品做军火的,主要是做飞行器管理。我有个感觉,我也知道现在应该从技术上来讲,云计算应该是很流行的,大家都在做,但是为什么我们选阿里呢?因为我们选一个品牌,他要有足够的用户数,因为我看过有很多专业的公司,确实也都做不出,我不能说别人不好,我们主要看阿里他也经过像天猫、淘宝,支付的考验,这是第一个。第二个我们选一个平台,我们希望只在一个平台上做,举个例子我刚才讲了,云主机放在一家,云计算放在另外一家,那么所有数据要通过公网传这是不现实的事情。阿里云其实它有两条,内部的你租十台电脑,有一个内网的 IP 地址,内网 IP 运算速度很快的,他的带宽是光纤的带宽。你要通过外网走的时候只能走互联网的带宽,你要传几个 G 的内容根本就受不了。所以从某种意义上你会发现,最后只能够做存储的公司,最多只能做相片的共享,非核心业务,你要有核心业务运算的时候,一定要跟计算和存储是绑在一起来做,否则会出问题的。第三呢?是因为,别的公司他没有数据库处理,我们现在有数据库,大量的海量数据运算,我们写个 SQL,比如 10 亿行数据进行运算,我内部我试过了,我怎么搭我的运算环境都很慢的,如果放在一个公司去,专门做数据库运算的,意味着我要放两套,数据库做一套,存储做一套,最后发现这个是很容易出问题的。

InfoQ:你们使用阿里云平台,当遇到问题时,有什么性能上面的问题,跟客服沟通过程有什么感触,可以分享一下这方面的实战经验吗?

沈英桓:我们好象感觉用起来阿里云还是很稳定的,还很少碰到出问题找阿里云帮忙,我们有时候找阿里云帮忙,我们在数据上出现问题的时候有什么好的方法,阿里云这方面知识库做得很好,有什么不懂可以问问他们,他们可以帮助你做一些小程序,这点对阿里云很感谢。现在还好没有出现,我们沟通下来就是态度,阿里云态度非常好,我们沟通很简单,两个人相处一样,就像谈恋爱一样,你对我胃口,我对你胃口,我相信大家能够互相宽容把问题解决掉。

InfoQ:通过现在你对阿里云的使用,和将要实施的计划,阿里云需要在那些改进,才更适合你们的实际业务需求?

沈英桓:因为阿里云在 IAAS 上做得很好,PAAS 有做数据库、存储,系统。比如说我们做一些机器学习、做一些判图的时候,我们发现如果阿里云未来把这块集成起来,在这上面做得更多一点,其实是有帮助的,因为阿里提供的搜索,我觉得这很好,推荐算法也很好,我觉得未来也许在医学上有些东西可以用得上,而实际上跟医学上的很多算法,科学的东西相关联专项知识,这一块目前阿里云还没有提供,未来也许会提供。像我们这种做 IT 公司的,做医院信息化就是做收费嘛,做了半天以后要提高临床的科学数据,现在有种说法叫 CDRM 叫临床数据中心,这块能够做是非常有价值的,这样就能够吸引很多医院把内部数据放到阿里云上面去。

云计算大数据语言 & 开发算法AI