2012.4.5 微博热报:SAE PHP Runtime 遇 500 错误、简单架构解决复杂问题、Amazon EBS 博文推荐

阅读数:2020 2012 年 4 月 5 日

话题:云计算DevOps语言 & 开发架构

SinaAppEngine在微博中提到,今天凌晨起,SAE PHP Runtime 的部分请求出现 500 错误,目前仍有小部分应用受影响;@Syupei 提到某网站负责重构的工程师,在每天 1KW 的 PV,每秒峰值只有 1K、公司总共 60 台机器的情况下,用了 Redis/MangoDB/PHP/Erlang/Thirft 等技术架构;@网易汪源 在微博中推荐了@网易余利华 的博文《Amazon EBS 特性、故障和设计》

@SinaAppEngine 早在微博中提到:“今天凌晨起,SAE PHP Runtime 的部分请求出现 500 错误,我们连夜对问题进行了排查和修复,但目前仍有小部分应用受影响,我们将尽快恢复服务,对此带来的不便我们非常抱歉。”,以下是网友对于此事的回复:

@DP- 神 -Theosoft:我查了下我网站的日志,好像从昨晚 23 点开始就有零星的 500 错误了,然后到 2 点不到的时候开始全面爆发,现在几乎是很少看到 200 了……。

@since2006:SAE 能不能搞一个类似 Server Status 的页面,至少出问题了能知道是自己的问题还是服务器问题呀。昨晚正好在修改功能,传上去后访问页面时不时 500,还以为是自己代码有问题,调试了半天。

@Belin_love:回复@since2006: 非常同意你的意见,我们不能了解服务器的状态,老在自己的应用上面找问题……看来我的应用也是少部分中的一个。

网友@Syupei 在微博中写道:“高手总是把复杂的事情用尽量简单的架构解决,反倒是很多年轻人喜欢把简单的事情用很复杂的架构来处理。今年见到一位某网站负责重构的年轻人,在每天 1KW 的 PV,每秒峰值只有 1K、公司总共 60 台机器的情况下,用了 Redis/MangoDB/PHP/Erlang/Thirft 等一堆东西,架构图让我误以为至少 6K 台机器。”:

@Erlang:有的架构是为了运行效率,有的则是开发效率。架构越复杂可能出问题的地方越多。

@胡争辉:MySQL 是王道。临时存储用内存表,持久存储用 MyISAM,再提升性能就换企业级 SSD……//@金山: 更可怕的是为了用设计模式而生搬硬套 //@周洋 -d: //@淘宝丁奇: 不在其中,不好评论单个例子。但确实见过为架构而架构的情况。有个好处是图画起来确实比较唬人。[转] 简单可依赖,复杂好晋升。

@南柯 cyu:我倒是觉得这个过程有时候是不得不走的,复杂化能够驾驭之后,简单才是自然而然的追求~~ 相比前者更能锻炼人,所以年轻人也更乐意追求。

@得意的那些事儿:新技术用得越少越简单越好。水平就是在简单的情况下,达到高性能。其实架构的伸缩性,体现在即要全,每个环节考虑充分,又要简,简到只要能满足性能要求,使得“全”的细节可扩展。架构是需要反复推敲和验证的。

@杭州李云:高手们总是强调“简单”,但真正认识和理解“简单”并不那么容易,因为其背后需要个体具有良好的洞察力——抓住问题的本质,并“对症下药”。低手们的这种表现其实并不让人意外,因为他们正在走高手昔日走过的成长道路!

@JasonLai:回复@Syupei: 这样说我没意见。当年在做某媒体网站的时候,简单的 CMS,CTO 选型用了非常复杂的 JavaEE 组件栈。为了让不同内容的模型类具备同样的行为,当年 AspectJ 神马的“高级 AOP 技巧”都用上了。结果就是每次改一点服务器端代码,重启这个 JVM 需要花费一分半钟。

@网易汪源在微博中推荐@网易余利华的几篇关于 EBS 的博文:推荐一下@网易余利华 近期关于 NBD 的几篇博文《Amazon EBS 特性、故障和设计》http://t.cn/zOX6EIb、《sheepdog(牧羊犬):一种 EBS 的开源实现》http://t.cn/zOX6EI4、《HLFS: 基于 HDFS 和 LFS 技术的 EBS 开源实现》http://t.cn/zOX6EIG

@Hadoop 中国:EBS 已经成标配要支持的标准了,搞云存储的注意咯。

@fengyuncrawl:信息量比较大,看完之后元气大伤,咳嗽不断,不知怎么的流鼻血了,Sheepdog 是概念产品,生产环境很难用上,强一致性,P2P,无单点故障看到这些关键字,马上联想到原先的 Dynamo 有异曲同工之妙,换汤不换药!

@网易余利华:Sheepdog 目前已经支持 Accord 和 Zookeeper,能够扩展到上千规模集群。本地 Object Cache 也是不错的特性,不仅提高效率也能避免数据恢复带来的不可用。多谢 Sheepdog 主要开发者@淘泰来 指出。

@淘泰来:事实上,最新的 Cache 策略是 Cache 所有的 IO 请求,无 Reclaim,所以数据恢复时的数据不可用不会存在 //@网易余利华: sheepdog 目前已经支持 accord 和 zookeeper,能够扩展到上千规模集群。 本地 object cache 也是不错的特性,不仅提高效率也能避免数据恢复带来的不可用。 多谢 sheepdog 主要开发者@淘泰来 指出。

今日微博推荐

@网易汪源

推荐理由:网易杭州研究院副总监。


欢迎读者关注@InfoQ官方微博,推荐热门话题,可私信@InfoQ,同时请您说明推荐理由。