50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

洪强宁介绍 Douban App Engine 的架构与特性

  • 2013-12-20
  • 本文字数:1904 字

    阅读完需:约 6 分钟

豆瓣网首席架构师洪强宁最近在 PyCon China 分享了他们研发两年的成果:Douban App Engine(DAE)。InfoQ 中文站编辑在现场对洪强宁的分享( PPT 下载)进行了记录,提取重点内容如下:

DAE 是专门针对 Python 做的私有 PaaS 平台,目前已经支撑了 427 个应用,其中 126 个是对外应用。126 个对外应用包括:

  • 豆瓣电台的 Bubbler
  • 豆瓣移动版网站
  • 豆瓣 FM
  • 豆瓣电影
  • 豆瓣小组

对内应用则包括 Douban Code 平台、豆瓣上线系统 Up 平台、用于人事管理和活动组织的豆瓣花名册、验证深度学习算法有效性的豆瓣电影评论数据分析系统精灵宝钻等等。

DAE 目前每天处理 2.4 亿动态请求,峰值可达到 5K qps,运行在 32 台服务器上(豆瓣称之为 32 个节点)。

开发 DAE 的原因

洪强宁介绍开发 DAE 的原因,包括几个方面:

  1. 用 Git 替换 SVN。此前,豆瓣所有的代码都在一个 SVN repo 上,commit 数量将近 17 万。PyCon 北京之前,豆瓣正式停用 SVN,将所有代码转移到 4.6k 个 git repo 上,目前有 2.8K 个 fork。项目数量以每一两天一个新项目的速度增长
  2. 基础设施公用,不用给每一个应用都配一套MySQL、BeansDB、Memcache、MQ 什么的了
  3. 大大简化了新项目启动的操作:你只需要 dae create 即可创建你的项目,dae serve 即可测试,dae deploy 即可上线
  4. 最佳实践可以自动实施到所有的项目上,这包括每次提交都进入持续集成系统进行自动化测试,分级上线,状态收集和故障报告的标准化等

基于上述好处,DAE 的存在还带来了另一个极大的好处:运维工作的可扩展性。如果没有 DAE,那么 SA 的工作量跟服务器数量、应用种类的数量是呈平方增长关系的。有了 DAE,只需要 4 个 SA 就能完成所有的豆瓣运维。

DAE 的架构设计

DAE 的架构是这样设计的:

每一个应用都有一个 app.yaml 定义这个应用的版本、是 sync 模式还是异步模式、出了问题该通知谁等信息。

应用依赖采用类 pip 的方案解决,只需执行 dae install package 即可安装该 package 以及相关的所有依赖。豆瓣提供了一个 pypi 的镜像供大家使用。

实例分为三种:web、service 和 daemon。

一个 web 实例就是一个 gunicorn。使用 gunicorn 的原因是因为它是用 Python 写的,适合豆瓣对它做二次开发,而且 gunicorn 还有一些很好的特性,比如 graceful restart。

service 是用于在应用和应用之间传递信息的,用 gunicorn 配合 thrift 实现。

daemon 是那种长期运行、不会死掉的守护进程,采用 ZooKeeper 做全局管理。有了这个就可以实现一些其他的应用,可以保证 Message Queue 里有固定数量的消费者,通过定时产生一些消息,让队列的消费者执行特定程序来实现定时任务。

路由系统采用两级 Nginx 结构,请求过来之后判断它是找哪个应用的哪个实例,给它做一个 HTTP proxy 过去。基本上,长期没人访问的应用消耗是很小的,仅占用硬盘空间。这里使用了 unix socket 而避免使用 tcp,是看中了 unix socket 的文件属性,实现更简单。

所有的基础服务,如 MySQL、memcache、doubandb、cdn、mail、irc 等,都是通过 API 的方式提供。业务访问不同的服务会有不同的前缀,通过这个实现隔离和监控。

DAE 的特点

根据洪强宁的介绍,DAE 本身的资源占用是很低的,因为是用进程来做资源分配,用 Unix 账号做资源隔离,监控则交给外部的监控系统。

另外,DAE 是一个自己实现自己的系统:通过一个 DAE 应用部署应用,通过一个 DAE 应用管理应用,一个 DAE 应用 scale 所有的应用,而 DAE 的代码也是托管在一个 DAE 应用上,会有循环依赖。

DAE 自身的升级是通过开发集群 ->beta 集群 ->stable 集群逐级上线的,目的是在发布到外部应用之前 DAE 系统已经经过了内部系统的测试。

DAE 在部署应用时,会分批逐步在各节点部署,部署后会自动测试,测试不通过就会自动回滚,这样来保证应用部署过程中和部署后的可用性。

另外,DAE 的环境是不受限的,比如 C 扩展,比如 Python 的 fork、subprocess、multiprocessing 等在其他 PaaS 上禁止使用的特性,在 DAE 上都是允许的。这样当然会造成一些潜在的问题,比如你的应用 fork 出来一堆线程没有处理,就会在那里占用很多资源。所以我们做了一个曹娥来解决这个问题,在父进程死掉的时候杀死所有 fork 出来的子进程。

接下来希望做的一些事情:

  • 让 DAE 成为豆瓣所有应用的平台
  • 采用 cgroups 实施资源限制,以免外部监控跟不上的情况
  • 开发新的服务系统,解决在应用 thrift 中发现的一些问题,和 thrift 互为补充
  • 自动实现跨 IDC
  • 实现 QoS,让任何应用的问题不会影响其他应用的表现

DAE 并没有计划做公有云服务,因为原本的设计采用的 Unix 账号模式,设计目标是数千个 app 的容量,很明显是无法支持公有云的用量的。

开源方面,其实一直有这个计划,会在基础库逐步开源之后再开放出来。

2013-12-20 08:395114

评论

发布
暂无评论
发现更多内容

时序数据库 TDengine × SSRS:自动报表的高性能组合拳

TDengine

tdengine 数据 时序数据库 报表

MyEMS开源能源管理系统核心代码解读011

开源能源管理系统

开源 能源管理

ByteBrain x 清华 VLDB25|时序多模态大语言模型 ChatTS

火山引擎开发者社区

火山引擎

IT小伙伴要知道的-IT运维堡垒机相关知识

行云管家

堡垒机 IT运维

中国商飞与宁德时代跨界,共护投资者权益

科技汇

中国商飞与宁德时代携手,技术创新引领航空新能源

科技汇

中国商飞与宁德时代战备合作,市场影响深远

科技汇

AI 英语口语 App 的开发

北京木奇移动技术有限公司

软件外包公司 AI听力 AI英语学习

京东携手HarmonyOS SDK首发家电AR高精摆放功能

HarmonyOS SDK

HarmonyOS HarmonyOS NEXT HarmonyOS SDK应用服务

一张表就是一个智能业务系统,钉钉全新发布“AI表格”

ToB行业头条

Claude Code 免费羊毛快薅

白大米

Claude cursor

数字化转型三阶段:信息化、数字化、数智化分别代表着什么?

优秀

数字化 信息化 数智化

2026第二届杭州国际人形机器人与机器人技术展览会

AIOTE智博会

机器人展 智能机器人展 人形机器人展

满血DeepSeek加持的AlphaGPT,助力高文律师事务所全面拥抱AI

科技汇

报名开启!AI 助力快速设计仿真技术研讨会(浙江温岭)

Altair RapidMiner

AI 制造业 CAE Inspire Simlab

Awesome Mac 精选资源合集

qife122

macos 命令行工具

天下拍“同步拍”模式:让异地竞拍变得触手可及

至存网络

拍卖系统 拍卖软件 艺术品拍卖 资产拍卖 竞拍

MyEMS开源能源管理系统核心代码解读012

开源能源管理系统

开源 能源管理 代码解读

在YashanDB中优化查询性能的技术分析

数据库砖家

原点安全签约广西北部湾银行,实现多场景一体化数据安全平台建设

原点安全

淘宝商品评论API接口全解析:从数据采集到情感分析

tbapi

淘宝商品评论接口 天猫商品评论接口 淘宝API 淘宝商品评论API 天猫商品评论API

MyEMS开源能源管理系统核心代码解读010

开源能源管理系统

开源 代码 能源管理 开源能源管理系统

脑机接口一百年

脑极体

AI

在YashanDB中如何实现高效的数据恢复和备份策略?

数据库砖家

官宣 | Fluss 0.7 发布公告:稳定性与架构升级

Apache Flink

KingbaseES 到 Apache Doris 实时同步实践|国产数据库数据入仓解决方案

tapdata

Tapdata 日志解析 KingbaseES实时同步 Doris数据入仓 国产数据库,数据类型映射

Agentic时代,我们需要什么样的数据工程(一)

MatrixOrigin

时序数据库技术创新大会:以 IoTDB 为核心,洞见「DB + AI」的工业物联未来

Apache IoTDB

LanceDB:AI时代的多模态数据湖

火山引擎开发者社区

火山引擎

全球研讨会|知识图谱赋能数据平台价值升级

Altair RapidMiner

人工智能 机器学习 AI 数据分析 知识图谱

失明十年后,他在这里找到当大侠的感觉

脑极体

AI

洪强宁介绍Douban App Engine的架构与特性_服务革新_sai_InfoQ精选文章