写点什么

赵钟秋谈又拍网架构中的消息/任务系统

2011 年 12 月 31 日

赵钟秋,又拍网核心开发人员,关注多种计算机语言、Web 技术和开源技术。他在 QCon 杭州 2011 大会的开放平台专题做了名为《又拍网架构中的消息 / 任务系统》的讲座,并和参会者做了热烈的讨论。会后,InfoQ 中文站对赵钟秋做了采访。

InfoQ:又拍的图片云计算平台与一般的 CDN 有什么区别与优势?

又拍图片云计算平台是 Amazon S3 + CloudFront 模式,因为源数据机房包含在整个 CDN 系统中(一般 CDN 服务源服务器往往在客户各自的机房),所以网络优化更彻底,达到整个 CDN 最佳效果。并且面对国内各省市之间复杂的网络结构,可以不断调整优化最佳链路(一般 CDN 服务,回源链路一旦确定,很少会再去为客户做变动)。另外,又拍在提供文件存储加速外,利用公司本身图片方面的技术积累,还提供一些特色功能:比如针对图片文件类型生成缩略图的功能,在线管理功能,防盗链功能等等。

InfoQ:又拍从什么时候开始使用 Erlang,目前开发团队有多大规模,除了消息系统,Erlang 还用在什么地方?给又拍带来了什么优势?

又拍从 2010 年初开始使用 Erlang,我们并没有专门的 Erlang 开发团队(需要的时候由团队中 1-2 个人负责 Erlang 相关开发)。除了消息系统,我们的文件存储系统也是使用 Erlang 开发。我们喜欢用最合适、最方便的工具解决问题,我们认为目前在分布式系统的开发中,Erlang 就是这样的工具。Erlang 的引入也的确为又拍这样的小团队快速地开发高效的、稳固的分布式系统带来了可能性。

InfoQ:选用 RabbitMQ 的时候,与其它的消息系统比如 ZMQ 等等,怎么确定造型的呢,是否有实际的 Benchmark 例子?

选择 RabbitMQ 是 2009 年的事了,当时网站架构在做比较大的变迁。又拍原来的架构是基于 Java 的,那次的迁移是打算减轻对 Java 体系的依赖,而开源消息队列中比较有名的 Apache ActiveMQ 是基于 Java 的实现,显得太厚重,所以被排除在我们的考虑之外。另外,那个时候 ZMQ 还没推出。没有具体了解过 ZMQ,以目前地认识来看,我认为它们之间也存在很大的差异。例如 RabbitMQ 比较完整的实现了 AMQP 协议,而 ZMQ 则提供了简单的接口,相比之下,前者显然比后者偏重。如果是比较性能,ZMQ 会胜出是无庸置疑。后面我们会对 ZMQ 作进一步了解,因为它可能能和 YPTask 有一个很好的结合。目前我们也没有再使用 RabbitMQ。

InfoQ: YPTask 是在 RabbitMQ 上的包装吗?有哪些自己独特的地方,是否回馈开源社区?

YPTask 和 RabbitMQ 没有任何关系,实际上 YPTask 并不是消息系统,确切地讲应该是一个基于消息的远程方法调用系统。YPTask 是基于 Erlang 的 OTP 实现的,本身就是一个很健壮的分布式系统。它具备管理、配置外部工作进程的功能,而简化了消息队列地实现。外部工作进程不是通过网络接口与 YPTask 通信的,而是通过标准输入 / 输出。所以理论上后端的工作进程可以用任何语言实现,只要它支持 Erlang 的序列化方式 BERT。事实上,BERT 的其它语言实现已经非常丰富。更重要的是,YPTask 作为一个中间层次的系统,把大多数的配置和管理工作统一起来,极大地减少了业务代码需要处理的事,使得业务逻辑的开发和管理都变得很简单。我们会将这个工具进行进一步的调整和完善,并在合适的时候将其开源。

InfoQ::Erlang 与 Python、PHP 的通信是怎么做的呢,RPC 是使用 Thrift 还是其它的例子?

目前 Erlang 与工作进程(主要由 Python 开发)是通过 Erlang 的内置序列化方式 BERT 进行通信的,与 PHP 则是通过 JSON-RPC 通信的。考虑到我们系统的迁移,目前只实现了这两个对我们来说最合适的通信方式。不过我们打算加入更多的外部通信协议,比如 msgpack,protobuf 等等。

InfoQ:之前知乎使用又拍时曾出现一些故障,现在在安全性可靠性上,主要有哪些保障?

知乎在使用过程中出现的故障是由于他们对 API 的使用不当造成的。他们将需要认证的 API 请求放到客户端发送,导致向客户端泄漏了 API 的认证信息。从又拍的角度看,这也反映出之前的 API 功能还不够丰富,调用不够方便等问题。我们也会在这个方面投入更多的精力。

InfoQ:又拍的消息系统的规模有多大,下一步会怎么发展呢?

目前又拍的消息系统规模不算太大,每天由 5 个节点处理大约 500 万条消息。目前这些节点的压力并不大。下一步的发展还要看网站的发展情况来确定。

InfoQ:除了消息系统外,整个又拍架构中还有哪些优秀的地方想和读者分享?(又拍曾分享过分库设计)

又拍也是较早在架构中引入 Redis 的站点,可能的话可以分享一下相关经验。

2011 年 12 月 31 日 09:455605
用户头像

发布了 133 篇内容, 共 26.3 次阅读, 收获喜欢 1 次。

关注

评论

发布
暂无评论
发现更多内容

一些思考

张健

信创舆情一线--《关键信息基础设施安全保护条例》纳入2020年立法计划

统小信uos

信息安全

LR.Net平台研发轶事,每一个点都很难,但我们不将就

力软.net/java开发平台

C# .net 跨平台 框架开发

一文看懂 OAuth2

pingan8787

Java 前端 Web oauth2.0

领域驱动设计(DDD)实践之路(一)

vivo互联网技术

架构 领域驱动设计 DDD

推荐一款Python开源库,技术人必备的造数据神器!

狂师

Python 开源 自动化 开发工具 开发数据

Tomcat8.5源码构建

知春秋

tomcat tomcat构建 tomcat源码解读 tomcat剖析

带你解析MySQL binlog

Simon

MySQL Binlog

SpringBoot入门:00 - 初始化项目

封不羁

Spring Boot java 14

开发者必备——IDEA配置清单

Noneplus

配置 IDEA

图片处理不用愁,给你十个小帮手

阿宝哥

Java 前端 工具 开源项目 图片

不是完成你学习的 KPI ,而是要形成指导你行动的 OKR

非著名程序员

学习 程序员 提升认知 知识管理 程序员成长

漫画 | 架构设计中的那些事

码农神说

架构设计 架构师 漫画编程

性能碾压 POI !利用模板语法快速生成 Excel 报表

Geek_Willie

表格控件 GCExcel 服务器端开发

Java集合总结,从源码到并发一路狂飙

给你买橘子

Java 编程 算法 集合

数据结构与算法知识点总结

hiqian

30 张图带你分分钟看懂进程和线程基础知识全家桶

爱嘤嘤嘤斯坦

Java 线程 进程 进程线程区别

Linux 进程必知必会

cxuan

Linux 操作系统

​区块链技术的重要性

CECBC区块链专委会

Redis进阶篇三——主从复制

多选参数

redis redis高可用 redis6.0.0 Redis项目

Node.js与二进制数据流

自然醒

Java node.js 前端 二进制

猿灯塔:spring Boot Starter开发及源码刨析(二)

猿灯塔

Java 猿灯塔 源码刨析

mac vmware centos7 设置静态IP

愤毛阿青

network vmware Centos 7

还在划水?这个SQL你能写出来吗?

书旅

php MySQL SQL语法 sql查询

Rust是如何保障内存安全的

博文视点Broadview

读书笔记 rust

字节跳动面试经验分享,已拿 Offer!

伍陆柒

Java 面试 大厂

关于计划的思考

zhongzhq

Python类中的__new__和__init__的区别

Young先生

Python __init__ __new__

Python中的@staticmethod和@classmethod的区别

Young先生

Python classmethod staticmethod

编程能力 —— 异步编程

wendraw

Java 前端进阶训练营 编程能力

流水账

zack

赵钟秋谈又拍网架构中的消息/任务系统-InfoQ