写点什么

搜狗开源轻量级 C++ 服务器引擎

  • 2020-09-03
  • 本文字数:1792 字

    阅读完需:约 6 分钟

搜狗开源轻量级C++服务器引擎

9 月 3 日,搜狗公司正式宣布开源 C++服务器引擎——Sogou C++Workflow。


目前 Workflow 支撑着搜狗几乎所有后端 C++在线服务包括所有搜索服务,云输入法,在线广告等,每日处理数百亿请求,引擎一经发布就在 GitHub 上引起众多开发者关注。这款引擎不仅实现了高性能、轻量级的落地,还创新性的引入任务流概念,实现了计算任务与通信任务的统一和协同调度。基于 Workflow 引擎,开发者可以方便的实现复杂的业务逻辑,并进一步满足对高并发、高性能 C++服务器程序的开发需求。


Sogou C++Workflow 地址:https://github.com/sogou/workflow

轻量级、高性能, Sogou C++ Workflow 助力企业降本增效

Workflow 在设计之初,就秉持着高性能与轻量级两个核心理念。长久以来,业界中优化服务器性能都主要专注于如何跑满 cpu、如何单独地让网络请求极速响应等方面。而此次上线搜狗 Workflow 则更专注于如何让各种网络资源被具体的调度器管理,使其尽可能地全部调度起来。



另一方面,对多通信计算资源融为一体的解决方案,进一步提升了 Workflow 引擎的性能。过去开发者在面临选择高吞吐网络框架时,需要自己面对不同计算资源比例而划分不同大小的线程池。然而每种计算具体资源需求比例是动态变化的,重要性也不一样,后端响应时长也是动态变动。如今在 workflow 的加持下,C++服务器引擎也能像 Go 语言一样,实现网络资源异步调度,并且进一步打通计算,磁盘等资源。



引入任务流概念,是搜狗 Workflow 引擎的另一亮点。Workflow 将资源高度封装,用户再也接触不到连接池、线程池、包括想要做 aio 时的文件 fd 与各种异步通知机制。这就意味着,在开发阶段开发人员仅仅需要了解业务关系而不用关心内部细节,帮助开发者们实现自己复杂的业务逻辑。


开发人员可以利用 Workflow 封装好的各种任务来动态或静态组建自己的业务逻辑,如下图所示,不同类型的任务都可以被串行、并行到一起:



除了各种创新设计以外,workflow 还拥有比其他 C++框架更友好的用户体验。过去许多企业自己搭建的服务器平台,在设计之初并未考虑到对多平台、多协议的支持,导致当新需求出现之时,开发者不得不通过自定义框架等方式来解决这个问题。Workflow 原生实现了对 http、redis、mysql 和 kafka 等协议,可以直接作为这些协议的客户端使用。并且在其基础上开发了一套更加易用的 Sogou RPC,实现与 brpc 和 thrift 互通,IDL 支持 protobuf 和 thrift,并且可以通过 http+json 或 IDL 实现跨语言,Sogou RPC 项目也会在不久的将来开源。

Http Server 性能实测:Sogou C++Workflow VS nginx、brpc

为了充分的体现出 Workflow 在性能上的优势,搜狗也提供了 Workflow 和 nginx、brpc 两个比较主流知名的系统一起做的 http server 性能对比。


测试环境:


这里选取了最基本的测试场景:wrk 或者 wrk2 跨机做 client,单 server,长连接,CPU:40 核 E5-2630 v4 @ 2.20GHz,内存:192GB,网卡:25000Mb/s。nginx 配置了 auto 的进程数(与核数一致),brpc 配置了 40 个 nthreads,workflow 配置了 16 个 poller 线程和 20 个 handler 线程。


测试一:不同并发数对 QPS 的影响(越高越好)



结论:随着压测并发数的增加,server 的 QPS 会随着增高。可以看到 Workflow 无论是低并发数还是高并发数的情况下,QPS 依然比 nginx 和 brpc 要高,尤其是并发数超过 128 的时候优势更加明显,Workfow 对于小包基本能保证 50w 的 QPS,说明内部对网络资源的高并发调度做了很多优化。


测试二:不同数据大小对 QPS 的影响(越高越好)



结论:此处的返回包大小是 http 请求的 body 大小,随着返回包增大,QPS 会有所下降,我们希望 QPS 依然尽可能保持平稳不要下降得太快。Workflow 在同并发下的性能依然比其他两个系统要好,说明网络收发和其他调用之间的调度协调得更好。


测试三:固定 QPS 下的延迟分布 CDF 图(越左越好,越直越好)



结论:本测试由 wrk2 进行固定 QPS 的压测,其中还有 1%的长尾请求 Outiler,长尾请求不计入结果,因为我们关注的是模拟真实情况下普通请求能否被及时处理。由于 nginx 在其他测试中性能略差一截,因此没有对其进行 CDF 对比。可以看到在不同比例的分布中,Workflow 的延迟更低、且最慢的那些(0.99 到 1.00 之间)延迟增长也相对缓慢,说明 Workflow 对长尾处理更及时。


通过对比,可以发现 Workflow 的确在核心性能上有着自己独到的优势,对于很多开发者来说,往后也就多了一种选择。


2020-09-03 13:5110770

评论 4 条评论

发布
用户头像
自己后台业务做得烂,和proxy什么关系,真6
2020-09-23 15:37
回复
用户头像
👏
2020-09-04 11:20
回复
用户头像
谢谢分享,改天下来阅读下。又gitee的镜像妈?
2020-09-03 16:03
回复
暂时没有放到gitee上~欢迎试用欢迎与我们多多交流哟~
2020-09-03 21:03
回复
没有更多了
发现更多内容

Python 语言基础变量的类型转换

HoneyMoose

MT马特量化交易系统开发|MT马特量化交易软件APP开发

系统开发

阿里P8大牛亲自讲解!难道Android真的凉了?3面直接拿到offer

欢喜学安卓

android 程序员 面试 移动开发

Python 语言基础变量定义和使用

HoneyMoose

《精通比特币》学习笔记(第四章)

棉花糖

区块链 读书笔记 3月日更

BI掌柜量化交易系统开发|BI掌柜炒币机器人软件APP开发

系统开发

列表推导式与字典推导式,滚雪球学 Python

梦想橡皮擦

28天写作 3月日更

大括号之谜:C++的列表初始化语法解析

华为云开发者联盟

c++ 函数 语法 元素 std::array

亿级用户中心的设计与实践

vivo互联网技术

大数据 架构设计 数据安全

女神节·走近又美又飒的程序媛

华为云开发者联盟

华为 程序媛 IT 工程师 汉服

面试现场:小伙伴的美团一面分享和分析[含答案]

小傅哥

Java 面试 小傅哥

纯干货 | 详解 HDFS 3.x 新特性-纠删码

五分钟学大数据

大数据 hdfs 28天写作 3月日更

正则表达式.03 - 分组

insight

正则表达式 3月日更

小喜量化交易系统开发|小喜APP软件开发

系统开发

阿里P8大佬亲自讲解!万字Android技术类校招面试题汇总,已拿offer

欢喜学安卓

android 程序员 面试 移动开发

了解MySQL6种约束的不同和特点

华为云开发者联盟

MySQL 数据 约束 主键约束 自增长约束

突破关系型数据库桎梏:云原生数据库中间件核心剖析

京东科技开发者

数据库 nosql 分布式系统

Python 语言基础变量获得变量类型

HoneyMoose

二维码高端路线养成计

happlyfox

学习 技能 28天写作 3月日更

工作日志3-2-3

技术骨干

36 Kr | 打造企业统一数据安全入口,「图尔兹」想用新思路解决数据安全问题

BinTools图尔兹

数据库 sql 数据安全 权限 数据库管理工具

2021网络系统流行架构

杨东冬

架构 网关 ebpf cilium envoy

LoadRunner测试中遇见的不可思议的问题及其解决方法

陈磊@Criss

七日更 28天写作 3月日更

关于MPI-IO,你该知道的

焱融科技

存储 HPC 焱融科技 文件存储 分布式存储

实现一个全链路监控平台很难吗?Pinpoint、SkyWalking、Zipkin,哪个实现比较好?

xcbeyond

架构 技术方案 链路监控 3月日更

上线 Python 应用仅需一条命令的开源框架:Zappa(详细教程)

HelloGitHub

Python Serverless 无服务器云函数

Python基础之:函数

程序那些事

Python 数据分析 Python3 程序那些事

知识+AI融合创新探索,华为云论文被AI顶级学术期刊IEEE TPAMI接受

华为云开发者联盟

AI 模型 华为云 卷积神经网络 IEEE TPAMI论文

10 个解放双手超实用在线工具,有些代码真的不用手写

程序员小富

Java

《我想进大厂》之分布式锁夺命连环9问 | 大理版人在囧途

艾小仙

Java redis zookeeper 分布式锁

实习记录-埋点测试

YUKI0506

搜狗开源轻量级C++服务器引擎_开源_搜狗架构团队_InfoQ精选文章