【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

C++/CX 性能陷阱

  • 2013-10-30
  • 本文字数:3213 字

    阅读完需:约 11 分钟

使用 C++/CX 编写应用程序和编写正常的 C++ 应用程序不一样。纯 C++ 代码和 Windows 运行时(WinRT)之间的互操作性出奇的昂贵。基于 Sridhar Madhugiri 的视频 C++/CX 最佳实战中的内容,我们在本文中列举了一些在 Windows 8 开发中避免性能问题的方式。

边界

在应用程序的边界上会产生多种性能障碍。

数据转换就是其中的一个例子。考虑一下一个 Web 服务客户端和应用程序剩余部分之间的典型边界。大多数 Web 服务是使用 UTF-8 编码的,而大多数 Windows 应用程序的内部则是使用 UTF-16 编码的。在 Windows 中 UTF-16 编码是如此的流行以致于人们有时会将它错误地称为“Unicode”编码。数据转换的成本可能是确定的,也可能广泛变化,这依赖于它在数据本身中的特定值。

下一种性能消耗来自于类型转换。例如,你可能需要一个 wstring,但是却有一个 wchar_t *。尽管在内存中每种类型所包含的数据看起来是一样的,但是将这些内容从一个数据结构复制到另一个数据结构依然是有性能成本的。

最后一种性能消耗来自于数据复制操作。有时候你必须为边界处的数据复制付出代价,哪怕它们并不需要数据转换和类型转换。

我们为什么要在现在讨论这些内容呢?原因是 WinRT 本身就是应用程序和操作系统其余部分之间的边界。编写高性能 C++/CX 应用程序的本质就是识别边界并在可能的情况下避免跨越边界。

如果跨越 WinRT 边界的操作无法避免,那么就寻找一些方式减少数据复制、类型转换和数据转换操作的数量。例如,如果数据源和目标都使用 UTF-8 编码,那么就没必要将数据转换为 UTF-16,因为你最终还是需要将其再转换回来。

字符串

在大多数应用程序中字符串都是主要的数据类型。文件系统、Web 服务、UI、消息、符文和契约等领域对字符串的依赖性日益加深。不幸的是人们所使用的字符串类型非常多。

在内部,大多数应用程序可能会使用 std::wstring 或者 std::wchar_t*,你所依赖的大多数第三方类库也是如此。但是在与 WinRT 类库进行通信的时候你需要切换到 Platform::String^ 。每一次转换都需要一次内存分配和一次数据复制操作。

String^ 和本地 C++ 版本之间的一个关键区别是:String^ 是不可变的。WinRT 运行时对不可变字符串的这种强调可能来自于.NET 和 CLR。正如 ^ 符号所表示的,String^ 也是引用计数。

人们可能会对可变和不可变字符串相关的优点争论一整天,但是最终只有一个事实。因为 C++ 标准类库只理解可变字符串,而 WinRT 仅理解不可变字符串,所以对这两者你都必须进行处理。正如前面所提到的,这意味着需要对字符串进行复制。

类库作者:如果你正在构建一个一般用途的类库供他人使用,那么你应该考虑提供多个不同版本的 API,为每种字符串类型提供一个 API。这样你就不需要猜测 API 的使用者在调用类库的时候使用的是哪种字符串类型了。

很多基于字符串的操作实际上并不需要使用字符串,但是开发者宁可选择使用字符串迭代器。因为可变和不可变数据结构的迭代操作是一样的,你可以在使用常规 xxx_iterator( begin(string), end(string), …) 语法的字符串平台上直接创建 STL 样式的迭代器。

另外,首先要查找直接返回 wchar_t* 的 API,而不是将它封装成一个 wstring。如果你找到了这样的 API,那么你就能够通过数组中第一个元素的地址以及数组的长度创建一个新的 platform string。这样就不需要创建一个在匹配的 platform string 被创建之后立即就会被废弃的 wstring。

调用带有字符串引用( StringReference )类型输入参数的 WinRT API 时有一个小窍门。你可以向一个参数类型为 platform string 的 WinRT 函数传递一个 wchar_t* 或者 wstring 参数,这种情况下将创建一个轻量级外观。无论如何,这里有一些需要注意的地方。

  1. 字符串必须是空终止否则将会抛出一个错误。
  2. 如果字符串在函数之外的任何地方发生了变化,那么结果将无法确定。
  3. 如果函数之内有任何字符串的引用,那么无论如何都会生成一个完整副本。

上面的第 1 条内容很容易验证,第 2 条则仅会在碰见线程安全问题的时候发生。在大多数环境下这应该是一个非常有用的技巧。

类库作者:为了确保上面的方案是真实可能的,首先尽量避免让它引用你以 StringReference 参数的方式获取到的字符串。因为随后的引用并不会引入额外的复制,所以不要担心使用第二个引用。

集合

与 C++ 中常见的集合相比,WinRT 中的集合是非常昂贵的。和.NET 中可观察的集合一样,对 WinRT 集合的每一次修改都会产生一个通知。该通知主要用于 XAML 数据绑定以便于更新 UI。

在初始化期间避免这种损失的一种方式是,首先在堆栈上创建并填充一个标准的 vector,然后使用 move 函数初始化一个 platform vector。你能够这样做,因为标准的 vector 将会被销毁,同时它的动态内存无论如何都会被释放。

在更新很多元素的时候,考虑使用 ReplaceAll 方法。这仅会触发一个通知而不是每一条记录一个通知。在 WPF 和 Silverlight 中没有与之相对应的方法,因为这些 UI 堆栈本身不支持一次性插入或者移除多个条目。

WinRT 集合中的另一种性能消耗来自于元素的读取。WinRT 集合是以接口的形式暴露的,因此它们是虚的,这就意味着它们并不能像普通的函数那样被内联。此外,每一次读取都需要进行范围检查。所以如果你需要多次读取同一个值,考虑将它复制到一个局部变量中,不要每次都从集合中读取。实际上复制的缺点是,你必须复制值或者增加对象上的引用数,这是一个连锁操作。

完全避免这种消耗的一种方式是在迭代集合之前复制它。分配一个正确大小的局部 vector,然后在 ArrayReference 上使用 GetMany 函数。然后结合使用 ReplaceAll 方法,你就能够对集合进行几次迭代,仅需要跨越 WinRT 边界三次就能够做一系列复杂的修改。

WinRT 接口

和传统的 COM 一样,在 WinRT 中一个对象的成员仅会通过接口暴露。你永远都不可能直接访问对象。C++/CX 通过做必要的隐式转换对你隐藏了这些细节。这样做之所以必要的一个常见原因是,可以满足调用非默认接口上的方法时的需要。

WinRT 中的转换不是廉价的。它需要调用 QueryInterface 这个虚方法,同时有一个增加引用数的连锁操作。一旦完成了对非默认接口的调用,还需要另一个减少引用数的连锁操作。

类库作者:

确保类中所有的常用方法在默认接口上都是可用的,这样就不需要转换成另一个接口了。

如果要对同一个非默认接口进行多次调用,那么创建一个该接口类型的局部变量。这样仅需要执行一次转换,而不是每次方法调用时都做一次转换。

在任何可能的时候你都应该使用堆栈分配或者 unique_ptr 类。因为这样你将获得所有选项的最好性能。

在你确实需要一个复杂生命周期的时候,你的下一个选择是通过一个 shared_ptr 访问的普通 C++ 类。这种方式和上面选项之间的主要区别在于引用数开销。

你选择的最后一种手段应该是 ref 类。一个 ref 类拥有和 shared_ptr 相似的引用数语义,但是能够带来其他基于 WinRT 的开销。所以仅在需要将类传递到一个 WinRT 函数或者在 XAML 的数据绑定中使用 ref 类。

在使用 ref 类的时候,尽量保持较浅的继承层次。WinRT 继承和 C++ 继承不一样,它有额外的开销。

XAML 数据绑定

在 WinRT+XAML 数据绑定中你应该避免实现 INotifyPropertyChanged,除非你确实希望在属性被填充之后发生改变。同样的,不要暴露公共 set 函数,除非 UI 确实需要修改数据。

XAML 所调用的 get 函数应该是廉价的。不仅仅是因为它们是在 UI 线程上被调用的,还因为我们可能会调用它们多次。所以不要在 get 函数中分配内存或者执行昂贵的计算。

对于所有基于 XAML 的 UI(WPF、Silverlight、WinRT+XAML)而言,一点非常重要的建议是保持较浅的数据层次。绑定表达式中的每一个点都代表了一次属性改变事件,而为了保持屏幕及时更新数据绑定引擎必须监听这些事件。

关于作者

Jonathan Allen 从 2006 年开始就一直在为 InfoQ 编写新闻,现在是.NET 版块的首席编辑。如果你有兴趣为 InfoQ 撰写新闻或者教育性的文章,那么请联系他:jonathan@infoq.com.

查看英文原文 C++/CX Performance Pitfalls

2013-10-30 23:052878
用户头像

发布了 321 篇内容, 共 116.1 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

【香山源码阅读】香山BPU代码阅读

源芯

开源 芯片 risc-v 高性能处理器香山

大型省级运营商:业务运营中,如何响应速度并有效提高准确性?

嘉为蓝鲸

ITSM 运营商 IT 运维

Android Studio安装超详细步骤

霍格沃兹测试开发学社

JMeter前置处理器-Beanshell前置处理器详解

霍格沃兹测试开发学社

高防服务器干什么的?用途及其重要性解析

一只扑棱蛾子

高防服务器

云原生最佳实践系列 7:基于 OSS Object FC 实现非结构化文件实时处理

阿里巴巴云原生

阿里云 云原生

如何搭建自动化测试平台

RestCloud

自动化测试平台 ipaas

掌握ADB:详解操作命令及完整用法指南(二)

霍格沃兹测试开发学社

分享 5 个提高技术领导力的技巧

高端章鱼哥

云原生最佳实践系列 6:MSE 云原生网关使用 JWT 进行认证鉴权

阿里巴巴云原生

阿里云 微服务 云原生 网关

AIGC重塑金融:AI大模型驱动的金融变革与实践

EquatorCoco

人工智能 金融 AIGC

表单与二维码:如何使用表单中的填表人组件?

草料二维码

二维码 草料二维码

享道出行:容器弹性技术驱动下的智慧出行稳定性实践

阿里巴巴云原生

阿里云 云原生 容器弹性

春天集结!Milvus 老友汇 · 线下 Meetup 来啦!

Zilliz

开源社区 Meetup Milvus Zilliz

SD-WAN组网方案简述

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

引入了 Shiro 的项目请求路径中带有中文报错400 的问题

emanjusaka

Java shiro Error 400

Baseswap交易所的得力助手:Base链市值机器人

开发丨飞机丨 @aivenli

OpenAI 展示音频模型 Voice Engine;清明节前 AI 复活亲人成热门生意丨RTE 开发者日报 Vol.175

声网

DR9274-6GK|4T4RQCN6224 QCN9274 QCN6274 WiFi7 Lower Power Consumption Network Card

wallyslilly

QCN6224

Git常用命令大全:让你轻松驾驭版本控制

霍格沃兹测试开发学社

Flutter iOS上架指南

雪奈椰子

Python 代码混淆工具概述

新一代营销费用管理:覆盖线上线下营销渠道各链路多场景费用

赛博威科技

小redbook.item_get_video API是小红书平台提供的一种数据接口服务,其主要功能是为电商企业提供商品数据,以便进行商品分析、个性化推荐等。通过该API可以带来哪些价值

技术冰糖葫芦

API 接口

京东一面挂在了CAS算法的三大问题上,痛定思痛不做同一个知识点的小丑

不在线第一只蜗牛

Java 算法 JVM CAS

阿里1688布局跨境业务,瞄准海外代采

技术冰糖葫芦

API 接口

【干货】零售企业商品数字化管理措施探讨

第七在线

如何在Java中读取超过内存大小的文件

快乐非自愿限量之名

Java

三思多功能智慧综合杆助推上海杨浦区数智化升级

电子信息发烧客

网络钓鱼升级 Darcula如何窃取用户信息

郑州埃文科技

网络安全

SD-WAN支持的多种线路类型

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

C++/CX性能陷阱_.NET_Jonathan Allen_InfoQ精选文章