阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

C++/CX 性能陷阱

  • 2013-10-30
  • 本文字数:3213 字

    阅读完需:约 11 分钟

使用 C++/CX 编写应用程序和编写正常的 C++ 应用程序不一样。纯 C++ 代码和 Windows 运行时(WinRT)之间的互操作性出奇的昂贵。基于 Sridhar Madhugiri 的视频 C++/CX 最佳实战中的内容,我们在本文中列举了一些在 Windows 8 开发中避免性能问题的方式。

边界

在应用程序的边界上会产生多种性能障碍。

数据转换就是其中的一个例子。考虑一下一个 Web 服务客户端和应用程序剩余部分之间的典型边界。大多数 Web 服务是使用 UTF-8 编码的,而大多数 Windows 应用程序的内部则是使用 UTF-16 编码的。在 Windows 中 UTF-16 编码是如此的流行以致于人们有时会将它错误地称为“Unicode”编码。数据转换的成本可能是确定的,也可能广泛变化,这依赖于它在数据本身中的特定值。

下一种性能消耗来自于类型转换。例如,你可能需要一个 wstring,但是却有一个 wchar_t *。尽管在内存中每种类型所包含的数据看起来是一样的,但是将这些内容从一个数据结构复制到另一个数据结构依然是有性能成本的。

最后一种性能消耗来自于数据复制操作。有时候你必须为边界处的数据复制付出代价,哪怕它们并不需要数据转换和类型转换。

我们为什么要在现在讨论这些内容呢?原因是 WinRT 本身就是应用程序和操作系统其余部分之间的边界。编写高性能 C++/CX 应用程序的本质就是识别边界并在可能的情况下避免跨越边界。

如果跨越 WinRT 边界的操作无法避免,那么就寻找一些方式减少数据复制、类型转换和数据转换操作的数量。例如,如果数据源和目标都使用 UTF-8 编码,那么就没必要将数据转换为 UTF-16,因为你最终还是需要将其再转换回来。

字符串

在大多数应用程序中字符串都是主要的数据类型。文件系统、Web 服务、UI、消息、符文和契约等领域对字符串的依赖性日益加深。不幸的是人们所使用的字符串类型非常多。

在内部,大多数应用程序可能会使用 std::wstring 或者 std::wchar_t*,你所依赖的大多数第三方类库也是如此。但是在与 WinRT 类库进行通信的时候你需要切换到 Platform::String^ 。每一次转换都需要一次内存分配和一次数据复制操作。

String^ 和本地 C++ 版本之间的一个关键区别是:String^ 是不可变的。WinRT 运行时对不可变字符串的这种强调可能来自于.NET 和 CLR。正如 ^ 符号所表示的,String^ 也是引用计数。

人们可能会对可变和不可变字符串相关的优点争论一整天,但是最终只有一个事实。因为 C++ 标准类库只理解可变字符串,而 WinRT 仅理解不可变字符串,所以对这两者你都必须进行处理。正如前面所提到的,这意味着需要对字符串进行复制。

类库作者:如果你正在构建一个一般用途的类库供他人使用,那么你应该考虑提供多个不同版本的 API,为每种字符串类型提供一个 API。这样你就不需要猜测 API 的使用者在调用类库的时候使用的是哪种字符串类型了。

很多基于字符串的操作实际上并不需要使用字符串,但是开发者宁可选择使用字符串迭代器。因为可变和不可变数据结构的迭代操作是一样的,你可以在使用常规 xxx_iterator( begin(string), end(string), …) 语法的字符串平台上直接创建 STL 样式的迭代器。

另外,首先要查找直接返回 wchar_t* 的 API,而不是将它封装成一个 wstring。如果你找到了这样的 API,那么你就能够通过数组中第一个元素的地址以及数组的长度创建一个新的 platform string。这样就不需要创建一个在匹配的 platform string 被创建之后立即就会被废弃的 wstring。

调用带有字符串引用( StringReference )类型输入参数的 WinRT API 时有一个小窍门。你可以向一个参数类型为 platform string 的 WinRT 函数传递一个 wchar_t* 或者 wstring 参数,这种情况下将创建一个轻量级外观。无论如何,这里有一些需要注意的地方。

  1. 字符串必须是空终止否则将会抛出一个错误。
  2. 如果字符串在函数之外的任何地方发生了变化,那么结果将无法确定。
  3. 如果函数之内有任何字符串的引用,那么无论如何都会生成一个完整副本。

上面的第 1 条内容很容易验证,第 2 条则仅会在碰见线程安全问题的时候发生。在大多数环境下这应该是一个非常有用的技巧。

类库作者:为了确保上面的方案是真实可能的,首先尽量避免让它引用你以 StringReference 参数的方式获取到的字符串。因为随后的引用并不会引入额外的复制,所以不要担心使用第二个引用。

集合

与 C++ 中常见的集合相比,WinRT 中的集合是非常昂贵的。和.NET 中可观察的集合一样,对 WinRT 集合的每一次修改都会产生一个通知。该通知主要用于 XAML 数据绑定以便于更新 UI。

在初始化期间避免这种损失的一种方式是,首先在堆栈上创建并填充一个标准的 vector,然后使用 move 函数初始化一个 platform vector。你能够这样做,因为标准的 vector 将会被销毁,同时它的动态内存无论如何都会被释放。

在更新很多元素的时候,考虑使用 ReplaceAll 方法。这仅会触发一个通知而不是每一条记录一个通知。在 WPF 和 Silverlight 中没有与之相对应的方法,因为这些 UI 堆栈本身不支持一次性插入或者移除多个条目。

WinRT 集合中的另一种性能消耗来自于元素的读取。WinRT 集合是以接口的形式暴露的,因此它们是虚的,这就意味着它们并不能像普通的函数那样被内联。此外,每一次读取都需要进行范围检查。所以如果你需要多次读取同一个值,考虑将它复制到一个局部变量中,不要每次都从集合中读取。实际上复制的缺点是,你必须复制值或者增加对象上的引用数,这是一个连锁操作。

完全避免这种消耗的一种方式是在迭代集合之前复制它。分配一个正确大小的局部 vector,然后在 ArrayReference 上使用 GetMany 函数。然后结合使用 ReplaceAll 方法,你就能够对集合进行几次迭代,仅需要跨越 WinRT 边界三次就能够做一系列复杂的修改。

WinRT 接口

和传统的 COM 一样,在 WinRT 中一个对象的成员仅会通过接口暴露。你永远都不可能直接访问对象。C++/CX 通过做必要的隐式转换对你隐藏了这些细节。这样做之所以必要的一个常见原因是,可以满足调用非默认接口上的方法时的需要。

WinRT 中的转换不是廉价的。它需要调用 QueryInterface 这个虚方法,同时有一个增加引用数的连锁操作。一旦完成了对非默认接口的调用,还需要另一个减少引用数的连锁操作。

类库作者:

确保类中所有的常用方法在默认接口上都是可用的,这样就不需要转换成另一个接口了。

如果要对同一个非默认接口进行多次调用,那么创建一个该接口类型的局部变量。这样仅需要执行一次转换,而不是每次方法调用时都做一次转换。

在任何可能的时候你都应该使用堆栈分配或者 unique_ptr 类。因为这样你将获得所有选项的最好性能。

在你确实需要一个复杂生命周期的时候,你的下一个选择是通过一个 shared_ptr 访问的普通 C++ 类。这种方式和上面选项之间的主要区别在于引用数开销。

你选择的最后一种手段应该是 ref 类。一个 ref 类拥有和 shared_ptr 相似的引用数语义,但是能够带来其他基于 WinRT 的开销。所以仅在需要将类传递到一个 WinRT 函数或者在 XAML 的数据绑定中使用 ref 类。

在使用 ref 类的时候,尽量保持较浅的继承层次。WinRT 继承和 C++ 继承不一样,它有额外的开销。

XAML 数据绑定

在 WinRT+XAML 数据绑定中你应该避免实现 INotifyPropertyChanged,除非你确实希望在属性被填充之后发生改变。同样的,不要暴露公共 set 函数,除非 UI 确实需要修改数据。

XAML 所调用的 get 函数应该是廉价的。不仅仅是因为它们是在 UI 线程上被调用的,还因为我们可能会调用它们多次。所以不要在 get 函数中分配内存或者执行昂贵的计算。

对于所有基于 XAML 的 UI(WPF、Silverlight、WinRT+XAML)而言,一点非常重要的建议是保持较浅的数据层次。绑定表达式中的每一个点都代表了一次属性改变事件,而为了保持屏幕及时更新数据绑定引擎必须监听这些事件。

关于作者

Jonathan Allen 从 2006 年开始就一直在为 InfoQ 编写新闻,现在是.NET 版块的首席编辑。如果你有兴趣为 InfoQ 撰写新闻或者教育性的文章,那么请联系他:jonathan@infoq.com.

查看英文原文 C++/CX Performance Pitfalls

2013-10-30 23:052874
用户头像

发布了 321 篇内容, 共 115.9 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

AntDB-M数据库锁分析,不要错过!

亚信AntDB数据库

数据库 AntDB 国产数据库 AntDB数据库 企业号 3 月 PK 榜

AI笔刷怎样导入?adobe ai笔刷安装教程

Rose

AI画笔 AI教程 Illustrator 2023 下载 AI中文版

Atlassian Server用户新选择 | 迁移到数据中心版前,您需要做这些准备(1)

龙智—DevSecOps解决方案

Atlassian Atlassian迁移 数据中心版 server版

PostgreSQL:psql 介绍

天翼云开发者社区

深入理解关键字volatile

小小怪下士

Java 程序员 volatile 关键字

ChatGPT4 高分通过数据库系统工程师(DBA)认证

NineData

数据库 dba GPT ChatGPT4 数据库系统工程师

学完阿里P8面试官推荐的Java高并发核心编程文档后终拿蚂蚁offer

程序知音

Java 并发编程 编程语言 高并发 java架构

共铸国云智领未来| 以数字林草之“笔” 绘就塞上江南新图景

天翼云开发者社区

Stepn跑鞋GMT系统开发(NFT链游)

薇電13242772558

NFT链游

Ascend CL两种数据预处理的方式:AIPP和DVPP

华为云开发者联盟

人工智能 华为云 昇腾CANN 华为云开发者联盟 企业号 3 月 PK 榜

听说火山引擎推出的DataLeap,已经可以支持万级表的数据血缘图谱了!

字节跳动数据平台

大数据 数据治理 数据研发 企业号 3 月 PK 榜

Neural Filters神经滤镜插件如何安装?PS神经滤镜插件安装教程

Rose

mac系统 Neural Filters PS滤镜插件 PS20221下载

Final Cut Pro资源库占用内存太大如何释放磁盘空间?

魔仙苹果mac堡

FCPX下载 fcpx Final Cut Pro空间不足 fcpx中文版

第四朵“云”!全托管的时序数据云平台 TDengine Cloud 正式支持阿里云

TDengine

大数据 tdengine 阿里云 时序数据库 云服务

代码质量与安全 | 免费的静态分析工具好吗?

龙智—DevSecOps解决方案

SAST 静态代码扫描 DAST

通通透透看无服务器计算:由来、场景和问题

天翼云开发者社区

Linux进程学习【进程地址】

Yohifo

Linux 学习 运维 后端 进程

优秀的录屏软件:Record It Pro 直装激活版

真大的脸盆

Mac Mac 软件 录屏 屏幕录制 录屏软件

HTML5智慧农业大棚Web3D可视化系统

2D3D前端可视化开发

智慧大棚 智慧农业 数字农业 大棚三维可视化 数字孪生智慧大棚

云计算搭上“双碳”,天翼云在绿色算力赛道加速跑

天翼云开发者社区

使用 Pixelmator Pro,打印出最完美的照片效果

魔仙苹果mac堡

Mac修图软件 Pixelmator Pro破解 Pixelmator Pro中文 Pixelmator Pro下载

专场直播预约 | 邀您探讨KaiwuDB 离散制造业场景解决方案

墨天轮

数据库 解决方案 制造业 国产数据库 KaiwuDB

大语言模型必将取代一切?暂时不会!

深数

人工智能 科技 AGI GPT LLM

解决苹果无线鼠标、键盘或触控板无法被 Mac 识别的方法

魔仙苹果mac堡

mac系统 苹果无线鼠标 触控板 无法被mac识别

SwitchResX for mac自定义分辨率时遇到的问题汇总

魔仙苹果mac堡

Mac软件 电脑分辨率 SwitchResX下载 SwitchResX常见问题

大语言模型(LLMs)和新兴机器学习技术栈

Baihai IDP

人工智能 自然语言处理 NLP 大模型 大模型 白海科技

开启一个A/B实验到底有多简单?

字节跳动数据平台

云服务 AB testing实战 ab测试 企业号 3 月 PK 榜

简单小巧的右键助手:MouseBoost for Mac让您的工作效率大幅度提高

Rose

mac效率工具 右键助手 MouseBoost激活版

全球掀起AI热,天翼云智算能力已就绪!

天翼云开发者社区

盘活存储资源,天翼云HBlock助力企业绿色高效发展!

天翼云开发者社区

Perforce研讨会回顾 | Helix Core在芯片行业的应用实例:芯片项目的版本控制、持续集成及自动化

龙智—DevSecOps解决方案

ci cicd 版本控制 持续集成 芯片开发

C++/CX性能陷阱_.NET_Jonathan Allen_InfoQ精选文章