【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

.NET 4.6 中的性能改进

  • 2015-07-23
  • 本文字数:1782 字

    阅读完需:约 6 分钟

.NET 4.6 中带来了一些与性能改进相关的 CLR 特性,这些特性中有一部分将会自动生效,而另外一些特性,例如 SIMD 与异步本地存储(Async Local Storage)则需要对编写应用的方式进行某些改动。

SIMD

Mono 团队一直以他们对 SIMD,即单指令流多数据流特性的支持引以为傲。SIMD 是一种 CPU 指令集,它能够在同一时间对最多 8 个值进行同一操作。而随着.NET CLR 版本 4.6 的推出,Windows 开发者终于也能够使用这一特性了。

为了实际观察一下 SIMD 的效果,可以参考一下这个示例。假设你需要通过 c[i] = a[i] + b[i] 这种形式对两个数组进行相加,以得到第三个数组。通过使用 SIMD,你可以按照以下方式编写代码:

复制代码
for (int i = 0; i < size; i += Vector<int>.Count)
{
Vector<int> v = new Vector<int>(A,i) + new Vector<int>(B,i);
v.CopyTo(C,i);
}</int></int></int></int>

请注意这个循环是如何按 Vector.Count 的取值进行递增的,根据 CPU 类型的不同,它的取值可能是 4 或是 8。.NET JIT 编译器将根据 CPU 的不同生成相应的代码,以 4 或 8 的值对数组进行批量相加。

这种方式看起来有些繁琐,因此微软还提供了一系列辅助类,包括:

程序集卸载

恐怕大多数开发者都不知道这一点:.NET 经常会对同一个程序集加载两次。发生这种情况的条件是.NET 首先加载了某个程序集的 IL 版本,随后又加载了同一程序集的 NGEN 版本(即预编译版本)。这种方式对于物理内存来说是相当严重的浪费,尤其是对诸如 Visual Studio 这样的大型 32 位应用程序来说更为明显。

而在.NET 4.6 中,一旦 CLR 加载了某个程序集的 NGEN 版本,它会自动清空对应的 IL 版本所占用的内存。

垃圾回收

早先我们曾讨论过.NET 4.0 中所引入的垃圾回收滞后时间模式,虽然这种方式比起让GC 完全停止一段时间的做法要可靠许多,但对于许多GC 场景来说,这种方式仍算不上完整。

在.NET 4.6 中,你将能够通过一种更精密的方式临时中止垃圾回收器的运作,新的 TryStartNoGCRegion 方法允许你指定在小对象以及大对象的堆中需要多少内存。

如果出现内存不足的情况,运行时将会返回 false,或是停止运行,直到通过 GC 清理得到足够的内存为止。你可以通过为 TryStartNoGCRegion 传入某个标记的方式控制这一行为,如果你成功地进入了某个无 GC 区域(在过程结束前不允许进行 GC),那么在过程结束时必须调用 EndNoGCRegion 方法。

在官方文档中并没有说明该方法是否是线程安全的,不过考虑到 GC 的工作原理,你应当尽量避免让两个进程同时尝试改变 GC 状态的做法。

对于 GC 的另一项改进是它处理 pinned 对象(即一旦分配后不可移动位置的对象)的方式。虽然在文档中对此方面的描述有些语焉不详,但当你固定了某个对象的位置时,通常也会固定其相邻对象的位置。 Rich Lander 在文中写道:

GC 将以一种更优化的方式处理 pinned 对象,因此 GC 能够将 pinned 对象周围的内存进行更有效地压缩。对于大量使用 pin 方式的大规模应用来说,这一改动将极大地改进应用的性能。

GC 对于如何使用较早的几代中的内存方面也体现出更好的智能性,Rich 继续写道:

第 1 代对象升级为第 2 代对象的方式也得到了改进,以更有效地使用内存。在为某一代分配新的内存空间之前,GC 会先尝试使用可用的空间。同时,在利用可用空间区域创建对象时使用了新的算法,使新分配的空间大小比起从前更接近于对象的大小。

异步本地存储

最后一项改进与性能并没有直接的关系,但通过有效的利用仍然能达到优化的效果。在异步 API 还没有流行起来的年代,开发者可以利用线程本地存储(TLS)缓存信息。TLS 对于某个特定的线程来说就像是一种全局对象,这意味着你可以直接访问上下文信息并进行缓存,而无需显式地传递某种上下文对象。

而在 async/await 模式中,线程本地存储就变得毫无用武之地了。因为每次调用 await 的时候,都有可能跳转至另一个线程。而且即便侥幸避开了这种情况,但其它代码也有可能跳转到你的线程中并干扰 TLS 中的信息。

新版本的.NET 引入了异步本地存储(ALS)机制以解决这一问题,ALS 在语义上等价于线程本地存储,但它能够随着 await 的调用进行相应的跳转。这一功能将通过 AsyncLocal 泛型类实现,其内部将调用 CallContext 对象用于保存数据。

查看英文原文 Performance Improves in .NET 4.6

2015-07-23 10:173461
用户头像

发布了 428 篇内容, 共 171.5 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

实时湖仓技术选型,企业如何借实时湖仓赢在“数据驱动”时代

袋鼠云数栈

大数据 数据湖 湖仓一体 实时湖仓

DxO PureRAW for Mac v3.8.0中文激活版(RAW照片处理器)

影影绰绰一往直前

Fine-Tuning: 精调大模型训练的关键步骤

百度开发者中心

大模型

人工智能与测试开发自动化沙龙(PPT和回放集锦)

霍格沃兹测试开发学社

淘宝商品评论数据接口(Taobao.item_review)

tbapi

淘宝API接口 淘宝商品评论接口 天猫商品评论接口 淘宝评论内容接口 天猫评论内容接口

喜讯!云起无垠斩获“东升杯”国际创业大赛“优秀奖”

云起无垠

GLTF/GLB模型在线预览、编辑、动画查看以及材质修改

3D建模设计

3D渲染 材质纹理贴图 3D材质编辑

WonderPen妙笔 for Mac v2.4.2中文激活版

影影绰绰一往直前

大模型微调:适应新任务的强大工具

百度开发者中心

深度学习 大模型 Prompt

软件测试/测试开发|测试开发线下高薪私教班助力你的职场晋升

霍格沃兹测试开发学社

如何将 Python 项目打包成 exe,另带卸载功能!

北桥苏

Python GUI pyinstaller tkinter Inno Setup Compiler

软件测试/测试开发丨名企私教服务加盟全栈开发与自动化测试班

测试人

人工智能 软件测试

软件测试/测试开发 | 测试开发线下高薪私教班助力你的职场晋升

测试人

人工智能 软件测试

DxO PhotoLab 6 for Mac v6.12.0.62激活版

影影绰绰一往直前

ApeCoin DAO猿岛质押游戏系统开发:APE开岛屿-质押藏宝箱获得代币

l8l259l3365

IPQ6010 vs. IPQ4019: The battle of Qualcomm chips and WIFI 6 vs WIFI 5

wallysSK

法线贴图实现地形模型皱褶、凹凸不平的纹理效果

3D建模设计

3D渲染 材质纹理贴图

Unclutter for mac v2.2.5中文激活版

影影绰绰一往直前

如何优化 RAG 系统的性能表现?10 条实用策略

Baihai IDP

深度学习 程序员 AI 白海科技 rag

未来LED小间距显示屏竞争的焦点在哪里

Dylan

中国 产业‘’ LED LED显示屏 市场

In-depth comparison of QCN9074, QCN9024 and QCN9274 Qualcomm Wi-Fi chip families

wallysSK

LLAMA预训练:大模型的潜力与挑战

百度开发者中心

人工智能 深度学习 大模型

得物商家域精准测试实践

得物技术

测试

一键生成PPT!让AI成为您的最佳帮手!

飞桨PaddlePaddle

人工智能 深度学习 PPT

百度搜索创新大赛,一场2800人的技术狂欢

百度Geek说

人工智能 企业号12月PK榜 百度搜索技术大赛

《环太平洋》流浪者机甲3D模型特效还原

3D建模设计

3D渲染 材质纹理贴图 3D材质编辑

瑶池数据库Serverless+AI训练营开营啦,参营享千元好礼

阿里云瑶池数据库

数据库 Serverless 阿里云; 阿里云瑶池数据库

开放原子开发者大会 | 开源就是国际化,华为大力推动开源社区建设

新消费日报

VideoPad Video Editor for Mac v13.81注册激活版

影影绰绰一往直前

科学启智,AI赋能:AI for Science塑造多学科研究新范式

飞桨PaddlePaddle

人工智能 开发者 AI for Science WAVE SUMMIT

法线贴图实现衣服上皱褶特效

3D建模设计

3D渲染 材质纹理体贴 3D材质编辑

.NET 4.6中的性能改进_.NET_Jonathan Allen_InfoQ精选文章