写点什么

高性能的.NET 不可变数组

  • 2013-07-05
  • 本文字数:1401 字

    阅读完需:约 5 分钟

最新发布的.NET不可变集合中包含了 ImmutableArray,一种在只读、索引化的场景中比 ImmutableList更快速的选择。ImmutableList在设计时选择了一种平衡的方案。由于其复杂的内部结构,添加新项只能是 O(log n) 的操作。同样,通过索引读取某项也要耗费 O(log n) 的时间。

ImmutableArray则没有这么复杂。它只是一个包装了数组的结构。用 ildasm 可以看到,它不包含任何其他字段。这意味着从不可变数组中读取只需要 O(1) 的时间。相反,向不可变数组添加一项则需要对实际数组进行完全拷贝,为 O(n) 操作。

Immo Landwerth 提出了以下建议:

使用不可变数组的理由:

  • 极少更新数据,并且元素数量很小(小于 16)
  • 对迭代数据的性能要求很高
  • 有很多不可变集合的实例,并且无法负担将它们全放在树中的开销。

仍然使用不可变列表的理由:

  • 更新数据比较常见,或者元素数量预计不会太小
  • 对更新集合的性能要求比迭代要高

作为一个值类型,ImmutableArray在创建时不需要显式初始化。此时,结构将检测到内部空指针,其行为就像是长度为 0 的数组。

重大改变

不可变集合正处于开发过程中,重大变更时有发生。这一次,我们看到 Create(IEnumerable items) 函数更名为“From”。

Immo 写到,

我们发现接受 IEnumerable参数的重载可能会产生意想不到的结果。你可能认为要通过其他集合创建集合可以使用接受 IEnumerable参数的重载:

但你最终创建的是 ImmutableList<List> 而不是 Immutable,这是因为在进行重载决策时,参数重载的优先级要高于从 List到 IEnumerable的隐式转换。

因此我们决定将所有操作 IEnumerable的工厂方法改名为 From,以消除这种歧义。

最初的 IImmutableList包含一个 ValueComparer 属性,并匹配 WithComparer 方法。为了让 ImmutableArray保持为一个简单的包装器,就有必要在 IImmutableList接口中移除它们。

扩展方法 GetValueOrDefault 曾经接受一个 IDictionary<TKey, TValue> 或 IReadOnlyDictionary<TKey, TValue>。如果实际的类同时实现了这两个接口就会引起编译器错误,因此用只接受 IImmutableDictaionary<TKey, TValue> 的版本进行了替换。

其他改变

IImmutableSet新增了 TryGetValue 方法。如果使用了比较器如 StringComparer.OrdinalIgnoreCase,并且想得到集中的实际值而不仅仅是判断是否存在等价的元素时,就需要使用该方法了。

不可变集合仍然是预览版,并且不允许在生产中使用。它们目前可用于.NET 4.5、Windows Store、Windows Phone 8 和 Portable Class Library。

数组的性能

Jon Skeet 最近测试了数组的性能并发现了一些有趣的结果。用包装器包装数组竟然可以使它们能够更快地写入。对一个包含 100 项的数组进行 1 亿次写入,字符串数组用了 40.865 秒,而包装的字符数组只用了 29.338 秒。读取速度两者差不多,字符数组用了 12 秒,包装的数组用了 11.843 秒。

其原因要追溯到 Java 了。Java 的数组是协变的,也就是说可以将一个 String[] 传递给任何期望 Object[] 的参数或变量。.NET 的运行时 CLR 要设计为支持 Java,所以也支持协变数组。因此在每次写入数组时 CLR 都需要执行一次类型检查。

Jon Skeet 的数组包装器与我们上面提到的 ImmutableArray 中使用的并不相同。它在内部对数组中的每一项使用了基于结构的包装器。由于它只是一个包含了指针的结构,因此并不比数组中存储的普通引用耗费更多的空间。但其设计可以使 CLR 的 JIT 编译器忽略类型检查。

查看英文原文 High Performance Immutable Arrays in .NET

2013-07-05 06:122757
用户头像

发布了 59 篇内容, 共 26.5 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

YashanDB数据库在金融行业中的关键应用与安全保障

数据库砖家

YashanDB数据库在零售行业数据分析的核心优势

数据库砖家

YashanDB数据库在物联网数据处理中的优势

数据库砖家

YashanDB数据库在线支持与资源的获取方式

数据库砖家

YashanDB是一种新兴的数据库管理系统

数据库砖家

YashanDB数据库在医疗行业数据合规中的关键作用

数据库砖家

谈谈Vibe编程(氛围编程)

周末程序猿

大模型 vibe coding

为什么应该测试无JavaScript的页面体验

qife122

JavaScript 渐进增强

无学历如何成为程序员

码界行者

程序员‘

YashanDB数据库在金融行业的数据安全应用分析

数据库砖家

YashanDB数据库在能源行业管理平台的应用前景

数据库砖家

YashanDB 可能对社交媒体平台带来影响

数据库砖家

华金证券再次携手非凸科技,共话AI时代数智交易新生态

非凸科技

YashanDB 零售行业的关键应用

数据库砖家

YashanDB数据库在医疗行业中的应用前景

数据库砖家

YashanDB数据库在游戏行业中的性能优化策略

数据库砖家

YashanDB数据库在数据湖中的角色与功能

数据库砖家

YashanDB数据库在云环境中的部署与管理技巧

数据库砖家

第一个运行起来的 Shader

Miracle

YashanDB数据库在人工智能项目中的应用分析

数据库砖家

YashanDB数据库在云环境中的应用效率探讨

数据库砖家

制造业碳足迹追踪:开源能源管理系统如何助力企业实现“碳数据可视化”?

开源能源管理系统

开源 开源能源管理系统

别再靠 “关设备” 减碳!EMS 的 “预测性控能”,让企业满产也能达标双碳

开源能源管理系统

开源 开源能源管理系统

C/C++ 内存问题排查太难?这场直播教你“快、准、狠”

TDengine

tdengine 时序数据库

YashanDB数据库在医疗行业的应用实例与优势

数据库砖家

第一个 Shader 完成!

Miracle

上下文为核心瓶颈!枫清科技如何攻克企业AI应用跨部门协作难题?

Fabarta

人工智能 AI Agent

舆情监测中的海外社交媒体监控实战

沃观Wovision

MyEMS 深度解析:核心功能模块、数据流转逻辑与工业能源优化落地路径

开源能源管理系统

开源 开源能源管理系统

YashanDB数据库在物联网数据管理中的创新应用

数据库砖家

YashanDB数据库在零售行业的转型应用

数据库砖家

高性能的.NET不可变数组_.NET_Jonathan Allen_InfoQ精选文章