【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

LLVM 提议向 C 语言中加入模块机制

  • 2012-12-05
  • 本文字数:2096 字

    阅读完需:约 7 分钟

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

在今年 11 月的 LLVM 开发者大会上,来自 Apple 的 Doug Gregor 做了一场讲座,主题是向 C 语言中加入模块(Module)机制。讲座中提到:

长期以来,C 的预处理器就是程序员和工具的问题之源。写得不好的头文件致使宏污染和包含顺序等问题大量存在,程序员必须不断地与之斗争。为了缓解这些问题,开发者习惯上采用各种预处理器变通方案,比如 LONG_MACRO_PREFIXES 这种风格的很长的宏前缀,#include 防卫语句,或是临时使用#undef 来处理库中的宏。

另一方面,工具也必须能够处理重复解析相同头文件时所面对的内在可伸缩性问题,因为即便程序员并不希望,但不同的处理环境还是可能影响头文件的解释方式。

模块试图解决这一问题,它的理念是:隔离特定库的接口,并将其一次性编译为一种高效的、序列化的表示形式,当使用该库时,可以高效地导入,从而改进程序员的体验和编译过程的伸缩性。

该提议的基本前提是,作为一种加速编译并允许复用之前解析过的头文件的手段,即使编译最简单的文件,也要避免使用预处理器来包含大量头文件。在一个与“Hello World”同名的例子中,他强调到,一个包含 64 个字符的 C 程序经过预处理变成了 11 074 个字符,而一个包含 81 个字符的 C++ 程序预处理后变成了 1 161 033 个字符。他还指出,因为包含要依赖于预处理器当时的状态,所以重新解析头文件可能让程序很脆弱(比如,如果在 #include 之前使用#define FILE “myfile.txt”,预处理器会破坏头文件,从而导致构建失败)。

他的建议是使用一个新关键字 import 来加载模块。不同于预处理器的文本包含方式,编译器能够理解该模块是一个固定的版本,所以只解析一次。如果多次使用相同的模块,可以使用前面解析过的同一数据结构,不需要每次都重新解析。

模块也可以嵌套,这允许导入子模块;在所给的例子中,他演示了 std 模块中的子模块 stdio 可以使用 import std.stdio 来包含。导入模块之后,其中的所有公开 API 就都导入到客户代码中了,但非公开 API 是隐藏的。为了实现这种控制,模块需要声明哪些接口是公开的,哪些是非公开的,这可以利用 public 关键字:

复制代码
// stdio.c
export std.stdio:
public:
typedef struct {
} FILE;
int printf(const char*, …) {
}

请注意,在这个例子中,仅提供实现文件就可以了,不需要头文件。export 包含了模块的名字,这里就是 std.stdio。public 用于区分 API 的公开部分与非公开部分。这可以编译为库以及带有充分元数据的函数类型和宏,供客户代码使用。

当然,这只是对未来的一个建议,并非标准。那么这种方式应如何实现呢?建议使用头文件来处理现有模块的公开 API,并将模块定义为一组头文件:

复制代码
// /usr/include/module.map
module std {
module stdio { header "stdio.h" }
module stdlib { header "stdlib.h" }
module math { header "math.h" }
exclude header "assert.h"
}
module ClangAST {
umbrella "AST/AST.h"
module * { }
} // 可以使用“import ClangAST.Decl”来导入 AST/Decl.h

为便于以后生成模块(部分原因是方便 Objective-C 框架导出模块),“umbrella module”机制允许将一个目录下的一组头文件作为单个模块导出。

适于处理模块的编译器可以在头文件上利用单独的一遍(Pass)来构建模块,之后在随后的头文件中复用该模块的信息。(编译好的模块应采用什么格式尚未指定,可能交由具体的编译器定义。)模块中也可以加入附加的元信息,比如说明模块运行所需的库。这允许编译器处理每个模块所需的链接标记,从而避免了用户在链接时提供一大堆 -l 标记。

要使用模块,客户代码唯一需要修改的是将#include 替换为等价的 import。此外,因为在预处理后,模块中带有导出的函数和类型等信息,因此能够更好地进行编译诊断;利用这些信息,编译器报错和 IDE 快速修复等功能也能提示所需的 import,而不仅仅是直接失败。

最后,复用模块信息也允许将调试信息与模块关联起来,而非让这些信息重复出现在每个目标文件中。编译器和链接器就可以少生成一些调试信息,反过来又加速了编译过程。模块也为调试器提供了额外的类型信息(而不是将类型信息内联到每个目标文件中),因此调试器可以报告模块中定义的正确类型。

模块提议的净效应是,它提供了一种能够兼容现有工具的迁移途径,同时,在用户无需对原有代码进行多少修改的条件下,还带来了一些优点(主要是提升了编译速度,并改进了诊断错误消息和调试)。它也支持文件增量式升级,支持增量式地将单个预处理器指令切换为基于模块的导入机制。同时无需将编译速度测量当做模块表示的一部分,该工作已经在 LLVM 实现这些模块时进行了。虽然模块机制没有考虑版本或命名空间(很大程度上是因为必须满足向后兼容性),但该机制如果得以广泛应用的话,能够显著提升 C 和 C++ 程序的编译速度。此外,向后兼容性被明确提了出来,像 LLVM 的块(block)规范,当需要的时候很可能用于支持其他编译器或规范中的包含。不过,在广为使用的 C 和 C++ 编译器中,LLVM 编译器工具链是唯一的一个保持创新并以身作则的了。其他编译器是否会引入这些特性,可能取决于 LLVM 实现方案能否成功以及能够带来哪些益处。

查看英文原文 LLVM Proposes Adding Modules to C

2012-12-05 05:472688
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 131.7 次阅读, 收获喜欢 34 次。

关注

评论

发布
暂无评论
发现更多内容

牛掰plus!裸辞后集中Java面试,凭借一个技术套路了多个面试官

Java 程序员 后端

清华大牛纯手写2021年最新JVM调优实战手册,看完让你精通JVM调优

Java 程序员 后端

牺牲速度来节省内存,Redis是觉得自己太快了吗?,mysql破解版百度网盘

Java 程序员 后端

深入解析java虚拟机:垃圾回收,最大并发标记清除垃圾回收器

Java 程序员 后端

牛P牛P!Github上堪称2021最全、最新Java面试题库到底有多香

Java 程序员 后端

独家!就是看透这份“347页并发编程笔记(1),mysql使用入门教程

Java 程序员 后端

独家!就是看透这份“347页并发编程笔记,java开发实战经典第二版pdf下载

Java 程序员 后端

深入P8级别JAVA底层知识:你知道阿里P8需要掌握哪些技术吗?

Java 程序员 后端

炸裂!这份阿里P8大佬手写“Java核心技能精选,java笔试面试宝典

Java 程序员 后端

爆赞!腾讯T4大牛发布Java基础核心宝典,简直就是及时雨

Java 程序员 后端

一文了解「区块链桥」:区块链桥的工作方式及四种类型

CECBC

深入浅出!全面剖析Java反射-Reflection,java项目开发实战入门电子书百度云

Java 程序员 后端

深入浅出!带你重学Java—ArrayList,mongodb的存储原理

Java 程序员 后端

深入理解Java内存模型,小白也能看得懂!,限时发布

Java 程序员 后端

深入理解Java虚拟机之类加载机制篇,秋招java后端面试

Java 程序员 后端

深入理解静态代理与JDK动态代理,java编程技术基础周绍斌

Java 程序员 后端

牛皮了!一篇文章直接解决关于TCP的23种疑难问题!,springboot源码深度解析视频

Java 程序员 后端

玩转Git就这么简单!这些常用命令你确定都用过吗?,java多线程编程面试题

Java 程序员 后端

理解RabbitMQ中的AMQP-0-9-1模型,深入java虚拟机第三版百度网盘

Java 程序员 后端

淘系,60W年薪大牛!新肝出一份,细说JVM内存模型

Java 程序员 后端

爽,字节架构师DDD(领域驱动设计,Spring事务扩展机制

Java 程序员 后端

独家!Java开发专家P7岗必备的MySQL高级笔记及面试宝典,面试横竖绕不开MySQL

Java 程序员 后端

源码解析BeanUtils,Java开发还不会这些

Java 程序员 后端

牛批!阿里的Springboot笔记,果然值得我每天熬夜啃,全栈系统化的学习路线

Java 程序员 后端

032云原生之AIOps运维

穿过生命散发芬芳

云原生 10月月更

理解 MyBatis 是如何在 Spring 容器中初始化的,java上传视频

Java 程序员 后端

元宇宙将如何影响我们的投资、就业和生活方式?

CECBC

区块链让奢侈品的分销、溯源不再是难题

CECBC

模块二作业-微信朋友圈的高性能复杂度

无名

架构实战营 「架构实战营」

猴子都能懂的数据库避坑指南,还说你不会?,闭关在家37天“吃透”这份345页PDF

Java 程序员 后端

源码解析 HashMap 的线程安全问题,mysql索引左前缀原理

Java 程序员 后端

LLVM提议向C语言中加入模块机制_C++_Alex Blewitt_InfoQ精选文章