来 DTDS 全球数字人才发展峰会,与刘润、叶军、快刀青衣畅聊成长>> 了解详情
写点什么

从 NSObject 的初始化了解 isa

2019 年 12 月 10 日

从 NSObject 的初始化了解 isa

关注仓库,及时获得更新:iOS-Source-Code-Analyze


因为 ObjC 的 runtime 只能在 Mac OS 下才能编译,所以文章中的代码都是在 Mac OS,也就是 x86_64 架构下运行的,对于在 arm64 中运行的代码会特别说明。


如果你曾经对 ObjC 底层的实现有一定的了解,你应该会知道 Objective-C 对象都是 C 语言结构体,所有的对象都包含一个类型为 isa 的指针,那么你可能确实对 ObjC 的底层有所知,不过现在的 ObjC 对象的结构已经不是这样了。代替 isa 指针的是结构体 isa_t, 这个结构体中”包含”了当前对象指向的类的信息,这篇文章中会介绍一些关于这个变化的知识。


Objective-C


struct objc_object {    isa_t isa;};
复制代码


当 ObjC 为为一个对象分配内存,初始化实例变量后,在这些对象的实例变量的结构体中的第一个就是 isa



所有继承自 NSObject 的类实例化后的对象都会包含一个类型为 isa_t 的结构体。


从上图中可以看出,不只是实例会包含一个 isa 结构体,所有的也有这么一个 isa。在 ObjC 中 Class 的定义也是一个名为 objc_class 的结构体,如下:


Objective-C


struct objc_class : objc_object {    isa_t isa;    Class superclass;    cache_t cache;    class_data_bits_t bits;};
复制代码


由于 objc_class 结构体是继承自 objc_object 的,所以在这里显式地写出了 isa_t isa 这个成员变量。


isa 指针的作用与元类

到这里,我们就明白了:Objective-C 中类也是一个对象


这个 isa 包含了什么呢?回答这个问题之前,要引入了另一个概念 元类(meta class),我们先了解一些关于元类的信息。


因为在 Objective-C 中,对象的方法并没有存储于对象的结构体中(如果每一个对象都保存了自己能执行的方法,那么对内存的占用有极大的影响)。


实例方法被调用时,它要通过自己持有的 isa 来查找对应的类,然后在这里的 class_data_bits_t 结构体中查找对应方法的实现。同时,每一个 objc_class 也有一个指向自己的父类的指针 super_class 用来查找继承的方法。


关于如何在 class_data_bits_t 中查找对应方法会在之后的文章中讲到。这里只需要知道,它会在这个结构体中查找到对应方法的实现就可以了。



但是,这样就有一个问题,类方法的实现又是如何查找并且调用的呢?这时,就需要引入_元类_来保证无论是类还是对象都能通过相同的机制查找方法的实现



让每一个类的 isa 指向对应的元类,这样就达到了使类方法和实例方法的调用机制相同的目的:


  • 实例方法调用时,通过对象的 isa 在类中获取方法的实现

  • 类方法调用时,通过类的 isa 在元类中获取方法的实现


下面这张图介绍了对象,类与元类之间的关系,笔者认为已经觉得足够清晰了,所以不在赘述。



图片来自 objc_explain_Classes_and_metaclasses


有关与介绍类与元类之间的关系的文章实在是太多了,因为这篇文章主要介绍 isa,在这一小节只是对其作用以及元类的概念进行介绍。如果想要了解更多关于类与元类的信息,可以看 What is a meta-class in Objective-C?


结构体 isa_t

其实 isa_t 是一个定义得非常”奇怪”的结构体,在 ObjC 源代码中可以看到这样的定义:


Objective-C


#define ISA_MASK        0x00007ffffffffff8ULL#define ISA_MAGIC_MASK  0x001f800000000001ULL#define ISA_MAGIC_VALUE 0x001d800000000001ULL#define RC_ONE   (1ULL<<56)#define RC_HALF  (1ULL<<7)
union isa_t { isa_t() { } isa_t(uintptr_t value) : bits(value) { }
Class cls; uintptr_t bits;
struct { uintptr_t indexed : 1; uintptr_t has_assoc : 1; uintptr_t has_cxx_dtor : 1; uintptr_t shiftcls : 44; uintptr_t magic : 6; uintptr_t weakly_referenced : 1; uintptr_t deallocating : 1; uintptr_t has_sidetable_rc : 1; uintptr_t extra_rc : 8; };};
复制代码


这是在 __x86_64__ 上的实现,对于 iPhone5s 等架构为 __arm64__ 的设备上,具体结构体的实现和位数可能有些差别,不过这些字段都是存在的,可以看这里的 arm64 上结构体的实现


在本篇文章中, 我们会以 __x86_64__ 为例进行分析,而不会对两种架构下由于不同的内存布局方式导致的差异进行分析。在我看来,这个细节不会影响对 isa 指针的理解,不过还是要知道的。


笔者对这个 isa_t 的实现声明顺序有一些更改,更方便分析和理解。


Objective-C


union isa_t {    ...};
复制代码


isa_t 是一个 union 类型的结构体,对 union 不熟悉的读者可以看这个 stackoverflow 上的回答. 也就是说其中的 isa_tclsbits 还有结构体共用同一块地址空间。而 isa 总共会占据 64 位的内存空间(决定于其中的结构体)



Objective-C


struct {   uintptr_t indexed           : 1;   uintptr_t has_assoc         : 1;   uintptr_t has_cxx_dtor      : 1;   uintptr_t shiftcls          : 44;   uintptr_t magic             : 6;   uintptr_t weakly_referenced : 1;   uintptr_t deallocating      : 1;   uintptr_t has_sidetable_rc  : 1;   uintptr_t extra_rc          : 8;};
复制代码


isa 的初始化

我们可以通过 isa 初始化的方法 initIsa 来初步了解这 64 位的 bits 的作用:


Objective-C


inline voidobjc_object::initInstanceIsa(Class cls, bool hasCxxDtor){    initIsa(cls, true, hasCxxDtor);}
inline voidobjc_object::initIsa(Class cls, bool indexed, bool hasCxxDtor){ if (!indexed) { isa.cls = cls; } else { isa.bits = ISA_MAGIC_VALUE; isa.has_cxx_dtor = hasCxxDtor; isa.shiftcls = (uintptr_t)cls >> 3; }}
复制代码


indexedmagic

当我们对一个 ObjC 对象分配内存时,其方法调用栈中包含了上述的两个方法,这里关注的重点是 initIsa 方法,由于在 initInstanceIsa 方法中传入了 indexed = true,所以,我们简化一下这个方法的实现:


Objective-C


inline void objc_object::initIsa(Class cls, bool indexed, bool hasCxxDtor){    isa.bits = ISA_MAGIC_VALUE;    isa.has_cxx_dtor = hasCxxDtor;    isa.shiftcls = (uintptr_t)cls >> 3;}
复制代码


对整个 isa 的值 bits 进行设置,传入 ISA_MAGIC_VALUE


Objective-C


#define ISA_MAGIC_VALUE 0x001d800000000001ULL
复制代码


我们可以把它转换成二进制的数据,然后看一下哪些属性对应的位被这行代码初始化了(标记为红色):



从图中了解到,在使用 ISA_MAGIC_VALUE 设置 isa_t 结构体之后,实际上只是设置了 indexed 以及 magic 这两部分的值。


  • 其中 indexed 表示 isa_t 的类型

  • 0 表示 raw isa,也就是没有结构体的部分,访问对象的 isa 会直接返回一个指向 cls 的指针,也就是在 iPhone 迁移到 64 位系统之前时 isa 的类型。


       union isa_t {             isa_t() { }             isa_t(uintptr_t value) : bits(value) { }
Class cls; uintptr_t bits; };
复制代码


* 1 表示当前 `isa` 不是指针,但是其中也有 `cls` 的信息,只是其中**关于类的指针都是保存在 `shiftcls` 中**。
复制代码


       union isa_t {             isa_t() { }             isa_t(uintptr_t value) : bits(value) { }
Class cls; uintptr_t bits;
struct { uintptr_t indexed : 1; uintptr_t has_assoc : 1; uintptr_t has_cxx_dtor : 1; uintptr_t shiftcls : 44; uintptr_t magic : 6; uintptr_t weakly_referenced : 1; uintptr_t deallocating : 1; uintptr_t has_sidetable_rc : 1; uintptr_t extra_rc : 8; }; };
复制代码


  • magic 的值为 0x3b 用于调试器判断当前对象是真的对象还是没有初始化的空间


has_cxx_dtor

在设置 indexedmagic 值之后,会设置 isahas_cxx_dtor,这一位表示当前对象有 C++ 或者 ObjC 的析构器(destructor),如果没有析构器就会快速释放内存。


Objective-C


isa.has_cxx_dtor = hasCxxDtor;
复制代码



shiftcls

在为 indexedmagichas_cxx_dtor 设置之后,我们就要将当前对象对应的类指针存入 isa 结构体中了。


Objective-C


isa.shiftcls = (uintptr_t)cls >> 3;
复制代码


将当前地址右移三位的主要原因是用于将 Class 指针中无用的后三位清楚减小内存的消耗,因为类的指针要按照字节(8 bits)对齐内存,其指针后三位都是没有意义的 0

绝大多数机器的架构都是 byte-addressable 的,但是对象的内存地址必须对齐到字节的倍数,这样可以提高代码运行的性能,在 iPhone5s 中虚拟地址为 33 位,所以用于对齐的最后三位比特为 000,我们只会用其中的 30 位来表示对象的地址。


而 ObjC 中的类指针的地址后三位也为 0,在 _class_createInstanceFromZone 方法中打印了调用这个方法传入的类指针:



可以看到,这里打印出来的所有类指针十六进制地址的最后一位都为 8 或者 0。也就是说,类指针的后三位都为 0,所以,我们在上面存储 Class 指针时右移三位是没有问题的。


Objective-C


isa.shiftcls = (uintptr_t)cls >> 3;
复制代码


如果再尝试打印对象指针的话,会发现所有对象内存地址的后四位都是 0,说明 ObjC 在初始化内存时是以 16 个字节对齐的, 分配的内存地址后四位都是 0。



使用整个指针大小的内存来存储 isa 指针有些浪费,尤其在 64 位的 CPU 上。在 ARM64 运行的 iOS 只使用了 33 位作为指针(与结构体中的 33 位无关,Mac OS 上为 47 位),而剩下的 31 位用于其它目的。类的指针也同样根据字节对齐了,每一个类指针的地址都能够被 8 整除,也就是使最后 3 bits 为 0,为 isa 留下 34 位用于性能的优化。

Using an entire pointer-sized piece of memory for the isa pointer is a bit wasteful, especially on 64-bit CPUs which don’t use all 64 bits of a pointer. ARM64 running iOS currently uses only 33 bits of a pointer, leaving 31 bits for other purposes. Class pointers are also aligned, meaning that a class pointer is guaranteed to be divisible by 8, which frees up another three bits, leaving 34 bits of the isa available for other uses. Apple’s ARM64 runtime takes advantage of this for some great performance improvements.

from ARM64 and You


我尝试运行了下面的代码将 NSObject 的类指针和对象的 isa 打印出来,具体分析一下



object_pointer: 0000000001011101100000000000000100000000001110101110000011111001 // 补全至 64 位class_pointer:                                 100000000001110101110000011111000
复制代码


编译器对直接访问 isa 的操作会有警告,因为直接访问 isa 已经不会返回类指针了,这种行为已经被启用了,取而代之的是使用 ISA() 方法来获取类指针。


代码中的 object 对象的 isa 结构体中的内容是这样的:



其中红色的为类指针,与上面打印出的 [NSObject class] 指针右移三位的结果完全相同。这也就验证了我们之前对于初始化 isa 时对 initIsa 方法的分析是正确的。它设置了 indexedmagic 以及 shiftcls


ISA() 方法

因为我们使用结构体取代了原有的 isa 指针,所以要提供一个方法 ISA() 来返回类指针。


其中 ISA_MASK 是宏定义,这里通过掩码的方式获取类指针:


Objective-C


#define ISA_MASK 0x00007ffffffffff8ULLinline Classobjc_object::ISA(){    return (Class)(isa.bits & ISA_MASK);}
复制代码


其它 bits

isa_t 中,我们还有一些没有介绍的其它 bits,在这个小结就简单介绍下这些 bits 的作用


  • has_assoc

  • 对象含有或者曾经含有关联引用,没有关联引用的可以更快地释放内存

  • weakly_referenced

  • 对象被指向或者曾经指向一个 ARC 的弱变量,没有弱引用的对象可以更快释放

  • deallocating

  • 对象正在释放内存

  • has_sidetable_rc

  • 对象的引用计数太大了,存不下

  • extra_rc

  • 对象的引用计数超过 1,会存在这个这个里面,如果引用计数为 10,extra_rc 的值就为 9


Objective-C


struct {   uintptr_t indexed           : 1;   uintptr_t has_assoc         : 1;   uintptr_t has_cxx_dtor      : 1;   uintptr_t shiftcls          : 44;   uintptr_t magic             : 6;   uintptr_t weakly_referenced : 1;   uintptr_t deallocating      : 1;   uintptr_t has_sidetable_rc  : 1;   uintptr_t extra_rc          : 8;};
复制代码


arm64 架构中的 isa_t 结构体

Objective-C


#define ISA_MASK        0x0000000ffffffff8ULL#define ISA_MAGIC_MASK  0x000003f000000001ULL#define ISA_MAGIC_VALUE 0x000001a000000001ULL#define RC_ONE   (1ULL<<45)#define RC_HALF  (1ULL<<18)union isa_t {    isa_t() { }    isa_t(uintptr_t value) : bits(value) { }
Class cls; uintptr_t bits;
struct { uintptr_t indexed : 1; uintptr_t has_assoc : 1; uintptr_t has_cxx_dtor : 1; uintptr_t shiftcls : 33; uintptr_t magic : 6; uintptr_t weakly_referenced : 1; uintptr_t deallocating : 1; uintptr_t has_sidetable_rc : 1; uintptr_t extra_rc : 19; };};
复制代码


参考资料


关注仓库,及时获得更新:iOS-Source-Code-Analyze


转载请注明 Blog: Draveness


本文转载自 Draveness 技术博客。


原文链接:https://draveness.me/isa


2019 年 12 月 10 日 17:47155

评论

发布
暂无评论
发现更多内容

开设赌场的CTO | 法庭上的CTO(23)

赵新龙

CTO 法庭上的CTO

被砍伤的技术VP | 法庭上的CTO(24)

赵新龙

CTO 法庭上的CTO

全面 Severless 化只需要 7天!看南瓜电影的云上升级

阿里巴巴中间件

阿里巴巴 中间件

2020盘点之手机失窃事件复盘分析

石君

信息安全 资金安全 手机失窃

“让专业的人做专业的事”,畅捷通与阿里云的云原生故事

阿里巴巴中间件

云计算 云原生

阿里P8大牛亲自讲解!6年菜鸟开发面试字节跳动安卓研发岗,成功收获美团,小米安卓offer

欢喜学安卓

android 程序员 面试 移动开发

时空大数据与智能技术的时代共舞,百度地图给2020的答案

脑极体

Head First设计模式

田维常

小说内容理解

DataFunTalk

AI 推荐系统

阿里P8大牛亲自讲解!Android高级工程师面试实战,Android岗

欢喜学安卓

android 程序员 面试 移动开发

互联网大厂有哪些分库分表的思路和技巧?

冰河

分布式数据库 分库分表 分布式存储 数据一致性 数据同步

散布消极言论被开除的总监 | 法庭上的CTO(25)

赵新龙

CTO 法庭上的CTO

美团面试:为什么就能直接调用userMapper接口的方法?

田维常

美团

百分点智能对话技术探索实践

DataFunTalk

AI

腾讯T2手把手教你!字节跳动历年校招Android面试真题解析,含BATJM大厂

欢喜学安卓

android 程序员 面试 移动开发

盘点2020 | 2021,Begin Again !

大导演

前端进阶训练营 盘点2020

史上最全面‘java监听器’解读,读完就能用进项目

Java架构师迁哥

58同城风控平台演进

DataFunTalk

架构 中台

工具词典:中立观点

lidaobing

维基百科 28天写作

生产环境全链路压测建设历程 23:FAQ 3、4 适配改造,目标压力

数列科技杨德华

全链路压测 七日更

云原生架构-静态代码扫描SonarQube超时

云原生实验室

DevOps jenkins 云原生架构 SonarQube Pipeli

甲方日常 77

句子

工作 随笔杂谈 日常

十大经典排序算法最强总结(含Java、Python码实现)

云流

Java 面试 算法

网络模拟器:Cisco Packet Tracer 设备登陆实验

C语言编程:入门指南(一周内学懂)

计算机与AI

c

Serverless 在 SaaS 领域的最佳实践

阿里巴巴中间件

阿里巴巴 中间件

犯”集资诈骗罪“、二审判6年的CTO | 法庭上的CTO(21)

赵新龙

CTO 法庭上的CTO

五步带你探究爬虫爬取视频弹幕背后的真相,附爬虫实现源码

小Q

学习 编程 架构 面试 python 爬虫

我对2021的期待,从合上这份2020日历开始

脑极体

侵犯著作权、判刑两年半的 CTO |法庭上的CTO(22)

赵新龙

CTO 法庭上的CTO

天下武功,唯”拆“不破之架构篇二 | 技术人应知的创新思维模型 (9)

Alan

架构 技术 技术人应知的创新思维模型 七日更 28天写作

「中国技术开放日·长沙站」现场直播

「中国技术开放日·长沙站」现场直播

从 NSObject 的初始化了解 isa-InfoQ