PHP代码中Foreach结构随处可见，我们在使用时，是否了解其行为呢？我们这篇文章通过一些例子来分析下Foreach结构的内存行为。如果你想了解PHP内存相关的内容，不妨把这篇文章作为一个参考。

问题

我们在写代码时经常会有这样的场景：遍历数组，对每个元素进行操作。一般这样的代码有两种写法：

$arr = [‘a’,‘b’,‘c’,‘d’];

非引用方式:

foreach($arras$key => $value) {

$arr[$key] = $value . $value;

}

引用方式:

foreach($arras &$item) {

$item = $item . $item;

}

对此，老司机们建议我们采用非引用方式，主要原因是变量的作用域。下面我们来看一个具体案例。

变量作用域

老司机们建议我们：在使用引用方式去遍历数组时，最好遍历结束后显式地unset掉该引用。原因是变量的作用域是整个函数，如果不unset掉该引用，在这个函数内其他地方操作这个引用时会引起冲突。下面我们来看这段代码：

$arr = [‘a’,‘b’,‘c’,‘d’];

foreach($arras &$item) {

$item = $item . $item;

}

foreach($arras$item) {

var_dump($item);

}

var_dump($item);

结果为：

string(2)“aa”

string(2)“bb”

string(2)“cc”

string(2)“dd”

string(2)“aa”

string(2)“bb”

string(2)“cc”

string(2)“cc”

string(2)“cc”

第一次的遍历打印了aa,bb,cc,dd比较容易理解，但是第一次遍历完成后$item保留下来了，而且指向$arr的最后一个元素。这样在第二次循环中，实际的行为是将$arr的每个元素依次赋值给了$item。具体的行为是：

第一次：’aa’ => $item $arr = [‘aa’, ‘bb’, ‘cc’, ‘aa’]

第二次：’bb’ => $item $arr = [‘aa’, ‘bb’, ‘cc’, ‘bb’]

第三次：’cc’ => $item $arr = [‘aa’, ‘bb’, ‘cc’, ‘cc’]

第四次：’cc’ => $item $arr = ‘aa’, ‘bb’, ‘cc’, ‘cc’]

最后$item指向的值是’cc’，用xdebug_debug_zval方法可以看到每个元素的引用情况，大家可以自行验证。

内存消耗

变量作用域相对比较容易理解，因为如果操作不当，我们容易从代码行为看到问题。除了变量作用域，我们还可以从内存行为去分析二者的差异。在开始行为分析之前，我们需要了解Array的内存结构。

Array内存结构

注：以下代码都是基于(PHP5.5.38，64位centos系统)

我们从最简单的问题开始，创建长度为1M的长整数Array，占用的内存是多少呢？我们首先想到的是长整型的长度是8字节，那么1M个长整型数字当然是8MB。然而，在PHP中却不是8MB。先看代码:

$mem_start = memory_get_usage();

$arr = range(0,(1<<20) - 1);

$mem_end = memory_get_usage();

var_dump(($mem_end - $mem_start)/1024/1024);

结果是: float(144.00043487549)

注：这里计算的是Array实际占用内存，不包含已分配但是没有被占用的内存，详情参考memory_get_usage的文档。

为什么是144MB而不是8MB呢？我们要从Array的结构入手开始分析。

哈希表

PHP的Array是基于哈希表实现的，那么哈希表长什么样呢？先看下面这张图（参考zend_hash.h）

关于哈希表的定义，请参zend_hash.h(55-84行)，对于哈希表，我们需要记住以下几点：

nTableSize指的是哈希表的长度，范围是8到1 << 31，当如果进行一次操作后发现元素个数大于nTableSize，长度会变为nTableSize * 2。• nNumOfElements指的是哈希表里面实际存储了多少元素，count方法使用的就是这个字段(zend_hash.c:1053-1058行)。
pInternalPointer是用来做内部遍历用，指向当前的元素，reset()，current()，prev()，next()，foreach()， end()等方法会修改这个指针。
pListHead和pListTail指向的是内部元素的头指针和尾指针，只有当HashTable的结构发生变化时这两个指针才会发生变化。
arBuckets指向存储元素(Bucket)的数组，里面存储的是指向Bucket的指针。

在PHP中，每个Array其实就是一个哈希表!

Bucket

typedefstruct bucket {

ulong h; //实际的哈希值，如果key是int类型的，那么hash就是key

uint nKeyLength; //key的长度(string类型的key时才有用)

void *pData; //指向data的指针

void *pDataPtr; //当data是指针类型时，为了避免内存碎片，直接将data存放到这里

struct bucket *pListNext; //剩下几个是bucket指针

struct bucket *pListLast;

struct bucket *pNext;

struct bucket *pLast;

constchar *arKey; //key值(string类型的才有用)

} Bucket;

关于Bucket，我们需要理解以下内容：

Bucket存储的是结构而不是实际的值，相当于在哈希表和实际值之间的映射关系。通过哈希运算，我们先找到对应的Bucket，然后再从Bucket里面找到指向实际值的指针(pData)，最后一步取出实际的值。
Bucket的大小是ulong(8)+uint(4)+指针(8*7) =68byte，加上对齐，所以实际是72byte。
通过对Bucket结构的分析我们知道：每个Bucket只能存储一个Array元素。

zval

PHP中存储值的最基本元素就是zval。在看zval之前，我们先看zvalue。zvalue定义如下(参考zend.h 321-330行)：

typedefunion _zvalue_value {

long lval; /*long value */

double dval; /*double value */

struct {

char *val;

int len;

} str;

HashTable *ht; /*hash table value */

zend_object_value obj;

} zvalue_value;

这是C语言里面的union类型，外部可以通过不同属性获取不同类型。zvalue->lval拿到的是long类型，zvalue->ht拿到的是指向哈希表的指针。
这个zvalue结构占用的空间是max(long, double, struct, pointer, zend_object_value)=max(8, 8, 12,8, 12)，加上对齐，实际占用16byte。(注：zend_object_value长度是12byte)

我们再看zval的定义(zend.h 332-338行)。

struct _zval_struct {

/* Variable information */

zvalue_value value; /* value */

zend_uint refcount__gc;

zend_uchar type; /* active type */

zend_uchar is_ref__gc;

};

我们看到除了zvalue，zval中还包含了GC(Garbage Collection)的内容：比如说被引用次数refcount_gc，是否被引用is_ref_gc，所以总的大小是：16+4+1+1=22byte，对齐之后是24byte。

PHP5.3之后，对于循环引用引入了新的垃圾回收机制。这里先不介绍GC的细节(参考GC)，只是要说明引入GC增加了实际存储的空间。（参考zend_gc.h 91-97行）

typedefstruct _zval_gc_info {

zval z;

union {

gc_root_buffer *buffered;

struct _zval_gc_info *next

} u;

} zval_gc_info;

还是老套路，union的实际大小是max(pointer, pointer) = max(8, 8) = 8 byte，所以包装好的zval_gc_info实际是32byte。

这还不够。

C/C++是自己管理内存的。为了让用户不直接管理内存，PHP在内核中加入了MM(Memory Management)模块。具体来讲就是为每个经MM分配的内容增加了一个zend_mm_block。关于内存分配，这里先略过。我们先来看zend_mm_block的结构(参考zend_alloc.c 336-342, 366-377行)。

typedefstruct _zend_mm_block_info {

#ifZEND_MM_COOKIES



size_t _cookie;

#endif
    size_t _size;
    size_t _prev;
} zend_mm_block_info;

typedefstruct _zend_mm_block {
    zend_mm_block_info info;
#ifZEND_DEBUG
    unsignedint magic;
# ifdef ZTS
    THREAD_T thread_id;
# endif
    zend_mm_debug_info debug;
#elifZEND_MM_HEAP_PROTECTION
    zend_mm_debug_info debug;
#endif
} zend_mm_block;

这个结构的大小受很多编译参数的影响，最小是zend_mm_block_info，也就是两个size_t的长度，共16byte。其他的编译参数在我的测试机上面没有开启，这里也暂不讨论。

所以，综合以上的分析，我们可以画出Array每个元素的结构：

通过上面的分析，我们可以看到在64位操作系统中，Array的每个元素实际上是要占用144字节的，所以在文章最开始问题解决了：1M的Array实际占用了144MB。

Foreach内存行为

那么，第二个问题来了，如果将这1M的Array每个元素存储两次，那么消耗的空间会是288M么？看代码：

$count = 0;
$arr = array();
$mem_start = memory_get_usage();
while($count < (1<<20)){
    $arr[] = $count;
    $arr[] = $count;
    $count += 1;
}
$mem_end = memory_get_usage();
var_dump(($mem_end - $mem_start)/1024/1024);

结果是：float(240.00015258789)

奇怪的是内存并不是288M，而是240M。根据我们对PHP的理解，对于相同的zval，PHP进行了复用，复用的结果仅仅是对该zval的ref_count加1。用xdebug_debug_zval分析，我们看到：

arr: (refcount=1, is_ref=0)=array (0 => (refcount=2, is_ref=0)=0, …)
对于每个zval，refcount=2。arr作为一个单独的zval，refcount=1。所以在这个例子中，Array的结构被复制了两份，zval没有发生复制，所以占用的内存是96M+144M=240M。

咦，好像还漏了一个问题，当Array的元素增长时，我们不是说过哈希表的长度是指数增长的么？我们再看一个例子：

$count = 0;
$arr = array();
$start = memory_get_usage();
while($count < (1<<5)) {
    $arr[] = $count;
    $count += 1;
    var_dump(memory_get_usage() - $start);
}

结果如下：

1 int(280) 9 int(1464) 17 int(2680) 25 int(3768)
2 int(448) 10 int(1600) 18 int(2816) 26 int(3904)
3 int(584) 11 int(1736) 19 int(2952) 27 int(4040)
4 int(720) 12 int(1872) 20 int(3088) 28 int(4176)
5 int(856) 13 int(2008) 21 int(3224) 29 int(4312)
6 int(992) 14 int(2144) 22 int(3360) 30 int(4448)
7 int(1128) 15 int(2280) 23 int(3496) 31 int(4584)
8 int(1264) 16 int(2416) 24 int(3632) 32 int(4720)

第一行和第二行我们可以忽略，因为最开始有些初始化的内容，我们不做讨论。我们重点关注3->7，8->9，10->15，16->17，18->32。我们看到3->7，10->15，18->32中间的数值是等差数列，差值是136byte。8->9的差别是200 = 136 + 88，16->17的差别是264 = 136 + 816。我们知道，哈希表的默认长度是8。当长度从8增长到9时，长度变为16，从16增长到17时，长度变为32。然而在这个过程中并没有为每个元素都申请96字节的bucket，而是将哈希表的arBuckets增加两倍，因为arBuckets里面存放的是指向bucket的指针(8byte)，所以每次Array增长时实际增加的大小是8byte*增长的长度。136byte=72+16+48。

回过头来，foreach过程中的内存行为是什么样子的呢？

我们分两种情况来讨论内存使用：1，只读；2，读写。我们来看个例子：

$arr = range(0,(1<<5) - 1);
code1:
$start = memory_get_usage();
foreach($arras$k => $v){
var_dump(memory_get_usage() - $start);
}
code2:
$start = memory_get_usage();
foreach($arras$k => &$v){
var_dump(memory_get_usage() - $start);
}

结果是两段代码输出是一样的，迭代过程中消耗的内存都是常量，说明迭代过程中的内存开销仅仅是迭代类和变量的开销。

当有写的情况是什么样子呢？再看个例子：

$arr = range(0,(1<<4) - 1);
code1:
$start = memory_get_usage();
foreach($arras$k => $v){
    var_dump(memory_get_usage() - $start);
    $arr[$k] = $v * 2;
}
var_dump(memory_get_usage() - $start);

code2:
$start = memory_get_usage();
foreach($arras$k => &$v){
    var_dump(memory_get_usage() - $start);
    $v = $v * 2;
}

code2同上面只读，内存增加仍旧是常量。
code1内存增长如下：
1 int(384) 5 int(2296) 9 int(2488) 13 int(2680)
2 int(2152) 6 int(2344) 10 int(2536) 14 int(2728)
3 int(2200) 7 int(2392) 11 int(2584) 15 int(2776)
4 int(2248) 8 int(2440) 12 int(2632) 16 int(2824)
17 int(448)

第一行是增加了迭代类和变量，可以理解。关键是第二行，我们看到突然增加到2152个字节，这个内存增加比较大。我可以假定这个地方复制了Array的结构。

我们再看后面的行数基本上每行都增加48字节，好熟悉有没有，分明是后面每次改变Array的值的时候增加了一个zval的大小。所以我们是否可以推测第二行增加是因为复制了Array的结构部分，也就是所有的Bucket。

这个例子我们看不出太大的规律，但是将Array增长为1M或者更大时，我们可以看到这个地方的内存增加确实是拷贝了所有的Bucket。值得注意的是最后一行，当迭代结束后，我们看到内存使用变得很小，说明迭代结束后没用的内存被释放掉了，也就是说原来Array的Buckets和zval全都被释放，因为已经没有地方引用它们了。

上面两个例子是我们最常见的例子，我们看一些复杂的例子，还是只读：

$arr = range(0,(1<<4) - 1);
 
code1：
$arr2 = $arr;
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => $v){
    var_dump(memory_get_usage() - $start);
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);

arr: (refcount=2, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=1...)
1  int(2072)   5  int(2072)   9  int(2072)  13 int(2072)
2  int(2072)   6  int(2072)   10 int(2072)  14 int(2072)
3  int(2072)   7  int(2072)   11 int(2072)  15 int(2072)
4  int(2072)   8  int(2072)   12 int(2072)  16 int(2072)
int(384)

code2：
$arr2 = $arr;
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => &$v){
    var_dump(memory_get_usage() - $start);
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);

arr: (refcount=1, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=1...)
1 int(2120)   5 int(2312)    9 int(2504)   13 int(2696)
2 int(2168)   6 int(2360)   10 int(2552)   14 int(2744)
3 int(2216)   7 int(2408)   11 int(2600)   15 int(2792)
4 int(2264)   8 int(2456)   12 int(2648)   16 int(2840)
int(2840)

我们重点对比两段代码的结果，我们发现下面几个不同：

对于$arr本身，code1循环前后refcount没有发生变化，code2的refcount变为1。
循环开始时，两段代码的内存都增加了很多，说明在循环开始时发生了复制动作。
循环结束后，code1的内存增加了常量。code2代码翻倍。

还不够，我们再看个例子：

$arr = range(0,(1<<4) - 1);
 
code1：
$arr2 = $arr;
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => $v){
    var_dump(memory_get_usage() - $start);
    $arr[$k] = $v * 2;
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);
arr: (refcount=2, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=1...)
1 int(2072)   5 int(3952)    9 int(4144)   13 int(4336)
2 int(3808)   6 int(4000)   10 int(4192)   14 int(4384)
3 int(3856)   7 int(4048)   11 int(4240)   15 int(4432)
4 int(3904)   8 int(4096)   12 int(4288)   16 int(4480)
int(2840)
arr: (refcount=1, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=2...)

code2：
$arr2 = $arr;
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => &$v){
    var_dump(memory_get_usage() - $start);
    $v = $v * 2;
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);
arr: (refcount=2, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=1...)
1 int(2120)   5 int(2312)    9 int(2504)   13 int(2696)
2 int(2168)   6 int(2360)   10 int(2552)   14 int(2744)
3 int(2216)   7 int(2408)   11 int(2600)   15 int(2792)
4 int(2264)   8 int(2456)   12 int(2648)   16 int(2840)
arr: (refcount=1, is_ref=0)=array(0 => (refcount=1, is_ref=0)=0,1 => (refcount=1, is_ref=0)=2...)
int(2840)

当refcount>1时，迭代过程中修改被迭代的数组，当使用引用方式访问时，首先复制了Bucket，然后逐个增加zval的值。当使用值方式访问时，我们看到进入循环时Bucket发生复制，然后当第一次发生写操作时，Bucket又发生，写操作完成后，内存释放，最终两种方式内存增加一样。

综合上面两个例子，我们可以得出结论：

当refcount>1， is_ref = 0时，用值引用来迭代Array，如果只读，那么只会拷贝Array的Bucket部分，且迭代完成后复制的内存会释放，$arr和$arr2还是引用相同的zval（这是合理的，当refcount>1时，你要是迭代Array，但是不能改变另外Array的结构，所以只能复制Bucket）；

如果有写操作，那么在进入循环时会拷贝Bucket一份，然后当写操作发生后，又会复制Bucket，然后对每个写操作都会增加相应的zval的内存开销，迭代完成后$arr 和 $arr2是不同的Array。

用索引在遍历对象时，无论读写，都会首先复制Array的Bucket部分，然后在迭代过程中再逐渐增加zval的开销，迭代完成后$arr 和 $arr2已经是完全不同的Array。

最后我们再来讨论一个is_ref = 1的情况：

$arr = range(0,(1<<4) - 1);
$arr2 = &$arr;
 
code1：
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => &$v){
    var_dump(memory_get_usage() - $start);
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);
 
code2：
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => $v){
    var_dump(memory_get_usage() - $start);
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);
 
code3:
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => &$v){
    var_dump(memory_get_usage() - $start);
    $v = $v * 2;
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);
 
code4:
var_dump(xdebug_debug_zval('arr'));
$start = memory_get_usage();
foreach($arras$k => $v){
    var_dump(memory_get_usage() - $start);
    $arr[$k] = $v * 2;
}
var_dump(xdebug_debug_zval('arr'));
var_dump(memory_get_usage() - $start);

这种情况下四个case结果都是一样的，因为$arr和$arr2本质上就是同一个Array，所以当is_ref=1的时候在以何种方式访问或者修改Array都是不会增加内存开销的。

综上：在refcount>1，is_ref=0的时候，无论以何种方式进行foreach操作，都会对Array的结构发生拷贝(Bucket)。如果采用引用的方式去迭代Array，那么每次迭代都会增加一个zval的内存空间。

我们还是用表格来描述所有的情况吧：

总结

所以，基于内存方面的考虑，在写代码的时候，如果迭代数组时是只读操作，我们建议是使用值引用来访问元素，因为当Array被引用多次时，读操作最终不会增加内存消耗。当对数组有修改操作时，建议使用引用的方式去访问数组，因为发生写操作时无额外内存开销。但是！！用完一定要记着unset！

本文转载自公众号贝壳产品技术（ID：gh_9afeb423f390）。

原文链接：

https://mp.weixin.qq.com/s/vbkiiIPddvXbt9YYeOicBA

创作场景

从 foreach 方法引出的 PHP 内存分析