广告:宝塔Linux面板高效运维的服务器管理软件 点击【 https://www.bt.cn/p/uNLv1L 】立即购买
本篇文章给大家介绍《解析PHP8底层内核源码-数组(二)》。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。
相关文章推荐:《解析PHP8底层内核源码-数组(一)》《解析PHP8底层内核源码-数组(三)》《解析PHP8底层内核源码-数组(四)》
zend_array 在 PHP中 被分为两种
1.packed array2.hash array
在上文中 补齐了zend_array的 所有值的 注释登录后复制
其实源码里顺序和我上面的稍微不一样 我觉得我上面的顺序理解起来更合理
//源码里的代码typedef struct _zend_array HashTable;struct _zend_array {zend_refcounted_h gc;union {struct {ZEND_ENDIAN_LOHI_4(zend_uchar flags,zend_uchar _unused,zend_uchar nIteratorsCount,zend_uchar _unused2)} v;uint32_t flags;} u;uint32_t nTableMask;Bucket *arData;uint32_t nNumUsed;uint32_t nNumOfElements;uint32_t nTableSize;uint32_t nInternalPointer;zend_long nNextFreeElement;dtor_func_t pDestructor;};//我调换下顺序后的代码struct _zend_array {zend_refcounted_h gc; /// gc 占用8个字节 用于引用计数和 字符串类型的记录union {struct {ZEND_ENDIAN_LOHI_4(zend_uchar flags,// flags 8位的无符号字符, 最大值为255 标记HashTable用 PHP8 中有6个值zend_uchar _unused,zend_uchar nIteratorsCount,//迭代器计数。foreach语句会在全局变量EG中创建一个迭代器,//迭代器包含正在遍历的HashTable和游标信息。//nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。zend_uchar _unused2)} v; //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistencyuint32_t flags; //} u;// u是是一个联合体。占用4个字节。//可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v,//这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。Bucket *arData;//HashTable中存储数据的单元的指针。// 用来存储key和value以及辅助信息的容器。uint32_t nTableSize;// HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。//该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。uint32_t nNumUsed;//指所有已使用bucket的数量,包括有效bucket和无效bucket的数量uint32_t nNumOfElements;//有效bucket的数量。该值总是小于或等于nNumUseduint32_t nTableMask;//索引大小。一般值为 -nTableSize。uint32_t nInternalPointer;//全局默认游标。reset/key/current/next/prev等宏 和操作都会用到zend_long nNextFreeElement;//下一个插入的元素的key的下标 //比如 当$a[] = 1 nNextFreeElement =1 dtor_func_t pDestructor;//指向一个函数 typedef void (*dtor_func_t)(zval *pDest);//可以看出是pDest是zval结构指针二级指针,//为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入//当bucket元素被更新或者被删除时,会对bucket的value调用该函数,//如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。};登录后复制
用understand 工具 生成的成员变量图如下
展开全部后 如下
zend_array 结构体 member
可以看出 其实核心就是 z_val +zend_string +zend_refcounted_h+Bucket 层层相扣
其中 Bucket 存储数组的 关键信息
typedef struct _Bucket {zval val; //数组的值 ( 复习下 zval只有16个字节)zend_ulong h; // key的 h 值zend_string *key; //当数组为 hash_array时候 会用到 也就是 key的值 } Bucket;登录后复制
不管 数组类型是 packed_array 还是hash_array 最终都会存储在 Bucket中
当 key全是数字key 并且 key按插入顺序递增的时候 数组类型为packed_array
packed array的特性
不需要索引数组 用不到 key 不带key的 数组h 值 直接等于bucket中空间的排序值 从0开始key-value对的数组 h 值 等于 key的内容其中第三条和第四条你可以理解为PHP中数组如果不写key 那么就默认key就从0开始依次排序
$a =array(1,2,3); // packed array$b =array(1=>'a',3=>'b',5=>'c'); //packed array登录后复制
bucket 数组前 会有索引数组
当为packed array 时 索引数组得大小一直为 2 因为用不到它
上面当 $a 对应的 zend_array里的内容为
nTableSize; 表示arData指向的bucket数组的大小,即所有bucket的数量。=数组的总大小
nNumUsed; 指所有已使用bucket的数量,包括有效bucket和无效bucket的数量
bucket会有三种状态 有效 无效 已使用
nNumOfElements; 有效bucket的数量。
所以 nNumOfElements+nNumUsed =nTableSize
nTableMask; 索引大小。 因为 packed array 没有用到索引 所以永远为-2
nNextFreeElement; 下一个插入的元素的key的下标
packed array 利用了bucket数组的连续性特点,对于某些只有数字key的场景进行的优化。由于不再需要索引数组,从内存空间上节省了(nTableSize-2 )* sizeof(uint32_t) 个字节。另外,由于存取bucket是直接操作bucket数组,在性能上也有所提升。
如果 未满足 packed array 的条件 在PHP中 数组用 hash_array表示
所有 key 值不是数字的都用hash_array 表示
$c =array('x'=>1,'y'=>2,'z'=>3,'a'=>0);登录后复制
上面的$c 会被用 hash_array 表示
bucket如下
zend_array如下
nTableSize; 表示arData指向的bucket数组的大小,即所有bucket的数量。=8
nNumUsed; 指所有已使用bucket的数量,包括有效bucket和无效bucket的数量=4
bucket会有三种状态 有效 无效 已使用
nNumOfElements; 有效bucket的数量。=4
所以 nNumOfElements+nNumUsed =nTableSize
nTableMask; 索引大小。 -8
nNextFreeElement; 下一个插入的元素的key的下标 hash_array 用不到 永远为0
▏本文经原作者PHP崔雪峰同意,发布在9543建站博客,原文地址:https://zhuanlan.zhihu.com/p/358354087
以上就是解析PHP8底层内核源码-数组(二)的详细内容,更多请关注9543建站博客其它相关文章!
发表评论