内存分区

C代码经过预处理、编译、汇编、链接4步后生成一个可执行程序。

在 Linux 下,程序是一个普通的可执行文件,以下列出一个二进制可执行文件的基本情况:

20150418160103391

通过上图可以得知,在没有运行程序前,也就是说程序没有加载到内存前,可执行程序内部已经分好3段信息,分别为代码区(text)、数据区(data)和未初始化数据区(bss)3 个部分(有些人直接把data和bss合起来叫做静态区或全局区)。

代码区

存放 CPU 执行的机器指令。通常代码区是可共享的(即另外的执行程序可以调用它),使其可共享的目的是对于频繁被执行的程序,只需要在内存中有一份代码即可。代码区通常是只读的,使其只读的原因是防止程序意外地修改了它的指令。另外,代码区还规划了局部变量的相关信息。

全局初始化数据区/静态数据区(data段)

该区包含了在程序中明确被初始化的全局变量、已经初始化的静态变量(包括全局静态变量和局部静态变量)和常量数据(如字符串常量)。

未初始化数据区(又叫 bss 区)

存入的是全局未初始化变量和未初始化静态变量。未初始化数据区的数据在程序开始执行之前被内核初始化为 0 或者空(NULL)。

程序在加载到内存前,代码区和全局区(data和bss)的大小就是固定的,程序运行期间不能改变。然后,运行可执行程序,系统把程序加载到内存,除了根据可执行程序的信息分出代码区(text)、数据区(data)和未初始化数据区(bss)之外,还额外增加了栈区、堆区。

img

代码区(text segment)

加载的是可执行文件代码段,所有的可执行代码都加载到代码区,这块内存是不可以在运行期间修改的。

未初始化数据区(BSS)

加载的是可执行文件BSS段,位置可以分开亦可以紧靠数据段,存储于数据段的数据(全局未初始化,静态未初始化数据)的生存周期为整个程序运行过程。

全局初始化数据区/静态数据区(data segment)

加载的是可执行文件数据段,存储于数据段(全局初始化,静态初始化数据,文字常量(只读))的数据的生存周期为整个程序运行过程。

栈区(stack)

栈是一种先进后出的内存结构,由编译器自动分配释放,存放函数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放,因此,局部变量的生存周期为申请到释放该段栈空间。

堆区(heap)

堆是一个大容器,它的容量要远远大于栈,但没有栈那样先进后出的顺序。用于动态内存分配。堆在内存中位于BSS区和栈区之间。一般由程序员分配和释放,若程序员不释放,程序结束时由操作系统回收。

#include <stdio.h>

int main()
{
    char buf1[10] = "aaaa";
    char buf2[] = "bbbb";
    char *p1 = "1111";
    //动态分配内存
    char *p2 = (char *)malloc(10 * sizeof(char));
    strcpy(p2, "3333");

    printf("buf1的地址是%d\n", buf1);
    printf("buf1的地址是%d\n", buf2);

    printf("======================\n");

    printf("buf[0]的地址是%d\n", &buf1[0]);
    printf("buf[0]的地址是%d\n", &buf1[1]);

    printf("======================\n");

    printf("p1[0]的地址是%d\n", &p1[0]);
    printf("p1[1]的地址是%d\n", &p1[1]);

    printf("======================\n");

    printf("p2[0]的地址是%d\n", &p2[0]);
    printf("p2[1]的地址是%d\n", &p2[1]);

    return 0;
}

image-20200808012012879

栈的生长方向是向下的,数值逐渐减小;栈中数组的元素的存放方向与之相反,是向上的,数值逐渐增大;堆的生长方向向上,数值逐渐增大。

内存简易四区模型

代码区:

程序指令

数据区(静态区 全局区):

1.全局变量

2.静态全局变量

3.静态局部变量

4.字符串常量(define)

栈区

局部变量

数组

结构体

指针

枚举

函数形参

堆区

音频文件

视频文件

图像文件

文本文件

大的数据

最后修改:2021 年 01 月 05 日 10 : 00 PM
如果觉得我的文章对你有用,请随意赞赏