内存中的堆栈-马育民老师

### 一、先记核心比喻：快速建立认知

把程序的内存空间比作一个**程序员的工作台**，栈和堆是工作台上两个不同的储物区：

- **栈（Stack）**：像工作台旁的**抽屉**，大小固定、分层叠放，放常用的小工具（临时数据），放的时候从上层叠、拿的时候从上层取（先进后出），不用手动收拾，用完自动归位；

- **堆（Heap）**：像工作台旁的**大仓库**，空间极大、摆放随意，放大件设备（大对象/长生命周期数据），放的时候需要找空闲位置、做标记，不用的时候需要手动清理（C/C++）或请保洁定期清理（Java/GC），找东西需要先看标签（引用/指针）。

### 二、栈（Stack）—— 轻量、高效、自动的「临时存储区」

栈是**操作系统提前划定的连续内存块**，由**编译器自动分配和释放**，完全不需要程序员干预（高级语言中），其生命周期和**代码作用域**强绑定，作用域结束，数据立刻被回收。

#### 1. 栈的核心特性

- **先进后出（LIFO）**：最后压入（push）栈的数，最先弹出（pop），这是栈的核心规则（比如函数嵌套调用，最内层函数先执行完释放）；
- **内存连续**：无内存碎片，访问时通过**栈指针**偏移直接定位，速度极快（接近CPU寄存器）；
- **容量有限**：大小固定（Windows默认~1MB，Linux默认~8MB），超出会触发**栈溢出（Stack Overflow）**（比如无限递归、定义超大数组）；
- **自动管理**：分配/释放由编译器完成，无内存泄漏风险，开发成本低；
- **线程私有**：每个线程都会有独立的栈，互不干扰（堆是线程共享的）。

#### 2. 栈上到底存什么？

所有**临时、短小、生命周期和作用域一致**的数据，核心包括：

- 基本数据类型的**实际值**（int/char/boolean/float等，比如`int a=10`，10直接存在栈）；
- 引用类型的**引用地址**（不是对象本身，比如Java的对象引用、C++的指针，相当于堆对象的「地址标签」）；
- 函数的**局部变量**、**函数参数**；
- 函数调用的**上下文信息**（返回地址、寄存器状态，保证函数执行完能回到原调用位置）。

### 三、堆（Heap）—— 灵活、大容量、需管理的「持久存储区」

堆是**操作系统管理的不连续内存块**（用链表管理空闲区域），是程序的「主存储区」，分配/释放要么由程序员手动完成（C/C++的`malloc/free`/`new/delete`），要么由语言的**垃圾回收器（GC）**自动回收（Java/Python/Go），其生命周期**不绑定作用域**——只要有引用指向，就会一直存在，无引用后才会被回收。

#### 1. 堆的核心特性

- **无序存储**：数据存放位置由操作系统/GC决定，无固定顺序，通过**引用/指针**间接访问；
- **内存不连续**：频繁分配/释放会产生**内存碎片**（GC会通过「整理」机制解决，比如Java的标记-整理算法）；
- **容量近乎无限**：理论上可使用计算机**全部物理内存+虚拟内存**，仅受系统总内存限制；
- **存取速度较慢**：访问时需先通过栈上的引用找到堆的内存地址，再访问数据，比栈多一次地址查找；
- **线程共享**：所有线程共用一个堆，多线程操作堆对象需要加锁（比如Java的synchronized），否则会有线程安全问题；
- **手动/自动管理**：C/C++需手动管理，易出现内存泄漏/野指针；GC语言自动管理，开发成本低，但会有GC停顿（性能损耗）。

#### 2. 堆上到底存什么？

所有**占用内存大、生命周期不明确、需要共享**的数据，核心包括：

- 所有**对象实例**（Java的`new`对象、Python的所有对象、C++的`new`对象，比如`Person p = new Person()`，Person对象存在堆）；
- 数组的**实际元素**（数组引用在栈，元素在堆，比如`int[] arr = new int[1000]`，1000个int值存在堆）；
- 大的数据集（集合/Map/链表等容器的实际数据）；
- 字符串**对象**（注意：字符串常量`"abc"`存在**常量池**——堆的特殊区域，`new String("abc")`会在普通堆生成新对象）。

### 四、核心示例：用Java直观理解堆栈协作

Java是最适合演示堆栈的语言（自动管理内存，无需关注底层释放，能清晰看到二者协作），核心规则：**栈存标签，堆存实物，标签指向实物**。

```java
public class StackHeapDemo {
    // 成员变量：属于类/对象，存在堆中（不是栈）
    private int age = 20;

public void test() {
        // 1. 基本类型：实际值存在栈上
        int num = 10;
        boolean flag = true;
        
        // 2. 引用类型：引用str存栈，字符串常量"java"存在堆的常量池
        String str = "java";
        
        // 3. new对象：引用p存栈，Person对象（含age=20）存在普通堆
        StackHeapDemo p = new StackHeapDemo();
        
        // 4. 数组：引用arr存栈，数组的5个int元素存在堆
        int[] arr = new int[5];
        
        // 调用子函数：子函数的局部变量压入栈顶，执行完自动释放
        subTest(num);
    } // test函数执行完毕，栈上的num/flag/str/p/arr全部释放（堆对象仍存在，只要有其他引用）

public void subTest(int a) { // 参数a存栈
        int b = a + 5; // 局部变量b存栈
    } // subTest执行完，栈上的a/b自动释放
}
```
**关键细节**：`test`函数执行完，栈上的引用`p`被释放，但如果在其他地方还有引用指向这个`Person`对象，堆中的对象就不会被GC回收；如果没有任何引用，这个对象就会成为「垃圾」，等待GC在合适时机回收。

### 五、堆栈的区别
| 对比维度       | 栈（Stack）| 堆（Heap）|
|----------------|---------------------------------------------|---------------------------------------------|
| 内存管理       | 编译器**自动**分配/释放                     | 程序员手动（C/C++）/GC**自动**回收          |
| 内存结构       | 连续内存块，无碎片                          | 不连续内存块，易产生碎片（GC整理）          |
| 存取速度       | 极快（栈指针直接偏移）                      | 较慢（间接通过引用访问）                    |
| 容量限制       | 小，固定大小（MB级）                        | 大，近乎无限制（GB级，受系统内存限制）      |
| 数据顺序       | 先进后出（LIFO）                            | 无序存储                                    |
| 生命周期       | 与**作用域**绑定，作用域结束即释放          | 不绑定作用域，由引用/程序员决定              |
| 线程特性       | 线程私有，互不干扰                          | 线程共享，需考虑线程安全                    |
| 溢出风险       | 栈溢出（Stack Overflow）                    | 内存溢出（OutOfMemoryError，OOM）           |
| 存储内容       | 基本类型值、引用地址、局部变量、函数上下文  | 对象实例、数组元素、大数据集                |

### 六、常见问题：避开易混淆的坑
1. **Java的String到底存在哪？**
   - 直接赋值`String s = "abc"`：`s`在栈，`"abc"`在**堆的常量池**（复用已有常量，节省内存）；
   - `new String("abc")`：`s`在栈，新的String对象在**普通堆**，常量池仍会保留`"abc"`（相当于创建两个对象）。

2. **栈溢出和内存溢出的区别？**
   - 栈溢出（StackOverflowError）：栈的容量不够用（比如无限递归、栈上定义超大数组）；
   - 内存溢出（OOM）：堆的空间被占满（比如不断new对象不释放，GC回收速度赶不上创建速度）。

3. **为什么栈的速度比堆快？**
   栈是连续内存，通过**栈指针**直接偏移访问（比如指针当前指向0x100，要访问下一个变量直接移到0x104），无需查找；堆是不连续内存，访问时需要先从栈取引用地址，再根据地址找堆的内存位置，多了一次寻址过程，且CPU缓存对连续内存的优化更好。

4. **Python/JavaScript有堆栈吗？**
   有！所有编程语言的底层都基于操作系统的堆栈设计，只是Python/JS是**动态语言+自动GC**，把堆栈的底层细节封装了，程序员不用感知，但底层分配逻辑和Java一致（比如Python的变量引用在栈，对象在堆）。

# 总结
1. 堆栈是**内存的两个逻辑区域**，栈管临时数据（自动、高效、容量小），堆管持久数据（灵活、大容量、需管理）；
2. 核心协作规则：**栈存引用/基本值，堆存对象/实际数据**，栈的引用是堆对象的「地址标签」；
3. 生命周期是核心区别：栈随**作用域**销毁，堆随**引用**销毁（GC/手动）；
4. 线程特性：栈私有、堆共享，多线程操作堆对象需考虑线程安全。

原文出处：http://www.malaoshi.top/show_1GW2iRVtcIo2.html