产业地图 · Industry Map

AI 近内存计算

MEMORY-CENTRIC AI INFERENCE

HBCPIM / PNM3DIMCCUDA MOAT

参考系 · The Frame

把 AI 近内存计算摊成一张技术地层图，你才看得见：真正卡住的是内存带宽与封装产能，短期把钱收走的却仍是 GPU+CUDA 生态。卡点在底层，利润池在既有平台，二者并不重合。

地图 · The Map

这张图最要命的错位：内存与封装层卡住了 token 产能，但钱短期仍沉在 GPU+CUDA 这个成熟平台里。HBC / 3DIMC 真正要打的，不是某颗芯片，而是这段距离。

基准率 · Base Rates

HBM 供给卡口

3 家

这意味着内存墙不是抽象问题，而是被 SK hynix、Samsung、Micron 三家供给节奏卡住。

HBC Gen1 公开基线

133TB/s

这意味着 Qualcomm 把赌注押在带宽/瓦，而不是峰值算力；但 2027 前仍是采样窗口。

CUDA 生态惯性

4M+

这意味着硬件赢 benchmark 不够，还要让开发者和模型服务栈愿意迁移。

三个大问题 · Three Big Questions

①

HBC / 3DIMC 能不能把 memory-wall 从 HBM 供给问题，改写成 near-memory 量产问题？

②

利润会不会从 GPU+CUDA 平台，迁到更低 tokens/watt 的推理专用机架，还是继续被 CUDA 生态锁住？

③

LLM 架构会继续被 decode bandwidth 主导，还是被新模型结构带回 compute-bound，让这条路线优势缩水？

印李继刚